我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
案情简介
2018 年 8、9 月间,被告人谢财安、林建华预谋窃取公民个人信息售卖获取利益。后二人通过网络联系被告人杨杭,被告人杨杭明知二被告人从事非法活动仍向被告人林建华、谢财安提供 “smarttool”(用于爬取京东商户订单信息)等软件并收取费用。被告人林建华、谢财安利用该软件通过技术手段非法侵入京东商城 “WIS 旗舰店” 等商户的账户维护后台,窃取公民交易类个人信息予以售卖并获利。经鉴定,本案涉及公民个人信息共计 297313 条,内容信息包含有 “店铺名称”、“购买产品”、“金额”、“ID”、“姓名”、“电话”、“地址” 等,经对该文件中每条个人信息的电话号码为标准进行统计剔除重复数据后,获取到信息共 240372 条。
供述情况
- 被告人林建华的供述(爬虫软件买家):
2018 年 9 月份左右,谢财安说京东网上有一些购物的数据有人要,让我和他一起去网上窃取数据。我们两个人就在新罗区适中镇中心村山脚下的一个老房子里面架设了设备开始窃取京东的数据,然后卖给龙岩当地从事网络诈骗的人,一条 3 到 4 元的价格,这些从事网络诈骗的人就是通过我卖给他们的这些数据给购物的人打电话实施诈骗。
谢财安首先联系做钓鱼链接的人,然后把钓鱼链接发给我,我自己注册一个京东账号,把钓鱼链接发给卖家说让对方看一下这款商品,对方点开链接之后是一个假的京东账号,对方就以为是自己掉线了,然后对方会在假的京东页面上重新登录自己的账号、密码和验证码,这些账号、密码就会通过钓鱼网站的链接发送到我们钓鱼链接的管理后台,我们登录钓鱼网站的管理后台就可以拿到商家的用户名和密码,在京东商城的网站登录商家后台,然后我们再用爬虫软件将商家的购买人订单信息采集下来,我们只需要设定好时间,软件就会自动批量的将这个时间段商家的买家数据采集下来,然后由谢财安负责在 QQ 上联系购买数据的人,如果有人购买的话,我们就从 QQ 上以 TXT 的格式发给对方,对方收到数据之后就会告诉我到什么地方取现金,我们就到对方放钱的地方把钱取走。我们从京东公司窃取的数据总共卖了大约十五、六万元,五五分成,我个人获利大概在七、八万元左右。
- 被告人谢财安的供述(爬虫软件买家):
2018 年听老家人说窃取买家数据可以赚钱,大约 8 月份左右,我在 “猪八戒” 网站上看到有人发布信息说可以写爬虫程序,于是我就加入一个 QQ 群,群里面有个叫 “宝爸” 的,我就问他可不可以做京东商城的爬虫程序,他说能做。没过几天他就做了一个钓鱼网站和一套爬虫软件。我和林建华一起出资购买设备用于取京东商家后台数据了。这样由 “宝爸” 提供技术支撑、我和林建华购买设备实施窃取商家数据。
登录商家后台信息查看实际购买商品的用户信息,用户信息包括姓名、手机号、邮寄地址等内容。之后再使用爬虫软件自动爬取这些买家信息,保存到我们的笔记本电脑里,去重之后售卖给那些做电信诈骗的骗子。爬虫软件爬取的数据我们会打包发给宝爸,他有工具可以查询这些买家信息中手机号的停机、空号情况,之后他再打包发给我们,我们将这些停机、空号的买家信息去掉后再进行去重,剩下的数据就可以卖给适中镇和龙岩市区的骗子了,我们卖数据收取的都是现金,一般都是让买数据的人将钱放在指定地点,然后我们去取。卖数据的钱我和林建华一人分了大概七、八万左右。“宝爸” 负责给我们提供技术支撑,维护钓鱼网站、爬取数据软件的工作。购买信息的骗子是我通过 QQ 联系的。
- 被告人杨杭的供述(钓鱼网站及爬虫软件制作者):
2018 年 8 月份左右,我 QQ 所在的 “深度软件订购群” 里有一个昵称叫 “小师弟” 的人跟我说他想让我做一个程序来获得京东商家的订单信息,我同意了,刚开始我在我自己的电脑上调试这个程序的时候发现这个程序用不了,大概 3 天的时间调试成功了,我就发给他用了,成功之后我跟他商量好通过这个程序获取的商家信息,一个商家 380 元,后来有一段时间用不了了,我就帮他重新调试了一遍,调试完之后我们商量好每个商家 400 元,我通过这个程序大概一共获利 1 万元左右。
他们大概获取了 30 个左右的商家信息。我设计的这个程序没有对应的商户,可以获取无限个商户的信息,他获取几个商户的信息我这边都有显示,如果他不给我钱我可以远程关停这个程序。对方还给过我两次包含手机号的文档,我通过创蓝 235 网站查询这些手机号是否为空号,每次付费 2 分钱一个手机号,我收下家是 5 分钱一个手机号,总共查询过 3 万多个手机号。对方使用我的软件共爬取了约 20 多万个订单信息,我把对方爬取的信息同步一份在我自己架设的网站上,是腾讯云服务器,对方每次启动软件都需要调用我的这个服务器,所以我能做到实时同步数据,同时记录了软件的登录日志、流量日志。
- 证人周某的证言(被骗的买家):
证实案发前几天我在京东商城上买了两瓶化妆品,花费 108 元。2018 年 10 月 1 日 14 时 15 分许,有一个陌生号码给我打电话说我在京东上买的化妆品质量有问题,要给我退钱。然后该男子在电话里告诉了我另一个手机号码,我按照对方要求将这个陌生号码加了微信好友。这个微信号给我发过来一个二维码说是退款的流程,我就用自己的手机扫了这个二维码进到一个很像京东平台的页面,然后按照网页上的提示操作,期间需要手机的验证码,我输入好几次都是超时不能继续操作,对方男子就告诉我是因为我的信用度不够,需要通过走流水的方式提高信用度,然后对方在微信里给我发来一张支付宝的二维码,对方在支付宝里下单,然后需要我操作付款以流水的方式提高信用度,这样我先后五次在支付宝里转款,分别为 18000 元、6000 元、9000 元、4000 元、6800 元,然后对方又让我打开我的京东账号,我看到账号里有四笔待付款,一共是 7680 元,我又把这四笔待付款订单、付款了。然后我电话问对方男子什么时候能把钱退给我,对方男子说不用管了已经还完了。对方男子也没有和我提我买化妆品花费的 108 元什么时候退给我,我觉得不对劲了,于是我就报警了。我一共被骗了 51480 元。
案件实施流程:
- 给卖家发送钓鱼链接;
- 拿到卖家在假的京东登录界面输入账户名、密码;
- 通过账户名、密码,登录商家后台;
- 使用爬虫软件,获取该商家所有买家的订单信息;
- 根据订单信息(姓名、手机号、邮寄地址等),实施电话诈骗行为。
法院观点
被告人林建华、谢财安非法窃取公民个人信息,被告人杨杭明知被告林建华、谢财安从事非法活动仍为其提供作案工具,情节特别严重,三被告人的行为均已构成侵犯公民个人信息罪,依法应予惩处。
被告人林建华、谢财安的辩护人所提涉案公民个人信息具有不确定性、鉴定结论不具有客观公正性的辩护意见,根据相关法律规定,对批量公民个人信息条数以查获的数量直接认定并无不当,虽获取的信息中部分信息无公民的真实姓名,但其电话号码 + 住址 + 订单信息等内容已然能够反映自然人的活动情况,属公民个人信息的范畴。
被告人杨杭明知其他二被告人从事非法窃取公民个人信息的活动,仍为其提供作案工具并获取利益,且该作案工具系被告人林建华、谢财安获取公民个人信息的关键性工具,其行为已构成侵犯公民个人信息罪的共同犯罪。
判决情况
一、被告人林建华犯侵犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币七万元。
二、被告人谢财安犯侵犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币七万元。
三、被告人杨杭犯侵犯公民个人信息罪,判处有期徒刑三年二个月,并处罚金人民币三万元。
四、扣押在公安机关的被告人林建华持有的黑色苹果 6 手机一部、U 盘一个、华硕笔记本电脑一台,被告人谢财安持有的银色苹果 6 手机二部、U 盘一个、华硕笔记本电脑三台、华为无线上网终端一个,被告人杨杭持有的戴尔牌笔记本电脑一台、华为荣耀手机一部、中国银行银行卡一张,依法予以没收;扣押在公安机关的被告人谢财安持有的交通银行卡一张、中国农业银行一张、中国工商银行一张、中国光大银行一张,由扣押机关依法予以处理。
五、扣押在公安机关的被告人谢财安持有的黑色苹果 X 手机一部、黑色小米手机一部、黑色苹果 7 手机一部,变价后折抵罚金;不足部分,继续追缴。
裁判文书
(2019)京 0115 刑初 570 号
案例分析
本案中,两被告人通过钓鱼网站,获取到了登录商家后台的账号和密码,再使用爬虫软件采集后台所有买家信息,最终被不法分子用于电话诈骗。这些数据的获取未经授权,侵犯了公民的个人隐私权,并且最终可能造成未知数额的经济损失,严重损害了公民的利益。
电话诈骗深恶痛绝,这也是近年来国家严厉打击的违法犯罪行为,不只是本案中涉及到的京东商家后台,拼多多、抖音、淘宝等电商平台也是不法分子的首选目标之一,作为爬虫工程师一定要仔细权衡自己的行为可能造成的影响,技术是无罪的,但是技术的滥用可能造成极大的社会危害,本案中的爬虫工程师在明知买家目的的情况下,还售卖爬虫软件等,成为了不法分子的帮凶,这是我们需要引以为戒且严厉禁止的行为,电话诈骗伤害的可能不只是一个人、更可能是一个圆满的家庭。电影《孤注一掷》向我们展现了诈骗团伙的可怕,为了利益丧失人性,身为爬虫工程师不应成为违法犯罪分子的助力。
由本案可知,违法犯罪行为人的技术提供者,也是逃脱不了法律的制裁的,且判罚同样严重。因此在技术获益之前,一定要问清楚买家的需求,不然一旦成为了帮凶,法律的重锤一样会砸到自己身上,切记不要越过法律的红线!
趣味验证码
为了应对爬虫, 12306 当年上线了王珞丹和白百何的 "史上最坑图片验证码",你能找的出来吗,欢迎评论区发表见解~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。