点击蓝字关注我们
序言:
在大数据时代,爬虫技术获得了十分广泛的应用,但随着网络安全法律体系的不断完善,企业以商业目的利用“大数据”模式进行生产、经营,通过网络爬虫技术自动搜索并抓取海量数据的同时,也会涉及到各种各样的法律风险,其中当然不乏可能会危及企业命脉的刑事法律风险,如何在合理使用爬虫技术的前提下规避其可能带来的刑事法律风险,应当成为企业的重点关注。
利用爬虫技术侵犯公民个人信息案
被告人魏江蒙是北京市滨海区中数智汇科技有限公司工作人员,其通过“网络爬虫”程序下载含有公民姓名和电话号码的工商个体户和单位资料进行贩卖,法院查明,到案后,公安机关从其使用的手机和笔记本电脑上查获自2018年3月至4月份期间的公民个人信息及企业信息总计3296634条,非法获利55822元。魏江蒙家属代其退出违法收入56000元。
法院认为,被告人魏江蒙违反国家规定获取公民个人信息后向他人出售,情节特别严重,其行为已构成侵犯公民个人信息罪。公诉机关指控的犯罪事实清楚,证据确实充分,本院予以支持。
最终法院判决被告人魏江蒙犯侵犯公民个人信息罪,判处有期徒刑四年,并处罚金五万元。
爬虫技术简介
什么是爬虫技术
网络爬虫,是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本的运行程序,可以理解为一个自动访问网页并抓取相关信息的小机器人。利用爬虫技术可以高效、自动地进行网络信息(比如网页、文档、图片、音频、视频等)的读取、收集。本质上就是通过代码实现对人工访问操作的自动化操作。但是,由于爬虫系通过解析代码的方式工作,因此爬虫还有可能访问到人工访问不会访问、或者无法访问的内容。这种技术通常被用来自动搜索并抓取数据。
2
爬虫技术的应用场景
当下,从我国信息技术应用产业的实际业务操作来看,利用网络爬虫技术手段爬取互联网数据的行为广泛存在,其应用具有多样性,最为普遍的是利用爬虫程序读取数据的搜索引擎,这在技术上属于常见的信息获取场景,此外,爬虫技术还被广泛应用于电商系统中的价格比较、获取用户数据、实时交易信息、视频文字、图片评论、租房信息等资料,总体上来说,网络爬虫是根据爬虫编写者的意志行事,目的在于获取某项网络数据。
爬虫可能导致的刑事法律风险(下)
1
侵犯著作权罪
具体而言,若利用爬虫技术非法侵入国家事务、国防建设、尖端科学技术领域以外的计算机信息系统,获取该计算机信息系统中存储、处理或者传输的数据,并达到情节严重的标准,可能会构成非法获取计算机信息系统数据罪。
2
侵犯商业秘密罪
在利用网络爬虫技术爬取数据的过程中,若对计算机信息系统的功能,存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,影响计算机系统正常运行(例如爬虫点击率过高导致系统崩溃)并给被爬取方造成了严重损失,则有可能构成破坏计算机信息系统罪。
3
侵犯公民个人信息罪
若未经授权爬取他人合法获取公民个人信息或者爬取的信息属于未经授权获取的公民个人信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,则还可能涉嫌构成侵犯公民个人信息罪。
4
量刑大数据
互联网企业该如何“置身事外”?
爬虫作为一项中立的技术措施,本身并不违法,故其涉及刑事法律风险的关注点主要在于其具体的使用场景,假设爬虫没有突破许可权限和安防措施,即便获取数据,也不构成非法获取计算机信息系统数据罪。因为取得权限的情况下,网络爬虫模拟人工点击,不断向访问接口发出访问请求,批量获取数据,只是提高了人工获取数据的效率,却没有突破权限许可,也就谈不上构罪问题。又如为了个人研究使用而获取数据,虽不会违反《竞争法》、《著作权法》,但仍有可能会触犯《刑法》。所以提醒企业,在使用爬虫技术的同时,应对其使用场景进行严格评估,着重从以下方面进行:
1.数据的开放程度和被爬取方的意愿,主要从数据的性质以及被爬取方对数据采取的技术保密措施进行综合判断;
2.数据的类型,如在爬取过程中获取对方保存的公民个人信息、商业秘密、版权内容,应及时停止并删除相关内容;
3.爬取手段,避免采取突破型、破解型、病毒型的爬虫程序爬取数据,避免造成爬取方系统功能障碍。
此外,实践中企业的技术人员对具体场景下爬虫的性质难以从专业的角度进行判断,所以如遇类似的问题,企业应及时寻求专业律师团队的帮助,从技术和法律两个维度对爬虫的应用进行综合判断,避免因使用不慎而陷入刑事法律风险的泥潭。

本文作者
郑传锴
北京市安理律师事务所刑民交叉团队 高级合伙人
ckzheng@anlilaw.com
赵锦裕
北京市安理律师事务所刑民交叉团队 实习律师
jyzhao@anlilaw.com
长按识别左侧二维码,关注我们

