一、问题讨论

先看以下几个场景:
场景一:在夜深人静的晚上,你想听某首歌,打开一个常用的音乐App,发现该App自身曲库本身并没有这首歌,但它抓取其它同类音乐App的歌曲播放URL和歌曲页面URL,所以在该App页面点击该歌曲时,还是可以播放该首歌,但显示的是那个同类音乐App的标识、名称、歌曲专辑封面、歌手照片等信息的页面。
场景二:有一天你想买个房,发现几个声称独家真实房源的中介平台上很多房子都一样,而且这些房子都有相同信息介绍及图片,经了解才知道原来A房产中介平台抓取了B房产中介平台收集、制作、积累的海量真实房源数据。
场景三:闲暇时你想看个短视频,无意发现某个App上的好几个短视频跟之前在抖音App刷到的短视频内容跟评论一模一样,后面才知道原来是该App抓取搬运了来源于抖音APP的数万条短视频文件、1万多个用户信息及数百条用户评论内容进行展示和传播。
场景四:你想将在淘宝的店铺搬运到拼多多等平台,发现在第三方平台上有不少店铺搬家软件,便使用了其中一款将你在淘宝的店铺整店搬家到了拼多多,同时看到这个软件有推荐精品货源,故也搬运了其他一些店铺的商品,并使用了一款可以批量下单的软件将上游店铺的商品直接发货给消费者。
以上类似场景近年屡见不鲜,特别是随着互联网商业竞争加剧,加之生成式人工智能的兴起,这类数据抓取不正当竞争所涉及的新场景、新模式、新案件类型越来越多。由于App开发及应用都离不开大量历史数据的学习和训练,而数据抓取又是综合技术和效率比较具有优势的数据获取手段,“数据抓取”竞争行为的合法性边界应该在哪,成为业界比较关注的话题。
但本文对此问题不深入探讨,仅讨论在当下司法实践中,与前述典型场景类似的数据抓取类不正当竞争案件是如何裁判的?裁判间的共同趋势是什么?裁判背后的司法逻辑如何?
二、几个说明

第一,本文讨论时尽量克制进行概念层面的阐述,所以先对题目所涉及的概念特别是数据抓取进行简单说明一下。所谓的数据抓取大意指的是从网上获取数据,最终可以将数据存储到本地计算机或者数据库,通常理解包括数据集下载、API读取以及爬虫爬取等形式。至于为什么是不正当竞争而非其他路径主张,可理解为经过多年实践,通过《反不正当竞争法》这一路径来保护数据市场竞争要素比较务实。因此,何谓数据抓取类不正当竞争案件,可以理解为主要涉及从其他平台抓取一定数量数据而引发的不正当竞争案件。
第二,为什么要关注这类案件。很重要的原因是,互联网及人工智能时代下商业竞争场景模式不断更迭,出现层出不穷的新型不正当竞争行为,已经极大地颠覆了法官审理不正当竞争案件的传统思维模式。比如实践中对竞争关系的扩大解释已使其在不正当竞争中的要件地位名存实亡,而互联网相关产品商业竞争中对用户注意力的争夺,也为法官说理论证打开自由闸门。那么探究法官是如何裁判这类案件,还是有意义的。
第三,如前,本文核心讨论的问题主要倾向于实然层面,应然层面的评价不是本文关心的问题,包括不讨论“实践中这么判好不好、应该怎么判”和在商业竞争中以数据之名的“利益保护”“竞争创新”的合理边界。前述问题只会在本文讨论过程中一带而过。
三、裁判趋势

先简单说一下结论:
第一,关于怎么判。根据作者经办及研究的50多个相对比较典型的案例来看,大部分与前述场景类似的案件,最终被认定为构成不正当竞争的比例在80%至90%之间。
第二,关于裁判的总体趋势。目前裁判的趋势主要关注为两点:
一是案涉数据权益及可保护性的问题。对这个问题一般有两个论证模式:从宏观出发认可整体的数据权益进行分析,或者对相关数据进行分类并从劳动投入角度进行分析。
二是被诉行为的不正当性问题。对这个问题一般也有三个论证模式:①从整体对经营者消费者及市场秩序的损害角度来倒推分析不正当性;②在宏观层面设立一些次级规则来论述违反诚实信用原则和公认的商业道德;③通过数据分类、行为分解等对不正当竞争行为进行分析认定。
第三,关于裁判背后的逻辑。根据公开的裁判文书,作者理解是最重要、最核心、最关键但又仅是隐隐暗含的论证逻辑为:裁判者的切入点主要集中于被诉竞争行为“为什么是不正当的”,而不是“为什么不是不正当的”,这明显体现出一种积极干预的“家长式”思维。其他所谓的认定思路论证模式都是在这个隐藏主流逻辑下派生出来的,具体来说:
(一)总体审判模式
如前述,现司法实践中法院基本形成了架构统一的论证逻辑,即从数据权益及可保护性、被诉行为的不正当性出发进行考察,从而形成了“权益保护——不正当行为”的范式裁判路径。
因此,数据抓取类不正当竞争案件常规认定思路及模式一般为:①法律没有明文规定,不属于《反不正当竞争法》中规定的类型化不正当竞争行为;②经营者是否具有相应的数据权益并适用《反不正当竞争法》的保护;③实施不正当竞争行为一方其行为具有不正当(有损害)。
需说明的是,对于是否具有竞争关系,大部分案件已不再进行专门阐述;而数据权益及相关数据权益是否应当适用《反不正当竞争法》保护,通常也没有太大争议,有时法院也会略过而直接进行行为考察。故在不同案件中前述思路法院还可能演化变异为以下几种:只论述③;只论述①和③;只论述①、③及损害结果(即是否对经营者消费者及市场秩序存在损害)。
(二)法律适用:“一般条款”还是“互联网专条”?
在司法实践中,虽此问题并无太大争议,但业界批评声音为多数。因数据抓取类不正当竞争行为主要适用两种规制路径:一是通过《反不正当竞争法》第十二条互联网专条的兜底条款,将其视为“其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为”;二是通过《反不正当竞争法》第二条原则性条款,将其视为“扰乱市场竞争秩序、损害其他经营者或者消费者的合法权益”的非类型化不正当竞争行为。其中第二条“一般条款”是数据抓取不正当竞争纠纷的主要裁判依据,部分会援引第十二条“互联网专条”第4款的兜底条款。
从数据抓取类不正当竞争案件认定思路来看,无论是适用第二条还是第十二条的兜底条款,其前提实质还是延续适用第二条“一般条款”的“三要件”,即“法无特别规定”“竞争者合法权益受损”以及“竞争行为不正当”。
关于该“三要件”,《最高人民法院公报》2009年第9期论述为:“在反不正当竞争法上,一种利益应受保护并不构成该利益的受损方获得民事救济的充分条件。商业机会虽然作为一种可以受到反不正当竞争法所保护的法益,但本身并非一种法定权利,而且交易的达成并非完全取决于单方意愿而需要交易双方的合意,因此他人可以自由参与竞争来争夺交易机会。竞争对手之间彼此进行商业机会的争夺是竞争的常态,也是市场竞争所鼓励和提倡的。对于同一交易机会而言,竞争对手间一方有所得另一方即有所失。利益受损方要获得民事救济,还必须证明竞争对手的行为具有不正当性。只有竞争对手在争夺商业机会时不遵循诚实信用的原则,违反公认的商业道德,通过不正当的手段攫取他人可以合理预期获得的商业机会,才为反不正当竞争法所禁止。”
入选最新人民法院案例库参考案例的(2022)沪0115民初13290号民事判决也有明确:
1.互联网企业实施反不正当竞争法第二章或专利法、著作权法等知识产权专门法没有作出明确规定的不正当竞争行为的,人民法院可以适用反不正当竞争法第二条的规定予以审查。
2.适用反不正当竞争法第二条认定不正当竞争行为,需要满足以下条件:一是法律对该竞争行为未作出特别规定;二是该竞争行为扰乱市场竞争秩序,损害其他经营者或者消费者合法权益;三是该竞争行为因违反诚实信用原则和公认的商业道德而具有不正当性。
(三)相关数据权益是否适用《反不正当竞争法》保护
权利或权益的合法性、可诉性是类似“侵权”案件的基点问题,但这个问题在数据抓取类不正当竞争案件司法实践中,其实早有结论,即对平台基于其各种“付出”而形成的数据集合予以权益上的肯定,不再依附于数据本身的主体权益,直接将平台数据控制权和收益权独立出来,形成一种新的竞争权益,当然也有部分判决认定为财产权益,这与“数据二十条”下的产权结构分置的逻辑类似。
而在可保护性的问题上,近两三年部分判决更进一步从以下逻辑进行论证:先明确数据类型,是个人信息数据还是非个人信息数据,非个人信息数据可能又分为企业公开数据、企业半公开数据、企业非公开数据等;然后从数据产生的合法性、运营数据的投入以及竞争利益进行审查。总体上,其逻辑还是站在先肯定权益的视角予以论证的,故关于数据权益及其可保护性这一点在司法实践中总体争议也不大。
(四)不正当竞争行为认定的裁判规则及司法逻辑:随数据经济价值及相关产品商业模式的变化而演化。
如前述,法律适用及数据权益问题,实践中总体相对明确,争议不大。而在竞争行为认定中,随着数据价值的变化及商业竞争的加剧,其裁判规则也在不断发展,从数据作为产品到数据作为要素的不同阶段,展现了争议与裁判规则的演化。
因此,个案中法官的具体考量因素相对不统一,自由裁量空间相对比较大,比如平均一个案件所涉及的认定要素可能就有3、4个,而要素间的叠加组合形成了近30种裁判路径,比如“未支付成本-行为道德判断”“行为手段判断-利益受有损害”等。但绝大部分认定要素主要还是在于是否采用非法手段、强调经营者利益保护及消费者和社会公共利益考量等,发展到近两年也有通过数据分类、行为分解等对不正当竞争行为进行认定。
实践中形成了几个参照适用的次级规则,包括所谓的实质性替代、破坏性规则、非公益必要不干扰原则、三重授权、多益平衡考量等。具体来说:
1.实质性替代
在数据作为产品阶段,数据被直接作为产品提供给大众使用。这一时期,竞争主要体现为经营者之间同类数据产品的横向竞争,如盗用其他网站相关文字图片视频等数据内容引发的竞争纠纷,如本文列举的场景二、场景三的情况。在这些案件中,如最早的某点评平台诉某帮网平台案及后来的某点评平台诉某百平台案,基本确立了“实质性替代”规则,即“利用他人网站的信息不得造成对该网站的市场替代”,以界定何种数据抓取行为构成市场替代,从而判定不正当竞争行为。简而言之,实质性替代被认为是对在先者商业模式的复制模仿,行为上具有“搭便车”和“食人而肥”的典型特征,被认为违反诚信原则和商业道德,因此被认定是一种明显的不正当竞争行为。
2.“破坏性规则”“非公益必要不干扰”和“三重授权”规则
在数据作为要素阶段,当数据利用方式从原生性使用演进为衍生性使用,抓取数据的目的可能变成开发出一个新的数据产品提供给用户,而非提供一个与被抓取平台在性质功能上类似的产品,即数据竞争转化为上下游经营者之间的纵向竞争时,比如本文列举的场景四,比如很多通过采集微信公众号的数据而开发出公众号数据监控与分析服务产品,比如采集微博数据提供舆情监控产品,等等。这种情况下,新的产品与被抓取数据的产品存在性质和功能上的不同,“实质性替代”规则便不再适用。这类案件法院在裁判中采用并形成了“破坏性规则”“三重授权”及“非公益必要不干扰”等规则。
“破坏性规则”是指违反平台设置的登录限制、IP频率访问限制、验证码、违背Robots协议爬取数据等限制措施进行爬取数据,这种行为被认为违反诚信原则和商业道德,从而被认定为不正当,后续的储存、使用也具有不正当性。而由此也衍生出一个所谓“非公益必要不干扰原则”,即互联网平台经营者在确需保障公共利益需要时可不经平台用户及其他经营者同意干扰其他经营者的产品或服务运行,但应确保手段的必要性和合理性。
而“三重授权”规则则是认为第三方通过开放数据接口(Open API)获取用户信息时应坚持“用户授权”+“平台授权”+“用户授权”的三重授权规则,这一规则是在某微平台诉某友天下平台案中开始适用。但在当下的司法实践中,“三重授权”规则只有在属于用户身份信息的情境下适用,并未适用于用户行为信息,比如仅适用于用户头像、名称、职业等个人信息,而用户浏览、搜索、交易、点赞、评论等行为痕迹属于用户行为信息并不适用。
3.“多元利益权衡”原则
法院在判断数据抓取的行为是否不正当时,综合考量数据抓取行为对公共利益、经营者利益及消费者利益带来的损失及影响,认为应将竞争者自由竞争利益、消费者自由决策利益和“不受扭曲的竞争标准”所产生的社会公共利益作为评价要素相结合,综合评价行为不正当性的过程。具体而言,不必拘囿于被诉竞争性行为是否对经营者造成实质性利益损害,而是综合考虑该行为是否对市场竞争秩序和消费者造成威胁,是否冲击了正常的商业模式和其他经营者的正当经营行为,是否损害了消费者的利益。
该思路的逻辑是,在当下互联网及人工智能社会,消费者及社会公众不再是竞争市场的场外人,而是直接作为参与的角色介入数据竞争,成为评判市场主体间数据行为正当性的“参考法庭”。故在个案中,应从消费者权益、社会整体利益与竞争者利益平衡的角度规范竞争行为和秩序。
4.区分数据类型和分解行为方式审查经营者利益损害
尽管多元利益衡量的审判思路相对普遍适用,但增加了个案判断中法官的主观能动性及任意性因素。随着实践中行为方式趋于复杂,部分法院已经开始尝试从细化数据类型和分解行为方式入手,区分“公开数据”和“非公开数据”,从抓取、存储、使用涉案数据的行为性质入手,立足经营者利益损害(而往往非多元利益)进行重点分析,如是否破坏了平台的管理秩序、损害了经营者的经营自主权、影响了经营者收益、用户粘性、运营成本、安全风险等。
以上为不正当竞争行为认定的主要裁判规则及司法逻辑。当然,对于前述不同个案中法官提出的次级规则,如何适用、适用的优先次序、次级规则的观点冲突处理等问题不可避免。据作者不科学的统计及实务经验,比较普遍适用的有实质性替代、破坏性规则及多元利益平衡这三个规则,可重点参考。
(五)赔偿责任认定的参考因素
根据前述数据抓取类不正当竞争案件的处理模式,损害赔偿的认定计算方式也各异,但可从现有案例提炼出以下参考因素:
(1)直接损失,如软件维修费,根据现有案例,数据抓取行为造成数据被抓取方直接损失的情形较少;
(2)间接损失,如广告收入的减少以及其他增值业务的减少。现有案例中造成被抓取方间接损失的情形较多,如数据抓取造成的流量损失间接体现在被抓取方的各项收入的减损中,但具体数额的确定以及其中的因果关系难以认定;
(3)双方的过错程度,比如数据抓取方的主观恶意、被抓取方是否采取合理的补救措施等;
(4)涉案行为的持续时间;
(5)数据抓取方适用涉案数据的方式和范围。
四、小结

从以上分析的数据抓取类不正当竞争案件裁判模式及逻辑来看,数据权益及法律适用相对明确争议不大,核心重点问题在于不正当竞争行为的认定。其中认定是否构成不正当竞争行为比较普遍适用的有实质性替代、破坏性规则及多元利益平衡这三个次级规则,但这三个规则相对自由裁量空间较大,且暗含的论证逻辑主要还是基于被诉竞争行为“为什么是不正当的”,而不是“为什么不是不正当的”,体现出一种积极干预的裁判倾向,这也一定程度解释了为什么该类案件中原告胜诉率较高。
作者简介
曾恺 合伙人
执业证号:14401201710013849
专注领域:人工智能、数字经济、跨境电商、虚拟数字货币等互联网新经济相关领域的刑民事合规及争议解决
具有大型企业、政府法制办等相关工作经历。曾经或正在为广州极飞科技股份有限公司、钱大妈农产品有限公司等多家华南地区独角兽企业提供争议解决服务及合规法律服务,包括为多家高新科技企业提供数据信息安全合规、APP合规、商业秘密保护等法律服务。在诉讼领域,先后经办处理多起涉诉标的额超五千万的重大民商事及行政诉讼案件,所经办案件曾获广州市律师协会业务成果奖等,并多次入选中国法制出版社、法律出版社等出版的典型案例集。在专业研究方面,曾获广州市律师协会理论成果奖等,在《中国律师》《广州律师》及威科先行等刊物平台发表数十篇原创专业文章。
往期回顾
*声明:本微信订阅号对所有原创、转载、分享的内容、陈述、观点判断均保持中立,推送文章仅供读者参考。本订阅号发布的文章、图片等版权归作者享有,如需转载原创文章,或因部分转载作品、图片的作者来源标记有误或涉及侵权,请通过留言方式联系本订阅号运营者。谢谢!
初审 | 品牌部
排版 | 林思容
核稿 | 朱惠婷
审定 | 杨超男




