数据爬取“实质性替代要件”:新指导案例与新《反法》数据权益专条的取舍之争

发布时间:2025-10-09

文 | 沈澄 汇业律师事务所 合伙人

2025年8月28日,最高人民法院首次发布数据权益司法保护专题指导性案例(第47批,指导性案例262-267号,下称“指导案例”),积极回应了数据权属认定、数据产品利用、个人信息保护等社会高度关注的问题,为数据爬取行为提供了重要的裁判指引。

2025年6月27日《反不正当竞争法》(下称“《反法》”)修订通过,新增第十三条第三款对侵害数据权益的不正当竞争行为作出专门规定。新《反法》即将于2025年10月15日起施行。

立法革新、司法创新,探析数据爬取的合法性边界具有更有力的依据和更重要的实践意义。

本文特别关注262号案例中引申出来的“实质性替代要件”,从正反两个方面分析其作为合法性界限的实践要点,同时评判新《反法》在现有规范层面所能“容纳”的构成要件及其实践张力。

1.新《反法》未规定实质性替代要件

第262号指导案例“某科技有限公司诉某文化传媒有限公司不正当竞争纠纷案”的裁判要点是:

网络平台经营者在其对数据集合形成的经营性利益受到侵害时,可以请求人民法院依法保护。对于未经许可获取并向公众提供相关数据,实质性替代网络平台产品或者服务,扰乱市场竞争秩序、损害网络平台经营者或者其他权利人合法权益的行为,人民法院可以适用《中华人民共和国反不正当竞争法》有关规定,认定构成不正当竞争行为。

根据该要点,可以归纳出最高院指出的“集合数据”类数据爬取行为的要件为:未经许可获取+实质性替代产品或服务+三元利益损害。但是,正如笔者曾经在新《反法》出台之日的解读文章中“威科先行|万字解读《反不正当竞争法(2025修订)》的13个重难点”中所指出的那样,《反法》第13条3款中规定了“合法持有”+“技术管理措施”=“不得非法抓取”的思路进行了规范,但没有将此前在典型案例中曾经广受关注的“同质化替代”/“实质性替代”要件纳入,这就留下了是否仍然需要以数据爬取行为造成“实质性替代”作为判断要件的争议。[1]而这个争议似乎随着第262号指导案例的出台大结局了?

我们认为,事情并没有这么简单。

2. 实质性替代要件由来已久

根据第262号案件的法院观点,该案中,“某文化公司未经许可,抓取搬运案涉数据集合中大量用户信息、短视频和用户评论在乙APP使用,导致乙APP与甲APP内容高度同质化,网络用户不使用甲APP,通过乙APP也可观看相同内容,实质性替代了某科技公司经营的甲APP产品和服务。由此,某文化公司抓取搬运案涉数据,并在乙APP使用的行为,损害了某科技公司的经营性利益”。

例如,在“大众点评与百度上诉”案(上海知识产权法院市浦(2015)沪73民终242号)中,法院认为,“百度公司在使用来自大众点评网的评论信息时,理想状态下应当遵循“最少、必要”的原则,即采取对汉涛公司损害最小的措施……而百度公司在百度地图和百度知道产品中大量使用来自大众点评网用户的评论信息,已对大众点评网构成实质性替代,这种替代必然会使汉涛公司的利益受到损害。

又如,在“饭友APP抓取微博数据”案(北京知识产权法院(2019)京73 民终2799号)中,法院认为,“基于正常的阅读习惯,明星粉丝用户在饭友APP中浏览完相关内容后再回到新浪微博查阅相关内容的概率很低……因此,就涉案92个明星微博而言,饭友APP已对新浪微博构成实质性替代,并结合其他论点综合分析得出结论认为复娱公司抓取新浪微博数据并在饭友APP中进行展示的行为妨碍、破坏了新浪微博的正常运行,进而构成互联网不正当竞争行为。”[2]

类似案件还有很多,因此从司法实践来看,该要件确实具备一定的典型性。但是问题在于,司法实践已经形成了足够的普遍性并足以形成立法规则吗?

3. 适用实质性替代要件在立法进展中的“三进三出”

(1)部门规章的一进一出

2021年8月,国家市监总局曾经就规范数据爬取问题纳入了《禁止网络不正当竞争行为规定(征求意见稿)》(下称“《网络竞争规定》(意见稿)”)的第20条,“经营者不得利用技术手段,非法抓取、使用其他经营者的数据,并对其他经营者合法提供的网络产品或者服务的主要内容或者部分内容构成实质性替代,或者不合理增加其他经营者的运营成本,减损其他经营者用户数据的安全性,妨碍、破坏其他经营者合法提供的网络产品或者服务的正常运行”。

在这版规则里,国家市监总局将“实质性替代”要件与“妨碍正常运行”要件作为互相并列的结果要件,任一要件构成都视为损害后果发生。

2024年5月,该征求意见稿正式成文后的《网络反不正当竞争暂行规定》第19条规定为“经营者不得利用技术手段,非法获取、使用其他经营者合法持有的数据,妨碍、破坏其他经营者合法提供的网络产品或者服务的正常运行,扰乱市场公平竞争秩序”。

可以看到,该规定在成文法层面删去了“实质性替代”要件,这是国家市监总局在部门规章层面的第一次纠结。

(2)司法解释的一进一出

与国家市监总局同时,2021年8月18日,最高人民法院发布《关于适用〈中华人民共和国反不正当竞争法〉若干问题的解释(征求意见稿)》(下称“《反法司法解释》(意见稿)”)。其中第26条1款规定,“经营者违背诚实信用原则和商业道德,擅自使用其他经营者征得用户同意、依法收集且具有商业价值的数据,并足以实质性替代其他经营者提供的相关产品或服务,损害公平竞争的市场秩序的,人民法院可以依照反不正当竞争法第十二条第二款第四项予以认定。”

最高人民法院并没有纠结太久,在约半年后的2022年3月16日,正式发布《反法司法解释》,其中干脆就没有再规定数据爬取的条款。

这一点,笔者当时即评析认为,“数据爬取”的行为正当性边界仍然复杂,数据主体存在多样性,数据权利的归属至今在理论界仍然存在巨大的分歧,数据控制者权、企业数据权、大数据有限排他权、企业数据知识产权等等观点不一而足。……所谓的“同质化替代”“商业道德认定”等要件似乎将“数据爬取”问题肢解的七零八落,令经营者和裁判者无所适从。从现实的情况看,对于“数据爬取”行为进行个案解决是比较妥善的做法,现阶段形成一个普适性的裁判规则可能尚不成熟。[3]

可以看到,在这次指导案例之前,最高人民法院在法律续造时的尝试与克制。

(3)基本法的一进一出

2022年11月22日,国家市监总局起草发布了《反法》(修订草案征求意见稿)(下称“草案意见稿”),剑指对数字经济领域不正当竞争的规范。

其中,第18条极具魄力地新增了数据保护专条,“经营者不得实施下列行为,不正当获取或者使用其他经营者的商业数据,损害其他经营者和消费者的合法权益,扰乱市场公平竞争秩序:(一)以盗窃、胁迫、欺诈、电子侵入等方式,破坏技术管理措施,不正当获取其他经营者的商业数据,不合理地增加其他经营者的运营成本、影响其他经营者的正常经营;(二)违反约定或者合理、正当的数据爬取协议,获取和使用他人商业数据,并足以实质性替代其他经营者提供的相关产品或者服务;(三)披露、转让或者使用以不正当手段获取的其他经营者的商业数据,并足以实质性替代其他经营者提供的相关产品或者服务;(四)以违反诚实信用和商业道德的其他方式不正当获取和使用他人商业数据,严重损害其他经营者和消费者的合法权益,扰乱市场公平竞争秩序。”

很显然,在这版规则里,国家市监总局再次按照《网络竞争规定》(意见稿)的思路,将“实质性替代”要件与“妨碍正常运行”要件作为互相并列的结果要件,任一要件构成都视为损害后果发生。

而在最终成文定稿的《反法》里,该要件仍然被删除了。

至此,我们看到了该要件的第三次“进出”。从这三进三出里,我们不难看到立法者的艰难取舍和立法进程的螺旋前进。

那么,这种进出之间的纠结根源问题到底出在哪里了?第262号指导案例中的“实质性替代要件”是否可以视为是对还未生效但即将生效的《反法》提前进行的法律续造呢?

4. 适用实质性替代要件的问题和难点

(1)难点之一:“部分替代”问题

就数据爬取的实施结果而言,并不一定会发生全量爬取或者全部替代结果。

比如,从事体育服饰贸易的A公司对即时社交平台B平台的部分用户浏览数据进行爬取以改善用户画像,这种时候A公司可能仅实施了部分数据爬取。对于B平台而言,可能仅在较小的体量上出现了数据流失和部分替代的结果,是否有必要给予否定性评价。

(2)难点之二:“不可量化”的定量问题

和难点之一正好相反,如果部分替代能够得到认定,至少在数据量的层面有一个关于到底有多少数据被非法爬取以及该部分数量是否很多以至于要给予否定评价的可能,这就意味着这时候的“实质性替代”可以实现定量。

但是实际情况是,在大多数案件中,判断标准存在很大的主观性。实质性替代的判断往往需要综合考虑多方面因素,具有一定的主观性和不确定性。不同法院对类似行为可能得出不同结论,甚至是无法对“实质性”做一个定量分析的,多少比例的替代构成实质性替代有较高的论证难度。

(3)难点之三:“替代”vs“补充”“促进”的定性

实践中很难避免的一个现象是,法院或者行政执法机构并不能很好地区分“信息聚合”与“功能替代”之间的关系。某个涉诉数据爬取行为如果对被爬取平台造成了一定影响,但极大地提升了消费者福利和社会整体效益,在《反法》三元利益均衡考察的理念下,这种提供消费者选择的爬取行为到底属于一种有利的“补充”还是“替代”呢?

实际上,我们认为,有一定共识的是,对AI训练、学术研究等“非商业替代”情形,应降低禁止强度。这种思路体现了反不正当竞争法保护竞争而非竞争者的理念。

(4)难点之四:开放vs封闭的理念之争

有效的数据爬取在某种程度上是互联网开放性和互联互通精神的体现,也是促进市场竞争和技术创新的重要手段。过于严格地适用实质性替代标准,可能会阻碍正当的市场竞争和技术进步。

实际上,同一批的第263号指导案例“某网络信息技术有限公司诉某信息科技有限公司不正当竞争纠纷案”的裁判要旨就体现了这一点,这也是中央“数据二十条”提出“充分保护数据来源者合法权益,推动基于知情同意或存在法定事由的数据流通使用模式,保障数据来源者享有获取或复制转移由其促成产生数据的权益”的要义所在。

结语

总的来看,难点和问题的存在也给特定场景的数据爬取行为的正当性留足了转圜余地。甚至从某种程度上来说,这些难点和问题可能也恰好可以成为爬取方的合理抗辩事由。从预防将来可能的争议出发,在经营者的管理工作中应该预备好关于数据相似度、功能替代度、市场影响力、投入成都、创新影响等5类信息的存证与合规建设。

脚注:

[1] 沈澄:《万字解读<反不正当竞争法(2025修订)>的13个重难点》,威科先行。

[2] 赵丹、沈澄:《数据爬取不正当竞争纠纷的司法审查要素考察与反思》,载《科技与法律》2023年第2期。

[3] 沈澄:《弦外之音:关于<新反法司法解释>未予解释若干问题的解释》,汇业评论。


返回列表