而在国外,有关数据竞争的争议已经延伸至反垄断领域。2017年6月,数据分析公司hiQ向加州北部法院提起诉讼,主张Linkedin拥有市场支配地位,推动法院于8月份发出临时禁令,要求Linkedin在24小时内容移除引人妨碍hiQ获取其公开数据的技术障碍,目前此案并未审结。在此之前,2016年在评估批准微软公司收以260亿美元收购LinkedIn的交易时,欧盟委员会重点关注领英的数据价值以及对手网站是否可以复制这些数据等问题。

数据保护与数据流动存在先天冲突

数据本身是一个复杂、模糊与开放的概念,本文无意对其进行清晰界定,其实,数据大体与作为知识产权客体的知识产品具有相似特性。物理上的无形性与可传输性,经济学上的非竞争性与非排他性,这些特性使得数据同多数知识产品一样,可以进行法律拟制的财产权保护与无损的数据流动。

事实上,基于商业竞争的考虑,具有数据优势的平台倾向于将“数据”资源作为竞争优势在自有体系与合作伙伴之间流动,有学者认为这可能会产生数据拒绝交易和歧视对待的问题,但于竞争政策的视角去讨论可能更加复杂。不管是因为,基于既有的若干判例,如新浪诉脉脉案与大众点评诉百度案,法院明确承认,数据平台对于平台内的信息具有一定的控制权,即使在现阶段是否赋予其“劳动成果权”还存有一些争议。还是因为,互联网与数据反垄断问题本身就是一个在现阶段很难明确,并需要谨慎对待与慎言的问题。

分析既有的争议,我们发现,数据竞争不仅仅是一个上游之治的问题,除了诸如华为magic读取用户微信聊天信息的争议外,顺丰与菜鸟关于物流数据API接口的争议则发生在同阶平台之间,而新浪微博与脉脉、新浪微博与今日头条的争议则反映了后进入市场者对既有平台海量数据的垂涎。“罗马不是一日建成的”,数据平台方的数据优势建立需要长期的成本投入,其他市场竞争者在未获数据平台方授权的情况下,非法抓取平台数据,直接触及对方核心商业资源,显然不妥。

北京知识产权法院张玲玲法官在新浪诉脉脉案提出了数据流动与使用的三重授权原则,也即平台之间的数据流动(Open API模式)需通过“用户同意+平台同意+用户同意”的模式,较为周延的平衡了用户与平台利益保护以及数据流动的关系。事实上,因为平台数据多涉及用户隐私、数据安全、消费者利益以及平台利益等问题,数据平台方可以通过平台协议、robots协议、API限制以及技术保护措施等手段控制、限制数据合作与数据保护的范围与方式。数据抓取方如未获授权,则必然动辄得咎,除了行政与民事风险,甚至面临刑事风险。

竞争关键在于公共领域的研究

当前数据争议的核心在于,我们是否要为数据赋权?以及,我们需要什么样的“数据权”?在此问题讨论前,我们借用Jessica litman教授在在论述版权法制度的经典表述,私以为,“公共领域才真正是“数据权”法的前提和基础,离开了公共领域,人类根本无法容忍“数据权”制度的存在。”那么,我们讨论数据赋权以及“数据权”范畴设定的关键就变为,“数据权”的公共领域是什么?我们反其道而行之,可以打开通往“数据权”制度的一扇“后窗”,借此窥探“数据权”的边界,以有效平衡用户、数据平台、数据使用方以及其他参与方与社会利益的关系,并基于用户权利、公共利益与竞争政策的协调为数据定章立规。 当前,欧美等国家与地区均在探索建立数据产权与流动规则。基于用户权利考虑,隐私权利、用户遗忘权、数据可携权、数据安全等在国内外立法实践中均有讨论,并已分别在GDPR(General Data Protection Regulation,欧盟通用数据保护条例)、《网络安全法》《民法总则》等国内外立法中有所体现。基于公共利益考虑,我们认为政府公共数据、自然气象数据、医疗数据等关系国计民生福利的数据在产权设定与流动使用应更多考虑社会福利与公民福祉。而基于竞争政策考虑,为了防范市场失灵,除了在反不正当竞争领域的司法探索外,我国应重点研究建立“数据权”的限制与例外制度,当然,我们首先要考虑数据是否可以成为市场力量的来源?不同数据类型、不同产业领域,以及不同竞争主体间的特定行为是否在竞争减损方面有所区别,以及此类竞争减损与效率促进之间如何平衡,以及如何救济。至于在数据经济驱动下的网络效应评估、相关市场界定、市场支配力衡量,甚至于反垄断理论更新等问题,研究工作任重而道远。

此外,近期关注两个问题,其实与“数据权”公共领域问题的研究关系密切。

其一,“数据权”设定的有效路径是什么?我国《民法总则》征求意见稿的最初文本将“数据信息”一体纳入“知识产权”进行保护,后遭多数专家反对,最终全国人大将数据信息与虚拟财产单列进行财产概括性保护,这是我国立法在“数据权”设定方面的谨慎尝试,也反应了数据与知识产权的复杂关系。其实,知识产权在诸多学术著作中被表述为“信息产权”。而从域外经验来看,早在1992年,欧盟委员会通过《数据库指令草案(Commission Proposal for a Council Directive on the Legal)》确立了数据库权(database right)。数据库权衍生于版权体系,以保护实质投资为目的,赋予数据库控制者对抗它人对数据库内容提取的排他权利,并存在着若干平衡性安排,如对合法利用人的非实质性部分的提取或再利用行为进行限制性排除,并规定了若干“法定许可”,虽存争议,但仍可为借鉴之有益经验。私以为,借鉴“数据库权”模式可以解决多数的与“数据权”相关的财产性权益争议。

其二,用户同意与平台协议的关系,也即在未经数据平台方同意,甚至是平台协议反对的情况下,第三方仅获用户授权,能否大批量、自动化抓取用户已在数据平台方发布的数据内容。今年8月9日,今日头条突然开始通过用户授权直接把新浪微博的内容自动搬家到今日头条。面对大量用户与数据溢出的情况,新浪坚决切断了与今日头条的内容接口,并在海淀区法院立案起诉,此案尚未审结。私以为,即使搜索引擎与抓取技术中立,但从技术伦理与商业伦理角度,此类行为的规制应在技术创新与数据平台方激励之间寻求平衡。新浪在微博用户数据的整个生命周期中持续投入,如新浪法律专家王磊所言,“数据的集体涌现性使得“大数据”出现了系统组成前单个要素所不具有的性质”,平台为数据赋能,法律保护应有所倾斜。

此问题的讨论并未结束,才是刚刚开始。

484