作者 | 《财经》研究员 樊朔 编辑 | 郭丽琴
最新司法判例明确,包括数据知识产权登记证在内的数据登记证书,对权益主体和合法来源的具备初步证据效力,这为后续的数据确权、数据资产入表和交易准入提供了依据。
在一起近期审结的数据领域不正当竞争案件中,《数据知识产权登记证书》首次被司法机关认定为具备数据权益主体和数据来源合法性的初步证据效力,随即引发数据全产业链的广泛关注。
在该案件中,一家从事人工智能领域数据服务的公司——数据堂(北京)科技股份有限公司(下称“数据堂公司”)此前发现,隐木(上海)科技有限公(下称“隐木公司”)未经许可在其网站发布前者采集、转写、标注的数据集。数据堂公司认为,隐木公司非法获得了其数据集,并向公众传播,还以提供下载服务为方式诱导用户注册会员。上述行为侵害数据堂公司的数据财产权、著作权和商业秘密,同时构成不正当竞争。
在2023年12月的一审判决中,北京互联网法院判决数据堂公司胜诉,认为隐木公司的被诉行为构成不正当手段获取并披露、使用数据堂公司的商业秘密。近期,这起案件在北京知识产权法院二审审结。
在二审中,北京知识产权法院认为,隐木公司的行为未侵犯数据堂公司的商业秘密,但违反了《反不正当竞争法》第二条的规定,因此驳回了隐木公司的上诉,维持一审判决。
值得注意的是,数据堂公司在该案中提供了涉案数据集的《数据知识产权登记证书》作为初步证据,获得法院认可,本案成为涉数据知识产权登记证效力的“第一案”。
负责该案二审的北京知识产权法院法官李迎新表示,对于《数据知识产权登记证》的效力认定,为后续的界定数据资产的持有权、数据资产入表和交易准入提供了依据。
北京大成律师事务所高级合伙人陈福表示,在数据产业中,数据的采集、加工、存储、应用、交易等环节充满了复杂性和不确定性,许多纠纷往往源于数据权益的边界不清。通过在司法程序中对《数据知识产权登记证书》的认可,可以促使数据相关企业更加规范地管理和保护其数据资产,形成统一的数据登记和认证机制。这不仅可以减少因权属争议导致的法律纠纷,还可以提高数据交易市场的透明度,促进数据市场的良性发展。
隐木公司构成不正当竞争
本案原告代理律师、北京瀛和律师事务所律师钟芯表示,数据堂公司是从事AI数据服务的企业,有大量数据集合以许可方式提供给数据需求方使用,因此该公司十分关注自身数据利益保护的问题。
2021年9月,《数据安全法》生效,其中第7条规定“国家保护个人、组织与数据有关的权益”,所以钟芯向数据堂公司建议,以此契机,用隐木公司未经许可在其网站发布子集200小时数据集的侵权事件向法院提起诉讼。立案时,数据堂公司以网络侵权责任纠纷提起诉讼,经过讼辩及法庭调查,最终案由为不正当竞争纠纷。
判决书显示,2021年9月,数据堂公司在其网站发布“AI数据开源计划1505小时中文普通话语音数据”,其中说明,开源数据机器衍生产品未经允许禁止任何形式的商业用途,且公开发表展示利用数据堂开源数据的全部或部分获得的科研成果时,必须注明使用“数据堂AI数据集”或“Datatang AI Dataset”,同时注明出处。
据介绍,该1505小时数据集是数据堂中文普通话语音数据库的一部分,采集区域覆盖全国,参与录音人数达6408人,录音内容超过30万条口语句子,经过专业语音校对人员转写标注,句标注准确率达98%以上,仅支持学术研究,未经允许禁止商用。
判决书显示,隐木公司网站可以搜索到来自上述1505小时数据集的涉案200小时数据集,其详情页面载明了版权归属方为数据堂公司,且点击版权归属方下的“Datatang”可以跳转至数据堂公司官方网站。会员登录网站账号,点击“License确认”弹窗,就可以下载涉案200小时数据集。隐木公司在其网页中声明此处转载的是涉案200小时数据集,如需完整版的1505小时数据集,会员需要前往数据堂公司网站。
数据堂公司主张,隐木公司非法获得了涉案的200小时数据集,并在其官方网站向公众传播,同时以提供下载服务为方式诱导用户注册会员,从而侵害数据堂公司的数据财产权、著作权和商业秘密,同时构成不正当竞争行为。
但隐木公司辩称,数据堂公司无权依据数据财产权、著作权和商业秘密请求保护。涉案200小时数据集是一款由数据堂公司自行公开的开源数据产品,依据相关规则,隐木公司的行为符合开源协议的署名和非商业目的使用规则,不构成不正当竞争。
在一审判决中,北京互联网法院认为,隐木公司直接将涉案200小时数据集作为其网站数据产品的服务内容,向网络用户披露并提供下载链接使用,主观上存在过错,属于通过不正当手段获取以及披露、使用他人商业秘密。判决隐木公司赔偿数据堂公司经济损失10万元及其他合理维权支出。
而在二审中,北京知识产权法院认为隐木公司的行为未侵犯数据堂公司的商业秘密,但违反了反不正当竞争法第二条之规定,维持原判,驳回了隐木公司的上诉。
涉案数据集具有财产性利益
这起案件的诸多争议都指向数据财产性权益如何认定,进而施加保护等问题,也因此对数据产业具有启示意义。
这些争议包括,数据堂公司是否有权主张涉案数据财产权益?涉案数据集是否构成汇编作品?涉案数据集是否构成商业秘密?
北京知识产权法院认为,涉案数据集通过对原始数据的提炼整合,将原本单一且价值有限的碎片化数据信息通过算法分析处理,可以提升数据的使用价值,具有数据财产权益。从《民法典》和《数据安全法》等法律规定和现实利益两个层面,均可得出涉案数据集具有财产性利益需法律保护的结论。但是,《民法典》尚未将“数据”作为一种绝对财产权而规定其权利内容,在缺乏法律明确赋权的情况下,数据堂公司无权要求将涉案数据集类推适用著作权法。
此外,根据《著作权法》对于“汇编作品”的界定,尽管涉案数据集是在基础语音文件上进行编排而成,但其每个单元文件夹中的结构、分布方式、整体布局均相同,数据集在展示方式及布局编排等方面不能体现出独特构思,故涉案数据集不构成著作权法保护的汇编作品。
判决书显示,数据堂公司于2019年7月2日公开披露了涉案200小时数据集的下载渠道和训练方法,因此该数据集不构成商业秘密。
负责本案二审的北京知识产权法院法官李迎新表示,公开数据集合并不因其被公开而丧失反不正当竞争法保护的可能性。数据堂公司依托其质量高、数量大、可用于研发语音识别等人工智能技术的涉案数据集,获得了用户的关注,并开展数据交易,获得了竞争优势和经济利益,属于反不正当竞争法意义上的竞争权益。
隐木公司使涉案数据集在具有竞争关系的数据共享平台公开传播,一定程度上截取了本属于数据堂公司的用户流量,损害了其所享有的合法权益。同时,由于隐木公司提供了涉案数据集的下载服务,数据堂公司无法通过开源获得对该数据集的进一步改进建议,其数据服务研发能力受到影响。
李迎新表示,上述竞争优势、经济利益等商业利益本质上是一种竞争性权益,应属《反不正当竞争法》所保护的合法权益。
李迎新表示,隐木公司行为是否具有不当性,需要结合数据服务领域的商业道德予以判断,并非只要赋予了开源协议的数据集合,就可以不受任何限制地公开传播。
李迎新表示,法院对于数据服务领域的商业道德的判断有明确标准:
第一、在未经数据集合持有者许可的情况下,任何人均不得公开传播其付出实质性投入合法收集整理的数据集合。
第二、当数据集合持有者对数据集合开源时,使用者是否遵循了开源协议是衡量该行为是否违反数据服务领域商业道德重要考量因素。在此案中,数据堂公司在开源协议中规定了涉案数据集只能进行非商业化利用,而隐木公司的行为为其网站获取了商业优势,且无合理理由,违反了非商业化利用规则,具有不正当性。
因此,隐木公司在未经数据堂公司许可的情况下实施被诉行为,违背了数据服务领域的商业道德,损害了数据堂公司的合法权益及消费者利益,扰乱了数据服务市场竞争秩序,构成了不正当竞争行为。
数据知产证书效力为何获认定
在确认数据堂公司对涉案数据集享有财产性权益的过程中,《数据知识产权登记证书》起到了重要作用。
这也是该证书自问世以来,在司法实践中首度发挥作用。
北京大成律师事务所高级合伙人陈福表示,中国现行有效的法律并没有规定数据属于什么类型的权利,因此,在实践中很难对数据进行确权。在“数据二十条”公布后,全国各地开展了数据资产登记的实践与探索。此外,中共中央和国务院于2022年12月颁布了《知识产权强国建设纲要(2021-2035年)》。国家知识产权局于2022年11月正式确定北京市、上海市、江苏省、浙江省、福建省、山东省、广东省、深圳市等8个地方成为数据知识产权试点,从推动制度构建、开展登记实践等方面开展数据知识产权地方实践。
例如,北京市知识产权局、北京市经济和信息化局、北京市商务局、北京市人民检察院于2023年5月颁布了《北京市数据知识产权登记管理办法(试行)》(下称《北京登记管理办法》)。数据堂公司正是基于《北京登记管理办法》进行了数据知识产权登记,并获得《数据知识产权登记证书》。然而,《北京登记管理办法》仅是地方政府部门颁布的规范性文件。据此,隐木公司才对数据堂公司的《数据知识产权登记证书》提出质疑,认为该证书没有法律依据。
但陈福表示,涉案数据集通过对原始数据的提炼整合,将原本单一且价值有限的碎片化数据信息通过算法分析处理,提升了数据的使用价值,具有数据财产权益。《数据知识产权登记证书》恰恰有力地证明了数据堂公司享有该数据集相关财产性利益,在司法审判中能够作为具备初步公信力的证据使用,从而在诉讼中获得了举证的主动权。
二审判决中,《数据知识产权登记证》可作为证明数据堂公司享有涉案数据集相关财产性利益的初步证据。同时,涉案200小时数据集虽然不构成商业秘密,也不构成作品,但由于数据堂公司的技术、资金、人力、物力等的实质性投入,在原始数据上添附更多商业价值,能够满足人工智能模型研发主体对声音数据的需求,可为该公司吸引流量、带来交易机会与竞争优势等商业利益,应属反不正当竞争法所保护的合法权益。
2024年全国两会期间,民进中央副主席何志敏对媒体表示,部分地区的知识产权管理部门与司法部门已经签订数据知识产权协同保护的备忘录,将进一步加强数据知识产权证书的证明效力应用。期待相关部门继续加强协同,探索建立数据知识产权保护在线调用、证据互认、信息共享等机制,为企业维护数据权益提供了有力支持。对数据市场的意义
陈福表示,《数据知识产权登记证书》作为数据相关权益的初步证据在司法程序中的认可首先解决了数据权益证明难题。在实际的司法实践中,数据相关权益的认定往往因数据的无形性、可复制性、非排他性、非竞争性等特性而变得困难,尤其是在数据归属不明或多方共享的情况下,举证难度极大。而《数据知识产权登记证书》通过行政机关或相关专业机构的登记程序,能够提供初步证明,减少了法院在事实认定中的困难。这大大降低了当事人提供数据相关权益证据的难度,减少了争议的焦点,有利于提高审判效率。
李迎新表示,包括数据知识产权登记在内的数据登记证书既要满足国家数据流通利用的政策目标,也需要回应司法实践中发现的问题。一方面,目前因数据本身未经法律明确赋权,数据知识产权登记证书的效力存在一些争议;另一方面,数据的可信、安全也有一些不确定性,一些试点的地方在登记的过程中仅仅做形式上的审查,在这种情况下如果赋予数据登记证书所涉权益归属和数据来源合法性以不容否定的证明效力,与客观实际不符。所以,应当允许对数据知识产权登记的效力提出质疑,并给予充分制度保障。
华东政法大学教授高富平曾撰文指出,当前司法实践中对侵害数据合法权益的不当行为的制止,以及对受害者的救济可以说明,将数据权益纳入知识产权体系通过责任体制保护已是可行路径。赋予数据产品(持有者)稳定专有权,既是让其可以开启知识(产权)交易或服务、实现其价值,同时也使其可以向数据供给者支付对价或分配收益。
高富平表示,数据集的知识产权登记,或者数据产权登记都没有明确的效力规定。法院之所以将登记证书视为数据堂公司的有效证据,其实是比照著作权登记效力规则。
“在被真正的权利人推翻推定登记人享有财产权之前,我认为这种类比是可接受的。认定数据集的登记证书,具有初步的推进效率,减少了法官对其是否享有财产权的审核义务,可以提升此类案件的审判效率。”高富平说。
但高富平也认为,如果数据集的知识产权登记真的能够证明登记人享有数据集财产权,“那会是一件很了不起的事情”。但实际这类登记效力是存疑的,登记的作用是将特定的客体与主体联系起来,并公之于世。而数据集通常是持续变化和维护的状态,登记时的状态和今后证明数据持有人享有财产权时的状态可能不一致,这就导致人们对登记效力的怀疑。
高富平认为,法院在数据堂公司案中的推定,“已经是一个非常大胆的尝试”,有助于推动此类登记的开展,但是如何解决前述担忧仍是面临的难题。
据李迎新介绍,目前司法实践中对持有者的数据权益一直持积极的保护态度,这种审判导向经过了一定时期的实践和实践检验,有助于确定数据知识产权登记证的证明效力。根据“举重以明轻”的原则,在没有数据知识产权登记之前,数据持有者的权益就已经可以得到保护,在有了数据知识产权登记制度后,其理应可以作为一个初步证据证明数据持有者持有相应数据的效力。
此外,在数据知识产权登记实践中,登记机构对数据来源合法性以及数据质量进行评估。因此,法院认为现有的数据知识产权登记证书具备初步证明数据来源合法性的效力,既可以符合前述审查实际,又可以降低第三人审查数据交易合法性的成本,提高数据要素市场的活力。总而言之,本案明确了数据知识产权登记证书对权益主体和数据合法来源的初步证据效力,也为后续的数据界权、数据资产入表和交易准入提供了依据。
钟芯认为,数据知识产权登记证书首次成为初步证据有着积极意义。第一,肯定了《数据知识产权登记证》在司法上的证明效力,也就是在无相反证据的情况下,可以证明登记主体即为数据集合的合法持有人,并享有数据集合的财产性利益。第二,肯定了相关部门为保护数据利益试行的数据知识产权保护方案。第三,数据知识产权登记证可以促进数据要素流通。通过办理《数据知识产权登记证》,一方面降低了数据供给方的自证“清白”负担,另一方面降低了数据需求方审查数据来源合法的成本,有助于数据流动。