知产力,为创新聚合知识产权解决方案

建议著作权法修法将文本挖掘行为纳入合理使用的情形

——兼评《著作权法修正案草案(二次审议稿)》第24条第1款第6项
2020-09-02 20:22 · 作者:吴青   阅读:4897

——兼评《著作权法修正案草案(二次审议稿)》第24条第1款第6项


原标题 | 文本挖掘的著作权研究
作者 | 吴青  浙江大学光华法学院
编辑 | 布鲁斯



01

问题的提出


随着大数据、人工智能等技术的迅猛发展,利用文本挖掘技术对文本进行信息提取研究,[1] 用于分析药物对疾病的治疗规律,[2] 发现布局性的环境隐患和结构性的环境风险等应用场景,[3] 为新时代经济增长和社会进步提供助力。然而,文本挖掘存在侵犯著作权的法律风险。文本挖掘的对象可能是受著作权法保护的文字作品,也可能是不受著作权保护的时事新闻等。若是前者,文本挖掘可能侵犯文字作品的复制权、改编权、署名权等著作权。即使是为科学研究的文本挖掘行为,可能因为海量复制文字作品而不属于现行《著作权法》为科学研究“少量复制已经发表的作品”的情形,[4] 或《著作权法修正案草案(二次审议稿)》的为科学研究“翻译、改编、汇编、播放或者少量复制已经发表的作品”的情形。[5] 对此,有学者借鉴欧盟《数字化单一市场版权指令》提出科学研究的文本挖掘合理使用,[6] 但是没有对著作权许可和法定许可两种方式进行讨论和比较。本文将文本挖掘对象限于受著作权法保护的文字作品,讨论著作权许可、法定许可和合理使用三种可能路径,阐述不同路径的优缺点后,建议我国著作权法修改将文本挖掘行为纳入合理使用的情形。



02

著作权许可


正如著名民法学者王利明提出,在法律体系形成后,法治建设的重心不再是解决无法可依的问题,而是法律应当如何有效适用的问题。[7] 面对新技术文本挖掘带来的著作权侵权风险的问题,本文首先检视现有著作权法框架下的可能路径,在现有法律确实无法解决问题时,再进行立法论上的探讨。


利用文本挖掘计算如何有效利用资源时,使用他人受著作权法保护的作品,首先应该考虑通过市场交易获得著作权许可的可能性。这既是著作权作为财产权的应有之义,亦是对作品创作进行经济性补偿以激励创作者积极性的主要途径。欧盟就文本挖掘的著作权问题组织著作权人出版商和使用者之间进行对话会,并以出版商承诺为非商业科学研究提供必要的著作权授权结束。[8] 根据我国著作权法,使用他人作品应当同著作权人订立许可使用合同,除非规定可以不经许可。[9] 文本挖掘可能全文复制他人文字作品进行信息挖掘,不属于明文规定的合理使用或法定许可的情形,[10] 因此挖掘前应当获得相关文字作品的著作权授权。欧盟对于非科学研究目的的文本挖掘的著作权限制可以通过合同另行约定。[11]


诚然,著作权许可的路径有利于保障著作权人就其作品获得许可费用等经济回报,但是文本挖掘通常需要海量文本,可能因为交易成本过高而无法实现。英国最大的医学基金威尔康基金会曾以文本挖掘“疟疾”为例,发现英国自2000年至2011年间发布了15757篇文献,其中7759篇需获得著作权授权。[12] 经估算,为获得前述授权,需花费9个月左右时间和18630磅(约合人民币16.4万元)。[13] 这对于经济实力强劲的大型企业或科研机构而言,可能尚能承受。但是对于大部分小微企业而言,如此高昂的著作权交易成本可能足以让其望而却步。因此,通过相对人自行达成著作权许可,对于文本挖掘可能交易成本过高,不利于鼓励文本挖掘的广泛应用。



03

  法定许可


文本挖掘需要使用海量作品,这一点与编写教科书汇编已经出版的作品[14]  或广播电视播放已经出版的录音制品 [15] 有一些相似之处,或许可以考虑法定许可的路径。对于著作权人非常分散,而使用人又需要使用大量的作品时,为节约交易成本,法定许可允许使用人可以不经著作权人许可,按照规定支付报酬后使用作品,除非著作权人事先声明不许使用。欧盟对科学研究以外的文本挖掘为法定许可,并且此时文本挖掘行为主体不限于科研机构,但是可以通过合同排除适用。[16]


对于文本挖掘而言,其若能作为法定许可的情形,行为人只需要按照规定支付一定的报酬(规定报酬通常比单独协商低),而不用担心事先获得著作权人授权,既能降低著作权交易成本,又一定程度上保障著作权人获得报酬。但是,前述理想可能因为著作权人事先声明不许使用而落空。相较于教科书使用作品能够带来知名度和社会认可,文字作品用于文本挖掘,其作者和作品名称等信息通常不会出现在最后的成果中,对于文字作品的著作权人可能激励不大。


同时,对于文本挖掘行为而言,法定许可带来的行政管理成本亦不应忽视。我国教科书法定许可制度的实施效果也并不理想,使用者没有履行向作者支付报酬的情况非常常见,通过集体管理组织转付也带来许可公示备案等问题。[17] 与此相似的是,美国版权法虽然规定音乐作品制作录音的法定许可和费用标准,但是大多数唱片公司认为法定许可规定的支付手续过于麻烦,仍然向音乐作品权利人的代理机构申请著作权许可。[18]


因此,通过将文本挖掘行为纳入法定许可的范围,可能面临作者或著作权人因为没有署名利益而事先声明不许使用而落空,也可能因为管理成本可能过高而收效甚微。



04

  合理使用


若文本挖掘为合理使用情形,直接降低甚至免除著作权许可的费用和协商成本。我国现行《著作权法》第22条和《著作权法修正案草案(二次审议稿)》第24条规定了十余种情况下使用作品,可以不经著作权人许可,不向其支付报酬,但在指明作者姓名或者名称、作品名称后,直接使用作品。若文本挖掘为合理使用,那么文本挖掘主体在指明作者姓名和作品名称外,不需经著作权人许可或支付报酬。这对于文本挖掘行为而言具有明显的好处,即直接降低甚至免除著作权许可的费用和协商成本。


同时,文本挖掘行为不影响作品的阅读欣赏或者出版发行。现行《著作权法》和《著作权法修正案草案(二次审议稿)》明确规定为科学研究使用的作品,不得出版发行。因此,即使研究人员复制和存储海量的文字作品,其依照著作权法不得出版或发行,并不影响著作权人就其作品的正常的发行行为。而且,文本挖掘形成的作品,通常无法看出其作为数据来源的文字作品的身影,因此不会对原作品形成市场替代而严重损害著作权人合法利益,反而有利于促进经济增长和社会发展。


欧盟《数字化单一市场版权指令》对科学研究的文本挖掘规定为合理使用情形,但是限于非商业性的科学研究的文本挖掘行为。[19] 美国联邦第二巡回上诉法院曾判决谷歌图书馆项目为文本检索目的的全文复制构成合理使用。[20] 其中,谷歌图书馆项目和谷歌图书项目虽然未经版权人许可全文复制上千万册图书,向公众提供全文关键词检索,检索可以获得关键词的出处、上下文、频率等信息。[21] 法院认为,此种文本检索功能亦提供了新的研究手段,即文本挖掘和数据挖掘,属于转化性合理使用。[22]


著作权人可能认为,文本挖掘行为已经“不合理地损害其合法利益”。[23] 尤其是掌握海量文字作品的数据库,对于文本挖掘行为可能无法容忍,且对于文本挖掘复制和存储的海量文字作品可能泄露后在市场上流通,严重损害其作为数据库的合法利益,感到担忧。例如,中国知网明确限制每台电脑每天限制下载300篇文献。[24] 诚然,数据库对作品的文本挖掘具有法律利益。但是,数据库对作品的控制,容易过度限制作品的传播与使用,可能阻碍新兴技术对作品的利用,最后损害社会公共利益。



05

    结    论


对文本挖掘行为而言,著作权法上可能存在著作权市场交易、法定许可和合理使用三种路径。著作权交易保障了著作权人控制作品使用的利益,但可能因为交易成果过高而限制文本挖掘。法定许可在一定程度上保障著作权人获得报酬的利益,但可能因为作者事先声明不许使用而被排除。合理使用直接免除文本挖掘关于著作权许可的费用和协商成本,虽然可能一定程度上损害著作权人的利益,但是有利于新兴技术服务于经济增长和社会进步的公共利益。



注释(上下滑动查看):

[1] 文本挖掘(text mining),亦被称为文本中的知识发现,是从海量文本中发掘隐含的、具有潜在价值的知识(如规则、趋势),其过程通常包括全文复制文本并对文本进行数字化等步骤。参见徐德金、张伦:《文本挖掘用于社会科学研究:现状、问题与展望》,《科学与社会》2015年03期。

[2] 参见王妍等:《利用文本挖掘技术分析慢性盆腔炎的用药规律》,《中国实验方剂学杂志》 2012年 09期。

[3] 参见张伦、钟智锦、毛湛文:《基于文本挖掘的公共事件分析(2012—2014)——类别、涉事者、地理分布及演化》,《国际新闻界》2014年11期。

[4] 《著作权法》第22条:“在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名、作品名称,并且不得侵犯著作权人依照本法享有的其他权利:……(六)为学校课堂教学或者科学研究,翻译或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行。”

[5] 《著作权法修正案草案(二次审议稿)》第24条第1款第6项。

[6] 参见唐思慧:《大数据环境下文本和数据挖掘的版权例外研究》,《知识产权》2017年9期;王进:《欧盟

[7] 参见王利明:《论法律解释之必要性》,《中国法律评论》2014年02期。

[8] See Shaping Europe’s digital future, A Statement of Commitment by STM publishers to a roadmap to enable text and data mining (TDM) for noncommercial scientific research in the European Union (American Chemical Society, British Medical Journal Publishing Group Ltd, Brill Publishers, Elsevier BV, Georg Thieme Verlag KG, Hogrefe Verlag GmbH & Co. KG, etc.) https://ec.europa.eu/digital-single-market/en/news/licences-europe-stakeholder-dialogue (last visited August 30, 2020).

[9] 《著作权法》第24条第1款:“使用他人作品应当同著作权人订立许可使用合同,本法规定可以不经许可的除外。”

[10] 《著作权法》第22条和第23条。

[11] See Quintais, João, The New Copyright in the Digital Single Market Directive: A Critical Look (October 14, 2019). European Intellectual Property Review 2020(1) (Forthcoming). Available at SSRN: https://ssrn.com/abstract=3424770 or http://dx.doi.org/10.2139/ssrn.3424770 (last visited August 30, 2020).

[12] See Diane McDonald & Ursula Kelly, The Value and Benefits of Text Minin, https://www.webarchive.org.uk/wayback/archive/20140613220103/http://www.jisc.ac.uk/reports/value-and-benefits-of-text-mining (last visited on August 30, 2020).

[13] See id.

[14] 参见《著作权法》第23条。

[15] 参见《著作权法》第44条。

[16] See Article 4, Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC, OJ L 130, 17.5.2019, p. 92–125; Quintais, João, The New Copyright in the Digital Single Market Directive: A Critical Look (October 14, 2019). European Intellectual Property Review 2020(1) (Forthcoming). Available at SSRN: https://ssrn.com/abstract=3424770 or http://dx.doi.org/10.2139/ssrn.3424770 (last visited August 30, 2020), at 10.

[17] 参见人民网,《

[18] 参见司法文明协同创新中心网站,刘家瑞:《论美国数字音乐版权制度及启示》,http://www.cicjc.com.cn/zh/node/10070,最后访问日期2020年8月30日。

[19] See Article 3, Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC, OJ L 130, 17.5.2019, p. 92–125.

[20] See Authors Guild v. Google, Inc., 804 F.3d 202, 209 (2d Cir. 2015).

[21] See Authors Guild v. Google, Inc., 804 F.3d 202 (2d Cir. 2015).

[22] See Authors Guild v. Google, Inc., 804 F.3d 202, 209 (2d Cir. 2015).

[23] 参见《著作权法修正案草案(二次审议稿)》第24条。

[24] 参见中国知网,《产品使用》,https://service.cnki.net/helpcenter/Html/detail_5_0.html?randomNum=421,最后访问日期2020年8月30日。



(本文仅代表作者观点,不代表知产力立场)


  • “江小白”赢了(附最高法再审判决)

    近日,备受关注的重庆江小白酒业有限公司(下称江小白公司)与重庆市江津酒厂(集团)有限公司(下称江津酒厂)之间的“江小白”商标之争有果,最高人民法院一锤定音,“江小白”商标属于江小白公司。
  • 康信视点|浅析商业秘密保护与专利保护的关联性

    识产权中所涉及的工业产权中,以专利权最被人熟知,而每位权利人在获得专利权之初,除了如何申请专利之外,在权利人选择专利保护之前也通常在商业秘密和专利保护之间徘徊,所以对于专利代理人来说,在日常的咨询业务中也会经常面对客户的这类问题,基于此通常专利代理人会向客户解释专利保护和商业秘密的区别,如何界定商业秘密和潜在的专利申请,以及如果选择商业秘密后如何与专利保护相关联,因此商业秘密如何与专利保护相关联。
  • 重磅发布 | 2017年知识产权诉讼实务大数据观察榜TOP10

    由知产力与IPRdaily联合推出的2017知识产权诉讼实务大数据观察榜TOP10正式发布!本次活动秉持客观、公正的原则,旨在对2017年度我国知识产权代理服务行业进行回顾与总结。
  • 北京市高级人民法院侵害著作权案件审理指南

    4月20日,北京市高级人民法院发布《侵害著作权案件审理指南》(下称《审理指南》)。《审理指南》共计2万余字、十一章,内容包括基本规定、著作权权利客体、权利归属的审查,侵害著作人身权、财产权、邻接权的认定,抗辩事由的审查,法律责任的确定,侵害信息网络传播权、影视作品著作权、计算机软件著作权的认定等。 《审理指南》规定,审理侵害著作权案件,在行使裁量权时,应当加大对著作权的保护力度,鼓励作品的创作,
  • 美方发布对华“301条款”调查征税产品建议清单 外交部等回应(附完整清单)

    美国东部时间2018年4月3日下午(北京时间4日凌晨),美国贸易代表办公室(USTR)发布了对华“301条款”调查征税产品建议清单(完整清单可点击文末“阅读原文”查阅),美方声称此举是为了应对中国所谓“有关强制美国技术和知识产权转让的不公平贸易行为”。这一举动将可能使中国出口至美国的多种产品受到影响。