查找:                      转第 显示法宝之窗 隐藏相关资料 下载下载 收藏收藏 打印打印 转发转发 小字 小字 大字 大字
【期刊名称】 《河北法学》
论文本与数字挖掘技术应用的版权例外规则构建
【英文标题】 The Theory of Copyright Exception Rules for TDM Technology Application
【作者】 董凡关永红
【作者单位】 广东技术师范大学法学与知识产权学院{讲师,法学博士}华南理工大学法学院{教授}知识产权研究所{所长,博士生导师,法学博士}
【分类】 著作权法
【中文关键词】 文本与数字挖掘技术;版权法;版权例外;利益平衡;规则构建
【英文关键词】 text and data mining technology application; copyright law; copyright exception; balance of Interests; construction of rules
【文章编码】 1002-3933(2019)09-0148-13【文献标识码】 A
【期刊年份】 2019年【期号】 9
【页码】 148
【摘要】

数字时代背景下,文本与数据挖掘技术已然成为科研创新与丰富文化生活的重要工具。然而,在我国现行版权法框架下,文本与数据挖掘技术的应用无法通过“临时复制”“合理使用”与“版权许可协议”摆脱版权侵权的窠臼。借鉴域外的相关立法制度与司法裁判经验,并且基于我国创新发展的需要,发现将文本与数据挖掘技术的应用纳入版权例外范围有其正当性;同时,我国应当选用“有条件的允许模式”将文本与数据挖掘技术应用纳入版权例外范围。在具体构建文本与数据挖掘技术应用的版权例外规则方面,应当将合法获取版权保护信息源的主体作为“主体要件”,将“非营利性”与“用于计算分析的科学研究目的”作为“目的要件”,并允许复制与转码行为,以及确立保护权利人正当利益的具体规则。

【英文摘要】

In the digital age background, text and data mining technology has become an important tool for scientific research innovation and rich cultural life. However, under the current framework of Copyright Law in China, the application of text and data mining technology cannot get rid of the plight of copyright infringement through the following ways such as “temporary copying”,“intelligent use” and “copyright licensing agreement”. Refer to the relevant legislation and judicial precedent in foreign countries and based on the needs of China's innovation and development, we have enough legitimacy and rationality to put the application into the scope of copyright exceptions by “conditional permission model”. When constructing the copyright exception rules for text and data mining technology, the subject that obtain the copyright protection information source legally should be regarded as the “subject component ”, and the “non-profit ” and “scientific research purposes for computational analysis” should be regarded as “the purpose of the object" which should be allowed to copy and transcode.

【全文】法宝引证码CLI.A.1277246    
  
  

引论

在“样本等于数据”全数据的时代背景下,数据信息的有效挖掘与利用业已成为社会经济增长的重要支撑和推动创新发展的催化剂。因此,对多元化海量数字信息进行挖掘与分析是学习、商业应用与科研创新过程中不可或缺的组成部分。其中,“文本与数据挖掘技术”便是当代数据挖掘领域中极具代表性的新型技术性研究工具之一。基于不同视角与表达习惯,对于文本与数字挖掘技术的认知表述多有差异[1]。本文认为,文本与数字挖掘技术可以概括为“在数字环境下从大量文本数据中挖掘信息和知识发现[2]的计算机处理技术”。事实上,文本与数字挖掘技术作为创新科技的时代产物,其本质是一项复杂的自动化处理技术,蕴涵着巨大的经济价值与社会机会[3]。善用文本与数字挖掘技术可以形成高效高质的研究成果,因此该项技术被社会各主体广泛地应用于社会科学与自然科学领域,尤其在制药和生物医学研究以及市场运营领域中发挥重要的技术性工具价值{1}。

众所周知,科技产品具有“技术中立”属性。然而,在以自然人为参与主体的社会中,各社会主体使用创新技术以达成个人目的或完成阶段性目标的过程中,势必对其他社会主体的利益产生一定影响。事实上,行为人应用文本与数字挖掘技术的过程中不可避免地对海量数字版权作品发生“复制与转码”行为——可能触动和侵害版权人的利益,从而对既有版权制度所构建的利益平衡机制构成了明显的冲击和挑战。因此,亟需寻求解决文本与数字挖掘技术应用行为的版权法地位或性质问题的方案。本文主要以我国文本与数字挖掘技术应用的现实状况为基础,借鉴域外制度成果与司法实践经验,进而藉“《著作权法》第三次修法”的历史契机,探析在我国构建文本与数字挖掘技术应用的版权例外规则的正当化理由与构成要件。

一、我国版权法视阈下文本与数字挖掘技术应用情况的现实考察

现实中,文本与数字挖掘技术的采样范围主要源自受版权保护的作品与数据库(可以视为“汇编作品”)以及公有领域的数据信息。囿于文本与数字挖掘技术的特殊性,该技术在我国版权制度框架内极易引发版权侵权纠纷,进而导致社会各界质疑文本与数字挖掘技术的合法性或版权法定位。有鉴于此,本文认为有必要深度剖析文本与数字挖掘技术在我国制度语境下的实际状况,详述如下。

(一)文本与数字挖掘技术应用可能侵犯信息/数据库的复制权与改编权

一般而言,文本与数字挖掘技术可以分解为四个步骤,即增强信息检索;语言分析(实体识别);信息提取;挖掘分析数据,直至知识发现{2}。以上每一项步骤都是挖掘程序中的必要环节,当然不排除按照其他顺序形成的挖掘模式。值得强调的是,无论采用何种数据挖掘模式均需要满足两项先决要件,即对目标信息的复制与转码行为{3}。由于我国现行版权制度尚未对文本与数字挖掘技术提供明确的制度指引,因此在技术应用过程中极有可能侵犯数据信息/数据库的复制权与改编权。

首先,考察文本与数字挖掘技术可能侵犯信息/数据库复制权的主要缘由。第一,学理界与实务界认为“复制行为”须满足如下两则要件,即应当在有形物质载体上再现作品;并且作品被相对稳定地“固定”在有形载体上{4}。聚焦于数字环境中的“复制行为”,其中有一项专门指向“将作品以各种技术手段固定在芯片、光盘、硬盘和软件磁盘等媒介之上”的情形{5}。事实上,在应用文本与数字挖掘技术的过程中,挖掘系统将目标信息相对稳定地复制于服务器之中,存储的信息是由特殊计算机语言组合而成,但可以通过计算机系统达到间接读取与再现目的。第二,在对数据文本目标进行复制时,数字信息挖掘系统无法清晰辨识目标对象的权利状态。考虑到识别的经济成本过高,行为人往往不经版权人授权许可便对目标样本进行挖掘。因此,文本与数字挖掘技术中的复制行为可能侵犯版权人的复制权[4]。

其次,应用文本与数字挖掘技术可能侵犯信息/数据库的改编权。通常而言,文本与数字挖掘技术为正常识别与处理文本数据,势必对信息进行统一转码以匹配系统运行;并且,“转码”行为主要是改变、编排目标对象的表达形式,从而形成新的研究样本。与此同时,版权法意义上的“改编权”是指改变作品的表现形式,从而创作出具有独创性的新作品;原作品与改编作品的差异仅聚焦于“表现形式”层面,其实质内容是基本一致的。因此,从客观行为的表现形式与行为的内部层面的机理出发,文本与数字挖掘技术过程中的“转码行为”与版权制度范畴内的“改编行为”具有相当程度的同质性。质言之,文本与数字挖掘技术在转码过程中难以有效规避受版权法保护作品/数据库的“改编权”。

(二)文本与数字挖掘技术应用过程中所面临的多重现实困境

现实中,文本与数字挖掘技术在我国应用与发展过程中极易受到版权侵权等非技术壁垒因素的阻碍,其问题核心在于文本与数字挖掘技术无法妥适纳入我国版权例外制度之中,同时版权许可协议亦不是解决问题的适合方案。质言之,我国版权制度尚未就文本与数字挖掘技术的应用与发展作出立法回应,文本与数字挖掘技术的版权法定位尚属模糊,分述如下。

1.现实困境一:“临时复制例外”无法为文本与数字挖掘技术应用提供理论支撑

临时复制,是指数字环境下作品浏览或传输过程中所发生短暂的存储行为{6}。现阶段,国际版权法领域支持临时复制应当属于版权例外制度的意见占主导地位{7}。由此可见,当文本与数字挖掘技术应用过程中可以被“临时复制”涵盖时,那么文本与数字挖掘技术将不再受版权侵权的“苛责”。

一般而言,构成“临时复制”需要满足“时间短暂性”与“复制件不具备经济价值”两项要求。在文本与数字挖掘技术中“信息提取”阶段产生的“复制行为”无法满足“短暂性”要求,即计算机系统无法自动消除存储信息,这些固定在服务器的数据是可以被计算机所读取、再现的。另者,“信息提取”作为文本与数字挖掘技术不可分割的一部分,其形成的数据报告必然蕴涵一定的经济、科研等多元价值;质言之,基于文本与数字挖掘技术获得的成果难以有效回应“经济价值”的拷问。因此,本文认为“临时复制例外”无法为文本与数字挖掘技术提供有效规避版权侵权的论理支撑。

2.现实困境二:版权合理使用制度无法为文本与数字挖掘技术应用提供制度支撑

“临时复制例外”无法为文本与数字挖掘技术提供论理支持,但并不意味着文本与数字挖掘技术一定发生版权侵权,倘若符合“合理使用制度”的规范要求,便可以获得“特权”,使文本与数字挖掘技术的应用行为具备合法性。但是,我国现行《著作权法》的合理使用制度尚不能为文本与数字挖掘技术的合法性提供制度支撑,理由如下。

首先,实践中应用文本与数字挖掘技术的主体大抵为公司或机构,而非“个人”行为。即便是自然人个体行为,但行为背后大多有公司或机构作为支撑,并且各公司或机构为个体所发生的行为后果负责。因此,文本与数字挖掘技术大多难以无法满足合理使用制度中“为个人学习、研究或者欣赏”中的“主体要件”规范要求。其次,应用文本与数字挖掘技术将会对挖掘样本进行大量复制,并不满足我国《著作权法》“为学校课堂或科学研究允许少量复制作品”的数量要求。最后,以图书馆等公益机构为代表的特殊主体,在社会中起着信息检索、收集、整合与再传播的社会作用,但我国现行《著作权法》仅将图书馆陈列或保存藏书需要进行的复制行为视为“版权合理使用行为”,实不符合我国现阶段图书馆的社会定位,客观上阻碍图书馆应用文本与数字挖掘技术的发展空间。菊花碎了一地

3.现实困境三:版权许可协议不是有效解决文本与数字挖掘技术应用的适合方案

目前,诸多国际大型出版商认为采取“版权许可协议”的方式可以为研究人员提供便利。诚如欧洲出版商协会所言,运用“版权许可协议”既可以满足合法访问者对文本与数字挖掘技术的实际需要,也可以适当地降低侵权风险{8}。但是,本文认为“版权许可协议”不是解决文本与数字挖掘技术合法性的适合方案,理由如下。

首先,出版商基于对自身利益的考量,可能利用版权许可协议明确排除文本与数字挖掘技术应用。其次,版权许可协议的内容可能限制被挖掘内容的格式{3},如果许可协议仅允许下载而不让其转化格式,数据挖掘系统也无法顺利读取数据信息。再次,出版商可能利用版权许可协议或技术措施限制被挖掘信息的数量,那么研究者将花费较大的时间成本。例如Clark认为,出版商要求网络爬虫在连续下载文章时应保持5至10秒的间距时间,但是实际中连续下载1万篇文献时需耗时4至8个月方可完成{9}。最后,版权许可协议主要基于当事人间的合意所致,具有较强的灵活性、特殊性,反而限制文本与数字挖掘技术的广泛应用。

二、域外文本与数字挖掘技术应用版权例外的立法实践与司法判例

在以数据内容开放获取与分享作为主旋律的大数据时代背景下,鲜有国家针对文本与数字挖掘技术进行规范安排与制度回应,仅日本、英国作出直接的立法支撑[5];另者,由欧洲图书馆研究协会发起的《数字时代知识发现海牙宣言》与欧盟委员会新近通过的《欧盟数字化单一市场版权指令》(以下简称为“《版权指令》”)[6]亦针对文本与数字挖掘技术作出赋有时代感的理性回应。与此同时,在尚未对文本与数字挖掘技术进行法律确性的美国与德国,法院亦通过司法判决作出有利于文本与数字挖掘技术应用与发展的司法支撑。因此,我国有必要熟悉域外规范文本与数字挖掘技术的制度安排与裁判态度,以此作为我国制度设计的经验镜鉴。

(一)域外文本与数字挖掘技术应用版权例外的立法实践

以日本、英国和欧盟为代表的国家或区域相继对文本与数字挖掘技术应用与发展给予关注。立法者尝试从版权制度层面为文本与数字挖掘技术定性,认为在特定情形下可以将其纳入版权例外的范畴。因此,本文以日本、英国与欧盟规范文本与数字挖掘技术的制度内容为鉴,将各类规范进行比较,以揭示要旨。(详见表1)

首先,从各类规范的主体要件观察,立法者均要求是合法获取版权作品/数据库的实施者;其中,仅《版权指令》明确要求主体为“研究机构”,《版权指令》将是否包括“商业性研究机构”的选择权交由欧盟各成员国自行决定,至于日本与英国尚未对实施主体作出明确界定。其次,各类规范中目的要件不甚统一。日本强调仅限于数据信息解析目的,并不强调行为是否涉及商业利益;英国强调非商业性应用目的;然而,欧盟采用“科学研究目的”的立法措辞,关于是否包括商业性目的则留给各成员国自行决定。再次,各类规范允许的客观行为亦各具特色,英国仅允许复制行为;欧盟扩展至提取行为;日本法的客观行为甚至包括改编行为。复次,观察各类规范对文本与数字挖掘技术版权例外制度的限制性要件,日本强调文本与数字挖掘技术仅能适用于计算机信息技术分析的具体情形,而英国强调限制文本与数字挖掘技术实施后的交易行为,欧盟则未对限制条件作出明确规定。最后,英国和欧盟均支持版权例外制度可以排斥限制文本与数字挖掘技术正当应用的合意约定,即通过立法排除限制文本与数字挖掘技术正当应用的私法合意。

表1英国、日本与欧盟规范“文本与数字挖掘技术”应用的制度内容概览表

┌───┬─────┬─────┬─────┬─────┬─────┬─────┐
│国家或│制度依据 │主体要件 │目的要件 │允许行为 │限制条件 │其他情形 │
│区域 │     │     │     │     │     │     │
├───┼─────┼─────┼─────┼─────┼─────┼─────┤
│日本 │《日本著作│合法获取作│用于信息解│允许复制行│控制在必要│适用对象不│
│   │权法修正案│品的权利主│析之目的 │为、改编行│限度内:仅│局限于文本│
│   │》第47条款│体    │     │为(不包括 │限计算机信│,还包括语│
│   │(2009年) │     │     │为供信息分│息分析技术│言、审阅、│
│   │     │     │     │析者使用而│     │影像等  │
│   │     │     │     │制作的数据│     │     │
│   │     │     │     │库)    │     │     │
├───┼─────┼─────┼─────┼─────┼─────┼─────┤
│英国 │《英国版权│合法获取作│用于计算分│允许复制行│转让限制 │任何违反规│
│   │法》亲修订│品的权利主│析+单一的 │为,但须标│     │定的合同条│
│   │第29A条条 │体    │非商业性目│记出处  │     │款无效等 │
│   │款(2014年)│     │的    │     │     │     │
├───┼─────┼─────┼─────┼─────┼─────┼─────┤
│欧盟 │《欧盟数字│合法获取作│科学研究目│允许复制行│/     │任何违反规│
│   │化单一市场│品的研究机│的(商业性 │为、提取行│     │定的合同条│
│   │版权指令》│构    │或非商业性│为    │     │款无效等 │
│   │第3条款  │     │)     │     │     │     │
│   │(2018年) │     │     │     │     │     │
└───┴─────┴─────┴─────┴─────┴─────┴─────┘

(二)域外文本与数字挖掘技术应用版权例外的司法判例

在当代数字时代背景下,美国与德国法院在未有成文法或立法政策支持的前提下,通过司法裁判承认文本与数字挖掘技术的合法性。正如美国学者所言,划定版权边界的决定主体不在于立法者而是在于司法机关{10}。

1.美国法院的裁判态度:以“作家协会诉谷歌案”和“作家协会诉Hathitrust案”为例

在“作家协会诉谷歌案”中,谷歌公司推行“Google Books项目”,即将美国著名大学提供的书籍进行数字化处理,并以snippets模式向社会公众提供图书数字化检索服务。值得注意的是,文本与数字挖掘技术是“Google Books项目”的核心支撑技术。尔后,2005年9月美国作家协会对谷歌公司发起停止版权侵权诉讼,双方当事人于2009年11月达成《Google Books和解协议》[7],此种推定权利人先于授权的模式被称为“默示许可方案”。但是,该案在后续发展过程中,主审法院放弃“默示许可方案”{11}。2011年11月,纽约南区地方法院对“作家协会诉谷歌案”作出初审判决,在阐明《美国版权法》第107条所载明的“合理使用四要素”的基础上,认定“Google Books项目”具有较强的“转化性目的”——为用户提供高效且完善的文字搜索服务,从而推进创新进程,属于“合理使用”的范畴[8]。2015年12月,美国第二巡回法院维持初审法院的裁判,并补充“开展商业盈利模式不能成为构成否定‘合理使用’的绝对标准;并且‘片段检索’模式不会替代版权人的版权市场,因此不会减损版权人的实质利益”[9]。

在“作家协会诉Hathitrust案”中,Hathitrust数字图书馆允许谷歌公司对其收藏的作品进行数字化,以换取对相关电子复制品的许可使用;Hathitrust数字图书馆允许其用户在作品数据库中进行全文检索,但检索结果仅显示搜索关键词所在的页码以及在该页上出现的频率[10]。通过运用“合理使用四要素”的判别方法,初审法院认为Hathitrust数字图书馆提供卓越的检索服务不再是单纯使用作品,而是衍生出新的学术研究方法与径路,因而具有较强的“转化性目的”{12}。最终,美国第二巡回法院亦认为Hathitrust数字图书馆实施文本与数字挖掘技术行为构成合理使用[11]。值得注意的是,美国法院认为文本与数字挖掘技术具有合法性并未止于上述两则案例,而是经过多年裁判经验总结而致。(详见表2)

表2 2003—2014年美国法院支持“文本与数字挖掘技术”合法性的司法裁判概览

┌───────┬─────┬─────────────┬─────────┐
│案件名称   │判决结果 │案号           │主审法院与发布时间│
├───────┼─────┼─────────────┼─────────┤
│White诉West案 │构成合理使│Whitev. West Pub. Corp.,2│纽约州南部法院2014│
│       │用    │014WL305788512- civ -1340-│年        │
│       │     │JSR(S. D. N. Y.2014)   │         │
├───────┼─────┼─────────────┼─────────┤
│Fox诉TVEyes案 │构成合理使│Fox News Network LLC.v. TV│纽约州南部法院2014│
│       │用    │Eyes, 13 Civ.5315(AK H)(S.│年        │
│       │     │ D. N. Y.2014)      │         │
├───────┼─────┼─────────────┼─────────┤
│A. V诉iParadig│构成合理使│A. V.v.iParadigms, LLC, 56│联邦第四巡回法院20│
│ms案     │用    │2 F.3d 630,630,634(4thCi│09年       │
│       │     │r.2017)          │         │
├───────┼─────┼─────────────┼─────────┤
│Perfect10诉亚 │构成合理使│Perfect10v. Amazaon, 508 F│联邦第九巡回法院20│
│马逊案    │用    │.3D1146(9th Cir.2007)   │07年       │
├───────┼─────┼───────

  ······

法宝用户,请登录后查看全部内容。
还不是用户?点击单篇购买;单位用户可在线填写“申请试用表”申请试用或直接致电400-810-8266成为法宝付费用户。
【注释】                                                                                                     
【参考文献】

{1}宋雅馨.文本与数据挖掘的版权例外[J].电子知识产权,2017,(6):42.

{2} JISC. The Value and Benefitsof Text Mining[EB/OL].https://www.jisc.ac.uk/sites/default/files/value-text-mining.pdf, 2018-10-10.

{3}罗娇,张晓林.支持文本与数据挖掘的著作权法律政策建议[J].书馆学报,2018,(5):24,26.

{4}王迁.著作权法[M].北京:中国人民大学出版社,2015.164.

{5}王迁.知识产权法教程·第五版[M].北京:中国人民大学出版社,2016.132.装完逼就跑

{6}崔国斌.著作权:法原理与案例[M].北京:北京大学出版社,2015.384.

{7}[德]约格·莱茵伯特,西尔克·冯·莱温斯基.万勇,相靖译. WIPO因特网条约评注[M].北京:中国人民大学出版社,2008.59.

{8} European Publishers Council. Copyright Enabled on the Network [EB/OL].http://www.leru.org/files/general/EPC%20Copyright%20Vision%202014_final.pdf, 2018-10-19.

{9} Jonathan Clark. Text Mining and Scholarly Publish[EB/OL].http://publish ingresearchconsortium.com/index.php/prc-documents/prc-guides-1/4-prc-text-mining-and-scholarly-publishin-feb-2013/file, 2018-10-10.

{10}张陈果.解读“三步检验法”与“合理使用”[J].环球法律评论,2016,(5):10,12.

{11}唐思慧.大数据环境下文本和数据挖掘的版权例外研究[J].知识产权,2017,(10):111-112,112-113,116.

{12}万勇,刘永沛.伯克利科技与法律评论:美国知识产权经典案例年度评论(2013)[M].北京:知识产权出版社,2016.17.

{13}董凡.竞争法视域下标准必要专利禁令救济滥用行为的司法适用问题[J].理论探索,2019,(2):109.

{14}杨建学.合理使用制度在网络环境下的困惑或出路[J].河北法学,2008,(4):141.

{15}詹艳.版权扩张:文化商品与文化全球化[J].河北法学,2013,(6):172.

{16}冯玉军.新编法经济学[M].北京:法律出版社,2018.107.

{17} Martin Senftleben, Bridging the Differences Between Copyright’s Legal Traditions-The Emerging EC Fair Use Doctrine ,57 J. Copyright Soc’y 521(2010).p.522.

{18}熊琦.著作权合理使用司法认定标准释疑[J].法学,2018,(1):182;朱理.著作权的边界[M].北京:北京大学出版社,2011.204-206.

{19}徐轩,孙益武.英国数据挖掘著作权例外条款研究及其启示[J].图书馆建设,2015,(9):116.

{20}孟兆平.比较与选择:互联网环境中作品复制权的重构——以临时复制为视角[J].河北法学,2015,(5):97.

©北大法宝:(www.pkulaw.cn)专业提供法律信息、法学知识和法律软件领域各类解决方案。北大法宝为您提供丰富的参考资料,正式引用法规条文时请与标准文本核对
欢迎查看所有产品和服务。法宝快讯:如何快速找到您需要的检索结果?    法宝V5有何新特色?
扫码阅读
本篇【法宝引证码CLI.A.1277246      关注法宝动态:  

法宝联想
【相似文献】

热门视频更多