人工智能训练与开发中著作权侵权问题研究_第1页
人工智能训练与开发中著作权侵权问题研究_第2页
人工智能训练与开发中著作权侵权问题研究_第3页
人工智能训练与开发中著作权侵权问题研究_第4页
人工智能训练与开发中著作权侵权问题研究_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能训练与开发中著作权侵权问题研究

技术的发展创造了一个新领域。人工智能技术已成为一个热门研究领域,人工智能在社会生活的各个方面都随处可见。在科学与文化领域,人工智能生成内容在互联网中大量出现,“微软小冰”的诗集《阳光失了玻璃窗》也已出版。人工智能生成内容以及该内容生成过程中涉及的著作权问题仍有待探讨。一、人工智能的创作方式人工智能(ArtificialIntellegence,AI)就是让计算机完成人类心智(Mind)能做的各种事情,其重点不在于计算机,而在于计算机所做出的行为。在大数据时代到来之前,人工智能的创作方式以“代码定义”为主,设计者通过程序代码在机器人的运行过程中模拟人类的思维方式或思维结构,人工智能机器仅仅是承载设计者思维过程的创作工具。随着互联网与大数据技术的不断发展,“数据训练”成为人工智能的主要创作方式。人工智能通过对数据库内的海量数据进行统计分析形成与数据库内所有数据所展现的人类思维方式近似的逻辑组合,其智能程度与数据库容量和计算能力的提升成正比。此时计算机的创作不再一味追求理解人类创作中使用的元素的本意,而是通过提炼数据库中出现的高频率搭配并按照设定的数据模型生成人类可以阅读、理解的内容。数据训练的基础是机器学习,由数据输入、机器学习与结果输出三个阶段构成。(一)人工智能技术中的“智能”人工智能生成内容能否取得突破性的进展,关键在于训练数据的完备性,数据输入是人工智能进行内容生成的重要基础。由于数据库的规模会对人工智能的“智能”产生直接影响,开发者或设计者往往在人工智能系统或实体的训练环节为其寻找尽可能多的训练数据。然而,训练数据作为以计算机可读形式呈现的知识和信息,难免会包括受著作权法保护的作品,对作品进行数字化处理并形成集合输入智能系统的行为是对文本数据进行挖掘,在本质上即是一种对作品的复制行为。(二)人工智能作品与人类读者在阅读目的间的差异在人工智能的开发过程中,训练数据的著作权问题不可回避。机器对数据的获取与人类读者的阅读行为具有一定的相似性,是“机器读者”的一种数据输入行为;但“机器读者”批量阅读的阅读数量和阅读速度远远超过人类读者,其阅读目的与作品本身的艺术价值和表达价值并无关联,而是为了提炼常见的词语搭配和句式关系并形成元素合辑以便依据指令按照既定模式生成新的内容,与人类读者通过阅读获得文学艺术滋养、学习思想观点、与作者进行交流的阅读目的存在明显差异。一旦获取训练数据的成本变得高昂,人工智能设计者将倾向于更多地使用已处于公共领域的不再受著作权保护的材料用于人工智能系统或实体的训练。由于著作权法对自然人作品的保护时限为终身加身故后五十年,对法人或非法人组织作品、著作权由法人或非法人组织享有的特殊职务作品、视听作品的保护时限也从作品首次发表时开始计算长达五十年,(三)传统著作权法模式的“选择加入”模式在当前的著作权法框架下,意图解决人工智能训练数据引起的版权争议存在多种方式。有学者认为,可以采取“选择退出”(opt-out)模式。传统著作权法模式采用的是“选择加入”(opt-in)模式,除法律规定的特别情形外,若要利用他人的作品则必须取得著作权人的许可,否则将构成侵权行为。“选择退出”模式则是将作品置于统一的“作品市场”之中,在法律规定的特殊情形下,作品的使用者从“市场”中选用作品并支付合理报酬即为合法,除非著作权人明确表示拒绝授权,即退出该“作品市场”,使用者应当停止对该作品的利用行为(四)立法的空白区域训练数据的输入为人工智能实行“创作”的后续机器学习和结果输出奠定了重要基础,因此著作权法从制度设计上对其做出回应是必然之势。若采用“选择退出”模式或“有条件例外”模式,在人工智能开发和设计的过程中仍将面临较大的授权阻力,目前看来“无条件例外”模式与“法定许可”模式更具有可行性。采取“法定许可”模式一方面可以简化著作权作品的获取环节,另一方面可以有效保障著作权人的利益,但“机器阅读”与人类阅读仍然有本质上的差异,因此在支付合理费用时应当对这一事实情况予以考量。更为重要的一点在于,法定许可需要由法律进行明文规定,但这恰恰是立法的空白区域。若采取“合理使用”模式,我国可以效仿日本或欧合输入智能系统的行为是对文本数据进行挖掘,在本质上即是一种对作品的复制行为盟的方式,将文本数据挖掘行为新增为合理使用的具体情形;亦或是参考美国的立法方式,在著作权法中增加合理使用情形的一般条款,同时在对合理使用的法定列举中增加兜底条款以扩展该条款的适用范围。我国新修订的《著作权法》即对合理使用的条件作出了新的限制规定,并在法定列举情形中增加兜底条款二、人工智能生成的内容的可版权纠纷(一)人工智能生成内容可版权性的探讨人工智能输入内容的著作权问题得到合理解决并不意味着其生成的内容就必然具有可版权性,学界对于是否应当将人工智能生成内容作为著作权法上的作品予以保护仍然存有争议。有学者主张,当前并不具备在著作权法体系中为人工智能生成内容寻求著作权或邻接权客体地位的必要性与合理性。(二)人工智能生成内容是否具有独创性我国《著作权法实施条例》第2条“独”与“创”结合构成“独创性”,“独”是指独立完成该成果,并非抄袭他人;“创”是要求生成内容至少表现出最低限度的智力水平。目前,针对“人工智能生成内容的独创性存在与否”应当采取何种判断方式,在学界存在两种截然不同的观点。观点之一认为,独创性判断应当采用主观主义标准,人工智能依据既定的规则生成目标内容的过程中并不具备创作主体应有的智力创作空间,对于相同的原始素材,其生成的内容是相同或类似的,不具有个性特征,因此不具有独创性。观点之二认为,采用客观标准才是独创性判断的正确渠道,内容“如何产生”以及“由谁生成”并不构成影响内容独创性的元素,应当站在受众角度仅从内容本身出发,对是否具有独创性作出判断。对人工智能生成内容进行是否具有独创性的甄别应当采取客观标准。我国的著作权法体系对英美法系的版权体系和大陆法系的作者权体系报以兼收并蓄的态度,一方面注重作者与作品之间的联系,在著作权体系中首先规定了四项重要的人身权利;另一方面维护著作权人的财产权利,从而保障权利人通过创作作品获得利益的可能性,有效激发作者的创作欲望,从而实现著作权法促进社会文化和科学事业发展的基本目标对人工智能生成内容的独创性判断应当坚持“人工智能创作工具说”的前提。人类是具有认识能力和实践能力的主体,具有理性与自主性,而人工智能的本质是物,可以被占有和利用,具有私人性和可占有性,因此赋予人工智能法律主体的地位使其享有权利和承担义务并不具有现实意义。在弱人工智能时代,任何机器的正常运转都依附于人类行为,人类的指令输入是其运行行为的发生原因,解决人类所提出的问题是其运行行为的目标和结果。在作品创作方面,人工智能本身不具备创作作品的冲动和欲望,生成作品的风格和所依照的模板由开发者或使用者事先设定,不具备自主意识。对于人工智能生成内容而言,其独创性的来源是人类而非机器。在人工智能的算法设计、数据纠偏、模板生成等各个环节,人类均有相应的参与和控制行为,并借此方式将自己的独创性意志融入到人工智能的生成内容之中。从这一角度来看,即使未来技术发展到强人工智能时代,人工智能的客体地位仍然不会发生改变,只能作为人类进行创作活动的工具而存在,因此对其生成内容独创性的判断不应当纠结于生成主体和生成过程,而应当专注于内容本身。人工智能本身即为人类创造的智力成果,其依据人类的指令并模仿人类的思维生成的内容理应具有智力成果的属性。人工智能虽然无法理解人类输入的符号所代表的文化含义,但能够依据这些符号创设的规则即人类的思维逻辑进行内容生成活动,其生成内容与人的智力成果在外观上几乎没有差异,能够被读者准确理解,因此具有智力成果的属性。(三)人工智能生成内容受保护的必要性人工智能生成内容获得的著作权法上的保护是人工智能产业发展所带来的现实需求。以搜狐“智能报盘”、腾讯“DreamWriter”、新华社“快笔小新”以及Giiso咨询机器人为代表的人工智能数据分析和新闻采编机器层出不穷,其生成内容的速度和体量都是人类作者难以企及的。但由于人工智能生成内容需要依照事先设定的模式或依照其通过自学习形成的某种现有模式,因此人工智能生成内容始终桎梏于现下存储的数据材料,无法像人类一样实现对当今创作水准的突破。若大量的人工智能生成内容充斥市场并处于公共领域,使用者无需付出任何代价即可获得,而人类的作品却因受著作权保护造成了使用成本的高昂,从而被束之高阁。不可否认财产权利是人类作者进行创作的重要原因之一,当作者无法从作品的使用中获取利益时,其创作欲望将会大大降低,此时文化市场将被大量创作水平“原地踏步”的人工智能生成内容占领,形成了“劣币驱逐良币”的不良局面,社会文化水平和科学事业发展将停滞不前。此外,明确界定财产权的边界有利于提高经济效率,降低交易成本。根据“知识产权法定主义”,由于知识产权客体具有无形性的特征,导致其无法通过合法占有排除他人的非法占有,知识产权的权利内涵与外延均依赖法律拟制,著作权的行使与保护均以法律规定为前提。在著作权法的保护体系内为人工智能生成内容创设一席之地将有助于文化市场的运行与发展。三、人工智能生成内容权利的所有权、义务的履行和责任的承担(一)对人工智能生成责任的质疑在一套成熟的权利体系中,权利的归属、义务的履行与责任的承担是永恒不变的中心话题,若权利义务确实存在却不明确其归属主体,无异于使该权力体系归于空白。人工智能技术的发展对现有的法律制度造成了重大冲击,欧盟甚至开始对是否应当赋予机器人以“电子人”法律地位的问题进行思考。本文认为,对于人工智能生成内容而言,人工智能本身仅仅是一种生成工具,无论是在“弱人工智能”时代还是“强人工智能”时代,甚至在未来可能存在的“超人工智能”时代,人工智能都无法拥有人类的自主意志,不具备行使权利的能力,没有独立的财产,更遑论履行义务与承担责任了。当人工智能的主体资格被全盘否定时,谁才是人工智能生成内容权利的归属、义务的履行与责任的承担主体呢?(二)人工智能生成内容是否具有著作权属性我国学者对于人工智能生成内容的权利归属从不同角度提出了多种学术观点。有学者认为,人工智能生成内容构成著作权法上的作品,具有独创性和必要的人格要素,在人机合作的情况下,“机器作者”与人类作者均对作品的产生做出了贡献,可以按照法人作品或创作者约定对作品的著作权进行安排。(三)人工智能生成内容著作权的保护我国《著作权法》坚持“著作权属于作者”的一般原则,自然人的作者地位来源于其创作作品的行为,法人或非法人组织则在特殊情况下可以被视为作者。并非所有构成作品的人工智能生成内容都可以将人工智能开发者、使用者或其他参与者对其贡献的创造性劳动大小进行对比和排序,针对难以区分何人投入的创造性劳动更大的人工智能生成内容,实现作品流通和利用效率的提高,对新兴产业的发展予以保障和激励,是进行著作权权利配置时应当考量的重要因素。本文认为,将该类作品的著作权赋予人工智能使用者比赋予其他主体更有效率。人工智能的本质是计算机软件,是受著作权法保护的作品,即使人工智能生成内容的著作权未被配置给开发者,开发者也可以通过对计算机软件作品的权利的行使得到利益回报。一方面,人工智能开发者可以与投资者签订委托协议或依据特殊职务作品、法人作品的制度规则从投资者获取资金支持;另一方面,人工智能开发者将开发成果投入市场也能够获取可观的许可费用收入和流量资金收入。人工智能使用者在作品的生成过程中也做出了贡献,但却没有相应的权利保障,缺乏权利保障的使用者可能面临其他有权主体“二次赋权”的风险。此外,人工智能产品的使用者众多,将生成内容交由开发者管理需要消耗大量的财力资源,相比较而言,使用者对于自己在某事某地生成的某一特定内容进行管理将更为明晰,既能够提高人工智能生成内容在文化市场中的利用效率,也能够对人工智能产业的发展也将起到一定的激励作用,有利于实现著作权法促进社会文化和科学事业发展的基本目标。此外,由于人工智能的开发需要大量的资金投入,对于部分学者主张的“注重对人工智能投资者的权益保护”的观点,著作权法本身从未忽视对投资者的权益保护,出于保护投资者所创设的委托作品制度、职务作品制度和法人作品制度在面对人工智能生成内容时的灵活适用足以充分保障投资者的利益。四、明确人工智能生成内容的可版权性随着人工智能技术的发展,人工智能实现了新闻机器人自主采编新闻稿件,“微软小冰”甚至出版了诗集,著作权法不可逃避地开始迈入“智能版权”时代。人工智能实施“创作”行为依赖于完备的数据输入,在此过程中可能涉及对输入的训练数据造成著作权侵权的风险,我国新修订的《著作权法》通过在合理使用的法定情形列举中增设兜底条款,为将文本数据挖掘行为纳入合理使用范围预留了充分的空间,对这一问题做出有效回应。判断人工智能生成内容的可版权性的应当采用客观标准,从生成内容本身出发,与生成主体和生成过程无关。人工

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论