浅析AI克隆艺人声音的侵权问题-中美新近立法与司法实践对比

上传人：策*** IP属地：山西上传时间：2024-06-19 格式：DOCX 页数：16 大小：20.93KB 积分：19.9 举报 版权申诉

已阅读5页，还剩11页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

随着人工智能科技的飞速发展，利用人工智能（ArtificialIntelligence，简称AI）生成与某个特定自然人的声音极为相似的虚假语音变得越来越容易。这一技术被称为“声音克隆”（VoiceCloning），也称“深度伪造语音”（DeepfakeAudio）。常见的声音克隆有两种形式：文本转语音（TexttoSpeech）及语音转换（VoiceConversion，也称SpeechtoSpeech）。“文本转语音”指利用AI将用户输入的文本转化为与特定自然人声音高度相似的语音。“语音转换”指在说话内容不变的情况下，利用AI学习并模仿特定自然人A的声音（包括音色及韵律），从而将特定自然人B（原本的说话人）的声音替换为特定自然人A（转换后的说话人）的声音。[1]艺人是AI声音克隆的主要对象。2024年5月13日，OpenAI发布最新多模态大模型ChatGPT-4o，并且在发布会上重点介绍了ChatGPT-4o的语音对话能力。知名演员斯嘉丽·约翰逊（ScarlettJohansson）随后惊讶地发现ChatGPT-4o用于对话的语音助手“SKY”的声音竟然与自己的声音高度相似，以至于新闻媒体和自己最亲密的朋友都无法分辨出二者的区别。据斯嘉丽透露，OpenAI曾数次请求斯嘉丽为ChatGPT的产品配音但均被拒绝。甚至在本次发布会前几日，OpenAI还曾联系斯嘉丽，希望能够获得声音授权。尽管OpenAI声明SKY的声音源自另一位配音演员，但斯嘉丽认为OpenAI涉嫌未经许可克隆自己的声音，要求OpenAI下架SKY。[2]极具特色和辨识度的声音是艺人的个人品牌。如何在鼓励科技创新的同时妥善保护艺人的声音权益，已经成为各国法律亟需回应的问题。本文将介绍中美两国立法和司法实践中对艺人声音的保护规则，通过对比研究，探讨两国声音保护规则的共识、差异及需要进一步关注的问题。一、美国在美国，艺人的声音可能落入个人形象权的保护范围。个人形象权指个人有权控制“代表其个体特征且具有商业价值的形象要素，并由此获得报酬”。[3]这一权利目前并没有联邦层面的统一立法，而是由各州通过成文法或判例单独进行保护，且各州在个人形象权的保护范围、保护期限、可否继承与转让等问题上均存在不同规定。例如在纽约、加州等地，声音可以得到个人形象权的保护，但在其他州则不尽然。[4]随着AI声音克隆技术的愈发成熟，利用AI克隆艺人声音的现象也愈加普遍。这一现象引起了艺人及音乐、影视行业的担忧和抗议，因为逼真的AI克隆声音正在广泛且实质地替代艺人的真实声音，不仅严重损害艺人的经济利益，同时削减了人类创作的价值。[5]为了保护艺人的声音免受人工智能未经授权的克隆，美国各州及联邦纷纷着手修改既有立法，不仅致力于将声音明确纳入个人形象权保护范围，并且聚焦于对AI声音克隆行为的规制。其中以田纳西州的立法及美国联邦的两部草案最具有代表性，以下将分别予以介绍。1.AI声音克隆受个人形象权规范田纳西州是美国音乐产业重要中心，这里坐落着音乐之城纳什维尔（Nashville），还有乡村音乐的发源地布里斯托（Bristol）。音乐产业为全州提供了超过61,617个工作岗位，为美国经济贡献了58亿美元的GDP。[6]在人工智能科技浪潮下，音乐产业受到AI声音克隆技术的巨大冲击，但田纳西州1984年的《个人权利保护法》（thePersonalRightsProtectionAct，简称TPRPA）却无法为艺人的声音提供足够的保护。依据1984年的《个人权利保护法》，个人形象权只保护个人的“姓名、照片和肖像”，艺人声音未被明确纳入个人形象权的保护范围，AI声音克隆更不属于个人形象权可以禁止的行为。为了保护当地的重要支柱音乐产业，2024年1月24日，田纳西州长BillLee提出田纳西州需尽快修改1984年的《个人权利保护法》，并且应在新法中重点解决AI未经授权以他人声音制作声音克隆音频的问题。2024年3月21日，田纳西州修改了1984年《个人权利保护法》的部分条款，并将修正后的法案命名为《确保肖像、声音和图像安全法案》（EnsuringLikenessVoiceandImageSecurityAct，简称TheELVISAct）。TheELVISAct不仅明确将声音纳入田纳西州个人形象权的保护范围，而且将个人形象权的保护范围明确扩张至AI声音[7]，这在各州立法中尚属首次。TheELVISAct将“声音”定义为：一种在媒介中可以被轻易识别并且可归属于特定个人的声音，不论该声音是否包含该特定个人的真实声音或模拟声音（StimulationoftheVoiceoftheIndividual）。[8]生成式AI通过学习特定个人的声音样本，能够输出令人难辨真伪的模拟声音，使他人将该模拟声音与特定个人关联。TheELVISAct中明确将“模拟声音”纳入“声音”定义，意在规制利用AI技术进行声音克隆的行为。根据TheELVISAct，艺人对声音享有个人形象权，这是一种财产性权利，可以转让和继承，不因艺人死亡而终止。除艺人本人外，其法定监护人、继承人、受遗赠人、遗产管理人等在艺人的声音权益受到侵害时，均有权提起诉讼。[9]相较于田纳西州1984年的《个人权利保护法》，TheELVISAct在上述有权起诉的主体外，还对获得排他许可的主体赋予了起诉资格。依据TheELVISAct第1106条，如果唱片公司等主体与艺人签订合同，对声音权益的利用获得排他性许可，则这部分主体可以单独就侵权提起诉讼。2.AI声音克隆的侵权责任（1）未经授权创建及使用AI克隆声音TheELVISAct§1105.(a)(1)规定：任何人出于广告宣传、劝诱购买产品或服务、募集资金等目的，在明知当事人未经同意的情况下，擅自使用他人声音的行为，都构成侵权。[10]本法规定的“声音”含义包括真实声音及模拟声音，而可能发生的侵权行为可以分为以下两类情形：A.使用他人真实声音、未经授权自行创建AI克隆声音：如果AI开发公司出于商业目的、未经授权擅自使用艺人的真实声音训练AI，并创建AI克隆声音，构成侵权。B.未自行创建、但明知且使用他人未经授权而创建的AI克隆声音：如果AIGC使用者“明知（knowingly）”所使用的声音是AI公司未经授权、利用他人真实声音训练合成的AI克隆声音，但依然决定使用上述AI克隆声音，也可能构成侵权。（2）发布、传输、提供AI克隆的声音TheELVISAct在1984年的《个人权利保护法》的基础上新增了§1105.(a)(2)条款，本条规定了“发布、传输和提供AI克隆声音者”的责任：在明知对他人声音的使用未经授权的情况下，仍发布、表演、分发、传输或者以其他方式向公众提供该声音，则此类行为的实施者也需要承担责任。不同于§1105.(a)(1)中未经授权创建、使用AI克隆声音的行为需要具有“商业目的”才能构成侵权，§1105.(a)(2)对于“传播、发布或向公众提供”AI克隆声音的行为并没有前述的“广告宣传、劝诱购买产品或服务、募集资金”等商业目的表述。这意味着如果个人或企业出于“非商业目的”发布、传输和提供AI克隆声音的行为也可能构成侵权。由于流媒体、社交平台是发布和传输的主要媒介，因此此类平台被认定为侵权的风险较大，[11]但承担责任仍然以“明知”为要件。（3）分发、传输、提供用于克隆声音的算法§1105.(a)(3)是TheELVISAct的立法创新。面对不断更新迭代的AI技术，TheELVISAct意在从源头加强对艺人声音的保护，在§1105.(a)(3)中对存在侵权风险的算法进行规制。如果某人“分发、传输或向公众提供某种主要目的或功能是为了制作特定的、可识别个人的声音的算法、软件或技术”，则需承担侵权责任。由于相应算法来自科技公司及开发者，因此科技公司及开发者研发用于AI克隆声音的算法时，需要关注向社会公众提供和传播相应技术的法律风险。值得注意的是，本条同样没有“广告宣传、劝诱购买产品或服务、募集资金”目的要对于“分发、传输、提供”用于克隆声音的算法的行为，虽然TheELVISAct规定了承担侵权责任的条件，但相关条款仍存在诸多模糊之处。首先，法案中多次提及的“分发、传输或以其他方式提供”含义不明，这一规定可能导致责任主体的范围边界难以界定。例如提供访问入口的搜索引擎或者聚合相应算法服务链接的网页都会可能落入这一范畴。不明确的责任边界若过度扩张，可能阻碍科技创新和音乐影视创作。[12]其次，针对可能用于AI声音克隆的算法或软件，如何判断§1105.(a)(3)中算法的“主要目的和功能”就是为了未经授权生成克隆声音，法案中并未给出需要考虑的因素。事实上，开发者提供声音算法时，可能难以预测并控制算法的实际用途。比如开发者可能出于善意的正常用途向公众提供具有多项功能的通用人工智能模型，但部分公众却将其用于侵权。并且，相应算法在运行过程中也可能难以由开发者控制或识别是否已经获得授权，以及授权是否有除以上内容外，TheELVISAct还就救济措施、赔偿责任、合理使用等内容进行规定。囿于篇幅所限，此处不再（二）美国联邦：NOFAKESAct及NoAIFRAUDAct除TheELVISAct外，针对涌现的AI技术，美国两党议员也期望在联邦层面为生成式AI的使用设置法律界限。以下将简要介绍美国联邦层面与AI声音克隆相关的立法进展。2023年10月12日，克里斯·库恩斯（ChrisCoons）等议员提出《培育原创、促进艺术和保障娱乐行业安全法案（草案）》（NurtureOriginals,FosterArt,andKeepEntertainmentSafeActof2023，简称NOFAKESAct）[14]，该法案的目标是“保护代表个人声音、肖像、姓名等个人特征的个人形象权免受生成式AI的不公平使用”。NOFAKESAct首次在美国联邦层面将“声音”纳入“个人形象权”保护范围，并禁止未经授权创建代表个人特征的数字复制品（DigitalReplica）或发布、分发、传输或以其他方式公开此类复制品，实施前述行为的主体需承担侵权责任。[15]NOFAKESAct尚未正式通过，仍在讨论阶段。目前讨论的焦点包括：是否应当采用“通知——删除”规则[16]；个人死亡后70年的个人形象权保护期是否应当延长或缩短；相较于州法，NO2024年1月10日，玛德琳·迪恩（MadeleineDean）等议员提出《禁止人工智能伪造复制品和未经授权复制法案（草案）》（NoArtificialIntelligenceFakeReplicasAndUnauthorizedDuplicationsAct，简称NoAIFRAUDAct）[18]，这一法案旨在从美国联邦层面建立防止生成式AI未经授权使用个人声音和肖像的法律机制。NoAIFRAUDAct明确个人对自己的声音、肖像等可识别特征享有财产权，该权利可转让可继承，并且在个人死亡后的10年内仍受到保护。根据NoAIFRAUDAct，以下三种行为均构成侵权，需对权利人承担赔偿责任：(1)分发、传输或以其他方式向公众提供声音克隆服务；(2)发布、表演、分发、传输或以其他方式向公众提供数字声音复制品（DigitalVoiceReplica），且明知该数字声音复制品未经授权;(3)实质上促进、指导或以其他方式便利前述第(1)、第(2)两项行为的主体，如果明知第(1)、第(2)项的行为未经授权，也需承担赔偿责任。目前该法案尚未正式批准通过。二、中国（一）声音保护的法律规范我国法律对自然人的声音提供保护。《民法典》第1023条规定：对自然人声音的保护，参照适用肖像权保护的有关规定。依据《民法典》第1018条，肖像是“在一定载体上反映的特定自然人可以被识别的外部形象”。可识别性是肖像的核心特征，声音权益的保护参照肖像权的规定，因此声音权益的保护前提也应当是具有可识别根据《民法典》第1018条，肖像权人对肖像的控制体现为制作、使用、公开或者许可他人使用自己的肖像。未经肖像权人同意，他人不得以发表、复制、发行、出租、展览等方式使用或者公开肖像权人的肖像。享有声音权益的主体可以参考肖像权人对肖像权的控制，禁止他人擅自制作或使用、公开自己的声音。并且，《民法典》第1019条规定“任何个人不得利用信息技术手段伪造等方式侵害他人的肖像权”，由于AI声音克隆技术属于“信息技术手段”，因此这一规定可以为权利人禁止他人未经授权利用AI克隆声音提供解释路径。（二）司法案例：AI生成声音人格权侵权案2024年4月23日，北京市互联网法院对全国首例“AI声音侵权案”宣判。本案基本案情如下：原告殷某是一名配音师，偶然发现利用自己的声音配音的视频在平台上广为流传。经溯源，前述视频中的配音来自被告A运营的原告曾为被告B（某传媒公司）录制录音制品，被告B对该录音制品享有著作权。后被告B将该录音制品提供给被告C（某软件公司），允许其“以商业或非商业的用途使用、复制、修改数据用于其产品及服务”。被告C将录音制品作为AI训练素材，制作生成涉案的文本转语音产品并在被告D（某云服务平台）的平台上出售。被告A与被告E（某科技发展公司）签订在线服务买卖合同，由被告E向被告C采购涉案文本转语音产品。被告A采用应用程序接口，直接调取该产品（未经技术处理）在其平台中使用。[20]本案包括两个争议焦点：自然人声音权益保护范围是否及于AI声音；被告是否应当承担侵权责任。[21]1.声音权益及于AI声音与肖像权的可识别性要求一致，北京市互联网法院以可识别性作为是否应当将AI声音纳入声音权益保护范围的判断标准。北京市互联网法院认为自然人的声音有独特性、唯一性、稳定性特点，“能够令一般人产生与该特定自然人相关的思想和情感活动，展示个人行为与身份”。案涉AI声音能够将该声音特征与特定自然人进行关联，实现声音的引

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

浅析AI克隆艺人声音的侵权问题-中美新近立法与司法实践对比

文档简介

温馨提示

最新文档

评论

浅析AI克隆艺人声音的侵权问题-中美新近立法与司法实践对比

文档简介

温馨提示

最新文档

评论

相关文档