作者简介:冯晓青,北京大学法学博士,中国人民大学法学博士后;现任中国政法大学民商经济法学院二级教授、博士生导师,中国政法大学国际知识产权研究中心执行主任;兼任中国法学会知识产权法学研究会副会长,中国知识产权研究会副理事长,最高人民法院知识产权司法保护研究中心研究员等。 当前,人类迎来了第四次信息产业革命。特别是人工智能技术的发展正深刻地改变着人们的工作和生活方式,世界各国和地区也就此展开了激烈竞争,对包括知识产权制度在内的现行法律制度带来了极大挑战。近几年来,国内外涉人工智能数据训练、人工智能生成作品的著作权侵权纠纷不在少数。我国现行《著作权法》缺乏对人工智能生成作品著作权制度方面的规定,亟待加以研究和探讨。 人工智能数据训练及其著作权侵权风险 随着人工智能技术的迭代更新,人工智能服务平台不断升级,用于预训练和训练的数据量呈几何级数增长。从著作权保护的角度来说,这些 数据 或 文本 ,很大一部分属于受著作权保护的作品。基于交易成本巨大以及其他市场失败原因,人工智能开发者也无力一一获取使用授权。国外即有多起著作权所有者基于人工智能开发者进行数据训练时未经许可地使用了其享有著作权的作品而提出著作权侵权之诉。例如,近年美国微软和OpenAI公司都被***指控使用的训练数据侵害了其著作权。在另一起Getty Images诉Stability AI,Inc.案中,被告被控其人工智能模型使用了原告1200多万张图片、配套注释、元数据等。 从我国情况看,涉及人工智能数据训练方面鲜有著作权侵权纠纷案件发生,学界对于人工智能数据训练对是否应取得著作权人许可也存在不同认识。在此,不妨结合我国相关规定,明确对待人工智能数据训练的态度。 按照《生成式人工智能服务管理暂行办法》第7条规定,生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,应当使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权。又依照《互联网信息服务深度合成管理规定》第14条第1款规定,深度合成服务提供者和技术支持者应当加强训练数据管理,采取必要措施保障训练数据安全;训练数据包含个人信息的,应当遵守个人信息保护的有关规定。上述法律文件尽管属于部门规章范畴,但也彰显了人工智能数据训练的合法合规要求,而非不受任何限制地抓取数据、输入数据和进行数据训练。其原因在于,尽管人工智能开发者模拟人工神经网络进行数据预训练和训练可以不对外公开,但训练的目的是为了日后通过生成作品等形式的使用。如果训练中采集了违法违规的有害内容,就会实质性地造成生成内容的不合法性。当然, 不得侵害他人依法享有的知识产权 是否意味着一定需要事先获得著作权人的同意仍值得探讨。无论如何,人工智能开发者在进行数据训练时存在著作权侵权风险。例如,近期有小说平台将作者文章 投喂 人工智能,就被质疑是否存在人工智能作者洗稿剽窃问题。 人工智能生成作品及其公开传播的著作权侵权问题 人工智能生成作品的著作权问题,和前述人工智能数据训练涉及的著作权问题有所不同。前者既涉及人工智能生成作品本身是否符合受著作权保护条件的问题,也涉及人工智能生成作品侵害在先作品著作权的问题。当然,在承认人工智能生成物的作品属性后,还会涉及该作品著作权被侵害及其法律救济问题。就人工智能生成物是否受著作权保护的问题而言,尽管我国学界存在争议,但主流观点仍然持肯定态度,笔者亦是如此,近年来的相关司法实践也同样如此,如深圳市南山区人民法院一审的腾讯案和北京互联网法院一审的文生图第一案都承认人工智能生成物受著作权保护。故而,研究的重点之一是人工智能生成作品是否侵害在先作品著作权。 目前,我国《著作权法》未涉及人工智能领域著作权问题。关于人工智能生成作品的著作权规范,见于2023年7月国家互联网信息办公室联合国家六部委发布《生成式人工智能服务管理暂行办法》等部门规章。例如,该规章第3条规定,提供和使用生成式人工智能服务,应当 尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为 。该规定为人工智能服务提供者和使用者不得侵害他人知识产权提供了基本的原则和规范。从著作权法原理和理论来说,通过人工智能生成的作品,只要其与在先享有著作权的作品构成实质性相似,就存在著作权侵权风险。这里的 在先享有著作权的作品 应当是特定人工智能平台在进行数据训练时未经许可使用的作品。若人工智能生成作品前并未事先 接触 在先作品,根据通常的界定著作权侵权的 实质性相似 加 接触 原则即可排除著作权侵权之虞。实际上,这里也体现了对于人工智能生成作品在著作权法中的平等保护问题。 需要指出,涉及人工智能生成作品侵害他人在先作品著作权问题,在实践中还有一个前提条件,即该人工智能生成作品在生成后通过一定形式公开和传播。以用户为例,如果通过输入主题词、调整参数和反向排除等手段获取了人工智能生成作品与某在先的享有著作权的作品构成实质性相似,但仅限于用户个人欣赏或者学习、研究之用,并未公开,他人就无法感知,也不存在侵害他人利益的问题。这与一般情况下因未公开使用和传播而不构成侵害著作权的原理一样。 我国近年确实发生过的涉及人工智能生成作品侵害他人在先作品著作权的案例。例如,2024年2月,广州互联网法院对全球第一例人工智能平台侵害著作权案作出判决。该案中,法院认为被告某人工智能公司在进行人工智能模型训练时未经许可使用了享有著作权的美术作品 奥特曼 ,并认定通过该平台用户获得的图片和原告主张著作权保护实质相似,进而认定被告侵害了原告作品的复制权和改编权。由此可见,人工智能生成作品著作权侵权认定标准和侵权责任需要相关法律予以明确。 人工智能生成作品著作权侵权认定及责任划分 人工智能生成作品著作权侵权认定和著作权法的一般原理与规定本质上一致,只因作品创作、使用和传播的场景不同而具有一定特殊性。如前所述,著作权侵权以实质性相似加接触作为判定标准,在判定实质性相似方面,需要运用思想表达二分法,排除不受著作权保护的公有领域。 在当前流行的生成式人工智能背景下,在人工智能生成作品著作权侵权判定中,用户通常通过不断输入和调整提示词、修改参数与排除主题词的方式获取自身所需要的最终成品。这种情况下,所生成作品的著作权问题具有一定复杂性,此类 人机互动 或 人机协作 所生成的作品,其作者和著作权人属于谁存在一定争议。对此,可以从人工智能服务提供者和使用者的角度判定著作权侵权问题。假设使用者(用户)借助于人工智能服务所生成的作品构成对在先作品著作权的侵害,此时应由谁承担著作权侵权和损害赔偿责任? 从人工智能平台实践看,用户在使用时需要接受平台合同约束,而合同通常将所生成的作品著作权指定由用户享有。此时,用户对于生成作品侵害他人作品著作权承担停止侵权责任应当没有疑问。至于其是否应承担损害赔偿责任,则取决于其主观上是否存在过错,因为知识产权侵权损害赔偿以侵权人存在过错作为前提。一般而言,人工智能服务平台使用具有开放性,用户借助于人工智能平台生成作品具有合理性,难以认定其主观上具有过错。但也应注意,用户并非在任何情况下都不存在过错。如果用户通过故意诱惑或者其他非正当形式获取侵害他人著作权的作品,则应当承担损害赔偿责任。用户通过反复输入和调整提示词获取目标作品,并且以著作权人名义公开,那么基于权利义务一致性原则,用户也应当对侵害他人著作权的行为承担停止侵害和赔偿损失的法律责任。人工智能服务提供者也不可因为格式合同将生成作品著作权约定给用户而完全不承担著作权侵权责任。现有研究认为,人工智能服务提供者对于著作权侵权发生存在一定注意义务,而且还应当采取一定的技术手段或者措施防止用户利用其平台生成侵害著作权的作品并予以传播。 应对人工智能挑战的著作权制度变革与完善 如前所述,我国《著作权法》尚未涉及人工智能生成著作权问题。人工智能技术及其产业化迅猛发展以及司法实践中不断出现的典型案例无不呼唤建立人工智能生成作品著作权制度,以强化对著作权保护,并促进我国人工智能产业发展。笔者认为,我国人工智能生成作品著作权制度应重视以下内容的规范: 其一,明确人工智能生成作品受著作权保护的条件,肯定其在著作权保护中的地位。随着生成式人工智能技术发展,会有越来越多的人工智能生成作品涌入市场,著作权法需要给予保护。同时,在著作权保护期限方面作出限缩性规定,如不超过发表后十年,以便实现这类作品著作权人和社会公众利益之间的平衡。 其二,明确人工智能系统开发中文本与数据挖掘合理使用例外规定,为我国人工智能技术开发和产业化提供宽松的法律环境。实际上,近年来国外著作权立法已有相关规定。例如,日本《著作权法》在修改后增加了涉及人工智能数据训练的 计算机信息处理 的合理使用方式,欧盟《数字单一市场版权指令》也有类似规定,值得我国借鉴。 其三,明确人工智能生成的作品的强制署名义务。人工智能生成作品在外观上与自然人创作作品并无实质性区别。为避免人工智能生成作品冲击人类作品市场,需要建立人工智能生成作品强制署名制度。 其四,在著作权侵权责任制度中,明确人工智能生成作品著作权侵权这一新型类型,赋予人工智能服务提供者和使用者相应的注意义务,以及著作权侵权豁免制度(如类似避风港原则),以便为人工智能生成作品著作权侵权判定及其责任承担建立裁判规则。
前沿 | 人工智能生成物著作权侵权风险与对策
随着人工智能技术的快速发展,人工智能生成物(如人工智能写作的文章、绘画等)在各个领域得到了广泛应用。然而,随之而来的是著作权侵权风险的增加。本文将探讨人工智能生成物著作权侵权风险的表现形式,并提出相应的对策。
一、人工智能生成物著作权侵权风险的表现形式
1. 未经授权使用他人的作品
人工智能生成物可能会侵犯他人的著作权,例如抄袭他人的文章、绘画等作品。
2. 错误归因
由于人工智能生成物的创作过程是基于算法和数据,可能会导致作品的错误归因,从而侵犯他人的著作权。
3. 缺乏独创性
人工智能生成物的创作过程是基于算法和数据,可能会导致作品缺乏独创性,从而侵犯他人的著作权。
二、应对人工智能生成物著作权侵权风险的对策
1. 加强法律保护
加强对人工智能生成物的法律保护,明确其著作权归属和保护范围,加大对侵权行为的打击力度。
2. 提高技术水平
提高人工智能的技术水平,减少侵权风险的发生。例如,通过技术手段确保人工智能生成物的独创性。
3. 建立审核机制
建立人工智能生成物的审核机制,对其进行严格的审核,确保其不侵犯他人的著作权。
4. 加强教育宣传
加强对人工智能生成物的教育宣传,提高公众的知识产权意识,减少侵权行为的发生。
总之,人工智能生成物的著作权侵权风险需要引起我们的高度重视。我们应该加强法律保护、提高技术水平、建立审核机制、加强教育宣传等方面的工作,共同应对人工智能生成物著作权侵权风险。