陷版权起诉潮，人工智能遭内容“封锁”？

发布时间： 2024年01月12日

文章来源：人民邮电报

近一年来,以ChatGPT为代表的生成式人工智能井喷式发展,风头一时无两。然而,近一段时间,推出ChatGPT的OpenAI公司和其背后的大股东微软因为版权问题频频成为被告,这也反映出生成式人工智能引发的版权问题正日益凸显。在强大技术的背后,“惊艳”的生成式结果在很大程度上依赖于庞大的内容库,这其中很大一部分均为拥有独立版权的自创内容。如今,有关版权的诉讼频发,生成式人工智能正面临“买米下锅”的新情况。

《纽约时报》起诉OpenAI和微软

2023年末,美国《纽约时报》正式起诉OpenAI和微软公司,指控这两家企业未经授权使用该媒体数以百万计的文章训练ChatGPT等人工智能聊天机器人,成为第一家起诉人工智能科技公司侵权的美国大型媒体。而在此诉讼之前,《纽约时报》已经与两家被告展开了数月的洽谈,始终未获满意的方案。

据媒体报道,《纽约时报》从2023年4月就开始与OpenAI和微软就版权一事谈判。当时距离ChatGPT诞生仅有半年时间。2022年11月,ChatGPT发布。5天后,ChatGPT用户便超过100万人,无情碾压了脸书公司10个月破百万用户的纪录。发布短短两个月,ChatGPT用户数突破1亿,打破了Twitter保持的9个月的纪录,成为史上用户数增长最快的消费者应用。微软则是OpenAI的主要投资方,能利用OpenAI的人工智能技术。据美联社报道,自2019年双方开始合作以来,微软已向OpenAI投资至少130亿美元。

用户激增的同时,ChatGPT语料库的资料版权使用问题也受到了关注。《纽约时报》就是典型案例。各方最终未能谈拢,于是,2023年12月27日,《纽约时报》向纽约曼哈顿联邦法院提起诉讼。起诉书称,OpenAI和微软“试图搭《纽约时报》在新闻领域巨额投资的便车,在未经许可或未付款的情况下利用《纽约时报》的内容制造替代产品”。

《纽约时报》称,在某些情况下,被告企业将《纽约时报》刊登的内容逐字复制,提供给向AI聊天机器人寻求答案的用户。如此使用《纽约时报》的作品违法,主要是因为这些新产品为新闻出版商创造了潜在竞争对手。

“如果《纽约时报》和其他新闻机构无法制作和保护独立的新闻报道,社会将出现计算机和人工智能无法填补的真空。”起诉书说,“新闻报道产出将减少,社会将付出巨大代价。”

据悉,《纽约时报》希望获得赔偿,并要求两家被告公司停止使用其内容训练AI模型并销毁已收集的数据。据法新社报道,《纽约时报》称,侵权行为可能造成“数以十亿美元计的法定和实际损失”。

OpenAI表示,鉴于其正在与《纽约时报》就版权问题进行“建设性谈判”,对《纽约时报》提起诉讼感到“惊讶和失望”。OpenAI发言人说:“我们希望能找到一种互利的合作方式,就像我们与许多其他出版商所做的那样。”微软暂未对此事置评。

生成式人工智能引发版权起诉潮

《纽约时报》并非唯一的一家。迄今,OpenAI已经遭遇了多宗版权起诉。

近日,美国作家尼古拉斯·巴斯贝恩和尼古拉斯·盖奇向纽约曼哈顿联邦法院提起集体诉讼,指控微软和OpenAI侵犯了他们以及其他作家的版权。诉讼称,微软和OpenAI使用原告书中的信息训练人工智能产品,既没有获得许可,也没有赔偿,其行为构成“对版权作品的恶意大规模窃取”。

2023年6月,两名作家在美国加州北区法院对OpenAI发起版权集体诉讼,指控其未经授权就利用他们享有版权的图书训练ChatGPT,牟取商业利益。

2023年7月,两位美国作家对OpenAI提起诉讼,理由类似。

2023年9月,《冰与火之歌》作者乔治·马丁等17位作家通过全美作家协会向纽约曼哈顿联邦法院提起集体诉讼,称OpenAI在未经许可的情况下批量复制原告作品,并将受版权保护的材料输入该公司的大语言模型中,对用户类似的文本需求进行响应。

2023年12月,11名美国作家在纽约曼哈顿联邦法院起诉OpenAI和微软,指控其滥用他们的作品来训练ChatGPT,向法院提出赔偿要求,要求法院下令被告停止侵犯版权。

这些原告的理由都类似,指控OpenAI在未经许可的情况下,从互联网上批量复制了他们的作品,并将这些作品纳入ChatGPT的训练数据里,侵犯了他们的作品版权。他们还表示,由于微软公司“深度参与”了训练和开发人工智能模型,也应承担侵权责任。

除OpenAI外,其他人工智能企业也有类似遭遇。

此前,法国环球音乐集团和其他音乐出版商起诉美国企业Anthropic公司,指控后者使用受版权保护的歌词来训练人工智能系统,并为用户查询生成答案。Anthropic是一家生成式人工智能公司,由OpenAI前员工于2021年创立,并于2023年5月筹集了4.5亿美元的资金,由风险投资公司Spark Capital领投,谷歌、SK电讯、Salesforce Ventures等参与投资。2023年8月,SK电讯再次向Anthropic增投1亿美元。

图片企业盖帝图像有限公司则指认英国“稳定”人工智能公司利用这家图片公司及其合作伙伴的照片获利,以制作能生成图像的视觉AI。

随着近年来生成式人工智能技术的火爆,与其相关的版权争议也愈演愈烈。从已有诉讼案例来看,版权拥有方认为,他们的作品包含大量智力和财力资源投入,而人工智能公司未经授权使用其作品的行为给他们带来了巨大损失。《纽约时报》是首家出手的美国大型新闻社。而据媒体报道,数以百计的新闻出版商正使用编程代码阻止OpenAI、谷歌和其他人工智能开发公司浏览其网站以获取培训数据。

对此,美国版权局也表示,已发起了一项倡议来研究人工智能所引发的一系列问题。去年8月,美国版权局发布通知,征求各方对该倡议的意见,并正在评估是否有必要采取立法或监管措施。

可以看到,针对生成式人工智能公司的内容“封锁”已经开始显露苗头,后续进展如何有待进一步观察。

（编辑：马慧彬）