ChatGPT制造商OpenAI因训练人工智能的数据而面临集体诉讼_地球与科学

　　旧金山——一家总部位于加州的律师事务所对OpenAI提起集体诉讼，指控这家人工智能公司在使用从互联网上收集的数据来训练技术时，创造了广受欢迎的聊天机器人ChatGPT，严重侵犯了无数人的版权和隐私。

　　这起诉讼旨在验证一种新的法律理论——OpenAI在使用数百万互联网用户的社交媒体评论、博客文章、维基百科文章和家庭食谱时侵犯了他们的权利。这起诉讼背后的律师事务所克拉克森(Clarkson)此前曾就从数据泄露到虚假广告等问题提起过大规模集体诉讼。

　　该公司的管理合伙人莱恩·克拉克森(Ryan Clarkson)说，该公司希望代表“那些信息被窃取并被商业盗用的真实的人，以创造这种非常强大的技术”。

　　该案件于周三上午提交给加州北部地区的联邦法院。OpenAI的发言人没有立即回应置评请求。

　　这起诉讼触及了围绕聊天机器人和图像生成器等“生成式”人工智能工具激增而悬而未决的一个重大问题的核心。这项技术的工作原理是，从开放的互联网上提取数十亿个单词，并学习在它们之间建立推理。在消耗了足够的数据后，由此产生的“大型语言模型”可以预测对提示的回应，从而使他们能够写诗，进行复杂的对话并通过专业考试。但写下这数十亿字的人从未同意让OpenAI这样的公司利用这些字为自己谋利。

　　这些网站让ChatGPT这样的人工智能听起来很聪明

　　克拉克森说:“所有这些信息都是大规模获取的，而这些信息从未打算被大型语言模型所利用。”他说，他希望让法院对人工智能算法的训练方式以及人们在使用他们的数据时如何获得补偿制定一些保护措施。

　　该公司已经有一批原告，并计划在诉讼启动后招募更多的原告。

　　使用从公共互联网上获取的数据来训练工具的合法性仍不清楚，这些工具可能会给开发者带来丰厚的利润。一些人工智能开发者认为，对互联网数据的使用应被视为“合理使用”，这是版权法中的一个概念，如果材料以“变革性”的方式进行更改，则会产生例外。

　　Gunderson Dettmer律师事务所的知识产权律师凯瑟琳·加德纳(Katherine Gardner)说，合理使用的问题是“一个悬而未决的问题，我们将在未来几个月甚至几年里在法庭上看到它的结果”。Gunderson Dettmer主要代表科技初创企业。她说，艺术家和其他有创意的专业人士可以证明他们的版权作品被用来训练人工智能模型，他们可以对使用它的公司提出异议，但仅仅在网站上发帖或评论的人不太可能赢得损害赔偿。

　　加德纳说:“当你把内容放在社交媒体网站或任何网站上时，你通常会授予该网站一个非常广泛的许可，使其能够以任何方式使用你的内容。”“普通终端用户将很难声称，他们有权因在培训中使用自己的数据而获得任何形式的付款或补偿。”

　　这一诉讼也为那些建立并希望从人工智能技术中获利的公司带来了越来越多的法律挑战。去年11月，OpenAI和微软被提起集体诉讼，指控这两家公司如何使用微软旗下在线编码平台GitHub中的计算机代码来训练人工智能工具。今年2月，Getty Images起诉规模较小的人工智能初创公司Stability AI，指控后者非法使用其照片来训练其图像生成机器人。本月，OpenAI被乔治亚州的一名电台主持人以诽谤罪起诉，该主持人称ChatGPT制作了错误地指控他欺诈的文本。

　　OpenAI并不是唯一一家使用从开放互联网上抓取的大量数据来训练人工智能模型的公司。谷歌(Google)、Facebook、微软(Microsoft)以及越来越多的其他公司都在做同样的事情。但克拉克森决定追随OpenAI，因为去年OpenAI凭借ChatGPT抓住了公众的想象力，促使其更大的竞争对手推出了自己的人工智能。

　　“他们是引发这场人工智能军备竞赛的公司，”他说。“他们自然是首要目标。”

　　OpenAI没有透露其最新型号GPT4的数据类型，但此前的技术版本已经被证明可以消化维基百科页面、新闻文章和社交媒体评论。谷歌和其他公司的聊天机器人也使用了类似的数据集。

　　监管机构正在讨论制定新的法律，要求公司在进入其人工智能的数据方面提高透明度。知识产权律师加德纳说，法庭案件也有可能促使法官迫使OpenAI这样的公司交出其使用的数据信息。

　　一些公司试图阻止人工智能公司收集他们的数据。据英国《金融时报》报道，今年4月，音乐分销商环球音乐集团(Universal music Group)要求苹果和Spotify屏蔽信息搜集。社交媒体网站Reddit关闭了对其数据流的访问，理由是大型科技公司多年来一直在其网站上收集评论和对话。Twitter所有者埃隆·马斯克(Elon Musk)威胁要起诉微软，因为微软使用从该公司获得的Twitter数据来训练其人工智能。马斯克正在建立自己的人工智能公司。

　　针对OpenAI的新集体诉讼进一步提出指控，称该公司对注册使用其工具的用户不够透明，他们输入模型的数据可能被用于培训新产品，该公司将从中获利，例如允许其他公司使用OpenAI的插件工具。它还指控OpenAI在确保13岁以下儿童不使用其工具方面做得不够，这是包括Facebook和YouTube在内的其他科技公司多年来被指控的问题。

• 辅助开挂工具“微乐江西麻将小程序万能开挂器”	• 大连海鲜外包装检出病毒，引发安全关注（大连进
• 必学教你安装“随意玩辅助器开挂”最新辅助详细	• 新辅助神器“大熊竞技麻将有没有挂- 百科讲解
• 必学教你安装“星禾卡五星可以开挂吗”真实开挂	• 十年间外资企业持有房产数量翻倍，外资房企有哪