GitHub Copilot 集体诉讼案概述
背景
GitHub Copilot 是由 OpenAI Codex 支持的代码助手,于 2021 年夏季首次预览,并于 2022 年 7 月正式发布。该服务通过分析 GitHub 上的现有代码和注释,帮助开发者编写新代码。
诉讼内容
程序员兼律师 Matthew Butterick 和专门处理反垄断和集体诉讼的 Joseph Saveri 律师事务所提交了针对 GitHub、微软和 OpenAI 的集体诉讼。诉讼指控这些公司通过使用公开仓库中的代码训练其 AI 系统,违反了开源许可证(如 MIT、GPL 和 Apache 许可证)中关于署名要求的规定。
主要观点
- 开源许可证的违反:诉讼认为,被告在未获得授权的情况下使用开源代码训练 AI 系统,违反了开源许可证的要求。
- 公平使用原则的质疑:诉讼文件质疑了“公平使用”原则在此案中的适用性,并指出即使适用,也无法规避合同违约、隐私问题和 DMCA 问题。
- AI 系统与人类用户的区别:Butterick 认为,AI 系统不应被赋予与人类用户不同的标准,广泛的开源许可证违规行为不应被视为不可避免的成本。
专家观点
- Alex Champandard:认为诉讼文件显示了 Codex 和 Copilot 的行为类似于数据库,并列举了从许可来源逐字复制的代码示例,包括错误。
- Giuseppe Bertone:认为开发者应对他们使用的工具负责,Copilot 只是一个工具,应该起诉那些错误使用受版权保护的代码的开发者。
影响
此案被认为是首例挑战 AI 系统训练和输出的集体诉讼,可能不仅影响 Copilot,还可能影响其他公司开发的类似工具,如 AWS 的 CodeWhisperer。
相关评论
- Authors Alliance:指出此案提出了关于如何使用基于受版权保护材料的数据集训练和生成 AI 输出的重要问题。
- Jeremy Daly:评论称,AI 生成的代码从私有仓库学习可能导致“前所未有的软件盗版”诉讼。
后续
Butterick 创建了一个专门网站,提供有关此案的背景信息。GitHub、微软和 OpenAI 尚未对此诉讼发表评论。
总结
此集体诉讼案挑战了 GitHub Copilot 和 OpenAI Codex 的合法性,指控其违反开源许可证。此案不仅对 Copilot 有影响,还可能对整个 AI 行业产生深远影响,特别是在如何使用受版权保护材料训练 AI 系统的问题上。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。