2

距离 GitHub 推出 Copilot 服务已经一个月。这款 AI 编程工具基于从 GitHub 上提取的万亿字节公开可用代码以及英语示例进行训练,能够自动补全整行代码或整段函数、基于注释生成对应代码,还能编写测试、快速发现解决问题的替代方法,带来了极大的效率提升。然而官宣一个月以来,它引发的关于版权、开源许可证、隐私安全等的讨论从未止息。

近日,自由软件基金会(FSF)也表明了质疑态度,并征集白皮书以探讨关于 Copilot 的哲学与法律问题。

自由软件基金会是一个致力于推广自由软件的民间非营利性组织,其主要工作是运行 GNU 计划,开发更多的自由软件。自 1990 年代中期以来,自由软件基金会的雇员和志愿者主要在自由软件运动的法律和结构问题上工作。

FSF 许可合规经理 Donald Robertson 在一篇博客中指出,Copilot 是不可接受且不公正的。它需要运行非免费 / 自由软件(如 Visual Studio 或 Visual Studio Code 的一部分),并且 Copilot 属于软件替代性服务(Service as a Software Substitute),即基于他人的计算获得能力。

FSF 表示 Copilot 对于 freely licensed 软件的使用给自由软件社区中很大一部分成员带来影响:开发者想知道在其软件上训练神经网络是否为合理使用;其他对使用 Copilot 感兴趣的人想知道从 GitHub 托管的 repo 中复制的代码片段和其他元素是否会导致侵权;即使这些在法律上是合理的,开发者也想知道,一家专有软件公司利用开发者的工作构建服务,是否存在根本上的不公平。

为了帮助社区获得所需要的答案,并寻求在这一领域捍卫用户自由的最佳机会,FSF 宣布资助白皮书征集活动,以解决 Copilot、版权、机器学习和自由软件问题。FSF 表示将阅读提交的白皮书,并选择有助于阐明问题的白皮书进行发表,被发表的文章将获得 500 美元奖金,截止时间为 2021 年 8 月 23 日。

此外,FSF 列出了一些感兴趣的问题:

  • Copilot 基于公共存储库进行训练是否侵犯版权?是否属于合理使用?
  • Copilot 的输出对 GPL 许可作品产生可诉侵权索赔的可能性有多大?
  • 开发者如何确保其拥有版权的代码免受 Copilot 的影响?
  • 是否有办法让使用 Copilot 的开发人员遵守自由软件许可证,如 GPL?
  • 如果 Copilot 学习 AGPL 覆盖的代码,那么 Copilot 是否侵犯了 AGPL?
  • 如果 Copilot 生成的代码确实导致了对自由软件许可作品的侵犯,版权所有者如何发现这种侵犯?
  • 由机器学习产生的人工智能 / 机器学习模型是训练数据的编译版本,还是用户可以通过进一步训练来修改的东西,如源代码?
    -Copilot 训练的 AI/ML 模型有版权吗?如果是,谁拥有版权?
  • 像 FSF 这样的道德倡导组织是否应该主张修改与这些问题相关的版权法?

对于 FSF 的抗议,GitHub 表示愿意对任何问题持开放态度。“这是一个新的领域,我们期待与开发者一起参与这些话题的讨论,引领行业就训练 AI 模型制定恰当的标准。

参考链接:


小魔
735 声望1k 粉丝