AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

贝壳号 | 发布于2021-07-02

  编辑按:本文转载至微信公众号 “新智元”,贝壳投研经授发布.

Github和OpenAI联合发布的AI代码生成工具——Copilot,看起来简直就编(mo)程(yu)神器。

 Copilot不仅能依据程序员写的几行注释生成对应的代码,而且还可以根据代码的上下文自动补全整段函数。

 在1750亿个参数的GPT-3语言模型的加持下,其核心Codex模型接受了来自GitHub的数十亿行开源代码的训练。

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 显然,Copilot的效果十分理想,用过的人都对其大加赞赏。

 「Copilot似乎确切地知道我接下来要输入的内容,而且Copilot在处理React组件时特别有用,它可以做出非常准确的预测。」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 GitHub的CEO Nat Friedman也非常兴奋地表示:「每天都有数百名GitHub的开发者在使用Copilot,如果预览版进展顺利的话,我们将计划在未来某个时候将其扩展为付费产品。」

 等一下,GitHub这是把开源的代码一波操作之后变成「付费」的产品?

 AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 网友们一下子炸了,看这架势是要无视General Public License?

 「他们自己承认,Github Copilot接受了大量GPL(通用公共许可证)代码的训练,这难道不是一种将开源代码清洗为商业产品的形式么。『它通常不会重现精确的代码』这个声明很难令人满意。」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 GPL——通用公共许可证是什么?

 根据维基百科的解释,GNU General Public License,中文翻译为通用公共许可证,简称GPL,是一系列自由软件许可证,可保证用户运行、研究、共享和修改软件的自由。 

 同时,GPL是一个Copyleft许可证,这意味着任何衍生作品都必须遵循相同或等效的许可条款。

 GNU官网对于GPL的解释说,如果你想把修改过的GPL代码向公众发布,就需要提供源代码。

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container

 GPL许可证系列一直是开源软件领域中最受欢迎的软件许可证之一。其中就有大名鼎鼎的Linux内核。 

 对于Linux的成功,GPL在其中也扮演了至关重要的位置,它保证了为内核做出贡献的程序员的工作保持自由,而不是被他人利用。

 而Copilot用基于GPL的代码进行训练这件事,网友概括道:「GPL明确声明『不要将我的工作放在专利软件中』,而Copilot则是一种将他们的工作放在专利软件中的机制。」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 有网友表示不解:「为什么这是一个问题?GPL不是说可以自由地共享和修改代码?」

 「是的,GPL允许共享和修改代码,但必须将其作为GPL发布」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 也有网友表示:「你怎么知道『你想出来』的代码不是源自GPL的代码?」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 「但是,人类也通过阅读开源代码来学习,所以这不是一回事么?」

「不,人类具有抽象的理解能力,并有广泛的知识可供借鉴,而统计模型没有。」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 「人类开发人员在大量封闭和开源项目上进行训练,并反刍他们作为片段藏起来的代码,是在创作衍生作品吗?」

 「呃,是的,如果你『隐藏』了GPL代码的片段,然后将其复制粘贴到商业项目中,这听起来就像是在违反许可。」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 难道真能用别人的代码赚钱?

针对把别人的代码商用化这件事,甲骨文对谷歌侵权的诉讼可以说是一个非常著名的案例了。

 其中的争议集中在Java的部分API和约11,000行源代码的使用上,这些源代码归甲骨文所有,而谷歌则把它们用在早期的安卓操作系统上。

 AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 甲骨文提起诉讼,称这些API是受版权保护的,要求谷歌从侵权的安卓版本的销售和许可中获得88亿美元的损害赔偿。

 虽然两次地区法院级别的陪审团审判都支持谷歌,但联邦巡回法院推翻了这两项决定,声称 API受版权保护,并且谷歌的使用不属于合理使用。

 谷歌在2019年的任期内成功向最高法院申请审理此案,重点关注API的版权和后续合理使用。2021年4月,最高法院以6比2的裁决裁定谷歌对Java API的使用属于合理使用。该决定推翻了联邦巡回法院的裁决,并将案件发回重审。

 网友调侃道:「在谷歌的某个地方:『我们有 0.1% 的机会从甲骨文中逐字复制一小块代码,我们应该使用它吗?』」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

 反方观点

「被视为一个受版权保护『作品』的『衍生作品』,必须包括原始作品的『实质性』部分。而Copilot自动生成的5行函数不会被法律领域的任何人视为『衍生作品』。」

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

对于AI学习了开源代码之后,重新组装并复用它们,而背后的公司则用这个AI去赚钱,你怎么看?

飞鲸投研从多维度分析,整理了一份《成长50》的名单,可以关注同名公众号:"飞鲸投研":feijingtouyan,进行领取(点击复制)

Tags: 新智元
该文观点仅代表作者本人,飞鲸投研系信息发布平台

/阅读下一篇/

产业发展沿革的分析重点有哪些?

热门推荐