开源不适用于人工智能?

在人工智能领域做最有趣工作的公司可能会努力以我们传统预期的方式“开源”。即便如此,这并不意味着它们不能以有意义的方式开放。

本文来自开源云中文社区。

我们需要做一些事情来谈论开源和开放性。至少从2006年开始,笔者就清楚地知道——笔者因为认为谷歌和雅虎阻碍开源而与很多人有了争吵。正如Tim O'Reilly当时写道的那样,在一个开源的云时代,“为了让别人运行你的程序,分享源代码副本的必要性的动机之一不复存在了。不仅不再需要它,对于最大的应用程序来说,这不再可能。”

在过去的十年里,共享的不可能性搅乱了开源的定义,正如Mike Loukides最近指出的那样,它现在正在影响我们对人工智能(AI)的思考方式。在人工智能领域进行合作,从来没有比这更重要的时刻,但也从来没有比这更困难的时刻。正如Loukides所描述的,“由于其规模,大型语言模型在再现性方面存在重大问题。”

正如2006年的云技术一样,在人工智能领域做最有趣工作的公司可能会努力以我们传统预期的方式“开源”。即便如此,这并不意味着它们不能以有意义的方式开放。

根据Loukides的说法,虽然许多公司可能声称参与了人工智能,但实际上只有三家公司推动了该行业的发展:Facebook、OpenAI和谷歌。他们有什么共同点?大规模运行模型的能力。换句话说,他们正在以一种你我都做不到的方式做人工智能。他们不是在试图保密;他们只是拥有基础设施和如何运行基础设施的知识,而你我都没有。

“你可以下载Facebook的OPT-175B的源代码,”Loukides承认,“但你无法在任何你可以访问的硬件上对其进行训练。即使对于大学和其他研究机构来说,它也太大了。你仍然必须相信Facebook的话,它做它所说的事情。”,尽管Facebook宣布“共享开放式预训练Transformer(OPT-175B)……让更多社区参与了解这项基础性新技术。”

这听起来不错,但正如Loukides坚持的那样,“即使谷歌和OpenAI拥有足够的计算资源,也可能无法复制OPT-175B。”为什么?“OPT-175B与Facebook的基础设施(包括定制硬件)联系太紧密,无法在谷歌的基础设施上复制。尽管Facebook并没有试图隐藏它对OPT-175B的使用。建造这样的基础设施真的很难,即使是那个些有资金和技术的人最终也会建造一些不同的东西。

这正是雅虎的Jeremy Zawodny和谷歌的Chris DiBona于2006年在OSCON上所体现的。当然,他们可以开放所有代码的源代码,但考虑到它是以一种在其他任何地方都无法复制的方式大规模运行的,别人能用它做什么呢?

回到人工智能。如果我们不了解机器内部的科学,就很难相信人工智能。我们需要找到开放基础设施的方法。Loukides有一个想法,尽管它可能无法满足最狂热的自由软件/人工智能人士:“答案是向外部研究人员和早期采用者提供免费访问权限,以便他们可以提出自己的问题,并查看广泛的结果。”不,不是让他们通过钥匙卡访问Facebook、谷歌或OpenAI的数据中心,而是通过公共API。这是一个有趣的想法,可能会奏效。

但它并不像许多人所希望的那样“开源”。

另一个角度看开放

自2006年以来,谷歌在满足其战略需求的情况下对关键基础设施进行了打包和开源。TensorFlow开源可以称为入站,Kubernetes的开源可以称为出站,要么是机器学习的开源行业标准,有望带来更多谷歌云工作负载,要么是确保云之间的可移植性,给谷歌云更多赢得工作负载的机会。这是一种智能业务,但在某种程度上,它不是开源的。

在这方面,谷歌也并非孤军奋战。它只是比大多数公司更擅长开源。因为开源天生自私,公司和个人总是会打开有利于他们或他们自己的客户的代码。一直都是这样,而且永远都是这样。

对于Loukides关于如何有意义地开放人工智能的观点,尽管三大人工智能巨头与其他所有人之间存在差异,但他并没有像我们传统上在开源定义下那样主张开源。为什么?因为尽管它很神奇(事实上也是如此),但它从来没有解决过DiBona和Zawodny在2006年OSCON提出的软件开发者和消费者的云开源难题。已经过去十多年的时间了,但我们还没有找到答案。

笔者认为我们需要一种新的思考开源许可的方式,笔者的想法可能与Loukides思考人工智能的方式没有太大的不同。我理解他的论点,关键是为研究人员提供足够的途径,使他们能够重现特定人工智能模型工作的成功和失败。他们不需要完全访问所有代码和基础设施来运行这些模型,因为正如他所说的那样,这样做基本上是没有意义的。在一个开发者可以在笔记本电脑上运行开源程序并进行衍生工作的世界里,要求完全访问该代码是有道理的。考虑到谷歌或微软今天运行的代码的规模和独特的复杂性,这已经没有意义了。无论如何,并不是所有大规模运行的云代码。

我们需要抛弃开源的非黑即白观点。它从来不是一个特别有用的视角来看待开源世界,考虑到我们的云时代,它正变得越来越不那么有用。作为公司和个人,我们的目标应该是以有利于我们的客户和第三方开发者的方式开放对软件的访问,以促进访问和理解,而不是试图将几十年前的开源概念改造为云。它不适用于开源,就像它不适用于人工智能一样。是时候换个角度思考了。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论