在明天 GPT-5即将发布之前,当人工智能新闻室里所有的氧气都将被吸走时,我认为值得指出一些关于 OpenAI本周“开源”发布的事情。
首先,OpenAI 又“开放”了!显然,这并不完全正确。但在人工智能领域,“开源”如今已经意味着“开放权重”,这在很大程度上要归功于马克·扎克伯格无休止地吹捧前者,而Meta 的 Llama 模型则意味着后者。也就是说,Meta 乐于让任何人看到香肠的制作过程,但不愿看到香肠的配料。而且,这现在已经成为相当标准的行业惯例。
情况并非一直如此。事实上,OpenAI 似乎被设定为谷歌在 2014 年收购 DeepMind(顺便说一句,Facebook/Meta 也曾试图收购 DeepMind)后即将采取的行动的完全“开放”替代方案。但现实很快显现。OpenAI 不仅发现很难真正以非营利组织的身份参与竞争——因此微软介入——而且开源技术对社会的影响如此深远,也引发了非常现实的质疑。如果任何人都可以完全访问此类技术,可能会产生一些非常负面的潜在副作用。
于是,真正的“开放”消失了,取而代之的是部分“开放”。OpenAI 上一次发布此类模型是在六年前,当时是 GPT-2。但现在他们又回来了,整个行业似乎都围绕着“开放权重”模型——这些模型是从非开放旗舰模型中提炼出来的或衍生出来的——而形成了一种行业标准做法。
Meta 曾试图通过开放其实际旗舰模型来运行不同的策略,但效果并不理想。现在,他们正斥资数十亿美元,试图重返通用人工智能/超级智能的前沿模型竞赛。他们仍然声称致力于“开源”,因为他们无疑将采用与 OpenAI 和其他公司相同的策略:锁定其旗舰模型,同时开放这些模型的子集。
需要明确的是,这仍然是一项重要且具有潜在危险的工作。正如 Casey Newton 在《Platformer》一书中所写:
关于人工智能安全的讨论通常集中在模型变得更强大时会发生什么。然而,或许同样重要的是,当它们变得更小时会发生什么。直到最近,可用于网络攻击或其他恶意行为的人工智能模型只能通过能够检测滥用并切断违规者的大型平台访问。然而,在过去的几个月里,前沿实验室发布了可以在商用笔记本电脑上运行的强大模型,完全不受实验室的任何监督。
这些“开源”模型不仅仅是“开放”,而是它们是更小的变体,可以在云端无需超级集群的机器上运行。你可以在你的MacBook上运行OpenAI模型的更小版本。这既令人惊叹,又可能令人担忧。
与此同时,他们通过将其设置为纯文本来进一步限制这些内容,但如果这些模型是最先进的,那么文本此时可能已经足够强大,足以引起真正的问题 – 即使还没有完全达到,它们也已经接近了。
至少从叙事角度来看,这无疑是 OpenAI 对 Meta 发起的一次猛烈反击。众所周知, Meta 似乎正在试图从竞争对手那里挖走所有人,而且这种做法有时奏效,有时则失败。Sam Altman 可以用金钱来反击,但更有力的可能是在 Meta 可能逐渐远离“开源”的同时,在“开源”领域引起轰动。
与此相关,此举也让 OpenAI 在那些关注 AI 开放元素的人眼中占据了更友好的地位。当你是市场领导者时,就像 OpenAI 现在显然是的一样,这虽然是小事一桩,但意义重大。
考虑到谷歌刚刚因为当年围绕 Android 的“开放”承诺而遭受重创,我觉得这一切都格外耐人寻味。这是一个完全不同的市场,一个完全不同的世界,但它表明,尽管“开放”显然备受推崇,但它也并非那么简单——我不妨参考一下达里奥·阿莫迪几周前在Big Technology播客上对“开源”的看法——而且 OpenAI 很可能也不会再有这样的情况了。