OpenAI 的 Foundry 将允许客户购买专用计算来运行其 AI 模型

OpenAI 正在悄悄推出一个新的开发者平台，让客户可以在专用容量上运行公司更新的机器学习模型，如GPT-3.5 。在早期访问用户发布到 Twitter 的文档截图中，OpenAI 将即将推出的名为 Foundry 的产品描述为“专为运行更大工作负载的尖端客户而设计”。

“[Foundry 允许]通过完全控制模型配置和性能配置文件进行大规模推理，”文档中写道。

如果屏幕截图可信，Foundry——无论何时启动——都将提供专用于单个客户的计算容量的“静态分配”。用户将能够使用 OpenAI 用于构建和优化模型的相同工具和仪表板来监控特定实例。此外，Foundry 将提供一定程度的版本控制，让客户决定是否升级到更新的模型版本，以及对 OpenAI 最新模型进行“更稳健”的微调。

Foundry 还将提供服务级别承诺，例如正常运行时间和日历工程支持。租金将基于具有三个月或一年承诺的专用计算单元；运行单个模型实例将需要特定数量的计算单元（见下表）。

实例不会便宜。运行轻量级 GPT-3.5 的三个月承诺费用为 78,000 美元，一年承诺费用为 264,000 美元。从这个角度来看，Nvidia 的新一代超级计算机之一 DGX Station 每台售价149,000 美元。

（GPT-3.5 Turbo 似乎指的是 ChatGPT Turbo 模型）

扩展产品简介和完整来源： https://t.co/GhBlSOR0ZA pic.twitter.com/FL0r4uCEiR

– Travis Fischer (@transitive_bs) 2023 年 2 月 21 日

眼尖的 Twitter 和Reddit用户发现，实例定价图表中列出的文本生成模型之一具有最大 32k 的上下文窗口。（上下文窗口指的是模型在生成额外文本之前考虑的文本；更长的上下文窗口允许模型本质上“记住”更多的文本。）GPT-3.5，OpenAI 的最新文本生成模型，有一个最大 4k 的上下文窗口，暗示这个神秘的新模型可能是期待已久的GPT-4——或者是迈向它的垫脚石。

在获得微软数十亿美元的投资后，OpenAI 面临越来越大的盈利压力。据报道，该公司预计到 2023 年将赚取 2 亿美元，与迄今为止投入这家初创公司的超过 10 亿美元相比，这微不足道。

计算成本在很大程度上是罪魁祸首。培训最先进的 AI 模型可能需要数百万美元以上的资金，而运行它们通常也不会便宜很多。根据 OpenAI 联合创始人兼首席执行官 Sam Altman 的说法，运行 OpenAI 的病毒式聊天机器人 ChatGPT 每次聊天花费几美分——考虑到截至去年 12 月 ChatGPT 拥有超过 100 万用户，这不是一个微不足道的数字。

在货币化方面，OpenAI 最近推出了 ChatGPT 的“专业”版本ChatGPT Plus ，起价为每月 20 美元，并与微软合作开发了Bing Chat ，这是一款引起主流关注的有争议的聊天机器人（委婉地说）。据Semafor 和The Information 报道，OpenAI 计划在未来推出一款移动 ChatGPT 应用程序，并将其 AI语言技术引入 Word、PowerPoint 和 Outlook 等微软应用程序中。

另外，OpenAI 继续通过微软的Azure OpenAI 服务（一个以业务为中心的模型服务平台）提供其技术，并维护与 GitHub 合作开发的高级代码生成服务Copilot 。

OpenAI 的 Foundry 将让客户购买专用计算来运行其 AI 模型，作者Kyle Wiggers最初发表于TechCrunch

原文： https://techcrunch.com/2023/02/21/openai-foundry-will-let-customers-buy-dedicated-capacity-to-run-its-ai-models/