OpenAI:
我们即将发布 gpt-oss-120b 和 gpt-oss-20b——两款先进的开放权重语言模型,能够以低成本提供强大的实际性能。这些模型采用灵活的 Apache 2.0 许可证,在推理任务上的表现优于同等规模的开放模型,展现出强大的工具使用能力,并针对在消费级硬件上的高效部署进行了优化。它们采用了强化学习和 OpenAI 最先进的内部模型(包括 o3 和其他前沿系统)的技术进行训练。
gpt-oss-120b 模型在核心推理基准测试中的表现与 OpenAI o4-mini 几乎持平,并且能够在单个 80 GB GPU 上高效运行。gpt-oss-20b 模型在常见基准测试中的结果与 OpenAI o3-mini 相似,并且只需 16 GB 内存即可在边缘设备上运行,使其成为设备端用例、本地推理或快速迭代的理想选择,无需昂贵的基础设施。这两个模型在工具使用、小样本函数调用、CoT 推理(从 Tau-Bench 代理评估套件的结果可以看出)和 HealthBench(甚至超越 OpenAI o1 和 GPT-4o 等专有模型)方面也表现出色。
期待已久的OpenAI 开放权重模型终于面世了,而且非常令人印象深刻。[…]
o4-mini 和 o3-mini 是真正优秀的专有模型——我没想到开放权重版本会达到这个水平,尤其是考虑到它们体积小巧。gpt-oss-20b 模型应该可以在配备 32GB RAM 的 Mac 笔记本电脑上轻松运行。