本月不可否认的是,目前最好的开放权重模型来自中国人工智能实验室。
我依然非常喜欢 Mistral、Gemma 和 Llama,但我的感觉是 Qwen、Moonshot 和 Z.ai 在 7 月份对它们的评价很高。
以下是本月发布的内容,并附有我对每个内容的笔记链接:
- Moonshot Kimi-K2-Instruct – 7 月 11 日,1 万亿个参数
- Qwen Qwen3-235B-A22B-Instruct-2507 – 2350亿年7月21日
- Qwen Qwen3-Coder-480B-A35B-Instruct – 7月22日,4800亿
- Qwen Qwen3-235B-A22B-思考-2507 – 2350亿年7月25日
- Z.ai GLM-4.5 和 GLM-4.5 Air – 7 月 28 日,3550 亿和 1060 亿
- Qwen Qwen3-30B-A3B-Instruct-2507 – 7月29日,300亿
- Qwen Qwen3-30B-A3B-Thinking-2507 – 7月30日,300亿
值得注意的是,DeepSeek 没有出现在这个列表中,但这只是因为他们上次发布的型号是 4 月份的DeepSeek-R1-0528 。
其中唯一不太靠谱的许可证是 Kimi K2,它使用了不符合 OSI 标准的修改版 MIT。Qwen 的模型都是 Apache 2,而 Z.ai 的模型是 MIT。
大型中国型号都提供自己的 API,并且越来越多地从其他供应商处获得。我已经能够在自己的笔记本电脑上运行 Qwen 30B 和 GLM-4.5 Air 106B 型号的版本。
我不禁想知道,OpenAI 的开放权重模型发布延迟的部分原因是否是因为他们希望比这一系列真正令人印象深刻的中国模型更出色。
标签:开源、 qwen 、 openai 、 generative-ai 、 ai 、 local-llms 、 llms
原文: https://simonwillison.net/2025/Jul/30/chinese-models/#atom-everything