Qwen3-235B-A22B-思考-2507 – 搞英语 → 看世界

这是 Qwen 模型发布的第三个周，此前一周发布了Qwen3-235B-A22B-Instruct-2507 （周一）和Qwen3-Coder-480B-A35B-Instruct （周二）。

这两个都是非推理模型 – 与 Qwen 3 系列中的先前模型不同，后者在同一个模型中结合了推理和非推理，由/think和/no_think标记控制。

今天的型号 Qwen3-235B-A22B-Thinking-2507（也作为FP8 变体发布）是他们的新思维变体。

Qwen 声称其“在开源思维模型中取得了最先进的成果”，并将上下文长度增加到 262,144 个标记，较 4 月份的Qwen3-235B-A22B有了很大的飞跃，后者“原生长度为 32,768 个标记，使用 YaRN 后长度为 131,072 个标记”。

他们自己发布的基准测试显示，在思考模式下，其得分与 DeepSeek-R1-0528、OpenAI 的 o3 和 o4-mini、Gemini 2.5 Pro 和 Claude Opus 4 相当。

新模型已经可以通过 OpenRouter 获得。

但它的鹈鹕有多好？

我尝试通过 OpenRouter 生成“鹈鹕骑自行车的 SVG”这个任务，它思考了 166 秒——将近三分钟！我从未见过一个模型思考这么久。难怪文档里有以下内容：

但是，由于模型可能需要更长的标记序列进行推理，我们强烈建议在可能的情况下使用大于 131,072 的上下文长度。

这是那段思考痕迹的副本。浏览起来真的很有趣：

Qwen3 235B A22B 思考 2507 鹈鹕的座位位于 (200,200) 处。鹈鹕的身体将是：- 主体：一个圆形，从 (200,200) 开始延伸到 (250, 250) 左右 [但请注意：鹈鹕是坐着的，所以身体可能更直立？] - 头部：位于 (200, 180) [座位上方] 处，喙向前延伸到 (280, 180) 左右。我们将鹈鹕设计为：- 头部：位于 (180, 170) 处，半径为 15 的圆圈。- 喙：一个从 (180,170) 到 (250,170) 再向下到 (250,180) 再返回的长三角形？实际上，喙是一个长而平的三角形。

鹈鹕画完了？不太好看！不过我喜欢它的喙：

克劳德·桑内特 (Claude Sonnet) 4 的描述：极简主义平面插图，以橙色喙的白色鸟类角色、紫色矩形平板电脑或设备、灰色云状形状、两个黑色“T”字母、彩色几何元素（包括橙色和青色三角形）、散布在浅色背景上的橙色和绿色圆点以及底部的细黑线

通过@Alibaba_Qwen

标签： ai 、 generative-ai 、 llm 、 qwen 、 pelican-riding-a-bicycle 、 llm-reasoning 、 llm-release

原文： https://simonwillison.net/2025/Jul/25/qwen3-235b-a22b-thinking-2507/#atom-everything