Qwen/Qwen3-30B-A3B-Instruct-2507 – 搞英语 → 看世界

Qwen 发布了新型号，比 4 月底发布的 Qwen3-30B-A3B有所改进。他们在推文中表示：

更智能、更快速、更适合本地部署。

✨ 主要增强功能：
✅ 增强推理、编码和数学技能
✅ 更广泛的多语言知识
✅ 改进了长上下文理解（最多 256K 个 token）
✅ 更好地与用户意图和开放式任务保持一致
✅ 不再有<think>块 — — 现在完全以非思考模式运行

🔧 使用 3B 激活参数，它的性能接近 GPT-4o 和 Qwen3-235B-A22B 非思考模型

我尝试了chat.qwen.ai托管的模型“生成一只骑自行车的鹈鹕的 SVG”，得到了以下结果：

这张照片很可爱：蓝天、绿草，阳光灿烂。自行车是红色的，带轮子的方块，看起来更像玩具车。鹈鹕看起来不像鹈鹕，喙上印着一丝古怪的微笑。

我特别喜欢 SVG 源代码中的这个细节：

 <!-- Bonus: Pelican's smile --> <path d="M245,145 Q250,150 255,145" fill="none" stroke="#d4a037" stroke-width="2"/>我去寻找适合我的 Mac 的量化版本，并发现<!-- Bonus: Pelican's smile --> <path d="M245,145 Q250,150 255,145" fill="none" stroke="#d4a037" stroke-width="2"/>

lmstudio-community/Qwen3-30B-A3B-Instruct-2507-MLX-8bit，来自LM Studio 。启动并运行它需要下载 32.46GB 的文件，而且它似乎占用了 30GB 多一点的内存。

我从那只鹈鹕那儿得到的不太好：

它看起来更像是一只高大的黄色小母鸡骑着赛格威

然后，我在 GLM-4.5 Air 上运行的“编写一个 HTML 和 JavaScript 页面来实现太空入侵者”任务中尝试了这个本地模型。输出结果看起来很有希望，尤其是在入侵者的设计上似乎投入了更多精力（GLM-4.5 Air 只使用了矩形）：

 // 绘制敌舰 ctx.fillStyle = this.color ;  // 船体 ctx.fillRect (这个.x ，这个.y ，这个.width ，这个.height ) ；  // 敌人的眼睛 ctx .填充样式= '#fff' ; ctx.fillRect (这个.x + 6 ，这个.y + 5，4，4 ) ； ctx.fillRect (这个.x +这个.width - 10 ，这个.y + 5，4，4 ) ；  // 敌人触角 ctx .填充样式= '#f00' ; 如果（这个。类型=== 1 ） {     // 基本敌人     ctx.fillRect (这个.x +这个.width / 2-1 ，这个.y - 5，2，5 ) ； }否则，如果（此。类型=== 2 ） {     // 快速敌人     ctx.fillRect (这个.x +这个.width / 4-1 ，这个.y - 5，2，5 ) ；     ctx.fillRect (这个.x + ( 3 *这个.width ) / 4 - 1 ，这个.y - 5，2，5 ) ； }否则，如果（此。类型=== 3 ） {     // 装甲敌人     ctx.fillRect (这个.x +这个.width / 2-1 ，这个.y - 8，2，8 ) ；     ctx .填充样式= '#0f0' ;     ctx.fillRect (这个.x +这个.width / 2-1 ，这个.y - 6，2，3 ) ； }

但最终的代码并没有真正起作用：

黑屏——一排好看的太空入侵者在屏幕上前进了一会儿……然后整个屏幕变黑了。

针对未量化的 Qwen 托管模型的相同提示产生了不同的结果，不幸的是，这也导致了游戏无法玩– 这次是因为一切都发展得太快了。

这个新的 Qwen 模型是一个非推理模型，而 GLM-4.5 和 GLM-4.5 Air 都是推理模型。看起来，在这个规模下，“推理”可能会在获得开箱即用的代码方面产生实质性的影响。

标签： ai 、 generative-ai 、 llm 、 qwen 、 mlx 、 llm-reasoning 、 llm-release 、 lm-studio

原文： https://simonwillison.net/2025/Jul/29/qwen3-30b-a3b-instruct-2507/#atom-everything