Qwen/Qwen3-30B-A3B-Instruct-2507
Qwen 发布了新型号,比 4 月底发布的 Qwen3-30B-A3B有所改进。他们在推文中表示:
更智能、更快速、更适合本地部署。
✨ 主要增强功能:
✅ 增强推理、编码和数学技能
✅ 更广泛的多语言知识
✅ 改进了长上下文理解(最多 256K 个 token)
✅ 更好地与用户意图和开放式任务保持一致
✅ 不再有<think>
块 — — 现在完全以非思考模式运行🔧 使用 3B 激活参数,它的性能接近 GPT-4o 和 Qwen3-235B-A22B 非思考模型
我尝试了chat.qwen.ai托管的模型“生成一只骑自行车的鹈鹕的 SVG”,得到了以下结果:
我特别喜欢 SVG 源代码中的这个细节:
<!-- Bonus: Pelican's smile --> <path d="M245,145 Q250,150 255,145" fill="none" stroke="#d4a037" stroke-width="2"/>
我去寻找适合我的 Mac 的量化版本,并发现<!-- Bonus: Pelican's smile --> <path d="M245,145 Q250,150 255,145" fill="none" stroke="#d4a037" stroke-width="2"/>
lmstudio-community/Qwen3-30B-A3B-Instruct-2507-MLX-8bit,来自LM Studio 。启动并运行它需要下载 32.46GB 的文件,而且它似乎占用了 30GB 多一点的内存。
我从那只鹈鹕那儿得到的不太好:
然后,我在 GLM-4.5 Air 上运行的“编写一个 HTML 和 JavaScript 页面来实现太空入侵者”任务中尝试了这个本地模型。输出结果看起来很有希望,尤其是在入侵者的设计上似乎投入了更多精力(GLM-4.5 Air 只使用了矩形):
// 绘制敌舰 ctx.fillStyle = this.color ; // 船体 ctx.fillRect (这个.x ,这个.y ,这个.width ,这个.height ) ; // 敌人的眼睛 ctx .填充样式= '#fff' ; ctx.fillRect (这个.x + 6 ,这个.y + 5,4,4 ) ; ctx.fillRect (这个.x +这个.width - 10 ,这个.y + 5,4,4 ) ; // 敌人触角 ctx .填充样式= '#f00' ; 如果(这个。类型=== 1 ) { // 基本敌人 ctx.fillRect (这个.x +这个.width / 2-1 ,这个.y - 5,2,5 ) ; }否则,如果(此。类型=== 2 ) { // 快速敌人 ctx.fillRect (这个.x +这个.width / 4-1 ,这个.y - 5,2,5 ) ; ctx.fillRect (这个.x + ( 3 *这个.width ) / 4 - 1 ,这个.y - 5,2,5 ) ; }否则,如果(此。类型=== 3 ) { // 装甲敌人 ctx.fillRect (这个.x +这个.width / 2-1 ,这个.y - 8,2,8 ) ; ctx .填充样式= '#0f0' ; ctx.fillRect (这个.x +这个.width / 2-1 ,这个.y - 6,2,3 ) ; }
但最终的代码并没有真正起作用:
针对未量化的 Qwen 托管模型的相同提示产生了不同的结果,不幸的是,这也导致了游戏无法玩– 这次是因为一切都发展得太快了。
这个新的 Qwen 模型是一个非推理模型,而 GLM-4.5 和 GLM-4.5 Air 都是推理模型。看起来,在这个规模下,“推理”可能会在获得开箱即用的代码方面产生实质性的影响。
标签: ai 、 generative-ai 、 llm 、 qwen 、 mlx 、 llm-reasoning 、 llm-release 、 lm-studio
原文: https://simonwillison.net/2025/Jul/29/qwen3-30b-a3b-instruct-2507/#atom-everything