Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

Qwen/Qwen3-30B-A3B-Instruct-2507

Posted on 2025-07-30

Qwen/Qwen3-30B-A3B-Instruct-2507

Qwen 发布了新型号,比 4 月底发布的 Qwen3-30B-A3B有所改进。他们在推文中表示:

更智能、更快速、更适合本地部署。

✨ 主要增强功能:
✅ 增强推理、编码和数学技能
✅ 更广泛的多语言知识
✅ 改进了长上下文理解(最多 256K 个 token)
✅ 更好地与用户意图和开放式任务保持一致
✅ 不再有<think>块 — — 现在完全以非思考模式运行

🔧 使用 3B 激活参数,它的性能接近 GPT-4o 和 Qwen3-235B-A22B 非思考模型

我尝试了chat.qwen.ai托管的模型“生成一只骑自行车的鹈鹕的 SVG”,得到了以下结果:

这张照片很可爱:蓝天、绿草,阳光灿烂。自行车是红色的,带轮子的方块,看起来更像玩具车。鹈鹕看起来不像鹈鹕,喙上印着一丝古怪的微笑。

我特别喜欢 SVG 源代码中的这个细节:

 <!-- Bonus: Pelican's smile --> <path d="M245,145 Q250,150 255,145" fill="none" stroke="#d4a037" stroke-width="2"/>我去寻找适合我的 Mac 的量化版本,并发现<!-- Bonus: Pelican's smile --> <path d="M245,145 Q250,150 255,145" fill="none" stroke="#d4a037" stroke-width="2"/>

lmstudio-community/Qwen3-30B-A3B-Instruct-2507-MLX-8bit,来自LM Studio 。启动并运行它需要下载 32.46GB 的文件,而且它似乎占用了 30GB 多一点的内存。

我从那只鹈鹕那儿得到的不太好:

它看起来更像是一只高大的黄色小母鸡骑着赛格威

然后,我在 GLM-4.5 Air 上运行的“编写一个 HTML 和 JavaScript 页面来实现太空入侵者”任务中尝试了这个本地模型。输出结果看起来很有希望,尤其是在入侵者的设计上似乎投入了更多精力(GLM-4.5 Air 只使用了矩形):

 // 绘制敌舰 ctx.fillStyle = this.color ;​​​​  // 船体 ctx.fillRect (这个.x ,这个.y ,这个.width ,这个.height ) ;​​​​​​  // 敌人的眼睛 ctx .填充样式= '#fff' ; ctx.fillRect (这个.x + 6 ,这个.y + 5,4,4 ) ;​​​​​​​​ ctx.fillRect (这个.x +这个.width - 10 ,这个.y + 5,4,4 ) ;​​​​​​​​​  // 敌人触角 ctx .填充样式= '#f00' ; 如果(这个。类型=== 1 ) {     // 基本敌人     ctx.fillRect (这个.x +这个.width / 2-1 ,这个.y - 5,2,5 ) ;​​​​​​​​​​​ }否则,如果(此。类型=== 2 ) {     // 快速敌人     ctx.fillRect (这个.x +这个.width / 4-1 ,这个.y - 5,2,5 ) ;​​​​​​​​​​​     ctx.fillRect (这个.x + ( 3 *这个.width ) / 4 - 1 ,这个.y - 5,2,5 ) ;​​​​​​​​​ }否则,如果(此。类型=== 3 ) {     // 装甲敌人     ctx.fillRect (这个.x +这个.width / 2-1 ,这个.y - 8,2,8 ) ;​​​​​​​​​​​     ctx .填充样式= '#0f0' ;     ctx.fillRect (这个.x +这个.width / 2-1 ,这个.y - 6,2,3 ) ;​​​​​​​​​​​ }

但最终的代码并没有真正起作用:

黑屏——一排好看的太空入侵者在屏幕上前进了一会儿……然后整个屏幕变黑了。

针对未量化的 Qwen 托管模型的相同提示产生了不同的结果,不幸的是,这也导致了游戏无法玩– 这次是因为一切都发展得太快了。

这个新的 Qwen 模型是一个非推理模型,而 GLM-4.5 和 GLM-4.5 Air 都是推理模型。看起来,在这个规模下,“推理”可能会在获得开箱即用的代码方面产生实质性的影响。

标签: ai 、 generative-ai 、 llm 、 qwen 、 mlx 、 llm-reasoning 、 llm-release 、 lm-studio

原文: https://simonwillison.net/2025/Jul/29/qwen3-30b-a3b-instruct-2507/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme