Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

Qwen3-235B-A22B-思考-2507

Posted on 2025-07-26

Qwen3-235B-A22B-思考-2507

这是 Qwen 模型发布的第三个周,此前一周发布了Qwen3-235B-A22B-Instruct-2507 (周一)和Qwen3-Coder-480B-A35B-Instruct (周二)。

这两个都是非推理模型 – 与 Qwen 3 系列中的先前模型不同,后者在同一个模型中结合了推理和非推理,由/think和/no_think标记控制。

今天的型号 Qwen3-235B-A22B-Thinking-2507(也作为FP8 变体发布)是他们的新思维变体。

Qwen 声称其“在开源思维模型中取得了最先进的成果”,并将上下文长度增加到 262,144 个标记,较 4 月份的Qwen3-235B-A22B有了很大的飞跃,后者“原生长度为 32,768 个标记,使用 YaRN 后长度为 131,072 个标记”。

他们自己发布的基准测试显示,在思考模式下,其得分与 DeepSeek-R1-0528、OpenAI 的 o3 和 o4-mini、Gemini 2.5 Pro 和 Claude Opus 4 相当。

新模型已经可以通过 OpenRouter 获得。

但它的鹈鹕有多好?

我尝试通过 OpenRouter 生成“鹈鹕骑自行车的 SVG”这个任务,它思考了 166 秒——将近三分钟!我从未见过一个模型思考这么久。难怪文档里有以下内容:

但是,由于模型可能需要更长的标记序列进行推理,我们强烈建议在可能的情况下使用大于 131,072 的上下文长度。

这是那段思考痕迹的副本。浏览起来真的很有趣:

Qwen3 235B A22B 思考 2507 鹈鹕的座位位于 (200,200) 处。鹈鹕的身体将是:- 主体:一个圆形,从 (200,200) 开始延伸到 (250, 250) 左右 [但请注意:鹈鹕是坐着的,所以身体可能更直立?] - 头部:位于 (200, 180) [座位上方] 处,喙向前延伸到 (280, 180) 左右。我们将鹈鹕设计为:- 头部:位于 (180, 170) 处,半径为 15 的圆圈。- 喙:一个从 (180,170) 到 (250,170) 再向下到 (250,180) 再返回的长三角形?实际上,喙是一个长而平的三角形。

鹈鹕画完了?不太好看!不过我喜欢它的喙:

克劳德·桑内特 (Claude Sonnet) 4 的描述:极简主义平面插图,以橙色喙的白色鸟类角色、紫色矩形平板电脑或设备、灰色云状形状、两个黑色“T”字母、彩色几何元素(包括橙色和青色三角形)、散布在浅色背景上的橙色和绿色圆点以及底部的细黑线

通过@Alibaba_Qwen

标签: ai 、 generative-ai 、 llm 、 qwen 、 pelican-riding-a-bicycle 、 llm-reasoning 、 llm-release

原文: https://simonwillison.net/2025/Jul/25/qwen3-235b-a22b-thinking-2507/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme