Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

deepseek-ai/DeepSeek-R1-0528

Posted on 2025-06-01

deepseek-ai/DeepSeek-R1-0528

可悲的是,这种给模型起糟糕名字的趋势也蔓延到了中国的人工智能实验室。

DeepSeek-R1-0528 是 DeepSeek 推出的一款全新且经过大幅改进的开放权重推理模型,较其 1 月份发布的 DeepSeek R1 有了重大改进。

在最新更新中,DeepSeek R1 显著提升了推理深度和推理能力,[…] 其整体性能现已接近 O3 和 Gemini 2.5 Pro 等领先型号。[…]

除了推理能力的提升之外,该版本还降低了幻觉率,增强了对函数调用的支持,并提供了更好的氛围编码体验。

新款 R1 有两种尺寸:一种是 685B 型号,称为deepseek-ai/DeepSeek-R1-0528 (之前的 R1 为 671B),另一种是从 Qwen 3 提炼出来的 8B 变体,称为deepseek-ai/DeepSeek-R1-0528-Qwen3-8B 。

1 月份发布的 R1 拥有更大的精炼模型集合:四个基于 Qwen 2.5(14B、32B、Math 1.5B 和 Math 7B)和两个基于 Llama 3(Llama-3.1 8B 和 Llama 3.3 70B Instruct)。

这次完全没有 Llama 模型。我想知道是不是因为 Qwen 3真的很好,而且是 Apache 2 许可的,而 Llama 仍然坚持他们糟糕的许可条款。

更令人困惑的是,Ollama 将这两个新模型混入了其现有的deepseek-r1标签中。上周,在 Ollama 中运行ollama pull deepseek-r1:8B会返回DeepSeek-R1-Distill-Llama-8B (互联网档案链接 ) ,而今天,同样的命令会返回DeepSeek-R1-0528-Qwen3-8B ,一个完全不同的基础模型。

如果这个问题也困扰着你,那么谢天谢地,你可以使用更明确的标签deepseek-r1:8b-0528-qwen3-q8_0 。我是这样运行的:

 ollama pull deepseek-r1:8b-0528-qwen3-q8_0

它获取了 8.19GB 的模型权重,然后我让它给我画了一只鹈鹕。

 llm install llm-ollama llm -m deepseek-r1:8b-0528-qwen3-q8_0 \ "Generate an SVG of a pelican riding a bicycle"

由于这些模型的“推理”痕迹几乎总是最有趣的部分,我将在此完整引用该回应:

<think>
我们将创建一个 SVG 文件,描绘一只骑自行车的鹈鹕。步骤:

  1. 创建 SVG 的基本结构,并适当设置宽度和高度(例如,400×200)。
  2. 画一只鹈鹕:我们将把它分成几个部分——身体、喙、眼睛、脚、翅膀等。
  3. 画一辆自行车:我们可以用两个圆圈作为车轮,一个矩形作为车架,以及一些其他细节来表示它。

让我们使用以下内容设计 SVG:

  • 鹈鹕将面朝右侧(x 轴正方向),因此它将从左向右骑自行车。
  • 自行车有两个轮子,并在鹈鹕前面有一个简单的框架。

我们将对每个部分使用绝对定位。假设我们设置坐标如下:

  • SVG 的左上角是 (0,0),我们希望场景从左到右绘制。
  • 鹈鹕的定位为 (50, 120),体长约为 30 个单位。

我们将使用简单的形状来表示鹈鹕:

身体:椭圆形或圆角矩形。我们用椭圆形来表示身体。喙:一个指向右侧的三角形。头:另一个椭圆形,但尺寸较小,位于身体前方。翅膀:两个上下颠倒的三角形(一个在上方,一个略微在后方)。

自行车:

  • 车轮:两个相对于车架固定位置的圆圈。
  • 框架:矩形,带有一些车把和座椅的细节。

由于这是一个有趣的插图,我们会保持其简单但易于识别。

让我们相应地编写代码。
</think>
这是一张鹈鹕骑自行车的 SVG 图片。本例使用基本形状来创建风格化的版本:

 < svg xmlns = “ http://www.w3.org/2000/svg ” viewBox = “ 0 0 400 200 ” >   <!--鹈鹕主体-->   <椭圆cx = " 150 " cy = " 150 " rx = " 80 " ry = " 60 " fill = " #FFD700 " />    <!--鹈鹕头(为了达到喜剧效果,请放大) -->   <圆圈cx = “ 90 ” cy = “ 120 ” r = “ 45 ”填充= “ #FFA3CE ” />    <!--鹈鹕喙-->   <多边形点数= “ 80,110 60,120 80,130 70,140 60,150 ”填充= “ #FFC233 ” />    <!--鹈鹕眼-->   <圆圈cx = “ 95 ” cy = “ 115 ” r = “ 3 ”填充= “ #fff ” />    <!--自行车车轮-->   <椭圆cx = " 380 " cy = " 140 " rx = " 25 " ry = " 60 " transform = "旋转(90 380 140) " fill = "黑色" />   <椭圆cx = " 380 " cy = " 70 " rx = " 25 " ry = " 60 " transform = "旋转(90 380 70) " fill = "黑色" />    <!--自行车车架-->   <路径d = “ M 15,40 L 15,140 H 370 L 370,140 V 40 Z ”描边= “灰色”描边宽度= “ 6 ”填充= “无” />    <!--车把和座椅(风格化) -->   <路径d = “ M 280,40 C 290,35 300,30 310,40 C 320,50 330,60 310,70 L 310,70 Q 290,50 280,40 ”填充= “无”描边= “灰色” />    <!--踏板-->   <圆圈cx = “ 340 ” cy = “ 70 ” r = “ 15 ”填充= “ #3366CC ” />   <多边形点= “ 340,65 330,45 350,45 ”填充= “ #F29E3D ” />    <圆圈cx = “ 340 ” cy = “ 140 ” r = “ 15 ”填充= “ #3366CC ” />   <多边形点数= “ 340,135 330,115 350,115 ”填充= “ #F29E3D ” />    <!--颈部连接头部和身体-->   <路径d = “ M 80,120 C 70,160 100,140 150,120 ”笔画= “ #FFA3CE ”笔画宽度= “ 8 ” /> </ svg >

解释:

  • 鹈鹕身体:一个大的黄色椭圆形。
  • 头部:粉红色圆圈,有突出的喙(黄橙色三角形)。
  • 自行车:
    • 车轮是垂直旋转的黑色椭圆形,以模拟辐条。
    • 该框架是一个灰色矩形,从鹈鹕的背部延伸到 SVG 的右侧。
    • 车把和座椅是灰色的简化曲线。

这幅图描绘了鹈鹕向前飞行的滑稽场景。您可以通过修改cx 、 cy 、 rx 、 ry属性以及填充/描边值来调整颜色、大小或位置。

喜欢这个思考过程和解释!不过实际渲染出来的SVG确实有很多不足之处:

一个粉色圆圈与一个黄色椭圆形交叠,中间有一个灰色粗线矩形贯穿两者。右侧两个相同的蓝色圆圈由橙色三角形元素和黑色椭圆形组成,与可能代表鹈鹕的部分有一段距离——很难分辨。

公平地说,这只是在我的笔记本电脑上使用~8GB Qwen3 Q8_0 型号。我没有硬件来运行完整尺寸的 R1,但它可以通过 DeepSeek 的 API 以deepseek-reasoner形式使用,所以我在那里尝试使用llm-deepseek 插件:

 llm install llm-deepseek llm -m deepseek-reasoner \ "Generate an SVG of a pelican riding a bicycle"

这个结果好多了:

一只骑自行车的鹈鹕,画得更好——你可以看出这是一辆自行车,也可以看出骑着自行车的是一只白色的鸟,有着长长的橙色喙,虽然它显然不是一只鹈鹕,而且这只鸟正躺在座位下面。

标签: LLMS 、 LLM 推理、 Deepseek 、 Ollama 、 AI 、 LLMS 、 LLM 发布、 Generative-AI

原文: https://simonwillison.net/2025/May/31/deepseek-aideepseek-r1-0528/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • Elad Gil
  • Ellie Huxtable
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme