deepseek-ai/DeepSeek-R1-0528 – 搞英语 → 看世界

可悲的是，这种给模型起糟糕名字的趋势也蔓延到了中国的人工智能实验室。

DeepSeek-R1-0528 是 DeepSeek 推出的一款全新且经过大幅改进的开放权重推理模型，较其 1 月份发布的 DeepSeek R1 有了重大改进。

在最新更新中，DeepSeek R1 显著提升了推理深度和推理能力，[…] 其整体性能现已接近 O3 和 Gemini 2.5 Pro 等领先型号。[…]

除了推理能力的提升之外，该版本还降低了幻觉率，增强了对函数调用的支持，并提供了更好的氛围编码体验。

新款 R1 有两种尺寸：一种是 685B 型号，称为deepseek-ai/DeepSeek-R1-0528 （之前的 R1 为 671B），另一种是从 Qwen 3 提炼出来的 8B 变体，称为deepseek-ai/DeepSeek-R1-0528-Qwen3-8B 。

1 月份发布的 R1 拥有更大的精炼模型集合：四个基于 Qwen 2.5（14B、32B、Math 1.5B 和 Math 7B）和两个基于 Llama 3（Llama-3.1 8B 和 Llama 3.3 70B Instruct）。

这次完全没有 Llama 模型。我想知道是不是因为 Qwen 3真的很好，而且是 Apache 2 许可的，而 Llama 仍然坚持他们糟糕的许可条款。

更令人困惑的是，Ollama 将这两个新模型混入了其现有的deepseek-r1标签中。上周，在 Ollama 中运行ollama pull deepseek-r1:8B会返回DeepSeek-R1-Distill-Llama-8B （互联网档案链接），而今天，同样的命令会返回DeepSeek-R1-0528-Qwen3-8B ，一个完全不同的基础模型。

如果这个问题也困扰着你，那么谢天谢地，你可以使用更明确的标签deepseek-r1:8b-0528-qwen3-q8_0 。我是这样运行的：

 ollama pull deepseek-r1:8b-0528-qwen3-q8_0

它获取了 8.19GB 的模型权重，然后我让它给我画了一只鹈鹕。

 llm install llm-ollama llm -m deepseek-r1:8b-0528-qwen3-q8_0 \ "Generate an SVG of a pelican riding a bicycle"

由于这些模型的“推理”痕迹几乎总是最有趣的部分，我将在此完整引用该回应：

<think>
我们将创建一个 SVG 文件，描绘一只骑自行车的鹈鹕。步骤：

创建 SVG 的基本结构，并适当设置宽度和高度（例如，400×200）。

画一只鹈鹕：我们将把它分成几个部分——身体、喙、眼睛、脚、翅膀等。

画一辆自行车：我们可以用两个圆圈作为车轮，一个矩形作为车架，以及一些其他细节来表示它。

让我们使用以下内容设计 SVG：

鹈鹕将面朝右侧（x 轴正方向），因此它将从左向右骑自行车。

自行车有两个轮子，并在鹈鹕前面有一个简单的框架。

我们将对每个部分使用绝对定位。假设我们设置坐标如下：

SVG 的左上角是 (0,0)，我们希望场景从左到右绘制。

鹈鹕的定位为 (50, 120)，体长约为 30 个单位。

我们将使用简单的形状来表示鹈鹕：

身体：椭圆形或圆角矩形。我们用椭圆形来表示身体。喙：一个指向右侧的三角形。头：另一个椭圆形，但尺寸较小，位于身体前方。翅膀：两个上下颠倒的三角形（一个在上方，一个略微在后方）。

自行车：

车轮：两个相对于车架固定位置的圆圈。

框架：矩形，带有一些车把和座椅的细节。

由于这是一个有趣的插图，我们会保持其简单但易于识别。

让我们相应地编写代码。
</think>
这是一张鹈鹕骑自行车的 SVG 图片。本例使用基本形状来创建风格化的版本：
 < svg xmlns = “ http://www.w3.org/2000/svg ” viewBox = “ 0 0 400 200 ” >      <椭圆cx = " 150 " cy = " 150 " rx = " 80 " ry = " 60 " fill = " #FFD700 " />       <圆圈cx = “ 90 ” cy = “ 120 ” r = “ 45 ”填充= “ #FFA3CE ” />       <多边形点数= “ 80,110 60,120 80,130 70,140 60,150 ”填充= “ #FFC233 ” />       <圆圈cx = “ 95 ” cy = “ 115 ” r = “ 3 ”填充= “ #fff ” />       <椭圆cx = " 380 " cy = " 140 " rx = " 25 " ry = " 60 " transform = "旋转(90 380 140) " fill = "黑色" />   <椭圆cx = " 380 " cy = " 70 " rx = " 25 " ry = " 60 " transform = "旋转(90 380 70) " fill = "黑色" />       <路径d = “ M 15,40 L 15,140 H 370 L 370,140 V 40 Z ”描边= “灰色”描边宽度= “ 6 ”填充= “无” />       <路径d = “ M 280,40 C 290,35 300,30 310,40 C 320,50 330,60 310,70 L 310,70 Q 290,50 280,40 ”填充= “无”描边= “灰色” />       <圆圈cx = “ 340 ” cy = “ 70 ” r = “ 15 ”填充= “ #3366CC ” />   <多边形点= “ 340,65 330,45 350,45 ”填充= “ #F29E3D ” />    <圆圈cx = “ 340 ” cy = “ 140 ” r = “ 15 ”填充= “ #3366CC ” />   <多边形点数= “ 340,135 330,115 350,115 ”填充= “ #F29E3D ” />       <路径d = “ M 80,120 C 70,160 100,140 150,120 ”笔画= “ #FFA3CE ”笔画宽度= “ 8 ” /> </ svg >
解释：

鹈鹕身体：一个大的黄色椭圆形。

头部：粉红色圆圈，有突出的喙（黄橙色三角形）。

自行车：

车轮是垂直旋转的黑色椭圆形，以模拟辐条。

该框架是一个灰色矩形，从鹈鹕的背部延伸到 SVG 的右侧。

车把和座椅是灰色的简化曲线。

这幅图描绘了鹈鹕向前飞行的滑稽场景。您可以通过修改cx 、 cy 、 rx 、 ry属性以及填充/描边值来调整颜色、大小或位置。

喜欢这个思考过程和解释！不过实际渲染出来的SVG确实有很多不足之处：

一个粉色圆圈与一个黄色椭圆形交叠，中间有一个灰色粗线矩形贯穿两者。右侧两个相同的蓝色圆圈由橙色三角形元素和黑色椭圆形组成，与可能代表鹈鹕的部分有一段距离——很难分辨。

公平地说，这只是在我的笔记本电脑上使用~8GB Qwen3 Q8_0 型号。我没有硬件来运行完整尺寸的 R1，但它可以通过 DeepSeek 的 API 以deepseek-reasoner形式使用，所以我在那里尝试使用llm-deepseek 插件：

 llm install llm-deepseek llm -m deepseek-reasoner \ "Generate an SVG of a pelican riding a bicycle"

这个结果好多了：

一只骑自行车的鹈鹕，画得更好——你可以看出这是一辆自行车，也可以看出骑着自行车的是一只白色的鸟，有着长长的橙色喙，虽然它显然不是一只鹈鹕，而且这只鸟正躺在座位下面。

标签： LLMS 、 LLM 推理、 Deepseek 、 Ollama 、 AI 、 LLMS 、 LLM 发布、 Generative-AI

原文： https://simonwillison.net/2025/May/31/deepseek-aideepseek-r1-0528/#atom-everything