可悲的是,这种给模型起糟糕名字的趋势也蔓延到了中国的人工智能实验室。
DeepSeek-R1-0528 是 DeepSeek 推出的一款全新且经过大幅改进的开放权重推理模型,较其 1 月份发布的 DeepSeek R1 有了重大改进。
在最新更新中,DeepSeek R1 显著提升了推理深度和推理能力,[…] 其整体性能现已接近 O3 和 Gemini 2.5 Pro 等领先型号。[…]
除了推理能力的提升之外,该版本还降低了幻觉率,增强了对函数调用的支持,并提供了更好的氛围编码体验。
新款 R1 有两种尺寸:一种是 685B 型号,称为deepseek-ai/DeepSeek-R1-0528 (之前的 R1 为 671B),另一种是从 Qwen 3 提炼出来的 8B 变体,称为deepseek-ai/DeepSeek-R1-0528-Qwen3-8B 。
1 月份发布的 R1 拥有更大的精炼模型集合:四个基于 Qwen 2.5(14B、32B、Math 1.5B 和 Math 7B)和两个基于 Llama 3(Llama-3.1 8B 和 Llama 3.3 70B Instruct)。
这次完全没有 Llama 模型。我想知道是不是因为 Qwen 3真的很好,而且是 Apache 2 许可的,而 Llama 仍然坚持他们糟糕的许可条款。
更令人困惑的是,Ollama 将这两个新模型混入了其现有的deepseek-r1标签中。上周,在 Ollama 中运行ollama pull deepseek-r1:8B
会返回DeepSeek-R1-Distill-Llama-8B
(互联网档案链接 ) ,而今天,同样的命令会返回DeepSeek-R1-0528-Qwen3-8B ,一个完全不同的基础模型。
如果这个问题也困扰着你,那么谢天谢地,你可以使用更明确的标签deepseek-r1:8b-0528-qwen3-q8_0 。我是这样运行的:
ollama pull deepseek-r1:8b-0528-qwen3-q8_0
它获取了 8.19GB 的模型权重,然后我让它给我画了一只鹈鹕。
llm install llm-ollama llm -m deepseek-r1:8b-0528-qwen3-q8_0 \ "Generate an SVG of a pelican riding a bicycle"
由于这些模型的“推理”痕迹几乎总是最有趣的部分,我将在此完整引用该回应:
<think>
我们将创建一个 SVG 文件,描绘一只骑自行车的鹈鹕。步骤:
- 创建 SVG 的基本结构,并适当设置宽度和高度(例如,400×200)。
- 画一只鹈鹕:我们将把它分成几个部分——身体、喙、眼睛、脚、翅膀等。
- 画一辆自行车:我们可以用两个圆圈作为车轮,一个矩形作为车架,以及一些其他细节来表示它。
让我们使用以下内容设计 SVG:
- 鹈鹕将面朝右侧(x 轴正方向),因此它将从左向右骑自行车。
- 自行车有两个轮子,并在鹈鹕前面有一个简单的框架。
我们将对每个部分使用绝对定位。假设我们设置坐标如下:
- SVG 的左上角是 (0,0),我们希望场景从左到右绘制。
- 鹈鹕的定位为 (50, 120),体长约为 30 个单位。
我们将使用简单的形状来表示鹈鹕:
身体:椭圆形或圆角矩形。我们用椭圆形来表示身体。喙:一个指向右侧的三角形。头:另一个椭圆形,但尺寸较小,位于身体前方。翅膀:两个上下颠倒的三角形(一个在上方,一个略微在后方)。
自行车:
- 车轮:两个相对于车架固定位置的圆圈。
- 框架:矩形,带有一些车把和座椅的细节。
由于这是一个有趣的插图,我们会保持其简单但易于识别。
让我们相应地编写代码。
</think>
这是一张鹈鹕骑自行车的 SVG 图片。本例使用基本形状来创建风格化的版本:< svg xmlns = “ http://www.w3.org/2000/svg ” viewBox = “ 0 0 400 200 ” > <!--鹈鹕主体--> <椭圆cx = " 150 " cy = " 150 " rx = " 80 " ry = " 60 " fill = " #FFD700 " /> <!--鹈鹕头(为了达到喜剧效果,请放大) --> <圆圈cx = “ 90 ” cy = “ 120 ” r = “ 45 ”填充= “ #FFA3CE ” /> <!--鹈鹕喙--> <多边形点数= “ 80,110 60,120 80,130 70,140 60,150 ”填充= “ #FFC233 ” /> <!--鹈鹕眼--> <圆圈cx = “ 95 ” cy = “ 115 ” r = “ 3 ”填充= “ #fff ” /> <!--自行车车轮--> <椭圆cx = " 380 " cy = " 140 " rx = " 25 " ry = " 60 " transform = "旋转(90 380 140) " fill = "黑色" /> <椭圆cx = " 380 " cy = " 70 " rx = " 25 " ry = " 60 " transform = "旋转(90 380 70) " fill = "黑色" /> <!--自行车车架--> <路径d = “ M 15,40 L 15,140 H 370 L 370,140 V 40 Z ”描边= “灰色”描边宽度= “ 6 ”填充= “无” /> <!--车把和座椅(风格化) --> <路径d = “ M 280,40 C 290,35 300,30 310,40 C 320,50 330,60 310,70 L 310,70 Q 290,50 280,40 ”填充= “无”描边= “灰色” /> <!--踏板--> <圆圈cx = “ 340 ” cy = “ 70 ” r = “ 15 ”填充= “ #3366CC ” /> <多边形点= “ 340,65 330,45 350,45 ”填充= “ #F29E3D ” /> <圆圈cx = “ 340 ” cy = “ 140 ” r = “ 15 ”填充= “ #3366CC ” /> <多边形点数= “ 340,135 330,115 350,115 ”填充= “ #F29E3D ” /> <!--颈部连接头部和身体--> <路径d = “ M 80,120 C 70,160 100,140 150,120 ”笔画= “ #FFA3CE ”笔画宽度= “ 8 ” /> </ svg >解释:
- 鹈鹕身体:一个大的黄色椭圆形。
- 头部:粉红色圆圈,有突出的喙(黄橙色三角形)。
- 自行车:
- 车轮是垂直旋转的黑色椭圆形,以模拟辐条。
- 该框架是一个灰色矩形,从鹈鹕的背部延伸到 SVG 的右侧。
- 车把和座椅是灰色的简化曲线。
这幅图描绘了鹈鹕向前飞行的滑稽场景。您可以通过修改
cx
、cy
、rx
、ry
属性以及填充/描边值来调整颜色、大小或位置。
喜欢这个思考过程和解释!不过实际渲染出来的SVG确实有很多不足之处:
公平地说,这只是在我的笔记本电脑上使用~8GB Qwen3 Q8_0 型号。我没有硬件来运行完整尺寸的 R1,但它可以通过 DeepSeek 的 API 以deepseek-reasoner
形式使用,所以我在那里尝试使用llm-deepseek 插件:
llm install llm-deepseek llm -m deepseek-reasoner \ "Generate an SVG of a pelican riding a bicycle"
这个结果好多了:
标签: LLMS 、 LLM 推理、 Deepseek 、 Ollama 、 AI 、 LLMS 、 LLM 发布、 Generative-AI
原文: https://simonwillison.net/2025/May/31/deepseek-aideepseek-r1-0528/#atom-everything