DeepSeek 的最新模型,一个 685B 的怪物(就像之前的DeepSeek v3一样),但这次它是一个混合推理模型。
DeepSeek 声明:
DeepSeek-V3.1-Think 的答案质量与 DeepSeek-R1-0528 相当,但响应速度更快。
Drew Breunig指出,他们的基准测试显示“分数相同,但令牌数量减少了 25-50%”——至少在 AIME 2025、GPQA Diamond 和 LiveCodeBench 中是如此。
DeepSeek 版本包含编码代理、 Python 代理和搜索代理的提示示例 – 更多证据表明,领先的人工智能实验室已将这些作为其模型支持的三种最重要的代理模式。
这是它给我画的一只骑自行车的鹈鹕(文字记录),是我使用OpenRouter 聊天从手机上运行的。
标签:人工智能、提示工程、生成人工智能、法学硕士、 drew-breunig 、鹈鹕骑自行车、法学硕士推理、 deepseek 、法学硕士发布、 openrouter 、编码代理、人工智能在中国
原文: https://simonwillison.net/2025/Aug/22/deepseek-31/#atom-everything