值得注意的是,当人们抱怨模型质量下降时,往往发现这是没有根据的——Anthropic 过去曾强调,在不更改版本号的情况下,他们不会在发布模型后更改模型权重。
在这种情况下,推理堆栈的升级失败导致模型性能真正下降了 56.5 小时:
从 UTC 时间 8 月 25 日 17:30 到 8 月 28 日 UTC 时间 02:00,Claude Opus 4.1 版本的部分请求质量出现下降。用户可能会遇到智能度降低、响应格式错误或 Claude 代码工具调用出现问题等问题。
这是由于我们的推理堆栈的推出而引起的,后来我们将其回滚至 Claude Opus 4.1。[…]
我们还发现 Claude Opus 4.0 也受到同样问题的影响,我们正在将其回滚。
标签:人工智能、生成人工智能、法学硕士、人择、克劳德、克劳德-4
原文: https://simonwillison.net/2025/Aug/30/claude-degraded-quality/#atom-everything