
Simon Willison 评论了苹果研究人员最近发表的一篇论文,该论文发现,最先进的大型语言模型在超过某些复杂度阈值后会面临性能彻底崩溃:我认为这篇论文获得的关注远远超出了它应有的程度——“思考的幻觉”这个标题吸引了“法学硕士是被过度炒作的垃圾”一派的注意。我看到了足够多的、理由充分的反驳,以至于我觉得不值得深究。现在,著名的法学硕士怀疑论者 Gary Marcus 将这些最好的反驳汇集到一起,为我节省了一些时间![…] 而这正是我的不同意见所在。我对法学硕士是否是“通往通用人工智能之路”并不感兴趣。我仍然只关心它们在今天是否有实际的应用,前提是你已经了解了它们的局限性。推理法学硕士是该领域一个相对较新且有趣的分支。它们显然能够解决大量以前的法学硕士(LLM)无法解决的问题,因此我们看到了 OpenAI、Anthropic、Gemini、DeepSeek、Qwen 和 Mistral 等机构涌现的新模型。如果将它们与工具结合使用,它们会变得更加有趣。无论它们能否可靠地解决汉诺塔或渡河难题,它们对我来说已经很有用了。
在 Slashdot 上阅读更多内容。