Drew Breunig 最近发表了一些关于情境工程的非常详细的文章。在《情境如何长期失效》一书中,他描述了情境腐烂的四种常见模式,并总结如下:
- 语境中毒:当幻觉或其他错误进入语境并被反复引用时。
- 上下文干扰:当上下文变得太长时,模型会过度关注上下文,而忽略在训练期间学到的内容。
- 上下文混淆:当模型使用上下文中多余的信息来生成低质量的响应时。
- 上下文冲突:当您在上下文中积累的新信息和工具与提示中的其他信息相冲突时。
在后续文章中,他介绍了解决这些问题的巧妙想法(以及更多新术语)。
工具装载描述了选择一组工具来启用提示,根据研究表明超过 20 个工具可能会使某些模型感到困惑。
上下文隔离是“在各自的专用线程中隔离上下文的行为”——我过去曾将其称为子代理,这是Claude Code 使用的模式,并在Anthropic 的多代理研究论文中进行了深入探讨。
上下文修剪是指“从上下文中删除不相关或不需要的信息”,而上下文摘要是指将累积的上下文提炼为精简的摘要。随着对话越来越长,并且越来越接近模型的标记限制,这些技术变得尤为重要。
上下文卸载是指“将信息存储在 LLM 上下文之外的行为”。我见过一些系统实现了自己的“记忆”工具,用于保存笔记并在工作时重新查看。但最近一个更有趣的例子是,各种编码代理在解决更大的问题时,会创建和更新plan.md
文件。
德鲁的结论:
上述所有策略的关键在于,上下文并非自由。上下文中的每个标记都会影响模型的行为,无论好坏。现代 LLM 的海量上下文窗口是一项强大的功能,但这并非在信息管理上马虎的借口。
标签:人工智能、提示工程、生成人工智能、法学硕士、 drew-breunig 、法学硕士工具使用、人工智能代理
原文: https://simonwillison.net/2025/Jun/29/how-to-fix-your-context/#atom-everything