去年年底,人工智能代理真正让我眼前一亮。这部分是因为模型性能的提升,但更重要的是,我们赋予了它们超越纯粹推理能力的工具。现在,这些编码代理能够控制终端,运行测试来验证其工作,在网络上搜索文档,并使用我们用通俗易懂的英语教给它们的技能来操作网络服务。现实正迅速赶上人们的预期!
如果你尝试过在现代终端设备上使用任何新型人工智能模型——尤其是 Claude Opus 4.5、Codex 5、Gemini 3,甚至是像 MiniMax M2.1 和 GLM-4.7 这样的中国产开源模型——就能明显感受到这一点。这些新型人工智能生成的代码比它们在 2025 年初的水平要高得多。
我非常享受在OpenCode中运用所有这些功能,OpenCode 是一个用于编码代理的终端界面,它允许您在所有模型之间无缝切换,捕获您的会话以进行共享,并且当与Omarchy的其他部分主题匹配时,看起来简直令人惊叹(我们将在下一个版本中将其设为默认主题!)。
说实话,我一直不太喜欢编辑器里那种让AI自动补全代码的体验。GitHub的Copilot和Cursor最初就是这么做的,但我并不觉得它好用。写代码的时候,我希望自己能把想法和句子写完。去年夏天我在Lex Fridman的播客节目里也表达过这种观点。
但有了这些自主智能体,体验就截然不同了。这更像是团队合作,而不是和一位过于热情、总是抢着敲键盘帮你完成代码的结对程序员一起工作。智能体团队能够自主完成工作,我只需要审核最终结果,在需要时提供指导,并惊叹于这一切是如何实现的。
是的,我准备给目前的这批人工智能代理升职。它们不再仅仅是帮助我学习、回答我的问题或检查我的工作。它们完全有能力为实际代码库贡献生产级别的代码。
然而,纯粹的灵感编码对我来说,目前仍然是职业工作的梦想。不过,有指导的协作如今已然成为现实。我曾与开发人员一起修复小bug、完成重要功能,并就一些重大新项目撰写了多个草稿。这种模式的转变终于让我感到真实。
现在,一切都取决于你正在做什么,以及你的期望是什么。炒作的浪潮愈演愈烈,如果你相信了“我们五分钟后就会让所有专业程序员失业”这种说法,你肯定会失望的。
我看到网上有些人吹嘘说,他们的代理人能写出 90% 以上的代码,但我离那种水平还差得远呢。我不知道他们是怎么写出那么高的代码比例的,但如果我能保证代码的质量和一致性,那我所能达到的水平就远远达不到那种程度了。
但我可以理解大家的兴奋之情!因为即使不仔细分析当前的趋势,未来的发展前景也足以令人眼花缭乱。人工智能代理在2025年取得的飞跃式进步简直令人难以置信。这是自上世纪90年代将计算机连接到互联网以来,我们让计算机完成的最激动人心的事情。那么,2026年或2027年又会是什么样子呢?我完全理解大家的激动心情。
我也理解有些程序员急于对这一切置之不理。各种炒作没完没了,最天马行空的说法也远未得到证实,而且这一切最终会把这个行业带向何方,确实充满不确定性。但这仍然不足以成为错过人类和计算机历史上这一激动人心时刻的理由!
你得亲自体验一下。看看我们现在的发展阶段。下载 OpenCode,在 Opus 或其他程序上投入一些实际工作,好好享受我们生活在教会机器思考的时代的这份殊荣。