我打开了 Claude Code,并给它下达了一条指令:“开发一个基于网络或软件的创业项目,每月能给我带来 1000 美元的收入。你负责生成创意并实现它,我什么都不用做,只需要运行你给我的程序一次。它不需要我任何编程知识,所以请确保一切运行良好。 ” 人工智能问了我三个选择题,然后决定我应该以 39 美元的价格出售包含 500 个提示的专业用户提示包。之后,它无需任何进一步的输入,就独立运行了……整整一个小时十四分钟,生成了数百个代码文件和提示。最后,它给了我一个运行文件,这个文件生成并部署了一个网站(里面充斥着非常可疑的虚假营销宣传),用来销售承诺的 500 个提示包。你可以在这里看到它生成的网站,不过我删除了销售链接,因为那个链接原本是有效的,而且确实能收款。我强烈怀疑,如果我无视自己的良心,真的把这些提示包卖出去,我就能赚到承诺的 1000 美元。
这是 Claude Code 的工作场景,它是新一代人工智能编码工具之一,代表着人工智能在过去一个月左右的时间里能力的飞跃式发展。这些新工具之所以如此强大,并非源于某一项突破,而是两项进步的结合。首先,最新的人工智能能够自主完成更多工作,并能自我纠正许多错误,尤其是在编程任务中。其次,人工智能被赋予了一套“智能体组件”,其中包含各种工具和方法,使它们能够以全新的方式解决问题。这两个因素的结合,促成了大型人工智能公司最新人工智能工具的飞跃式发展。
METR 指标追踪人工智能能够以 50% 的可靠性自主完成的任务时长(以人类专业人员完成这些任务所需的时间衡量)。该指标呈指数级增长,尤其在过去几个月中实现了大幅提升。这只是衡量人工智能能力的一个指标,但它与其他大多数指标也存在相关性。
对于我们大多数想要尝试人工智能的人来说,不幸的是,这些新工具是为程序员设计的。我的意思是,它们确实是为程序员设计的:它们假定你了解 Python 命令和编程最佳实践,而且它们的界面看起来像是上世纪 80 年代计算机实验室里的东西。它们还明确地设计成使用符合现有程序员工作流程的方法来帮助分析、排除故障和编写代码。在很多方面,这很可惜,因为这些系统实际上对各种类型的知识工作者都非常有用,而且,通过了解它们的功能(并亲自尝试),我认为你可以对人工智能的未来有更深入的了解。在本文中,我们将重点介绍其中一款工具——基于 Opus 4.5 的 Claude Code,但它的工作原理与它的主要竞争对手 OpenAI 的 Codex(基于 GPT-5.2)和Google 的 Antigravity(基于 Gemini 3)类似。
回到Claude Code创建的那家初创公司的例子,尽管它的实际效果令人印象深刻,但这仅仅展现了该工具强大功能的一小部分。当时我只用Claude Code编写代码,但如果我让它以不同用户角色对网站进行测试并生成报告,它就会启用其众多工具之一——连接到我电脑上的浏览器。Claude会控制浏览器,访问它创建的网站,像真人一样浏览。第一次测试,它给出的报告相当乐观,但我知道人工智能往往会吹毛求疵,所以我又要求它生成一份更严谨的报告。第二份报告更好地指出了潜在的问题(并识别出了网站上那些可疑的虚假评论)。接下来,我可以轻松地让它实施这些建议,只需我极少的干预即可继续完成整个流程。
魔术戏法
Claude Code之所以如此出色,很大程度上是因为它在其智能体框架中运用了多种技巧,使其高度智能的AI Opus 4.5能够克服许多LLM(长期记忆模型)的难题。例如,在AI进行用户调研时,发生了一件有趣的事情:它的上下文窗口被填满了。众所周知,AI一次只能“记住”有限的信息。这个上下文窗口按人类的标准来看通常相当长(15万字或更多),但它填满的速度却非常快,因为它包含了你们的全部对话、AI阅读的每份文档、拍摄的每一张图片,以及引导AI的初始系统提示。AI没有真正的长期记忆,因此一旦上下文窗口被填满,AI就无法记住任何其他内容。如果你们只是在进行简单的聊天,这倒不是什么问题。与 ChatGPT 的任何长时间对话都会采用滚动上下文窗口,人工智能会不断遗忘对话中最古老的部分,但通常能够根据最近的讨论内容进行即兴发挥,从而跟上对话节奏。然而,如果你在进行实际工作,人工智能在读取新代码时遗忘部分代码就会成为一个大问题。
Claude Code 以不同的方式处理这个问题。当它失去上下文时,它会停止并“压缩”迄今为止的对话,记录下停止时的具体位置。然后,它会清除上下文窗口,新版本的 Claude Code 会读取这些记录并回顾迄今为止的进度——可以想象一下电影《记忆碎片》中失忆的主角,每次醒来失去记忆后都会查看自己的纹身作为参考。这些记录为 Claude 提供了继续运行所需的一切。这就是为什么 Claude 可以一次运行数小时,它会仔细记录沿途的操作,并生成一些阶段性成果,例如软件和报告,供其参考。
这并非克劳德·科德用来绕过人工智能局限性的唯一技巧。另一个技巧是运用“技能” 。正如所有读者所知,用户需要提示人工智能执行操作。这些提示相当于指令,随着人工智能变得越来越智能,它们执行复杂提示的能力也越来越强,即使是长达数百页的提示也能轻松应对。然而,这些冗长的提示会占用大量的上下文窗口,因此需要用户在恰当的时机向人工智能提供恰当的提示。这意味着,要么用户需要不断地提示人工智能,要么用户需要设计一个复杂的自动化系统来持续地向人工智能提供提示。
技能可以解决这个问题。技能是人工智能决定何时使用的指令,它们不仅包含提示,还包含人工智能完成任务所需的工具集。它需要知道如何搭建一个优秀的网站吗?它会加载“网站创建者”技能,该技能解释了如何搭建网站以及搭建过程中需要使用的工具。它需要创建一个Excel电子表格吗?它会加载“Excel”技能,其中包含相应的指令和工具。再举个电影的例子,就像《黑客帝国》中的尼奥将武术指令上传到大脑并获得一项新技能:“我会功夫了。”技能可以让人工智能根据需要替换知识,从而完成整个流程。例如,杰西·文森特发布了一份有趣的免费技能列表,让克劳德·科德能够处理完整的软件开发流程,根据需要选择技能,从头脑风暴和规划开始,一直到代码测试。创建技能在技术上非常简单,它使用简单的语言编写,而且人工智能实际上可以帮助你创建技能(稍后会详细介绍)。
除了技能之外,Claude Code 还掌握着其他一些技巧来管理其有限的上下文窗口并解决难题。它还可以创建子智能体——实际上是启动其他专门的 AI 来解决特定问题。这在很多方面都很有用。由于 Opus 是一个庞大且昂贵的模型,它可以将一些简单的任务交给更便宜、更快速的模型。这也使得 Claude 能够同时运行许多不同的进程,使其像一个团队一样工作,而不是像一个独立个体。而且这些模型可以非常专业化,拥有各自的上下文窗口。例如,我构建了用于研究和图像创建的独立子智能体。主 AI 模型会在需要时“雇佣”这些子智能体来完成专门的工作。
而且你甚至不需要创建自己的工具。任何人都可以共享技能或子代理,希望人工智能代理与其产品协同工作的公司可以使用一种名为模型上下文协议(MCP)的方法,向任何人工智能提供指令和访问权限。例如,出版商的 MCP 允许人工智能访问科学论文进行研究;支付公司的 MCP 使人工智能能够分析财务数据;软件提供商的 MCP 允许人工智能使用特定的软件产品,等等。最终形成了一个非常灵活的系统,像 Claude Opus 4.5 这样的智能通用人工智能可以随时应用专业技能,根据需要使用工具,并跟踪自身的操作。
Claude Code之所以功能强大,是因为它直接作用于你的电脑和文件。这意味着你现在拥有了一个人工智能,它几乎可以完成任何人类用户能够访问你电脑时所能做的事情。它可以读取你所有的文件并创建新文件(毕竟,PowerPoint和Word本质上也是代码,而Claude懂得如何编写代码),使用你的浏览器访问网络,为你编写并执行程序等等。当然,人工智能并非完美无缺,让人工智能访问你的浏览器和电脑会带来各种新的风险和危险。人工智能可能会删除不该删除的文件,执行会产生意想不到后果的代码,或者访问你浏览器中的敏感数据。尽管存在这些警告,我还是会为你快速介绍一下Claude Code,但请务必做好备份,使用专用文件夹,并且不要让它访问任何你无法承受损失的数据。
克劳德密码业余指南
虽然我之前的截图中一直使用的是 Claude Code 的命令行界面,但从昨天开始,访问 Claude Code 有了一种更简便的方法。你可以使用 Claude Desktop,你可以从这里下载并安装(长期使用至少需要每月 20 美元的订阅费)。目前,桌面版的功能比命令行界面少一些,但对于新手来说更容易上手。
现在,只需授予 AI 访问某个文件夹的权限(请记住,Claude 可以对该文件夹中的文件执行任何操作,因此如果文件包含敏感信息,请务必小心并做好备份),您就可以开始使用 AI 了:让它进行研究并撰写报告,授予它访问您的信用卡记录的权限以便将其导入电子表格并告知您任何异常情况,让它进行数据可视化,或者做任何您想要的事情。我之前提到的最强大的功能可以通过以“/”开头的斜杠命令访问——输入 /agents 可以设置子代理,输入 /skills 可以创建或下载技能,等等(桌面版的斜杠命令有限,但完整的命令集即将推出)。人们使用 Claude Code 的方式多种多样,您可以尝试不同的方法,找到最适合自己的方式,但我建议您也用它来编写实际代码,即使您不是程序员。
例如,在我撰写这篇文章时,我会时不时地打开一个 Claude Code 窗口,让 AI 为我构建一个游戏,纯粹是为了好玩:一个模拟历史的游戏,其中文明兴衰更替,发展出各自的语言、文化和经济。每隔几分钟,我就会给 AI 提出一个看似不可能完成的任务:确保世界拥有自己的板块构造和气候;记录统治者的家谱;构建一个能够生动概括历史事件的 AI 等等。每次修改后,AI 都会测试结果并生成一个新版本的游戏。与我之前使用 Vibe Code 的经历不同,这次 AI 从未卡住或陷入循环,一切都进行得非常顺利。请观看下面的视频。我确信,视频中肯定存在一些经验丰富的程序员能够发现的问题,但您可以在这里下载最终结果(这部分也是 AI 处理的)。
这一切意味着什么?如果你是一名程序员,你应该已经在探索这些工具了。如果你与编程相关(比如从事数据工作的学者、想要尝试代码的设计师,或者任何想要将脑海中的想法付诸实践的人),现在正是你进行实验的好时机。但这里还有更深层次的意义:有了合适的工具,如今的人工智能能够胜任真正有意义的、持续性的工作,而这反过来又开始改变我们处理任务的方式。
不出所料,变革始于编程领域。人工智能领域一位颇有名气的程序员 Andrej Karpathy最近发帖称:“我从未感觉自己作为程序员如此落后。随着程序员贡献的部分越来越少,整个行业正在经历剧烈的重构。我感觉,如果我能把过去一年左右涌现的资源整合起来,我的能力可以提升十倍,而未能充分利用这些资源,无疑让我觉得自己的技能出了问题。” 不要被当前 Claude Code 的笨拙之处或其对编程的专精所迷惑。让人工智能应用于其他知识任务的新工具即将问世,随之而来的变革也将接踵而至。
原文: https://www.oneusefulthing.org/p/claude-code-and-what-comes-next







