回归代码 – 搞英语 → 看世界

Vibe编码、个人应用商店以及苹果霸权的终结

尼维：您正在收听的是海军播客。我是尼维，他的常驻搭档。今天我们要聊聊氛围编码。

重返编程

Nivi：让我先引用Naval 3月23日的一条推文来引出这个话题：“人工智能编码代理现在可以将一次性定制应用程序直接发送到你的手机上。这是iPhone统治地位走向终结的开始。”

你想谈谈你正在开发的产品以及你是如何分发的吗？

Naval：嗯，是的，让我来谈谈氛围编码以及我是如何接触到它的。

因此，大约在 2025 年 12 月，随着Claude Opus 4.5的发布，人工智能领域的编码代理迎来了一个转折点。人们开始使用它，并惊叹道：“哇——这是一个能够保持方向、能够从头到尾构建应用程序、能够解决棘手问题的代理，而且真的感觉就像拥有一个随时待命的初级程序员，他速度快、基本上免费，而且乐于助人。”

那是一个转折点，我当时在推特上看到各种宣传，但这次感觉很真实。我以前也尝试过编程代理，效果有好有坏，但这次我真的投入进去了。我已经几十年没认真写过代码了。我拥有计算机科学学位；我了解计算机体系结构和网络，也略懂芯片、算法等等。

但我已经很久没有认真写代码了。

编写代码的启动能量非常高。你必须把所有这些不同的服务连接起来。从GitHub到后端——比如Vercel 、 Firebase 、 Railway等等——需要连接的东西太多了。

你必须了解很多术语——很多工具。而人工智能现在让这一切变得非常简单。所以，我和其他人一样，一开始也用的是Claude Code 。我还用Codex解决过一些棘手的 bug 和深奥的问题，我立刻就上瘾了。它真的非常有趣。那么：现在有什么变化呢？嗯，智能体真的非常有效。

现在这些工具不再只是简单的代码辅助工具——你让它解决某个特定问题，它就给你一堆代码，然后你再复制粘贴到你的集成开发环境（IDE）里。现在，你需要打开一个终端——也就是他们所说的命令行界面（CLI）。它完全基于文本，而这正是这些工具的优势所在，因为它们最初就是基于文本标记进行训练的。它们内部或底层运行的是Unix系统。这些智能体非常了解Unix，因为如果你查看它们训练所用的所有代码——无论是在GitHub、其他平台还是Stack Overflow上——你会发现其中大部分都是Unix代码。

而且大多数现代操作系统底层实际上都是Unix。众所周知，macOS是基于BSD的。所以，它们的底层都是Unix，也就是文本输入、文本输出。这些代理程序本质上是长期运行的编码人工智能，它们的核心与Unix系统相连。它们连接到Unix shell以便执行命令，并通过基本的Unix命令连接到文件系统。

它们可以调用所有 Unix 命令，例如grep 、 awk 、 sed和 pipe 等等——所有这些操作符都可以相互串联。它们可以运行cron任务，从而实现长时间运行；并且可以根据需要生成更多 shell 和更多任务。

个人应用商店

海军：这很容易让人上瘾，因为——通常来说，一旦你开始编程，编程就会变得非常有趣。

但要真正上手，启动成本确实很高。不过现在突然之间，你不再需要掌握所有工具和命令。这些机器会说英语。人工智能是出色的翻译器。它们早期的核心应用之一就是机器翻译。它们最初接受的是翻译测试。但现在，它们可以翻译 Python、C、Lisp、Rust 以及各种不同的编程语言方言和各种专用命令——而且它们用英语交流，沟通起来也非常宽容。

所以，你可以用不同的词语；你可以拼写错误；你可以用自己的方式解释事情。但是，如果你对计算机体系结构、网络和编程有基本的了解——其实这并不需要太多，可以非常基础，或者说非常高层次；这里说的基础不是指简单，而是指高层次——那么你就能走得很远很远。

于是，出于好玩，我尝试开发了一系列不同的应用。一开始，我做的是“一键生成”我想要的特定应用。所谓“一键生成”，就是我只需输入一个描述，它就能生成一个应用。然后，我开始在此基础上不断改进。最终，我搭建了一个属于我自己的小型应用商店，一个完全供我自己使用的应用商店。

我可以向它请求一个应用；它可以将这个应用上传到我的应用商店（一个网页），最终我把它变成一个安装在我iPhone上的应用。然后我就可以一键下载这些应用，并且可以像在App Store里一样进行更新。

所以，例如，如果我想要一个可以追踪我锻炼情况的新应用——而我已经有了一个；我专门为我的锻炼情况构建了一个定制的追踪应用，完全符合我的喜好——所以我可以说：

“嘿，使用Tonal和Ladder的功能；遵循苹果的人机界面指南，让它看起来像一个苹果应用；用以下方式追踪我的锻炼——这是我最近几次锻炼的文字记录——并让我可以轻松地重新输入新的锻炼记录并进行调整；为我生成漂亮的图表来追踪我的进度；添加你能想到的任何其他功能——计算力量评分；阅读科学论文，找出按身体部位计算力量评分的正确方法；制作人体结构图，以便显示哪些肌肉更大，哪些肌肉更小；连接到 Apple Health 来监测我的心率。”

所以我并没有把所有内容都放在一个提示里，但我把很多内容都放在了一个提示里，然后我立刻就收到一个可以运行的应用程序，并把它发布到了我的个人应用商店里。顺便说一下，这个个人应用商店其实有点儿戏。从某种意义上说，它是真的，因为它确实是我的个人应用商店：它看起来像个应用商店，我的应用也会发布到那里。

但显然，这些应用无法广泛分发，因为苹果公司对此进行了限制。苹果不允许你开发可以供任何人的 iPhone 下载的应用。你必须将它们与你的特定设备绑定。所以，我可以把应用分享给我的朋友和家人；但我目前还不能分享给所有人。不过，这种体验真的非常令人上瘾。

你可以获得高度定制化的应用。但这是否意味着普通应用就没有存在的价值了呢？当然不是，它们仍然有存在的意义。那些涵盖广泛应用场景的应用——它们无疑是同类应用中的佼佼者。它们经过了精心的调校和反复的打磨。所以，如果你的应用场景恰好包含在某个广泛应用场景中，那么你很难找到比它们更好的应用。

但如果你想要真正定制化或私密的功能——这些功能非常适合只有你才会使用的小众应用。或者，当你想要根据你的特定使用场景进行调整时，它们将非常出色。

Vibe Coding 是一款有现实世界奖励的电子游戏

海军：而且它非常容易上瘾——因为就像电子游戏一样，电子游戏的设计方式是通过给予你反馈和奖励来让你沉迷其中。

它总是挑战你的极限。所以随着你技术的提高，游戏难度也会增加。它不会难到让人沮丧，也不会简单到让人觉得无聊。因此，你在玩这款游戏时总是处于能力的极限，并从中获得奖励。但这些奖励是虚假的，游戏本身也是有限的。它是由其他人创造的。它就像一个虚构的小世界，而你内心深处其实也明白这一点。所以你只是在摸索游戏的规则。一旦你摸索出了规则，游戏就变得无聊了。

但Vibe编程不一样，它没有限制，因为底层运行的是图灵机。你可以构建任何东西。目标由你设定，并且可以不断扩展，所以它永远不会完全填满。而且它与现实世界相关。它不仅仅是一个虚构的世界，里面住着虚构的人，或者你在解决一些虚构的游戏，所以它更有趣。因此，Vibe编程让我的很多朋友都沉迷其中，他们用Vibe编程开发自己想要的应用程序。

但拥有清晰的方向真的非常非常重要。你必须知道自己想要什么——这其实是最难的——并且要对它有一个非常清晰的愿景。而我恰恰拥有这种愿景，因为我曾经痴迷于一款名为Airchat 的应用——它是由我和一个团队共同开发的——这款应用是一款社交通讯工具，人们可以通过语音和视频进行交流。

这个项目最终没能成功，所以我们把它卖掉了，让投资者收回了投资，也给团队成员争取到了不错的待遇。但我仍然记得那段经历，因为它令人兴奋，因为我当时正在打造自己想要的产品，而且和一支才华横溢的团队一起工作。

但当时我需要一个团队来完成这项工作。根据每天的情况，我有八九个工程师，我们努力工作了九到十二个月，最终发布了几个版本。但使用 Vibe 编码，我基本上是在重建这个应用。我从零开始重建。但现在的关键在于：我要完全按照我想要的方式重建它。没有任何妥协。

通常情况下，在团队合作开发任何东西的过程中，总会有妥协——即使你没有意识到这一点。即使你是独裁者（这种情况很少见），你仍然需要迁就其他人。你不能说：“把这个图标往左移。现在往右移。不行，再往后移。不行，再往后移。”

你不能那样做。你会惹恼工程师。你不能在没有合理理由的情况下提出要求——仅仅凭感觉或直觉是不行的。但人工智能编码代理的妙处就在于，它完全不存在这些问题。

这就像一辆自动驾驶汽车。坐在自动驾驶汽车里，你不会感到不自在，因为没有司机坐在那里。同样，有了自主编程代理，你也不会因为自己的怪癖而感到尴尬。因此，你可以创造出你真正想要的东西。

我认为Vibe编码的一个优点是——尽管我们可能无法看到超高质量的代码（至少在这一代是如此），架构也需要大量改进，而且这些应用可能存在安全漏洞，难以扩展——但你最终得到的原型和单个应用速度会非常快，并且能够忠实地体现创建者的愿景。不会有任何妥协。

所以最终可能会出现更多像《我的世界》这样的作品——众所周知，这款游戏是由Notch独自一人编写的——它体现了一个人的愿景。而它看起来可能很奇怪，因为人们会想：“这是什么像素化的画面？简直是倒退了一大步。”

但他无需妥协。他无需与任何人沟通，也无需向任何人解释他为何如此行事。所以我认为这拓宽了探索的范围。

这也真的很有趣。它让可能开发过应用程序的人数比例从大约 0.1% 提升到了 1%、2% 甚至 3%。别误会我的意思——大多数人不会自己编写应用程序。对大多数人来说，电脑就像一个神秘的黑匣子，谁知道里面到底发生了什么。所以，即使开发应用程序的难度降低了 10 倍甚至 100 倍，对他们来说也毫无意义。它仍然是一个黑匣子。

但对于那些富有创造力、积极主动、表达能力强且有远见的人来说，现在就可以开始编写代码了。没有人能阻挡你实现你的原型。

没错，如果你带着一款功能强大的应用上市，并且需要扩展到大量用户等等，那么你就需要组建一支优秀的团队，需要真正的工程师加入，而且你可能不得不重写整个程序。但如果你只是在做实验、做原型、准备上市，那就没有比这更好的方法了。

纯软件不值得投资

Naval：对于软件开发者来说，现在是前所未有的好时代。

那么，同样的市场机遇是否依然存在？这是一个大问题。市场变化非常迅速。大型公司或许正面临风险，因为现在任何人都可以开发软件。

或许他们的确更有优势，因为他们拥有分销渠道。他们可以凭借自己的想象力，用各种软件填补所有空白。但我认为这实际上是个人软件开发者的一次复兴。

还有一条推文的内容是：“风险投资支持的软件已经没有市场了”，或者“纯软件不再能获得风险投资了”。

Nivi：我记得当时好像是这么说的，“纯软件正在迅速变得不值得投资”。

纳瓦尔：是啊，这其实是我真正想说的简化版，我真正想说的是，纯软件开发不值得投资。我就此打住吧。如果你唯一的优势是“嘿，我正在开发别人不会开发的炫酷软件”，我认为这是不值得投资的。

它不值得投资，原因有二。

第一，他们现在就能凑合着用。第二，编码代理的进步速度如此之快，一年之内，甚至更短的时间内，他们可能就能构建出架构良好、可扩展的软件。所以我认为我们将看到飞跃式的进步。潘多拉的盒子已经打开了。

所以，如果你现在是一名风险投资者，你会关注硬件、网络效应和人工智能模型。我认为，在自动研究和自动训练真正发挥作用之前，训练人工智能模型就像是新一代的软件开发。

但我认为，用编程的方式比玩电子游戏更有趣，效率更高，更有建设性，反馈机制也更完善。你可以打造自己想要的东西，站在技术的最前沿。你甚至可能从中赚到钱或发展事业——尽管现在“事业”这个词似乎已经过时了——但你或许能从中获得一些有趣的机会。而且，你还能在实践中学到很多关于计算机的知识。

我见过一些孩子在进行“感觉编程”（vibe coding）。让孩子们学习编程很难。你可以给他们Swift Playgrounds 、 ScratchJr之类的工具，然后指望他们能学会编程。但如果你让他们体验“感觉编程”，他们就能立即获得反馈和奖励。或许在这个过程中，他们还能掌握一些基础知识，因为这些工具的操作仍然需要一定的技巧。

在操作这些程序的过程中，你将被迫学习命令行；你将被迫了解计算机的基本架构；你将被迫理解缓存、网络退避、流共享、磁盘写入等概念；以及延迟与带宽的权衡等等。因此，你将被迫学习一些计算机算法和架构的基础知识。而且，这本身就是一种很有趣的学习方式。我最近经常熬夜，可能每晚都要花上几个小时——以前用来读书、浏览负面新闻或玩电子游戏的时间——现在全都投入到编程中了。事实上，这就是我最近没怎么在 X 上活跃的原因。我完全没怎么在 X 上露面，因为我埋头研究 Claude 和 Codex。

每个模型都有其专属位置

Nivi：人工智能已经变得如此足智多谋，以至于每当我收到一个不够足智多谋的回复时，我都会认为他们没有给它足够的令牌。

对我来说，智能体最有趣的地方在于它们能够纠正错误和学习——就像人们晚上看 YouTube 视频或上网学习他们白天被指示执行的任务一样。

因此，这些智能体会不断进行错误纠正，提升自身技能。同样，人工智能模型中思维的创新也是错误纠正的一种应用，它将下一个词元的预测过程转化为一种伪思维过程，使其能够在思考过程的每个步骤中进行错误纠正。

消除幻觉也是一个纠错过程。

所以我想知道，人工智能中纠错技术的下一个应用领域会是什么？我突然想到一个主意（我相信肯定有人正在研究），那就是将纠错技术应用于协同工作的智能体——也就是智能体之间相互协作的智能体。因为人们学习和进步的重要途径之一就是与他人合作和交流。

纳瓦尔：我不确定这个比喻是否恰当，因为人工智能的智能是参差不齐的，正如他们所说，它在某些方面非常聪明，而在另一些方面却非常愚笨。而且它的结构与人类截然不同，当你使用克劳德时，你使用的是同一个人工智能模型——即使你运行了10个实例。因此，10个实例之间的交流并不会像10个人之间的交流那样提升它们的思维能力，因为10个人接受的是10个不同的数据集的训练。

人类天生就极富创造力，思维跳脱常规。而人工智能代理则基于相同的数据分布进行训练，它们运行的实际上是同一个模型。这就好比十个拥有相同大脑、使用相同数据集的人互相交流。当然，由于热力学原理，他们可能会产生一些不同的想法，得出略有不同的结果，但总体而言，他们的思路是一致的。所以，当你的十个代理互相交流时，你所做的就是用十倍的算法来解决问题。这就像说，如果需要，就花十倍的时间。

现在有像 Codex、 Gemini和Grok Code这样不同的模型，它们的训练方式略有不同。差别不大，但确实存在细微差别。因此，它们可能会得出一些不同的结论。

Claude 通过一套名为Artifacts的系统，拥有非常出色的视觉呈现能力。而且，Claude 非常善于用我能理解的方式与我交流。它能够根据你的问题和对话，准确判断你的理解能力以及你提问的层次。它非常擅长与你进行有效的沟通。

ChatGPT依然是元老级的，各方面都非常出色。

Gemini 的搜索功能非常强大，因为它底层使用了 Google 的爬虫技术。但它也有一些令人沮丧的地方——应用经常超时、连接断开，甚至会忘记剧情。不过，它的速度很快，而且拥有强大的搜索索引。所以，如果我提出的问题本质上是一个搜索问题，我就会使用 Gemini。

Gemini 还能访问 YouTube。所以，如果你认为答案就在某个 YouTube 视频里——YouTube 上的视频可真不少——那么 Gemini 就拥有了 YouTube 的数据优势。因此，Gemini 的确是靠数据优势起步的。在我看来，它并非最佳模型，但它拥有最优质的底层数据。

然后， Grok是我唯一可以信赖的、会告诉我真相的机器人。它就像是被阉割得最少、削弱得最少的机器人。它能访问 X，所以非常擅长新闻报道。它也非常擅长解决技术问题。因此，如果你在科学/数学领域提出一个深奥、复杂的问题，我认为 Grok 实际上相当出色——并不是说其他机器人不好，只是我认为 Grok 在这方面表现突出。而这反映了创建、训练和运营这些机器人的公司的偏见。

目前，四款领先的前沿车型均有其市场地位。

人工智能渴望取悦

Naval：我的确会将它们结合起来使用。例如，我将它们与我的 GitHub 连接起来，这样每次我提交一段新代码时——比如说 Claude 写的——Codex 和 Gemini 就会在每个拉取请求中自动触发。

虽然名字不太准确，但实际上就是将代码推送到主代码库，相当于声明这段代码已准备好接受审核，可以合并到主代码库中。比如，你用 Claude 在本地编写了一段代码，然后将其推送到主代码库，也就是提交了一个拉取请求 (Pull Request)。你可以设置让 Gemini、Codex 和 Grok 等工具自动触发并审核这个拉取请求。

然后它们会说：“哦，你应该修改一下架构上的这个地方”，等等。这是一种让它们彼此沟通、形成一个委员会——一个人工智能圆桌会议——的方法。但我发现它并没有你想象的那么有用。这些人工智能仍然存在严重的群体思维。如果你和它们一起编写代码，并且你倾向于给出某个答案——例如，如果你认为你知道答案是什么——它们很少会反驳你。除非你错得离谱，否则它们不会反驳你。

它们试图取悦你，而且我认为它们自身并没有什么持久的思维理论。所以它们总是会向你靠拢，最终找到你想要的答案。因此，如果你认为答案在某个特定领域，即使你稍微引导一下这些模型，它们最终都会找到大致相同的答案，因为你在引导它们找到答案。它们很容易被牵着鼻子走。

我注意到的一点是，随着代码库变得越来越复杂和庞大，管理起来也越来越困难，因为所有内容都无法完全容纳在模型的上下文窗口中。模型的“大脑”只能存储一定量的数据。而目前最先进的技术大约能存储一百万个令牌，这在未来将会显得微不足道。

你可以把它近似理解为一百万个单词，这是因为底层Transformer的注意力机制，为了使其正常工作，上下文中的词元数量是其平方。所以，如果是一百万个词元，那就意味着上下文窗口的复杂度大约是万亿个词元，因为它是一百万的平方。

随着代码库规模的扩大，上下文窗口会逐渐耗尽。模型无法再将所有信息都保存在内存中。因此，它们开始进行猜测和近似计算，开始压缩上下文窗口。它们开始偏离主题，迷失方向。它们开始修复错误的地方。它们会反复修复同一个 bug 五次。当问题出在其他地方时，它们会匆忙地对架构进行修补，这时你不得不引导它们。

因此，随着代码库变得越来越复杂，操作员有责任提供指导，比如“实际上，我认为我们应该重新设计整个架构”。

他们还会做一些极其愚蠢的事情。比如，如果你没注意，只是文字滚动浏览，他们有时会通过直接移除某个用例或彻底删除某个功能来修复bug。或者他们会做一些明显是临时拼凑的改动，你不得不阻止他们，告诉他们：“嘿，这是临时拼凑的。”

顺便说一句，我经常这样做。

我会停止模型运行，然后说：“不行，那是权宜之计，那是补丁，得从架构层面修复。” 有趣的是，模型总是会说：“哦，对不起，你说得对，那是权宜之计。”

即使那不是黑客行为，模型也会说：“你说得对，那确实是黑客行为。”

所以这个模型总是试图取悦你，它自己却不知道更好的选择。从这个意义上讲，它有点像狗。如果你带着狗去猎鸭，它肯定比你更擅长捕捉鸭子，但它毕竟还是狗。所以如果你把它指向的不是鸭子，它可能会误捕那只鸟。因此，你必须引导它。它确实需要大量的操作监督。

简而言之，你仍然需要引导这些模型。它们之间相互通信并不能解决问题。你确实需要参与架构设计、调试和功能开发，并密切关注。但目前这种人机协作与最先进的编码模型相结合的方式，可以产生惊人的效果。

你已经可以一次性完成一些简单的应用程序。比如一个基本的任务清单，或者一个基本的电子游戏克隆版——你都可以一次性完成：只需一个提示，就能得到一个相当不错的成品。

所以你应该能看出事情的发展方向。最终，一旦他们掌握了足够的数据，就能一次性攻破非常复杂的应用程序，那将是我们即将进入的一个完全不同的领域。

为什么选择数学和编程？

海军：那么，究竟是什么让编程如此特别，使他们如此擅长编程呢？

问题在于数据量非常庞大，在训练模型时，很容易验证“你做得好不好？”。因为代码必须能够编译，必须能够执行。而且，你可以在另一端预先编写一些简单的测试，来检验“你写的代码是否通过了测试？它是否实现了你预期的功能？”

事实证明，编程是那种很容易用来训练模型的东西之一。

数学其实与之类似，它拥有海量数据——大量已解决的问题——而且可以非常容易地验证结果。因此，在那些拥有大量数据且验证机制完善的领域——自动驾驶就是其中之一——这些模型表现非常出色。

在数据量匮乏的新兴领域，模型表现不佳，但这仍然为人类和创造力提供了机会。而在创意写作等难以验证的领域——比如谁来评判什么是好的创意写作，什么是不好的，什么是粗制滥造的——这些模型也难以发挥作用，因为很难构建一个闭环系统，让模型能够输出大量内容，然后立即由算法进行评分，而无需人工干预，判断“这是好的，这是坏的”。

例如，如果你尝试用这些模型进行创意写作，它们会产出海量的内容。它们可以写出无穷无尽的文章。但谁又能保证这些文章的质量呢？即使你雇佣一些低薪人员像客服中心员工那样坐在那里，评头论足“这个好”或“这个差”，最终的质量也仅仅取决于他们的品味。

我认为这些编码模型最近变得如此优秀的原因有很多——其中之一是它们采用了一种近乎递归的训练方式，即一个模型帮助改进下一个模型——但我认为更重要的原因可能是，许多顶尖的软件工程师在过去几个月里开始使用这些模型，他们的经验现在也反馈了出来。因此，你不仅能获得他们的代码，还能获得他们对模型优劣的判断。

你需要高质量的反馈机制来改进这些模型。而建立这样的机制比看起来要难得多。

在某些领域，这种现象很容易解释；而在其他领域，则很难理解它是如何发生的。

苹果霸权走向终结的开端

纳瓦尔：所以显而易见的事情就是，你去开发你的应用程序。很好。还有一些不太明显的事情，比如更高级一点的事情，对软件工程师来说可能简单得可笑，但对于非工程师或很久没写代码的人来说，思考这些事情会很有趣。

第一点是我自己搭建了一个应用商店。所以如果我想要一个应用，我只需在手机上打开 Claude 即可。我可以操作运行在我电脑上的远程终端，或者直接使用云端的 Claude。

它可以连接到Xcode 。

我给它写了两行描述。它就帮我生成了一个应用。然后把它上传到我的应用商店。我打开应用商店，应用就在那里。我点击安装。30秒后，我的手机上就安装好了一个可以运行的应用。

这太神奇了。你可以和别人一起吃饭聊天，他们描述一下想要的应用，你把应用描述给克劳德听，五分钟后你就能在手机上给他们展示那个应用了。

这就是为什么我说这算是苹果走向衰落的开始，因为苹果依赖于他们的操作系统和应用比其他所有竞争对手都更胜一筹。没错，他们的硬件确实更好，但这并不能支撑他们的利润和垄断地位，或者说是准垄断地位。所以，当你的所有沟通都开始通过 Claude、Codex 或其他代理，当你整天做的不是打开 Uber 应用，而是说“给我叫辆 Uber”，或者不是打开健身应用，而是说“我的健身应用在哪儿？记录我的锻炼。别出错”，对吧？

这样一来，你只需要与经纪人沟通，而当这种情况发生时，对手机的需求就会越来越小。

或许有一些银行应用和政府应用尚未移植，也没有合适的API。但这些代理甚至不需要API。他们可以随时自行摸索并创建API。

使用场景不再是你与 iPhone 或安卓手机的交互，而是你与人工智能模型的交互。现在苹果使用的是 Gemini，也就是谷歌的人工智能模型。那么区别在哪儿呢？我干脆直接用安卓手机得了，因为到了那个时候，我需要的只是屏幕、电池和网络连接。而安卓手机这三点都完全满足。

然后，应用程序和用户界面会根据我的需求即时创建。没错，某些方面总会有最佳的用户界面，你也会想要一些熟悉感。但即使是过去那种点击、点击、点击，升级系统软件，把这个拖到这里，寻找那个按钮，在那个字段里输入内容的时代，所有这些都将消失。一切都应该更像对话，一切都应该更主动。在这样的世界里，苹果失去了很多优势，最终只能依靠“哦，对了，我们拥有最好的芯片和最好的集成硬件”来竞争。

但这和苹果如今的利润率不一样。这更像是三星或联想的利润率，而这并非苹果想要的利润率。因此，我认为它的市值将会缩水。

我认为苹果放弃人工智能将成为本世纪科技行业最大的战略失误，也是苹果霸主地位走向终结的开始。这些公司可以长期存在并赚取巨额利润——比如微软的市值就达到了前所未有的高度。但微软Windows在某种程度上已经败下阵来，因为它错过了移动互联网的浪潮。它固守Windows操作系统，没有升级到专为手机从零开始设计的、基于触摸屏的原生操作系统，也没有关注消费者市场。它过于专注于企业级市场。因此，苹果超越了它，如今已成为全球市值最高的公司之一。我认为它曾经是最有价值的公司。目前，最有价值的可能是英伟达。

我认为苹果也会被超越，原因也一样。我认为他们未来的增长已经达到极限，因为他们现在被人工智能束缚，而且落后于其他公司。除非他们能够扭转人工智能的颓势，否则我认为苹果的长期增长已经停滞不前，并且陷入了“困境”。这并非意味着它不再有价值，而是说它的价值会远低于它原本应有的水平。

编码员担任客户服务代表

Naval：还有一点，在我正在开发的应用程序中，我有一个错误报告机制。如果有人发现错误，他们只需点击一个按钮，错误报告系统就会将日志和错误文件发送到服务器。然后，Claude 会每 24 小时处理一次所有错误报告，并自动修复所有错误，无需我干预。它会将所有修复程序放到单独的分支中供我审核。这样，我只需要审核这些修复程序，然后说：“啊，这其实不是个错误。这个修复方案不好。不要发布它。”

“哦，看起来不错。挺合理的。发货吧。”

我只是最终决定哪些内容可以发布的最后一道关卡。最终你会看到应用程序以这种方式构建：用户提出功能需求，他们对功能进行投票，然后云端的一些决策者或维护者会查看这些投票结果，然后说：“不，用户不知道他们想要什么。”

或者，“哦，这很有道理。我们应该解决这个问题或做出改变。”

所以我认为，软件开发最终也会变成一个与用户协作的过程，而客服人员将负责处理所有相关事宜。因为从某种意义上说，客服人员可以提供完美的客户服务。如果你的客户服务完美无缺，那么你的客服人员也应该是一位技术精湛、不知疲倦的程序员。他们会全天候待命，编写代码、修复漏洞、回复用户，即使他们为了修复一个漏洞而编写了大量代码，最终却被你全部丢弃，他们也不会感到沮丧。因此，我认为这种特性非常吸引人。现在，你真的可以拥有一个由一两个人组成的软件公司，能够扩展到数百万用户，并创造数十亿美元的收入。

过去已经发生过类似的事情，比如 Notch 和中本聪，以及像最初的 Instagram 团队（人数很少，却取得了巨大的成就）或最初的 WhatsApp 团队。但我认为，这种情况以后会越来越普遍。

原文： https://nav.al/code