我每年都会列出预测清单,并对去年的预测进行评分。2025 年的预测不错,我得了 7.85 分(满分 10 分)。我明天会公布最终评分。今天,先来看看我对 2026 年的预测:
1. 企业首次为人工智能代理支付的费用高于为人类支付的费用。
这种情况已经在消费者身上出现了。Waymo 的乘车费用平均比 Uber 高出 31%,但需求却持续增长。¹ 乘客更青睐自动驾驶车辆的安全性和可靠性。对于重复性的商务任务,由于公司需要将入职、招聘、培训和管理成本考虑在内,人工服务也将获得类似的溢价。
2. 2026 年成为流动性创纪录的一年。
SpaceX、OpenAI、Anthropic、Stripe 和 Databricks 相继上市,其中 SpaceX 和 OpenAI 的 IPO 规模位列史上十大 IPO 之列。长达四年多的低迷期终于释放了被压抑的需求。由于担心快速增长的人工智能系统会带来颠覆性影响,现有企业纷纷进行防御性收购,总额超过 250 亿美元,他们选择收购而非自主研发。
3. 向量数据库作为人工智能技术栈中的重要基础设施再次兴起。
多模态模型和世界/状态空间模型需要新的数据架构。向量数据库作为基础模型和企业数据之间的连接纽带,正以爆炸式增长的方式创造收入。
4. AI 模型能够自主执行任务,持续时间超过一个工作日。
根据METR的数据,人工智能任务的持续时间每7个月翻一番。目前最先进的模型能够可靠地完成人类大约需要一小时才能完成的任务。如果按照这个趋势推算,到2026年底,人工智能代理将能够自主执行8小时以上的工作流程,这将从根本上改变公司项目人员的配置方式。
5. 人工智能预算首次受到审查。
采购委员会和董事会对人工智能支出持谨慎态度。随着研究实验室探索如何针对特定任务对小型语言模型和开源替代方案进行定制,它们越来越受欢迎,并以极低的成本实现了最先进的性能。开发人员更倾向于选择它们,因为它们可以降低十倍的成本。
6. 谷歌凭借在人工智能领域的广度拉开了与竞争对手的距离。
没有其他公司能在如此多的领域取得突破:前沿模型、设备端推理、视频生成、开源权重和搜索集成。谷歌引领潮流,迫使 OpenAI、Anthropic 和 xAI 等公司进行专项化发展以应对挑战。所有实验室在所有前沿领域展开竞争的时代已经结束。
7. 智能体可观测性成为推理栈中最具竞争力的层。
工程可观测性、安全可观测性和数据可观测性融合为一个单一的学科。代理需要对代码执行、威胁检测和数据沿袭进行统一的可见性监控。这标志着我曾在2025年预测的融合的开始:这三个可观测性领域最终汇合。
到 12 月,8. 30% 的国际支付将通过稳定币进行。
即时结算和跨境支付推动了稳定币的广泛应用。随着主要市场监管透明度的提高,稳定币正从加密货币的边缘走向全球贸易融资的核心,并在相当一部分B2B交易量中取代传统的SWIFT系统。
9. 代理数据访问模式会给现有数据库带来压力并导致其崩溃。
智能体向数据库和数据湖发出的查询数量至少比人类多一个数量级。这种并发性和吞吐量需求的激增迫使我们重新设计事务型数据库和分析型数据库的整体架构,以满足自治系统持续不断的需求。
10. 到 2026 年,数据中心建设将达到美国 GDP 的 3.5%。
投资规模与铁路的历史扩张相呼应。唯一减缓整体建设速度的因素是信贷市场,尤其是私人信贷市场的风险感知。该资产类别的迅猛增长突然显现出违约率上升的压力,这可能对资本密集型基础设施项目构成瓶颈。
11. 网络转向以代理为先的设计。
大多数开发者文档和许多网站都从以人为本转变为以智能体为本。这种转变的出现是因为许多购买决策现在首先是基于智能体的研究。因此,正门需要为机器人设计,而侧门则服务于人。
12. Cloudflare 成为代理支付的守门人。
x402 协议重新启用了 HTTP 长期闲置的 402“需要支付”状态码,使 AI 代理能够实时支付 API 访问权限。Cloudflare作为网络基础设施层,自然而然地成为这种新型商业模式的关键节点。随着几家巨头公司敦促 Cloudflare 更加开放,这种集中局面也成为了一个冲突点。
2026年是企业将人工智能投入生产应用的年份。