每 40 分钟投放一条搜索广告就能为拥有万亿参数的模型提供资金。每 3 分钟投放一条内容广告也能达到同样的效果。广告支持的 AI 的收益比你想象的要高得多。
上个月,Anthropic 将 Claude Code 从 20 美元的套餐中移除,这反映了业内的一种普遍认知:前沿智能技术需要前沿定价。但对于开源模型而言,情况则恰恰相反。
B200 GPU 在现货市场上的售价为每小时 4.50 美元。 <sup>1</sup> Google 搜索广告的 CPM(每千次展示成本)为 38.40 美元,<sup> 2 </sup> 而 Google 展示广告的 CPM 为 3.12 美元。 <sup>3</sup>
| 广告背景 | 每千次展示成本 | 达到盈亏平衡所需的曝光量(每小时) | 每隔…条广告 |
|---|---|---|---|
| 内容网络 | 3.12美元 | 5,769 | 约3分钟 |
| 搜索 | 38.40美元 | 469 | 约39分钟 |
这些数字假设运营商运行 4 台 B200 Blackwell 路由器,每台路由器支持 300 个用户,相当于理论最大容量的 50%,这样就留出了应对突发流量的空间。
为了支付这些费用,用户每 3 到 39 分钟会看到一条广告。这远低于用户目前的容忍度:超休闲手机游戏每次会话会显示六条广告,大约每分钟一条。5
这里有一些细微差别。假设广告填充率(即广告请求中实际显示付费广告的比例)和广告网络收入分成比例不变,我们可以模拟出有效的每千次展示成本 (CPM) 为 1.50 美元。在这个最低值下,广告频次翻倍。每 90 秒投放一条内容广告仍然可以覆盖目标受众,这与移动用户目前的接受程度相当。
另一方面,激励视频广告的每千次展示费用 (CPM) 可达 40 至 50 美元,游戏广告的填充率接近 100%。集群中单次激励视频广告投放即可满足近一小时的计算需求。6
但这里存在利用率的问题。所有这些数据都假设集群始终处于繁忙状态。闲置的GPU会增加每个用户的成本。
如果工作负载更重怎么办?主动式编程消耗的代币数量是被动聊天的 10 到 20 倍。7照此速度,纯广告模式根本无法跟上。但混合模式可行:每月 10 美元加上每天 8 个广告,就能覆盖 200 万个代币。8这不足以让你沉迷于代币最大化,但足以保证你持续发布内容。
广告支持的人工智能是可行的:开放模型、通用 GPU 和广告频率已经与移动和网络广告的频率相当。
-
B200 云定价:比较 22 家以上供应商(2026 年) :现货市场平均价格为每小时 3.40 美元至 4.50 美元(涵盖 22 家云供应商) 。↩︎
-
2026 年在线广告成本预测(精选) :谷歌搜索广告平均每千次展示费用 (CPM) 为 38.40 美元(由每次点击费用 (CPC) × 预估点击率 (CTR) 计算得出;搜索广告通常按点击付费,此处为便于比较而转换) 。↩︎
-
2026 年在线广告成本预测(精选) :谷歌展示广告平均每千次展示费用 (CPM) 为 3.12 美元。↩︎
-
GPU并发性能基准测试:H100 vs H200 vs B200 (AIMultiple) :Kimi K2.6 在 4 块 B200 显卡上峰值支持 600 个并发用户;此处保守地设定为 300 个并发用户。↩︎
-
2026 年 AdMob 和移动应用变现策略手册 (MonetizeMore) :超休闲用户基准,每次会话投放 6 个广告,平均每天 3.2 次会话。↩︎
-
计算:300 位用户 × 每人 1 次付费展示 × 0.05 美元(CPM 为 50 美元)= 15 美元。集群成本 = 18 美元/小时。15 美元 ÷ 18 美元 = 83%,约 50 分钟。↩︎
-
Claude Code 与 Cursor:速度、准确率和成本基准测试 2026 (SitePoint) :Claude Code 每次任务消耗 33,000 个令牌;Cursor 每次任务消耗 188,000 个令牌。重度用户每天运行 20 到 60 个任务,在活跃会话期间每小时消耗 100 万到 200 万个令牌,是被动聊天的 10 到20倍。
-
计算:每月 10 美元 = 每天 0.33 美元。仅按每天 0.33 美元计算,该集群可支持 1309 位用户,每位用户每天可获得 100 万代币,达到目标的一半。剩余的 0.33 美元/天的缺口由广告填补。按激励视频的 CPM 40 美元计算,每天可获得 8 次展示。总计:每月 10 美元 + 每天 8 次广告 = 每位用户每天 200 万代币。