
在人工智能时代,谷歌I/O大会召开前的几周甚至几个月总是充满趣味。网络上似乎都在流传着这样一种观点:谷歌似乎比竞争对手更加低调,所以落后了。尽管起步缓慢,但谷歌最终还是迎头赶上,那么为什么谷歌没有继续保持强劲势头呢?这几乎是所有人的普遍看法。然而,I/O大会一开场,谷歌就火力全开,重新夺回领先地位。
至少去年是这样。今年情况有所不同。
虽然昨天的主题演讲展现了谷歌如何有效地利用其规模优势,发布了涵盖众多服务的广泛公告(其中许多服务拥有数十亿用户——正如CEO桑达尔·皮查伊重点强调的那样,其中13项服务的用户数量已超过10亿),但说实话,感觉还是有点令人失望。或许这只是因为人工智能技术日趋成熟,而我们这些每天与之接触的人自然而然地对它强大的功能习以为常了(所有技术都会经历这个过程)。但这也让人感觉谷歌或许需要重新思考一下他们处理此类产品发布的方式。
我并不是说他们应该取消 I/O 大会,但我认为他们明智的做法是,与其把它变成一场大型的公开展示会,不如把它变成一场真正的开发者盛会。谷歌和其他公司一样,自然而然地效仿苹果,走上了举办大型主题演讲的道路。在安卓与 iPhone 竞争的时期,这种策略似乎很奏效。但人工智能时代已经不同了。尤其值得注意的是,这其中就包括产品发布的频率。
显然,谷歌并非每年都等到 I/O 大会才发布他们过去几个月一直在研发的成果。和其他人工智能实验室一样,他们也在不断推出新的模型和功能。但与此同时,与其他人工智能实验室不同的是,谷歌显然也会有所保留,以便在 I/O 大会上大放异彩。只是今年,他们的“秘密武器”似乎相对匮乏。
别误会,他们谈论和展示的很多东西看起来确实很酷。问题是,几乎所有这些东西似乎都还没准备好真正面世。我是说,还没正式推出。
虽然他们似乎已经将整个技术栈迁移到了Gemini 3.5 Flash ,但真正的前沿机型——Pro 版本——显然尚未准备就绪。以至于皮查伊只是顺带提了一下,说它会在下个月发布。观众对此很不满意。虽然让一个模型充分打磨比过早展示(更不用说强行推出)要好得多(问问 Meta 就知道了),但这恰恰凸显了我的观点:在人工智能时代,举办一场大型的、面向未来的单一主题演讲还有什么意义呢?
要么你得有所保留,才能在展会上展示,但如果你的竞争对手不这么做,那就很糟糕了。要么你得提前推出产品,才能在展会上展示——但不能发售——这或许更糟。
同样,后一种情况也占了很大比例。台上展示的几乎所有功能要么会在今年晚些时候正式推出,要么会以测试版的形式面向愿意付费购买 Gemini“Ultra”套餐的用户开放。¹如果你只是普通的 Gemini 用户——甚至是普通的“Pro”用户——那么今天你实际上并没有太多可以体验的内容。
我并不是说这会像两年前苹果在WWDC上大肆宣传的那种——虽然不能称之为“概念产品” ,但确实非常像概念产品——人工智能那样昙花一现。但话说回来,谷歌刚刚举办了一场盛大的活动,宣传即将推出的一系列产品和功能。其他人工智能实验室也会进行一些预览,但他们的活动规模远不及I/O大会。而且,他们的预览往往是因为资源有限,或者像Anthropologie那样担心“Mythos”会毁灭我们所知的文明。总之, Gemini 3.5 Pro似乎还没准备好。
那当然没问题!不过,或许可以等到下个月,等 Gemini 3.5准备就绪后,再举办一个规模较小的发布会?
新的“Omni”系列模型也存在同样的问题。新一代视频效果看起来不错,但显然只是谷歌希望实现的冰山一角。而且,就面向公众的推广而言,这项功能也显得不够完善。即使是功能较为有限的子集,最初也只对付费用户开放。
谷歌竟然用“Gemini Spark”来命名他们的OpenClaw 杀手——Meta首次尝试追赶前沿模型时,谷歌的这种做法也太冷酷了吧?——这款模型将首先面向“受信任的测试人员”推出,然后是“Ultra”级别的用户,之后才会推广到其他用户。据说它会在“今年夏天晚些时候”集成到Chrome浏览器中,但可能不会覆盖所有地区,也可能不会面向所有用户。
“Android Halo”也将在今年晚些时候推出,但除了谷歌极其含糊地提到“代理”之外,似乎没有人知道它究竟是什么。(它可能只是对Android用户界面的一次调整? )
Antigravity昨天发布了 2.0 版本,但在这个可以说是目前人工智能领域竞争最激烈、最重要的领域,人们似乎对此反应平平。谷歌或许应该等到 3.5 Pro 版本发布时再推出它?不过,3.5 Pro 版本似乎要等到下个月才会发布。
谷歌搜索本身即将迎来一系列新功能——但几乎所有功能都将在稍后推出。生成式用户界面?今年夏天。智能助手和小程序?今年夏天。全新的购物功能?今年夏天。
等等。Gemini Mac 应用演示的新语音功能?今年夏天。谷歌新的“Pics”照片编辑器?今年夏天。Chrome 浏览器的 Spark?也是今年夏天。
感觉谷歌本应该在今年夏天举办一场活动才对。
Gemini 的全新“每日简报”功能似乎即将推出,但首先将面向付费用户。至少全新的“神经表达”用户界面看起来已经上线——而且看起来相当不错!
搭载 Gemini 技术的智能眼镜——哦不,是“智能眼镜”——怎么样?这些产品至少已经预告或预览过三四次了,可能更多。它们现在肯定已经准备好与 Meta 眼镜在市场上一较高下了,对吧?没错,如果你说的“现在”是指今年秋季的话。至少“音频眼镜”(这名字真够呛)是这样的。至于镜片里带显示屏的那款?看来得等到明年了。
因此,在它们正式发货之前,我们大概还会看到它们至少几次预览或展示。
听着,我这么说可能有点刻薄。我的意思是,在人工智能时代,我不确定把 Google I/O 作为展示平台是否真的有意义。如今科技发展日新月异(或者在某些情况下,速度又太慢),一年一次的大型活动根本无法满足需求。我认为以这种方式召集开发者生态系统是有意义的,但就像苹果的 WWDC 一样,这些活动已经演变成过于前瞻性(而且期望值也过高)。对于实际的产品(和模型)而言,或许根本没必要效仿苹果秋季(有时是两次)和/或春季活动的节奏。相反,或许可以像 OpenAI 那样,只在真正有东西要讲、要展示的时候才召集大家。理想情况下,最好是在产品真正准备就绪的时候。
还有几点:
- 皮查伊特别强调 Gemini 的月活跃用户数达到 9 亿,这一点很有意思。这不仅因为这似乎与 ChatGPT 最近的数据相近,还因为和 ChatGPT 一样,他们显然更希望在用户数达到 10 亿时再公布。OpenAI 花了相当长的时间才达到这个目标,但谷歌应该不会花那么长时间——因为这应该是他们即将推出的第 14 款此类产品了。
- 更令人惊讶的是,他还在主题演讲的开场部分专门提到了他们的资本支出!但这显然是为了扭转这种局面,并指出与竞争对手不同,谷歌正在进行“全栈”构建,即使用 TPU(尽管亚马逊显然也可以提出同样的观点)。
- 德米斯·哈萨比斯的第一篇博文开篇就语出惊人:“通用人工智能(AGI)指日可待。”过去,他在时间表方面总是含糊其辞。我确信他不会明确地说“三年”,但对我来说,“几年”听起来像是“三四年”。2030 年前就能实现通用人工智能?
- 再次强调,正如上文所述,谷歌似乎想大力推广其首个真正的“世界模型” ——Omni,但最终不得不有所保留。这其中显然也暗示着哈萨比斯认为此类模型将是解锁通用人工智能的关键……
- 谷歌展示的Gemini 3.5 Flash基准测试结果显然令人印象深刻,但其他一些厂商给出的评分呢?就没那么好了。
- 无论如何,主题演讲结束后,大家讨论的焦点似乎是这类机型的价格上涨。
- 虽然网上很多人嘲笑Josh Woodward 用 iPhone 来演示 Gemini 在移动设备上的智能代理功能,但我其实觉得这很棒——这表明他们很重视产品在不同生态系统中的运行效果。(而且这显然是他们有意为之!)
- 我不太清楚《反重力》演示中的“法典”部分是否……
- 25年来首次对搜索框进行重大更新,这当然意义非凡,不过去年在搜索框中插入“AI模式”似乎也是一项相当大胆的重大变革。而且显然,这一变革取得了成功!所以,现在的更新只是将他们引导的用户行为改变永久化而已……
- Hassabis 再次出来谈论科学突破(再次以“通用人工智能即将到来”开场),但显然也觉得有必要提及房间里的 Mythos 巨头(虽然没有直接点名),指出谷歌几十年来一直专注于安全。
- 主题演讲最后由哈萨比斯完成,而不是皮查伊。有意思。
1谷歌确实降低了“Ultra”套餐的价格,但这感觉像是明知限制这么多新功能会令人恼火,却仍然采取的举措,只是为了安抚那些无疑会想要尝试这些新功能的用户。↩