OpenAI 的视频生成应用 Sora 目前在 App Store 排行榜上名列前茅,但我预计它很快就会跌落。制作 Sora 视频确实能带来短暂的快感。你可以把自己和朋友们置身于搞笑、恐怖或奇幻的场景中,并在适当的时候加入杰克·保罗或马克·库班。但过了一段时间,所有 Sora 视频看起来和感觉都变得千篇一律。新鲜感逐渐消退,打开应用的吸引力也逐渐消退。
Sora 的千篇一律问题并非个例,几乎所有 AI 生成的内容都存在这个问题。生成式 AI 倾向于生成平均值的平均值,力求将其输出与人类生成作品平均值之间的差异最小化。因此,AI 的图像、视频和文本常常呈现出一种千篇一律的一致性,只有经过刻意引导才能打破这种一致性,即便如此,这种一致性也并非可靠。
要想长期保持相关性,就必须打破这种千篇一律的局面。正因如此,Instagram 联合创始人、现任 Anthropic 首席产品官 Mike Krieger 上周在我采访他时,似乎并不认为 Sora 是他所开发应用的继承者。他表示,要想取代现代社交媒体,内容必须“随着时间推移而变化,而不仅仅是‘嗯,好吧,我以前好像见过。它确实很有趣,但我以前也见过。’”
AI 生成的图像也存在着千篇一律的问题。这些图像有一种特性,让人即使隔着很远也能辨认出大部分图像。就好像是同一位艺术家对每个提示都做出了回应,尽管这些模型已经吸收了世界上所有的艺术作品。
一些提示可以生成独特的AI图像,尤其是当你要求模型遵循某位艺术家的风格时。但随着提示变得流行,千篇一律的问题再次出现。OpenAI的4o模型开启的吉卜力工作室时刻就是这种情况。在最初的一些新鲜感之后,一切最终都变成了吉卜力工作室。然后,兴奋感逐渐消退,没有人再对他们的图像进行“吉卜力化”了。
人工智能的千篇一律问题或许在写作方面最为明显。别再说破折号了,如今大多数商务沟通读起来都千篇一律,因为很多都是通过提示语写的。我的收件箱里现在收到的公关推介邮件比以往任何时候都多,而且它们看起来都像是同一家公司写的。这并不是说公关行业已经标准化了推介格式,而是人工智能替他们实现了标准化。
我不想低估这项技术的卓越之处。Sora 视频是一项突破,它展示了 AI 对物理学的一些基本理解,其方式甚至让最先进的研究人员都感到惊讶。AI 图像很有用,我经常依靠它们来制作这份新闻通讯。AI 文本生成,至少在 ChatGPT 中,非常受欢迎,而且通常很有帮助。但要让 AI 生成的内容发挥其潜力,就必须增加其多样性。考虑到这项技术的基本原理,这可能是一个难以解决的问题。
人工智能热潮是否会破坏安全?(赞助商)
人工智能正在改写公司运营方式以及攻击者的攻击方式。在这场科技巨头对话中,Alex Kantrowitz 和Netwrix首席执行官 Grady Summers 深入探讨了人工智能在当今组织内部引发的隐性安全风险。
Netwrix与全球 13,000 多家公司合作,统一身份和数据安全,让安全团队能够了解数据、访问和治理,从而能够领先于不断演变的威胁。
立即观看完整对话,了解自动化、数据蔓延和新访问模型如何测试企业安全的极限。
本周大型科技播客:人工智能初创公司在哪里?——里克·海茨曼
Rick Heitzmann 是 FirstMark Capital 的创始人兼董事总经理。Heitzmann 参加 Big Technology Podcast,探讨人工智能初创公司能否与全球 ChatGPT 巨头竞争,或者大型人工智能机器人是否已经吞噬了所有机遇。敬请收听 Heitzmann 对当今人工智能投资经济学的分析,以及应用层是否值得投资。我们还将分析当今人工智能领域的大型融资交易,探讨这股热潮带来的潜在回报。敬请收听这场关于人工智能创新未来潜力的理性讨论。
您可以在Apple Podcasts 、 Spotify或您选择的播客应用上收听
感谢阅读!我们将于周五带来更多精彩内容。