算法学会行动的一年 – 搞英语 → 看世界

在 2024 年熙熙攘攘的科技园区，被动人工智能时代（仅响应我们的查询的系统）正在让位于更深刻的时代：人工智能代理时代。

展望 2025 年，我们将发现当算法学会行动时会发生什么。

这些新兴代理的核心在于三位一体的学习方法：

深度学习意味着使用神经网络架构来计算答案，例如明天的天气如何或总结昨晚的尼克斯队比赛。

我记得在研究生院学习深度学习时，作为教科书的最后一章——一位教授随口说道：“这是一个令人着迷但不切实际的想法！”

Transformer 架构改变了一切。就像神经网络的印刷机一样，人工智能可以处理大量数据，每千兆字节的能力都会增强。除了准确性之外，它的多功能性也在增长：总结文章的基本原理可以生成艺术、创作音乐和翻译。

就像人类一样，智能体也会面临很多不确定性。用户要求预订《莫阿娜 2》假期门票，但时间和地点已被预订。它应该做什么？

使用 DRL 训练的 AI 创建世界的心理模型，然后考虑时间、计算费用和其他参数，努力找到最佳答案。

是同时寻找下一个最近的影院还是另找时间或询问用户比较好？

我们为代理提供的建模和探索问题空间的工具越好，代理就越能代表我们采取行动。我们距离教科书的那一章已经有很长的路要走。

Miguel Morales 是《Grokking Deep Reinforcement Learning》一书的作者，制作了上面的图像。这是一本很棒的书，可以更深入地理解这个主题。