Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

算法学会行动的一年

Posted on 2024-12-03

在 2024 年熙熙攘攘的科技园区,被动人工智能时代(仅响应我们的查询的系统)正在让位于更深刻的时代:人工智能代理时代。

展望 2025 年,我们将发现当算法学会行动时会发生什么。

图像

这些新兴代理的核心在于三位一体的学习方法:

  • 监督学习:就像给孩子读书一样,人类为人工智能标记猫和狗、羊和牛提供了明确的指导。
  • 无监督学习:人工智能发现数据中隐藏的模式;电子商务网站通过聚集相似用户的购买模式来推荐您可能喜欢的产品。
  • 强化学习:人工智能通过玩数千次来学习玩视频游戏,就像游戏玩家一样。

深度学习意味着使用神经网络架构来计算答案,例如明天的天气如何或总结昨晚的尼克斯队比赛。

我记得在研究生院学习深度学习时,作为教科书的最后一章——一位教授随口说道:“这是一个令人着迷但不切实际的想法!”

Transformer 架构改变了一切。就像神经网络的印刷机一样,人工智能可以处理大量数据,每千兆字节的能力都会增强。除了准确性之外,它的多功能性也在增长:总结文章的基本原理可以生成艺术、创作音乐和翻译。

图像就像人类一样,智能体也会面临很多不确定性。用户要求预订《莫阿娜 2》假期门票,但时间和地点已被预订。它应该做什么?

使用 DRL 训练的 AI 创建世界的心理模型,然后考虑时间、计算费用和其他参数,努力找到最佳答案。

是同时寻找下一个最近的影院还是另找时间或询问用户比较好?

我们为代理提供的建模和探索问题空间的工具越好,代理就越能代表我们采取行动。我们距离教科书的那一章已经有很长的路要走。

Miguel Morales 是《Grokking Deep Reinforcement Learning》一书的作者,制作了上面的图像。这是一本很棒的书,可以更深入地理解这个主题。

原文: https://www.tomtunguz.com/agents/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • Elad Gil
  • Ellie Huxtable
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme