Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

人工智能的作用越来越小了吗?

Posted on 2026-02-27

我一开始让AI包办一切。六个月后,我的代理程序中65%的工作流节点都由非AI代码运行。

第一版完全由系统自主控制:所有任务都分配给一个学习型学习模型(LLM)。LLM 会自信地完成任务,尽管并非总是准确无误。

所以我添加了一些工具来限制LLM可以调用的内容,限制了它的偏差能力。我还添加了一个发现工具来帮助AI找到这些工具。情况有所改善,但还不够。

后来我发现了 Stripe 的Minion 架构。他们的洞见是:确定性代码处理可预测的情况;LLM 处理模糊的情况。

我实现了蓝图,也就是用代码编写的工作流程图。每个蓝图都定义了节点、节点之间的转换、匹配任务的触发条件以及明确的错误处理机制。

 extract_domain (code) → attio_find (code) → harmonic_enrich (code) → generate_summary (LLM, 1 turn) → notion_prepend (code)这与技能或提示不同。技能告诉学习管理者(LLM)该做什么。而蓝图则告诉系统何时需要学习管理者参与。 extract_domain (code) → attio_find (code) → harmonic_enrich (code) → generate_summary (LLM, 1 turn) → notion_prepend (code)

Julius 工作流程确定性

每个蓝图都是一个有向节点图。节点分为两种类型:确定性节点(代码)和代理节点(LLM)。节点之间的转换可以根据条件进行分支。

工作流程类别

交易流程更新、聊天消息和电子邮件路由占工作流程的 29%,所有这些都无需任何 LLM 通话。

公司调研、新闻稿处理和人员调研仅需使用LLM进行提取和综合,占比36%。整个工作流程67-91%以代码形式运行。LLM仅需处理所需内容:一段待概括的文本、一个待分类的列表,并使用有限的工具在一到三个步骤内完成处理。

博客文章、文档分析和错误修复确实是混合型工作流程,占总工作流程的 21%。多次 LLM 会议会迭代改进,以提升质量。

只有14%的人仍然完全自主。数据转换和错误调查。这些通常是编码任务,而不是评估工作流程中的决策点。LLM需要探索的自由。

人工智能最初包揽一切。现在它负责路由、异常处理、研究、规划和编码。其余部分则无需它也能运行。

人工智能的工作量减少了吗?是的。系统的工作量增加了吗?也是的。

蓝图、工具和技能可能只是临时的支撑。随着每个新型号的发布,功能也会不断扩展。六个月前需要编写确定性代码才能完成的任务,明天可能就不需要了。

原文: https://www.tomtunguz.com/hybrid-state-machine-agents/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Alin Panaitiu
  • Anil Dash
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brent Simmons
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • PostHog
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Slava Akhmechet
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2026 搞英语 → 看世界 | Design: Newspaperly WordPress Theme