虽然人工智能模型的聊天界面不会很快消失,但人工智能代理能力的不断增强使得与人工智能模型来回聊天来完成任务的概念显得过时了。
首先我要澄清的是,我的意思并非指人们用来表明意图的开放式文本框正在消失。正如我最近所写,软件中将会出现更广泛的输入方式,无论是文本、图像、音频、视频还是其他类型。我所说的聊天AI,指的是那些主要通过与AI模型进行来回消息对话来完成任务的应用程序:你输入内容,模型响应,你再输入内容……如此循环往复,直到你得到所需的输出。
任何与此类应用程序交互过的人都知道,AI 模型的响应很快就会淹没在对话线程中,而从一组聊天回复中获取信息可能会非常痛苦。这种界面对于撰写文档、编写代码或制作幻灯片等任务来说并非最佳选择。为了解决这个问题,一些应用程序现在包含一个画布或工件区域,用于存放 AI 模型的工作输出。
在这些布局中,聊天界面通常会从单窗格布局变为分窗格布局。大约一半的用户界面以聊天的形式输入,另一半以画布或工件查看器的形式输出。在这类应用中,我们已经开始看到聊天的重要性逐渐消退,因为人们在输入和审阅、编辑或处理输出之间来回切换。
然而,在这个模型中,用户仍然需要与模型反复沟通,直到模型在工件或画布窗格中生成所需的输出。代理(使用工具的 AI 模型)改变了这种动态。用户陈述他们的目标,然后 AI 模型规划使用哪些工具以及如何完成他们的任务。
每个步骤不再是人与AI模型之间来回沟通,绝大多数(如果不是全部)步骤都由模型本身协调。这再次削弱了沟通的作用。模型负责来回沟通,并且在大多数情况下只是告知人们何时完成,以便他们能够查看和利用其输出。
当代理能够使用多种工具、呼叫其他代理并在后台运行时,人类的角色就转移到启动流程、在需要时澄清问题以及利用最终结果。来回的聊天次数大大减少。因此,聊天界面的重要性可以进一步降低。如果你想查看人工智能完成任务的步骤,它就在那里。但在此之前,它不会干扰你,这样你就可以专注于最终结果。
您可以在 AI 工作区Bench中看到这种 UI 过渡。第一个版本专注于与模型之间来回传递指令以完成任务:一个单窗格 AI 聊天 UI。之后,分窗格界面更加注重这些指令的结果,其中一半屏幕专门用于输出窗格。如今,Bench 在后台运行并协调代理。因此,主要的交互是启动任务并在结果准备就绪时查看结果。
在这个 UI 中,聊天界面不仅缩小到屏幕的四分之一以下,而且默认折叠,隐藏模型与自身的来回对话,除非人们想要深入了解它。
以这种方式使用人工智能模型时,那种在消息界面中反复沟通创建内容的流程感觉已经过时了。能够接受你的指令,利用工具、多种模型和可更改的计划完成任务,并在完成后自动提醒你的人工智能,感觉更像是“未来”。当然,我之所以把“未来”加上引号,是因为以如今人工智能的发展速度,未来会比我们任何人想象的都要快得多。所以……未来还会有更多用户界面的改变!