当今人工智能产品面临的最大问题或许是:人们并不了解这些产品的全部功能,也不知道如何从中获得最佳效果。考虑到大多数人工智能产品的界面只是空洞的文本框,只会询问“你想做什么? ”,这并不奇怪。快速构建用户界面可以帮助回答这个问题,甚至更多。
我们一直在探索如何帮助人们理解Bench 的潜力以及如何实现这些潜力。Bench 是用于日常工作任务的人工智能。因此,它可以做很多事情:搜索网页、像你一样浏览网页(使用浏览器扩展程序)、生成报告、制作 PowerPoint、使用电子邮件,以及构成人们日常工作任务的许多其他事情。问题是……它的功能太多了。
为了让用户更好地了解Bench 的功能,我们首先提供了一些建议提示(也就是说明),用于完成特定的工作任务。为了使这些提示尽可能贴近用户,我们在 Bench 的初始体验中添加了一个初始屏幕,要求用户明确自己在工作中的主要角色:工程、设计、销售等等。如果他们明确了这些角色,建议的提示就会反映出他们在工作中可能要做的事情。例如,销售人员会看到类似的建议:研究潜在客户、准备销售会议、总结客户反馈等等。
这些高层次建议的问题在于:它们太高深了。虽然与职位相关,但与某人当前的工作任务无关。销售团队正在研究潜在客户,但他们的研究方式是针对他们所销售的产品和他们所研究的潜在客户。通用的提示性建议没什么用。
为了解决这个问题,我们尝试通过在用户注册时在后台研究他们所在的公司来个性化基于角色的建议。这些额外的信息使我们能够根据用户所在的行业和公司提供更具体的建议。这无疑使建议的提示更加具体,但也降低了它们的实用性。研究某人的公司可以提供一些背景信息,但远不及其员工所能提供的信息量。正因为如此,个性化的建议提示感觉有些“不对劲”。所以我们恢复了更通用的建议,但使其更加具体。
原子建议并非涵盖完整的工作任务,而是仅关注其中的一部分:工作任务的信息来源(查看我的 Gmail、搜索我的 Notion)以及工作任务的输出结果(创建 Word 文档、制作图表)。这些建议让人们更好地了解了 Bench 的功能。它可以读取我的日历,可以制作 Google 表格。然而,几乎立刻,我就觉得这些原子建议应该可以组合使用。
为了实现这一点,我们制作了一个提示重写器,它会根据用户选择的原子建议进行调整。如果用户选择了“使用 Salesforce”和“创建 Google 文档”,重写器会将它们合并为一条合理的指令“使用 Salesforce 中的 [变量] 创建 Google 文档”。这使得编写复杂提示的过程变成了只需点击建议即可。然而,这些建议的布局方式并没有明确指出它们可以像这样组合。它们看起来和感觉起来都像是独立的提示。
进入任务构建器。在Bench的最新版本中,原子建议得到了扩展,布局更像任务提示的构建块。用户可以选择自己想做的事情、使用的内容、制作的内容,或者三者的任意组合。然后,任务提示重写器会将机器编写的提示与一些可选的输入字段拼接在一起,用户可以填写这些字段,以提供有关他们想要完成的工作任务的更多详细信息。
此提示生成器 UI 为使用 Bench 的用户提供了一些功能。它:
- 让产品的功能更加清晰
- 提供一种方法来展示产品中添加的新功能
- 重写人们的提示,以便他们获得更好的结果
- 阐明人们可以在提示中添加哪些内容,以提高他们的任务效率
虽然这已经是相当不错的成果了,但设计永无止境,AI 能力也不断提升。因此,我确信,我们不仅要完成 Bench 的任务构建器 UI,还要解决 AI 产品整体的可发现性和提示功能。换句话说……未来还有更多。