如果你访问你最喜欢的社交媒体网站,你会发现上面充斥着大量看起来惊人相似的帖子:
这些帖子下的许多评论也都是人工智能生成的。越来越多的学术论文、 《纽约时报》评论文章,甚至一些获奖短篇小说,也都是人工智能生成的。如果你经常使用人工智能,你可能已经注意到身边充斥着大量的人工智能写作(以往经常使用人工智能的人通常都能很好地识别出哪些是人工智能写作),如果没有,我可以向你保证,人工智能写作的数量远超你的想象。
问题不仅仅在于人工智能写作的千篇一律,虽然这种千篇一律最终会让人感到厌倦,以至于如果我的“人工智能探测器”响起,即使是有趣的话题,我也会选择跳过写作。更糟糕的是,糟糕的人工智能写作往往每个词都意义不大,只会把你带入无休止的理论空谈。我们习惯于阅读那些精心雕琢、听起来很有深度的文字,因为那是人类辛勤工作的成果,所以我们看到人工智能写的评论时会格外关注。但这些评论往往缺乏人类的思考,它们只是徒有其表的注意力吸血鬼,需要你耗费脑力去解读,却无法给你带来任何相应的理解¹ 。
但使用人工智能写作的代价远不止让读者反感,它还可能阻碍一项重要的人类技能的发展。我很幸运,写作已有数十年之久,并逐渐形成了自己独特的写作风格,我认为无论写书、发推文还是写博客文章,这种风格都能体现出来。而这种风格的形成,背后凝聚着我无数令人抓狂的努力:良师益友的指导、反复修改以及网络上那些尖锐的评论都功不可没。如果人工智能能够出色地完成写作任务,我当然可以省去所有这些麻烦,但代价却是放弃了这项对我事业和幸福都至关重要的技能。
这并非反对以任何方式使用人工智能辅助写作。我认为人工智能对于优秀的写作者来说是一个绝佳的工具(我让人工智能检查我的所有文章,并模拟不同读者的视角,以发现我是否遗漏了重要信息)。对于那些沟通有困难的人来说,人工智能可以帮助他们更好地表达想法,而且写作并非人人都需要思考。此外,稍加努力就能让人工智能生成的文字不那么陈词滥调,更具个性化,也更有价值(当然要适度使用)。因此,我反对的是将人工智能作为默认选项,或者更糟糕的是,完全不加思考地使用。如何平衡人工智能的使用与我们自身的思维能力,将是未来几年的一项重大挑战。
细微的变化,却能带来巨大的结果差异。
在教育领域,这一点体现得最为明显。两篇论文的研究团队有部分重叠(包括沃顿商学院的同行),它们很好地阐释了使用人工智能简化思考和辅助思考之间的区别。第一篇论文是在土耳其一所高中进行的一项实验,约有1000名学生正在学习数学。一组学生使用普通的ChatGPT,另一组则没有使用任何人工智能。使用ChatGPT的学生作业完成得更好,他们也认为自己学到了更多东西,但在考试中,他们的成绩却不如未使用ChatGPT的同学。这是因为,这款旨在提供帮助的人工智能实际上只是在直接给出答案,而真正的学习需要付出脑力劳动。如果省略了思考过程,学习也就无法真正实现。这就是为什么人工智能在课堂学习中的初步应用结果令人担忧的原因。
然而,在另一篇由许多相同的作者撰写的论文中,我们看到了不同的结果。他们在台北的十所高中开展了一项为期五个月的Python课程,近千名学生参与其中。由人工智能导师提供个性化习题序列的学生,在期末考试中的平均得分比未接受人工智能帮助的学生高出0.15个标准差。据估计,这相当于额外学习了六到九个月,而且没有增加任何教学时间或教师工作量。人工智能的作用在于帮助学生量身定制学习方案。这与其他关于人工智能辅导的研究结果相符,表明如果使用得当,个性化辅导可以显著提升学习效果。
这只是人工智能使用方式上一个相对较小的差异,却会导致截然不同的结果。更糟糕的是,人性驱使我们做出错误的选择。学习需要我们直面自身的无知,进行艰苦的脑力劳动,而这些都令人感到不适。这就是为什么学生们认为轻松有趣的讲座比课堂上做难题更有教育意义,尽管他们实际上从后者中学到的东西更多。要想在学习中真正受益于人工智能,你需要转变思路,从利用人工智能解决问题,转变为促使自己去解决问题。
幸运的是,三大人工智能公司都提供了一些工具,可以让人工智能更像导师一样辅助学习。但遗憾的是,这些工具的使用并不直观。Gemini 最简单,点击“+”号,然后选择“引导式学习”。ChatGPT 的操作方法是在聊天框中输入“/learn”。Claude 的操作方法是点击“+”号,选择“使用风格”,然后选择“学习”(Anthropic 公司已宣布正在改进此方法,但尚未公布具体细节)。无论使用哪种模式,都应该尽可能选择思维模式或高级模式,尤其是在学习 STEM(科学、技术、工程和数学)学科时。这些模式只能帮助真正想学习的人,并不能阻止你作弊。
摩擦力太小
人工智能未必会削弱你的思考能力,但如果使用不当,就会造成这种后果,而糟糕的使用方式往往是默认的。我在沃顿商学院的同事们将这种现象称为“认知投降”,他们记录了人们如何停止思考问题,仅仅让人工智能代劳,即便人工智能的答案是错误的。我认为部分问题在于这些工具的设计方式。
当人工智能系统需要复杂的来回对话且经常出错时,人类必须全程参与。智能体系统旨在简化你的生活,因为它们只需执行任务即可。这固然有利于完成任务,但不利于学习、保持真诚或避免认知上的妥协。如果你提出一个棘手的要求并得到答复,你很容易就会接受人工智能的回答。
在我们最近与 Fabrizio Dell’Acqua 以及我在哈佛大学、麻省理工学院、华威大学、波士顿咨询公司 (BCG) 和其他机构的同事们共同发表的论文中(我三年前就写过关于这篇论文的内容,但学术论文的发表需要时间!),我们对波士顿咨询公司的 758 位咨询顾问进行了一项实验,其中一半人可以使用 GPT-4。使用人工智能的咨询顾问的表现远超未使用人工智能的顾问。但我们也要求咨询顾问们解决一个我们明知人工智能无法解决的问题。在这项任务中,使用人工智能的咨询顾问获得正确答案的概率显著低于未使用人工智能的咨询顾问。人工智能给出了一个看似权威但实际上错误的答案,而大多数咨询顾问——那些在其他所有方面都表现优异的精英顾问——却未能发现这个错误。当然,现在人工智能已经能够解决这个问题,所以问题的关键不再是错误率,而是咨询顾问们因为屈服于同样的“放弃”冲动而未能学会如何成为一名优秀的咨询顾问。
当然,这并非默认选项。Anthropic 进行的一项小型研究中,程序员们利用人工智能来辅助完成一项新任务。那些完全放任人工智能工作的程序员无法回答有关他们工作内容的问题,这是一种放弃的迹象。但那些要求人工智能解释其操作过程的人,或者那些仅让人工智能协助完成部分工作的人,似乎避免了这种情况。
部分解决方案或许就在于工具本身,但这毕竟有限。如果 ChatGPT 在每次回答前都问“你希望我引导你思考,还是直接告诉你答案?”或者告诉你“我觉得你自己写会更真实”,那大多数时候都会让人难以忍受。但有些情况下,我们确实需要这些提醒。台北的实验结果暗示了一个方向,即系统层面的限制而非用户层面的意志力,但我们在消费产品中很少看到这种趋势,而商业压力却大多朝着相反的方向发展。
选择保留哪些人类
很多问题最终都取决于我们自己。说实话,我并不介意在认知能力上做出很多妥协。我已经记不住电话号码了,因为手机会帮我记。我很庆幸我的孩子不需要学习草书。计算器帮我完成日常计算,电脑帮我安排课程,这些我都觉得很方便。这些技能曾经很有用,但我们或许当初放弃它们是对的。
人工智能之所以不同,是因为这项技术足够通用,几乎任何认知任务都可以在一定程度上交给它来完成。我不想对写作过于执着:并没有任何原则规定,一篇精炼的电子邮件草稿必须出自人脑,就像一列算术运算也不一定非得出自人脑一样。但我们不想放弃一切,而且我们目前大多还不清楚,对于任何具体任务而言,哪些是重要的,哪些是不重要的。做出这样的决定将是一个真正的挑战。
关键不在于回避人工智能,而在于有意识地选择如何使用人工智能,而不是出于本能的依赖或回避。更广泛地说,我们正处于一个关键时刻:人工智能公司为了实现无缝使用而设定默认标准,雇主决定何为“有效使用人工智能”,而教授不断变化的“人工智能素养”概念的人们也正在设定这些默认标准。讽刺的是,这一切的发生很大程度上缺乏真正的规划和思考。而且我怀疑,一旦一代工人和学生养成习惯,这些默认设置将难以逆转。我们能做的最重要的事情就是不断思考哪些工作应该交给人工智能,哪些工作应该保留……并且不要指望任何人,包括人工智能,会替我们回答这个问题。
这一点在小说创作中尤为突出,人工智能在这方面虽然看似强大,实则能力薄弱。ChatGPT尤其偏爱毫无意义的比喻和隐喻(例如“街道像一个缺牙的微笑”、“他坐的姿势连树木都会嫉妒”),这些比喻和隐喻乍看之下似乎意味深长,但这仅仅是因为我们假定晦涩的文字是作者有意为之,并努力赋予其意义。人类只要足够努力,就能非常擅长为毫无意义的素材赋予意义。



