过去几年,围绕人工智能的文化争论不出所料地沿着既定的路线展开。批评者理所当然地指责大型人工智能平台未经用户许可就进行训练,肆意开发而不考虑环境影响,并且由于其代码和权重(描述人工智能模型运行方式的参数)不对第三方开放,导致平台缺乏问责机制。人工智能狂热分子不仅无视所有这些合理的批评,还对大型人工智能平台的能力做出越来越离谱和极端的夸大其词,同时大肆渲染人工智能将对人们的生活和职业生涯造成毁灭性影响,这无疑加剧了公众对人工智能的负面情绪。
但我们当中一小部分人,既对机器学习技术本身感到好奇,又对大型人工智能公司对社会的影响深感批判,因此一直在思考“好的”人工智能究竟是什么样子?是否有可能开发出真正造福人类、切实帮助人们,同时又避免所有伴随而来的危害的技术版本?我们之前也曾经历过机器学习工具的时代,它们既实用又不会造成大规模破坏——那么,机器学习技术的负面外部性是否普遍存在呢?
我们或许刚刚第一次见到了真正优秀的人工智能。
这只是我最近在一个意想不到的地方看到的一个小例子,但它却一直萦绕在我的脑海中。这并非人人都会使用的工具,但它有点像威廉·吉布森那句名言:“未来已来,只是尚未普及。” 这或许是人工智能美好未来的一小步,而我们现在需要做的,就是将这种美好的事物推广给更多的人。
什么好?它完全符合我们最直接、最积极的目标:它完全使用经双方同意收集的数据进行训练;它是完全开源的,权重也完全公开,因此任何人都可以查看它,了解它的工作原理以及可能存在的偏差或缺陷;它的设计目标是在普通人可以使用的普通电脑上运行——包括那些完全使用可再生和负责任能源的电脑。而且,它由创造者而非数据攫取者控制,这些人无疑站在艺术家、创意人士以及所有从事艺术和文化创作的人们一边,旨在支持、赋能并增强他们的表达能力。这项技术的开发过程中,没有任何亿万富翁或爱泼斯坦岛上的客人参与。
绿色环保
让我们先回顾一下。Corridor Digital是一家视频制作公司和内容工作室,自 YouTube 独立电影社区兴起之初就已在 YouTube 上颇受欢迎。他们经历了许多潮流更迭和形式转变,始终保持着影响力,最近更是凭借其持续更新的系列视频——对热门电影和电视剧中的视觉特效和特技片段进行反应——而迅速走红。随着时间的推移,该系列视频赢得了众多业内顶尖人士的尊重,涵盖视觉特效、特技、动画等领域。他们甚至还推出了面向粉丝的订阅服务,让粉丝能够直接支持他们的创作。
但说到底,这基本上就是一群(大部分是)男生在拍视频。直到最近发生了一些有趣的事情。
尼科·普林格是Corridor Digital的联合创始人之一,也是该公司出镜作品中较为知名的演员之一,但他并非软件开发人员。几周前,他意识到自己在特效师经常面临的一项挑战——绿幕抠像——上已经忍无可忍。(绿幕抠像是指艺术家在制作用于合成特效镜头的片段时,从绿色背景中提取前景图像的过程。)基本上,现有的工具非常粗糙,几乎像手工操作一样,艺术家们需要费力地抠出图像,就像用一把钝剪刀从杂志上剪图片一样。
于是,尼科利用计算机生成的图像技术(CGI)制作了一系列模拟绿幕的视频,并开始训练一个人工智能模型——在本例中是一个神经网络——来学习如何抠像他为此目的而生成的素材。(他借助一款当时流行的商业人工智能工具,构建了执行训练的工具。)经过大量的时间、反复试验和计算,最终开发出了一套极其高效的绿幕抠像系统。他甚至将系统的早期版本发送给业内其他专业人士,让他们将结果与他们自己的商业级工具进行比较,结果证实该系统的性能通常可以与市面上一些最好的工具相媲美。
尼科制作了一段视频来解释这个项目,并发布了代码,以便其他人也能运行同样的工具。(一定要看看这段视频——团队成员都非常擅长讲故事,视频叙述精彩,带领观众体验了他们探索发明新事物过程中的种种高潮和低谷。)
敞开心扉
这款名为CorridorKey 的新工具一经推出,便迅速形成了一个社区,并立即将其发展成为一个成熟的开源项目——尽管 Niko 此前从未领导过开源项目。正如这类充满热情的社区通常的做法,他们教会了 Niko 如何接受来自世界各地陌生人的代码改进,以及其中涉及的各种复杂流程。
短短几天内,社区就大幅简化了这款工具的使用——尤其对于那些难以驾驭传统(极其专业)开源软件配置的非专业视频剪辑师而言。其他社区成员也大幅降低了执行该工具所支持的高级视频处理所需的硬件要求,使其从需要一些最强大的工作站就能运行,如今许多家庭电影制作者都能使用普通的家用台式电脑。而且这一切都是免费的。许多类似的工具对视频剪辑团队来说,使用成本高达数千甚至数万美元。正如尼科在他最初的视频中所说,他“不想为自己的画笔付租金”。
仅仅两周后发布的后续视频就清晰地表明,CorridorKey 的发布获得了非凡的反响。而接下来的里程碑更是意义非凡:Niko 宣布将公开创建该工具的所有原始训练数据——包括用于创建模型的所有视频和内容,以便其他人可以复现这项工作,甚至可以创建自己的模型,在此基础上进行改进。
对于技术爱好者来说,CorridorKey 采用的是修改版的知识共享许可协议,旨在防止未经许可的商业利用。我确信这会引发一些关于它是否符合所有人对“开源”定义的争论,但考虑到任何人都可以从头开始重新实现这种方法,而且 Niko 和他的社区已经分享了这么多资料,我认为这其实无关紧要。这里更重要的意义在于,对于过去几年一直被人工智能的狂热宣传所困扰的创作者来说,人工智能和语言学习生态系统的转折点将带来怎样的变革。
重要的是,使用CorridorKey 不会对视频制作者施加任何限制或义务。它不会泄露用户隐私,不会抓取视频用于训练模型,甚至不会收集电子邮件地址用于营销目的。这与人们在商业软件领域习以为常的做法截然不同,更不用说与大多数大型人工智能公司过度监控的现状相提并论了。
这会导致什么结果?
好的,这是一种工具。但如果你不是使用绿幕的视频创作者呢?它对其他人有什么帮助?这里有一些非常重要的突破,可以帮助更多人认识到各种可能性。
- 这些不良行为是一种选择。那些未经许可擅自使用内容、拒绝公开代码、或者坚持不让用户控制模型运行方式以及是否对环境影响负责的大型人工智能公司,如今已被彻底驳斥。如果这个甚至不是科技公司的小团队都能开发出行为正确的AI,那么为什么世界上最大的公司做不到呢?
- 关键在于目标,而不是一刀切。CorridorKey不会像 ChatGPT 那样诱导孩子自残,因为 CorridorKey 有其特定的任务。人工智能也应该如此运作——为特定群体解决特定问题,而不是试图满足所有人的所有需求。后者正是这些平台变得不受监管、最终伤害大量人群的根源。
- 它被低估了,而不是被过度炒作。事实上,CorridorKey 的发布被安排在一个较长的视频结尾,而这个视频主要讲述的是它的创作过程;发布视频甚至都没有提到产品的名字!创始人并没有吹嘘它有多棒,也没有说它比其他任何产品都好,更没有说它会改变世界。相反,他谦逊地表示,希望它能对特定的社群有所帮助,而社群也以热情、互动和协作回应了这份真诚。这并非一款需要强行推销的工具。
所有这些特质都可以在更多领域被更多充满热情的人复制,这些人不一定是专家,但他们关心的是用人性化、负责任的平台取代科技巨头的“一刀切”平台。
多年来,我一直坚信更先进的人工智能是可能的,我也理解为什么很多人觉得我天真,或者认为以目前的技术发展水平,这样的人工智能根本无法生存。但我认为风向正在转变,人们已经厌倦了那些只会用 软件做决策的CEO们强加给他们不想要的东西。这并不意味着人们憎恨科技!这只是意味着他们憎恨这些人把科技变成现在这样。
很高兴能再次感受到科技的强大之处。有时候,它能从我们试图摆脱的背景中,精准地提取出我们想要看到的东西。