企业对人工智能的需求是无法满足的,但挑战在于构建基础设施以支持及其开发和维护。 2020 年 IDC 调查发现,训练 AI 的数据短缺和低质量数据仍然是实施 AI 的主要障碍,以及数据安全、治理、性能和延迟问题。事实上,三分之一的受访企业表示,与实际的数据科学工作相比,他们将大约三分之一的 AI 生命周期时间用于数据集成和准备工作。
OpenAI 的前研究科学家 Josh Tobin 在 2019 年与 Vicki Cheung 一起在加州大学伯克利分校教授深度学习课程时亲眼观察了这一趋势。他和 Cheung 看到 AI 的历史达到了一个转折点:在过去十年中,公司投资 AI 是为了跟上技术趋势或帮助分析。然而,尽管一些供应商宣布“人工智能民主化”,但大多数公司仍然很难构建人工智能驱动的产品。
“为机器学习构建或采用基础设施的主要挑战是该领域的发展速度非常快。例如,自然语言处理在几年前还被认为无法用于工业应用,但如今正迅速变得司空见惯,”托宾说。 “这就是我们构建持续机器学习改进平台的原因。”
Tobin 和 Cheung 曾是 OpenAI 的基础设施负责人,也是 Duolingo 的创始工程师,他们是 Gantry 的联合创始人, Gantry旨在帮助 AI 开发团队决定何时重新训练他们的 AI 系统以及在重新训练期间使用哪些数据。 Tobin 声称,连接现有应用程序、数据标记服务和数据存储的 Gantry 可以在训练、评估和部署阶段汇总和可视化数据。
今天,Gantry 以 2830 万美元的身价脱颖而出,其中包括 2390 万美元的 A 轮融资和此前未披露的 440 万美元种子轮融资。 Amplify 和 Coatue 与包括 OpenAI 总裁兼联合创始人 Greg Brockman 和工业机器人初创公司Covariant的联合创始人 Pieter Abbeel 在内的投资者共同领导了 A 系列。

图片来源:龙门
“我们的产品帮助机器学习工程师使用流经他们的实时机器学习驱动产品的数据来确定应用程序的实际性能,找到改进它的方法,并将这些改进付诸实施,”托宾说。
人工智能系统通过摄取数据集(例如,历史天气模式)和学习这些数据集中的各种数据点之间的关系(例如,晴天的温度往往更高)来学习做出预测。但人工智能系统在现实世界中往往很脆弱,因为现实世界的数据几乎从来都不是静态的,所以训练集不能长期代表现实世界。例如,由于大流行改变了购物行为,库存预测系统可能会崩溃。沃尔沃的自动驾驶汽车系统臭名昭著地被袋鼠弄糊涂了,因为袋鼠的跳跃让我们很难判断它们之间的距离。
Tobin 和 Cheung 认为,解决这个问题的方法是 Gantry 的“持续”学习系统——可以使系统适应不断发展的数据流的基础设施。托宾说,Gantry 旨在作为 AI 系统性能的单一事实来源,允许用户了解系统的性能以及使用工作流工具定义指标和计算它们的数据切片的改进方法。
“糟糕的企业客户体验时代已经结束——客户现在期望获得与现代科技公司所期望的一样无缝、一致和直观的体验。机器学习使大规模提供这些体验成为可能。然而,机器学习驱动的产品的构建成本很高,并且会带来品牌和客户体验风险,因为模型在与用户交互时可能会以意想不到和有害的方式失败,”他补充道。 “Gantry 通过提供安全维护和迭代机器学习驱动的产品功能所需的基础设施和控制,帮助企业以更低的风险和更低的成本开发无缝的机器学习驱动的客户体验。”
Gantry 适合称为 MLOps(机器学习操作)的新兴软件类别,该软件旨在通过自动化和标准化开发工作流程来简化 AI 系统生命周期。在人工智能加速采用的推动下,分析公司 Cognilytica预测,到 2025 年,全球 MLOps 解决方案市场价值将达到 40 亿美元,高于 2019 年的 3.5 亿美元。
Tobin 承认其他工具,例如Arize 、 Arthur和 Fiddler,可以完成一些与 Gantry 相同的事情。但他认为,他们专注于更广泛的 AI 问题,而 Gantry 涉及但超越了可观察性、监控和可解释性等方面。例如,Tobin 声称,Gantry 可用于检测 AI 驱动的应用程序中的偏差,即使应用程序使用文本和图像等“非结构化”数据也是如此。
Tobin 拒绝透露 Gantry 有多少用户或客户。但他表示,除了扩大 Gantry 22 人团队的规模外,这笔资金还将用于部分客户获取。
当被问及当前的经济环境及其对 Gantry 意味着什么时,托宾补充说:“我们认为,科技领域的潜在逆风被机器学习的强劲顺风所抵消。” “此外,随着安全带收紧和公司对支出的考虑更加周到,投资于帮助提高团队效率和产品性能和可靠性的工具变得更加重要。”