数据科学团队因公司的混乱而受阻,影响及时部署人工智能和分析项目的努力。在最近对美国公司的“数据主管”进行的一项调查中,44% 的人表示他们的招聘人数不足,过于孤立而无法发挥作用,并且没有被赋予明确的角色。受访者表示,他们最担心的是由于人工智能系统失败而导致收入损失或品牌声誉受损,以及短期回报的大笔投资趋势。
这些最终都是组织挑战。但 AI 开发平台Predibase的联合创始人 Piero Molino 表示,工具不足往往会加剧这些问题。
“我们今天在行业中看到的主要挑战是机器学习项目往往会延长实现价值的时间,并且整个组织的访问权限非常低。结果,组织中的大多数机器学习任务都在超额订阅的集中式数据科学团队中成为瓶颈,”莫利诺通过电子邮件告诉 TechCrunch。 “鉴于这些挑战,当今的组织在开发机器学习时需要在两种有缺陷的方法之间进行选择。他们可以使用低级 API 构建从数据到部署的自己的系统,这为他们提供机器学习任务通常需要的灵活性,但代价是复杂性。或者他们可以选择使用现成的黑盒‘AutoML’解决方案,以牺牲灵活性和控制为代价来简化他们的问题。”
事实上,根据 Alegion 的一份报告,虽然 2019 年全球在人工智能技术上的支出估计为 358 亿美元,但由于数据质量问题和对人工智能系统缺乏信心,近 80% 的公司已经看到他们的人工智能项目停滞不前。作为一名企业家(和一名销售人员),莫利诺声称他的产品 Predibase 是解决这个问题的方法——或者至少是朝着这个方向迈出的一步。
Predibase 今天在 Greylock 领投的 1625 万美元 A 轮融资中悄然崛起,工厂和天使投资者参与其中,它允许用户将 AI 系统指定为一个文件,告诉平台用户想要什么(例如,识别物体在图像中)并找出满足该需求的方法。 Molino 将其描述为 AI 开发的“声明式”方法,借用了计算机科学中的一个术语,指的是为描述开发人员希望完成的工作而编写的代码。
“在我们合作过的大多数组织中,今天的机器学习项目通常需要六个月到一年的时间。我们希望 [通过为组织带来低代码但高上限的机器学习工具来大幅减少这种情况”,Molino 继续说道。 “通常情况下,大多数公司都受到数据科学资源的限制,这意味着产品和分析师团队被稀缺且昂贵的资源所阻碍。借助 Predibase,我们已经看到工程师和分析师直接构建和操作模型。”
Predibase 建立在开源技术之上,包括用于 AI 模型训练的框架 Horovod 和一套机器学习工具 Ludwig。两者最初都是在 Uber 开发的,几年前,Uber 将项目的治理移交给了Linux 基金会。
Molino 通过公司收购创业公司 Geometric Intelligence 加入 Uber,并于 2019 年帮助创建了 Ludwig。Predibase 的另一位联合创始人 Travis Addair 在 Uber 担任高级软件工程师时是 Horovod 的主要维护者。
为了推出 Predibase,Molino 和 Addair 与前 Google Cloud AI 产品经理 Devvret Rishi 和斯坦福大学计算机科学教授 Chris Ré 合作,后者是 Lattice.io 的联合创始人之一,Lattice.io 是 Apple 于 2017 年收购的一家数据挖掘和机器学习公司。
Predibase 旨在使开发人员能够在几行代码中定义 AI 管道,同时在数千台机器上扩展到 PB 级的数据。正如 Molino 解释的那样,使用该平台,用户可以用六行代码创建一个文本分析 AI 系统,指定输入和输出数据。如果他们想要迭代和定制该系统,Predibase 允许他们在配置文件中添加参数,从而提供更精细的控制级别。
Predibase 与包括 Snowflake、Google BigQuery 和 Amazon S3 在内的数据源集成用于模型训练。用户可以根据用例通过平台或以编程方式训练模型,然后将这些模型托管、服务或部署到本地生产环境中。
“除了缩短实现价值的时间之外,Predibase 还允许用户使用相同的工具集处理不同模式的数据。使用 Predibase,我们已经看到用户在图像上训练模型以用于分类、文本数据(如用于分类的电子邮件)、表格数据用于检测和回归任务,甚至是在没有原生功能的情况下需要大量内部复杂性的音频数据集。平台,”莫利诺说。 “对于在这个领域工作的许多人来说,Predibase 在处理非结构化数据的用例时提供了一种全新的能力。”
从广义上讲,无代码开发平台正在兴起,一些初创公司直接与 Predibase 竞争,包括 AI 编排初创公司Union.ai和低代码数据工程平台Prophecy (更不用说SageMaker和Vertex AI )。但莫利诺的观点是,虽然竞争对手满足了企业对简单解决方案的需求,但他们这样做是以牺牲灵活性为代价的,从而导致客户“触顶并大量生产”。
“[L] 就像基础设施一样,代码简化了 IT,我们的平台允许用户专注于他们的模型的‘什么’而不是‘如何’,让他们能够使用可扩展配置打破低代码系统的通常限制……我们提供开箱即用的模型可解释性,因此用户可以了解哪些功能正在推动预测,“他说。 “[我们的平台] 已被财富 500 强公司使用,例如美国领先的科技公司、大型国家银行和大型美国医疗保健公司。”
这场演讲给 Kaggle 首席执行官 Anthony Goldbloom 和前英特尔 AI 首席运营官 Remi El-Ouazzane 等天使留下了深刻印象,他们两人都投资了。其他值得注意的支持者包括 Kaggle 首席技术官 Ben Hamner 和 Zoubin Ghahramani,他是剑桥信息工程教授和 Google Brain 的高级研究科学家。
Molino 表示,A 系列的新资金将用于将 Predibase 的 beta 产品推向更广阔的市场——它目前只接受邀请。它还将用于发展 Predibase 的机器学习工程师团队并建立一个进入市场的组织,扩大公司的 21 人团队。