MLOps 平台Iterative几乎在一年前宣布了 2000 万美元的 A 轮融资,今天推出了 MLEM,这是一种基于 git 的开源机器学习模型管理和部署工具。
该公司表示,这里的想法是通过使用开发人员已经熟悉的基于 git 的方法来弥合 ML 工程师和 DevOps 团队之间的差距。使用 MLEM,开发人员可以在整个生命周期中存储和跟踪他们的 ML 模型。因此,它补充了 Iterative 的开源GTO 工件注册表和DVC ,该公司的数据和模型版本控制系统。
“拥有机器学习模型注册表正在成为机器学习技术堆栈的重要组成部分。当前的 SaaS 解决方案可能导致 ML 模型和软件应用程序的生命周期出现差异,”Iterative 的联合创始人兼首席执行官 Dmitry Petrov 说。 “我们对 ML 模型注册表的方法是提供模块化构建块,组织可以轻松地将其集成到他们现有的 MLOps 技术堆栈中。 MLEM 用于提取 ML 模型的元信息并简化部署。 DVC 在云或本地存储中管理大型 ML 模型文件。 GTO 提供 GitOps 功能,用于在 Git 中对模型进行版本控制,并向 CI/CD 系统发送信号以进行模型生产。这些单独的工具为 ML 模型管理和 ModelOps 带来了模块化的 Unix 理念。”
正如团队所指出的,这样的系统可以让业务部门和团队之间更轻松地共享模型,同时也让 ML 团队更容易与他们的 DevOps 团队协作。对于高度监管的行业,这样的系统还提供了一个单一的事实来源,用于确定给定模型的血统。
Iterative 的联合创始人兼首席执行官 Dmitry Petrov 说:“模型注册表通过存储和版本化训练模型来简化在 ML 生命周期中移动的跟踪模型,但构建这些注册表的组织最终会使用两种不同的技术堆栈用于机器学习模型和软件开发。” . “ MLEM作为模型注册表的构建块,使用 Git 和传统的 CI/CD 工具,使 ML 和软件团队保持一致,以便他们可以更快地将模型投入生产。”
当然,Iterative 本身提供了一个托管平台,该平台通过其Iterarative Studio服务来完成所有这些事情,用于在 ML 模型上进行协作并跟踪实验和可视化,以及它的托管模型注册表。