数据质量已经成为数据科学世界中一个显着且越来越重要的部分:企业正坐拥不断增长的信息宝库,但只有我们相信它是准确和可用的,它才有用。为此, Validio是一家构建工具以改善和确保数据质量的初创公司——特别是使用允许用户实时清理存储在数据仓库和其他地方的数据的工具——宣布进行种子轮融资以标记其从隐身中出现。这家总部位于斯德哥尔摩的公司已经筹集了 1500 万美元,资金计划用于业务和产品开发、研发以及雇用更多人才。
Lakestar——这家总部位于伦敦的风险投资公司,早期投资于 Facebook 和 Airbnb 等公司,但主要专注于支持欧洲前景看好的初创公司(它还支持 Skype、Spotify、Revolut 和许多其他公司)——以 J12 领投本轮融资还有几位知名人士也参与其中。
(名单包括足球运动员(足球运动员)Zlatan Ibrahimović、Snowflake 的 CMO Denise Persson、MongoDB 的联合创始人 Kevin Ryan、Neo4j 的联合创始人 Emil Eifrem、DeepMind 的产品负责人 Mehdi Ghissassi 以及天使集体Framtid的 Kim Fai Kok 和 Dara Gill。)
与如今许多隐秘的企业初创公司一样,Validio 自 2019 年成立以来一直在利用这段时间安静地开发其产品,同时还与客户签约以进行实时部署。它的客户涵盖大数据游戏中的常见嫌疑人——营销和商业、安全公司和商业智能领域的那些人。 Validio 没有透露很多名字,但指出了一些:电子商务领域的 Budbee 和 Babyshop;电动滑板车公司 Voi;和电力初创公司 Tibber。
Validio 确定并解决的挑战是首席执行官兼联合创始人 Patrik Liu Tran 说他在工作生涯早期遇到的挑战。作为一名数学和计算机专家,他 16 岁从学校毕业,并加快了他在大学的学习时间,将在 2014/2015 年开始工作,当时他还是一名青少年咨询公司的 AI 项目。在大多数地方,这仍然是一项新生的努力(坦率地说,现在仍然是),除了在该领域很少有人准备进入公司解决他们的问题之外,最大的问题之一是缺乏诚信和质量。他说,他们试图在机器学习模型中使用的数据。
“在我建议的每一家公司,引起我注意的是缺乏对数据的信任,以至于人们对数据做的很少,而且没有工具可以真正帮助解决这个问题,”他在接受采访时说.他补充说,识别问题并尝试处理它的最初努力(例如由 Superconductive 背后的人创建的 Great Expectations 开源项目)是有希望的,但并不像关注实时信息那样关注实时信息。仓库中的数据。
“但机器学习存在于流中,而不是仓库中,”他说。
除此之外,他们通常过于依赖工程师和数据科学家需要设置并定期监控和调整的规则。
Validio 的方法是创建不完全低代码的工具。 “我们正在为数据工程师构建。这是非常技术性的,”Tran 说,对我的问题有点惊讶。 “但我们专注于流畅的用户体验。”
这包括使用机器学习和统计分析来“教”用户系统更快地查找和响应来自管道的数据;自动创建供工程师使用或补充自定义规则的规则集;自动阈值和自动解决功能等。
“我们希望让数据工程师能够尽可能无缝地完成他们的工作,”他补充道。
该公司没有一套适用于整个平台的更大规则,但已将其构建为针对各个组织量身定制。
“‘数据质量’很难定义。对一家公司有利的事情可能对另一家公司不利,”Tran 说。 “数据从来都不是完美的,公司也需要开始接受这一点。”但它的投资者名单(包括一些与战略名称相关的投资者)表明其他人可能会以这种想法唱同样的调子,以及 Validio 如何专门构建来解决这个问题:提高数据质量的工具,但为现实世界而建。
还有一些其他公司已经确定了数据质量市场,并正在努力解决这个问题——包括今年早些时候筹集了 4000 万美元的 Great Expectations 创建者Superconductive ;与微软、 SAS和Talend等重量级人物一起——但就目前而言,Validio 的方法似乎触动了正确的心弦,足以在仍然年轻的领域扩大赌注。
“随着数据团队越来越多地将注意力转向数据质量,我们相信 Validio 具有独特的优势,可以成为欧洲的下一个大型全球软件公司,”Lakestar 合伙人 Stephen Nundy 在一份声明中指出。 “Validio 建立了具有独特架构的平台,能够实时管理数据仓库、湖泊和流中的数据质量,包括实际数据和元数据。我们期待支持一流的 Validio 团队打造全球数据基础设施领导者的旅程。”