对于所有关于数据对企业的重要性的讨论,企业数据通常是孤立的、不协调的并且分布在不同的系统中,这使得使用和分析变得具有挑战性。根据 Seagate 和 IDC 的 2020 年报告,企业仅收集了 56% 的可能通过其运营获得的数据——其中 43% 最终未被利用。与此同时,埃森哲在其研究中发现,只有 32% 的公司能够从数据中实现“有形且可衡量”的价值,而只有 27% 的公司能够获得“高度可行”的见解和建议。
单一平台不可能解决困扰企业的所有数据问题,但企业家 Brett Hurt 相信他的最新冒险——Data.World——至少可以影响一些变化。 Data.World 今天宣布在高盛牵头的 C 轮融资中筹集了 5000 万美元,该公司希望利用基于云的工具来提供以企业为重点的数据发现、数据治理和大数据分析功能。赫特说,其使命是为数据科学家、工程师和研究人员创建一个协作社区,为此,他声称 Data.World 现在拥有超过 160 万会员,包括美联社和企鹅兰登书屋。
“从一开始,我们就坚信数据是企业中最具变革性的力量,可以在业务内外创造巨大的积极变化,”赫特在通过电子邮件进行的采访中告诉 TechCrunch。 “历史上,数据孤岛迫使 IT 团队进入‘命令和控制’状态。这会产生一系列问题,从试图集中数据的过度支出到破坏围绕数据的整个公司文化。 Data.World 通过将孤立的数据映射到已知的业务概念来正面解决这些问题,以便每个人,无论您是在 C 套件还是 IT 部门,都可以理解和使用知识。”
使数据可操作
Hurt 与Bryon Jacob、Jon Loyens 和 Matt Laessig 于 2015 年共同创立了总部位于德克萨斯州奥斯汀的 Data.World。在创立 Coremetrics 之前,赫特在德勤担任系统分析师,后来 IBM 以大约 3 亿美元的价格收购了一个网络分析平台 Coremetrics。 2005 年,他帮助创办了初创公司 Bazaarvoice,该公司提供有关零售客户购物习惯的数据。
Jacob 之前是度假租赁网站 HomeAway.com 的技术副总裁,而联合创办了几家公司的 Laessig 曾担任 Bazaarvoice 的业务发展副总裁。至于 Loyens,在继续领导 HomeAway.com 的工程工作之前,他是 Bazaarvoice 的工程副总裁
Data.World 是一个企业数据目录——一个组织内所有数据资产的清单。它描述了数据的存储位置、如何定位数据源、谁可以访问这些源以及谁对数据负责。
所有数据目录都可以帮助扫描、分析和索引元数据,同时提供跨数据集的沿袭(请参阅 Google Cloud 数据目录、Alation 数据目录等)。但 Hurt 声称 Data.World 的独特之处在于它建立在知识图谱上,这是一组相互关联的数据概念和实体,可提供组织数据和元数据的“语义组织”视图。
“知识图是数据目录的理想架构基础,它提供了关系和传统图数据存储无法获得的价值,[并]弥合了数据消费者如何理解他们的业务世界与公司如何存储数据之间的差距,”赫特说。 “知识图提供了更大的灵活性,更具可扩展性,并且能够作为高级数据项目的启动平台。”
在 Hurt 看来,Data.World 的“云原生”、软件即服务开发方法是其在竞争中脱颖而出的另一个方面。他指出了该平台最近推出的 Kos,这是一个开源元数据模型和集成工具包,旨在更容易地对数据进行一致的建模。继用户界面增强和敏感数据“自动策略管理”之后,即将推出的产品将使 Data.World 客户能够对某些元数据和治理任务使用自动化。
图片来源: Data.World
当被问及安全性时,Hurt 很快强调了 Data.World 的隐私工具,声称该平台能够屏蔽、隐藏或匿名化数据库中的选定行或列。他说,Data.World 还提供安全性和合规性监控,并记录特定数据集的使用或查询情况。
“Data.World 既是云优先又是安全第一。通过互联网传输的所有数据都经过加密,存储在磁盘上的所有客户数据都经过加密,”他补充道。 “这包括客户上传的文件、我们的应用程序数据库、搜索索引和任何本地缓存的客户数据……[平台] 超越了元数据治理,通过安全数据虚拟化扩展到数据访问和探索。”
成长为未来
赫特表示,最新一轮融资使 Data.World 的总融资额达到 1.322 亿美元,将用于“全球扩张、人才获取和产品创新”。该公司的目标是在未来 12 到 18 个月内将其 100 名员工的规模扩大近一倍,以加强其公共部门的客户获取工作。据 Hurt 称,Data.World 目前的客户包括州、县和地方政府机构。
“企业正面临价值数万亿美元的数据问题,而且大多数企业只是不知道从哪里开始,”赫特说,并引用了 NewVantage Partners 2021 年的一项调查,该调查发现只有 24% 的受访者认为他们的公司实际上是数据驱动的。 “我们认为领导者应该像看待他们的实际供应链一样看待他们的数据供应链。这需要投资,但也需要围绕企业如何查看和围绕数据进行协作的文化转变。”
除了通常的嫌疑人(例如,谷歌、IBM 和甲骨文)之外,Data.World 在像Stemma这样的初创公司中也有竞争对手,Stemma 去年 6 月筹集了 480 万美元用于构建托管数据目录平台。它还面临来自不相信数据目录是当今数据密集型世界中正确解决方案的行业部分的反对。
不过,像高盛的迈克·赖利这样的投资者毫不意外地坚信该公司拥有可观的跑道。他和赫特都吹捧 Data.World 的认证 B 公司和公益公司地位,他们说这强调了公司对积极行业变革的承诺。 (值得注意的是,由非营利组织 B Lab 管理的项目 B Corporations有点争议,一些批评者指责它洗刷了道德。)
“Data.World 处于定义数据管理未来的几个流行趋势的交汇点,”赖利在一份声明中说。 “鉴于他们的定位和产品差异化,我们相信他们最有能力在不断发展的、高增长的数据目录领域获得广泛的市场份额。”
Prologis Ventures、Shasta Ventures、Vopak Ventures、Sandbox Insurtech Ventures,以及个人投资者 Paul Albright、Zachary Karabell 和 Scott Stephenson 也参与了 Data.World 的 C 轮融资。