Hydra是 Y Combinator 2022 年冬季班的成员,有着广阔的抱负。它正在构建一个开源云数据仓库,并希望最终与Snowflake竞争。数据仓库概念自 80 年代以来就作为结构化数据的大型仓库而存在。
Snowflake 于 2012 年成立时将这一概念推向了云端,并在 2020 年上市前筹集了超过 20 亿美元的资金。 Hydra 的创始人希望采取不同的方法,建立一个成本更低的开放式替代方案。他们的解决方案是在流行的开源Postgres数据库之上构建一个云数据仓库。
公司联合创始人兼首席执行官 Joseph Sciarrino 是 Postgres 的长期用户。他和联合创始人兼首席技术官 Jonathan ‘JD’ Dance 认为,既然数据仓库为组织保存了如此重要的信息,那么它绝对应该建立在开源基础之上——Postgres 提供了一个熟悉的环境。
“我在 Postgres 工作了很长时间,所以我对一个组织的真相来源应该保存在供应商的专有软件后面的想法有点过敏。所以我们所做的就是将 Postgres 转变为这种数据仓库类别,”Sciarrino 告诉 TechCrunch。
他承认 Postgres 被构建为一个事务性数据库,在这一点上不一定非常适合作为分析引擎,但他和他的联合创始人接受了修改它的挑战。他们通过解耦 Postgres 的查询层、计算和存储以在其上构建数据仓库来解决这个问题。
“我们所做的是将 Postgres 转变为这种数据仓库类别。 Postgres 一直擅长事务性工作负载,但由于设计选择的原因,它并不是特别擅长大分析。所以我们正在修改 Postgres……把它放到一个新的环境中,它可以通过列存储和矢量化执行以及传统数据仓库今天所做的所有好东西,真正进行大规模的适当分析,”他说。
虽然需要一些修改,但使用 Postgres 是创始人深思熟虑和有意识的选择,因为它已经在开发人员中如此受欢迎。 “Hydra 的伟大之处在于它是 100% 纯 Postgres,您可以继续使用所有现有的 Postgres 生态系统和工具,而且它已经可以与 Hydra 一起使用。所以这很棒,因为我们不需要出去创建一百万种不同的专业工具和集成,”Sciarrino 说。
该公司为客户提供下载开源版本并自行管理的选项,或者提供付费托管服务,由初创公司为他们管理所有潜在的复杂性。
他说,作为 Y Combinator 的一员,他可以与一群几乎了解所有情况的合作伙伴一起对商业模式进行压力测试,并且可以在需要时提供正确的建议或推动。但他说,成为一群大多数都在同一个地方的创始人的一员,对他也有帮助。
“被具有某种个性的人包围真是一次很棒的经历。你必须有一定程度的乐观才能想要建立一个企业,而且遇到这样的人总是很高兴的,”他说。
他说,当他看到 Postgres 的联合创始人Michael Stonebraker最近在Postgres 愿景会议上发表讲话时,创始人感到他们的想法得到了特别的验证,他在会上就生态系统中缺少的四个关键要素进行了演讲, 数据仓库就是其中之一.
该公司目前是一个四人团队,在去年春天的演示日之后,由 Pioneer Fund 牵头,Y Combinator 和几位行业天使参与其中,筹集了 310 万美元的种子投资。除了开源产品之外,该公司还提供托管产品,并且在早期访问计划中拥有付费客户,因此它已经产生了收入。