多亏了云,生成和存储的数据量在规模和数量上呈爆炸式增长。
企业的各个方面都在为数据进行检测,因此基于这些数据构建了新的运营,推动每家公司成为数据公司。
云数据库的出现是推动这一趋势的最深刻且可能不明显的转变之一。 Amazon S3、Google BigQuery、Snowflake 和 Databricks 等服务已经解决了对大量数据的计算问题,并且可以轻松存储来自每个可用来源的数据。
企业希望存储他们可以存储的所有内容,以期能够提供更好的客户体验和新的市场能力。
现在是做数据库公司的好时机
根据 CB Insights 的数据,在过去 10 年中,数据库公司筹集了超过 87 亿美元,其中近一半是 41 亿美元,仅在过去 24 个月内。
鉴于 Snowflake 和 Databricks 的天价估值,这并不奇怪。市场在过去四年翻了一番,达到近 900 亿美元,预计未来四年将再次翻一番。可以肯定地说,有一个巨大的机会去追求。

数据库的增长正在推动企业的支出。图片来源:文罗克
20 年前,您只有一个选择:关系数据库
今天,由于云、微服务、分布式应用程序、全球规模、实时数据和深度学习,新的数据库架构已经出现,以解决新的性能要求。
我们现在有不同的系统用于快速读取和快速写入。还有一些系统专门用于支持临时分析或非结构化、半结构化、事务性、关系、图形或时间序列的数据,以及用于缓存、搜索、基于索引、事件等的数据.
这可能会让人感到意外,但今天仍有数十亿美元的 Oracle 实例仍在为关键应用程序提供动力,而且它们可能不会去任何地方。
每个系统都有不同的性能需求,包括高可用性、水平扩展、分布式一致性、故障转移保护、分区容错以及无服务器和完全托管。
因此,企业平均在七个或更多不同的数据库中存储数据。例如,您可能将 Snowflake 作为您的数据仓库,Clickhouse 用于临时分析,Timescale 用于时间序列数据,Elastic 用于搜索数据,S3 用于日志,Postgres 用于事务,Redis 用于缓存或应用程序数据,Cassandra 用于复杂工作负载和 Dgraph* 用于关系数据或动态模式。
这一切都假设您配置到一个单一的云,并且您已经从头开始构建了一个现代数据堆栈。
与我们 5 到 10 年前相比,这些服务和平台的性能和保证水平已经大不相同。与此同时,数据库层的扩散和碎片化也越来越多地产生新的挑战。
例如,跨不同模式和系统同步、编写新的 ETL 作业以跨多个数据库桥接工作负载、持续的串扰和连接问题、跨许多不同系统管理主动-主动集群的开销,或者新集群或新集群时的数据传输。系统上线。其中每一个都有不同的缩放、分支、传播、分片和资源要求。
更重要的是,我们现在每个月都有新的数据库,旨在解决企业规模的下一个挑战。
新时代数据库
所以问题是,数据库的未来是否会继续像今天一样被定义?
原文: https://techcrunch.com/2022/06/01/this-is-the-beginning-of-the-unbundled-database-era/