放大(图片来源: Adrienne Bresnahan )
研究界对 DNA 作为长期档案存储的潜力感到兴奋。这主要是因为它非常致密,化学性质稳定了数万年,并且采用了我们不太可能忘记如何阅读的格式。虽然取得了一些有趣的进展,但由于成本高昂和读写速度极慢,大部分工作仍停留在研究界。这些都是在基于 DNA 的存储变得实用之前需要解决的问题。
因此,我们很惊讶地听到存储巨头希捷与一家名为 Catalog 的基于 DNA 的存储公司合作。为了了解该公司的技术离实用性有多近,我们采访了 Catalog 的首席执行官 Hyunjun Park。 Park 指出,Catalog 的方法在两个层面上是违反直觉的:它不以您期望的方式存储数据,并且根本不关注档案存储。
一种不同的存储方式
DNA 是一种分子,可以被认为是碱基的线性阵列,每个碱基是四种不同的化学物质之一:A、T、C 或 G。通常,DNA 分子的每个碱基用于保存两个位元信息,以及由存在的特定碱基传达的位值。所以A可以编码00,T可以编码01,C可以编码10,G可以编码11;使用这种编码,分子 AA 将存储 0000,而 AC 将存储 0010,依此类推。我们可以高效地合成数百个碱基长的 DNA 分子,我们可以添加提供相当于文件系统信息的侧翼序列,告诉我们单个 DNA 片段代表二进制数据的哪一部分。