「兔子」也能当硬盘?Nature 子刊报道下一代 DNA 存储技术的诞生!
到 2020 年,全球每人每秒将创建约 1.7 兆字节的数据,假设全球人口为 78 亿,相当于每年产生约 418 ZB(大约 4180 亿个 1 TB 硬盘)的数据量。在这一趋势下,地球上的传统存储介质的容量只能满足一个世纪的需求。
图片来源:站酷海洛 Plus
对此,生物学家们开始探索能否利用 DNA 的碱基序列信息作为替代传统存储的方案。随着研究的不断加深,「DNA 存储系统」的技术也日臻成熟。
12 月 9 日,在 Nature Biotechnology 杂志上发表的一项研究《A DNA-of-things storage architecture to create materials with embedded memory 》中,来自瑞士苏黎世大学化学与应用生物学系的教授 Robert N. Grass 团队开发了一种新型的 DNA 存储方案 1。这一名为「DoT(DNA of Things)」的存储架构不仅能够很好地代替传统存储介质的功能,并且还有许多意想不到的「惊喜」。
图片来源:Nature Biotechnology
主要内容
DNA 存储介质的设计与生产工艺
首先,作者希望利用 DNA 的优势形态特征,开发一种「无形(any shape)」的存储介质,从而摆脱我们日常生活中对「硬盘」等固定形态设备的依赖。
为了达到这一目的,研究者们将二进制的信息转码为由 DNA 碱基编码的序列信息,然后将包含有特定信息的 DNA 序列包裹在硅纳米颗粒中,以防止其降解。
最后,作者将这些硅纳米颗粒作为原材料进行 3D 打印处理,最终得到了一个「小兔子」形状的玩偶。
图片来源:Nature Biotechnology
上图简要描绘了整个存储介质的构建流程。可以看出,这个其貌不扬的小兔子内部含有海量的 DNA 信息。
更加重要的是,研究者们从小兔子体内取出少量材料并进行 PCR 验证发现,这些 DNA 保存的信息完好无损。
根据作者们的说法,他们的 DNA 存储技术能够很大程度上避免 DNA 降解,据估计,这些 DNA 的半衰期竟然有数千年之久。
复制过程中 DNA 信息的稳定性如何?
进一步,作者希望验证存储介质在复制过程中的稳定性。
对此,他们从第一代小兔子的耳朵附近采了 10mg 的材料,并通过如上所述的方法构建出了下一代的「小兔子」。这些新生代小兔子不仅外观与「父亲」相同,而且内部的 DNA 信息也是几乎一模一样。
图片来源:Nature Biotechnology
当然,在不断复制的过程中,DNA 还是会有信息丢失情况的出现。例如,在经历了几个月,若干代的复制之后,DNA 的丢失率上升到了 20%。
图片来源:Nature Biotechnology
接近「无限」的存储空间
相比以磁带、硬盘为主的传统存储设备,DNA 存储的最大优势在于其广阔的存储空间。
为了证明这一点,作者基于相同的原理,利用完全不同的材料、加工以及塑形工艺,对一段长达两分钟的视频进行转码与存储。
这段被存储的视频来自于林格布鲁姆档案馆,记载了第二次世界大战期间德国纳粹对犹太人犯下的罪行。
作者通过「DNA Fountain」库将这段视频的二进制编码信息转换为 30 万个核苷酸编码的 DNA 序列信息。
之后将合成的 DNA 序列与 SPED 融合,并用甲基丙烯酸甲酯处理,最终得到了一种透明的「聚甲基丙烯酸甲酯」材料。
进一步,作者利用这种材料设计出了一种特殊的「眼镜」,这副眼镜具有与普通眼镜相同的光学特性与功能,而其内部则「暗藏玄机」。
图片来源:Nature Biotechnology
最终,作者通过对镜片中的部分材料进行分离与读取,发现其中 96% 的信息都能够在首次检测中被读取到。表明这一设计工艺具有极高的保真性能。
亮点分析
本文结合了材料学、分子生物学以及信息学等多领域的前沿技术,提供了一种新的 DNA 存储的设计方案。相比传统的存储介质,以 DNA 序列信息为核心的存储方式拓宽了存储量的限制,并且打破了对于介质形状的要求。
目前来看,DNA 存储技术还存在很多问题,例如上文提到的复制过程中的信息丢失率过高,以及制备工艺复杂等等。此外,相比于以硬盘为代表的传统设备,目前我们还无法对 DNA 存储设备进行便捷地读取与储存。
不过,我们相信随着技术的日臻完善,这些问题都将会得到解决。
试想一下,在未来生活中我们或许不必再购买一堆「砖头」状的硬盘用于保存资料,而是可以将数据轻松地保存在各种类型的,平时可以用到的物件中,例如杯子,茶几,书桌,锅碗瓢盆等等。
是不是想想都觉得刺激呢?
延伸阅读
事实上,科学家们对 DNA 存储能力的探索很早之前便已经开始。早在上个世纪 50-60 年代,就有人曾提出 DNA 作为储存介质的设想 2-3。然而,受限于当时的测序技术与合成技术,在很长一段时间内没有显著进展。
近年来,技术的进步使得「DNA 存储」的设想成为了可能。
下图介绍了 DNA 存储领域的研究进展时间表,感兴趣的朋友可以阅读更加详细的综述介绍 4。
图片来源:Nature Reviews Genetics
2017 年,遗传学领域开山鼻祖,哈佛医学院遗传系 George M. Church 教授在 Nature 杂志发文,介绍了通过 CRISPR 技术向活细菌基因组中导入「数字影片」的方法 5。
图片来源:Nature
上图这张著名的「赛马」图片便是 Church 教授先锋尝试的「杰作」。
总的来说,利用活细菌进行数据储存的优点在于细菌能够自发性地复制与分裂,而且一旦得到应用,细菌也将会是比传统介质更加经济的选择。
参考文献
1. Julian Koch et al. A DNA-of-things storage architecture to create materials with embedded memory . Nat Biotech (2019)
2. Wiener, N. Interview: machines smarter than men? US News World Rep. 56, 84–86 (1964).
3. Neiman, M. S. On the molecular memory systems and the directed mutations. Radiotekhnika 6, 1–8 (1965).
4. Ceze, L., Nivala, J. & Strauss, K. Molecular digital data storage using DNA. Nat Rev Genet 20, 456–466 (2019)
5. Shipman, S., Nivala, J., Macklis, J. et al. CRISPR–Cas encoding of a digital movie into the genomes of a population of living bacteria. Nature 547, 345–349 (2017)