推特 反差 北大最新Nature:诈欺表不雅遗传,将大熊猫像片存进DNA,终了更高效的DNA数据存储
撰文丨王聪推特 反差
动漫成人剪辑丨王多鱼
排版丨水成文
从智妙手机和外交媒体到电子商务和科学商讨,一切皆在鼓励数据的空前激增。如今,每年产生的数据高达1021比特。跟着数据的激增,咱们对数据存储需求也不休增长,传统硅基材料存储难以得志日益增长的数据存储需求,这鼓励了东谈主们寻求新的存储处置决策,举例基于DNA的存储。
DNA具有超高存储密度,仅1克DNA就足以存储1000万小时高清视频数据。此外,若是幸免湿气和紫外线照耀,DNA不错保存数十万年之久。比拟之下,硬盘每每需要每隔几年更换一次以数据损坏。因此,DNA泄走漏动作存储介质的浩繁后劲。
关连词,传统DNA数据存储设施依赖于从新合成DNA序列,这导致其局限性也十分杰出——DNA合成速率慢、失实率高、合成用度激昂。
2024年10月23日,亚利桑那州立大学颜颢、北京大学定量生物学中心钱珑、欧阳颀及北京大学策画机学院张成等东谈主在海外顶尖学术期刊Nature上发表了题为:Parallel molecular data storage by printing epigenetic bits on DNA 的商接洽文,北京大学策画机学院为该论文第一单元。
该商讨描述了一种受表不雅遗传学启发的DNA数据存储新设施——表不雅比特(epigenetic bits),或可普及将数据写入DNA的速率和本钱效益。
在该期间的演示中,商讨团队将一张中国汉代拓片图像(16833比特)和一张熊猫像片(252504比特)存储进了DNA推特 反差,其可被准确地印刷和检索出来。该期间有望为可抓续、高密度数据存储期间不休增长的需求提供可限制化的处置决策。
DNA存储泄走漏在存储密度、寿命和动力破费方面寥落刻下硅基数据存储期间的后劲。关连词,通过从新合成的形态将大限制数据平直写入DNA序列,在时辰和本钱上皆不经济。
在这项最新商讨中,商讨团队成就了一种很是规的DNA数据写入框架,该框架允许基于DNA自拼装疏通的酶促甲基化将恣意的表不雅比特(epigenetic bits)以并行形态巩固地写入DNA模板上。
具体来说,商讨团队从当然发生的甲基化(DNA的表不雅遗传修饰)取得灵感,忽视了一种无需合成的设施,通过自拼装疏通的酶促甲基化,通过一组事先制备的DNA活字和甲基迂曲酶DNMT1,终了并行和遴荐性地将表不雅比特写入到DNA模板上,就像在纸上印刷翰墨一样。领先,假想并预制通用的单链DNA (ssDNA)载体和互补短ssDNA“砖块”文库。然后,通过将“砖块”文库装到DNA载体的雷同加载序列上,恣意表不雅比特信息被排版。接下来,碱基修饰(5-甲基胞嘧啶,5mC)通过DNMT1酶的遴荐性甲基化以并行的形态巩固地“打印”在DNA载体上。
这种称为“表不雅比特”的设施,类 似于传统的比特,以两个二进制值中的一个(0或1)来存储信息,对应碱基是否甲基化。商讨团队通过使用有限的700种DNA活字和5个模板进行编程,在一个自动平台上终赫然约27.5万个比特的免合成写入,每个反馈的写入输出为350比特,远远逾越依赖DNA从新合成的数据存储系统每个反馈约1比特的输出量。
通过纳米孔测序,以复杂表不雅遗传模式编码的数据不错高通量检索,商讨团队还成就了算法来细巧理解每个测序反馈的240个修饰模式。
表不雅比特DNA存储暗示图
该战略不错使用事先制备的核酸并行写入DNA中的恣意数据,而不是从新合成。这种酶打印工艺可能会缩小本钱和时辰,逾越化学合成的放手,何况高度特异性的“砖块”模板DNA拼装赋予了数据写入的准确性。
这一设施可用于存储图像和文本,商讨团队展示了使用该设施存储一张中国汉代老虎拓印图像(16833比特)和一张熊猫像片图像(252504比特),通过纠错解码,存储的图像巧合被完好归附。
基于表不雅比特条码的高位并行大限制存储
该商讨还泄露,60位莫得专科生物实验室告诫的志愿者用这个设施得胜地编码了文本数据,展现出该设施的可靠性和可用性。
定制和踱步式表不雅比特DNA存储
表不雅比特DNA存储使用预制的DNA片断,因此不错进一步优化以进行批量出产,这将比通过定制合成DNA链来存储信息要低廉得多。但 DNA存储在买卖化之前还有很长的路要走,该界限还需要大幅缩小本钱,才略与刻下的硅基材料存储相竞争。
总的来说,该商讨忽视了一种并行、可编程、巩固和可扩张的DNA数据存储新模式 。这种非传统的模式为生物分子系统的践诺数据存储和双模式数据功能开荒了阶梯。
论文相连:
https://www.nature.com/articles/s41586-024-08040-5