推特反差北大最新Nature：诈欺表不雅遗传，将大熊猫像片存进DNA，终了更高效的DNA数据存储

发布日期：2024-10-25 10:56 点击次数：117

撰文丨王聪推特反差

剪辑丨王多鱼

排版丨水成文

从智妙手机和外交媒体到电子商务和科学商讨，一切皆在鼓励数据的空前激增。如今，每年产生的数据高达1021比特。跟着数据的激增，咱们对数据存储需求也不休增长，传统硅基材料存储难以得志日益增长的数据存储需求，这鼓励了东谈主们寻求新的存储处置决策，举例基于DNA的存储。

DNA具有超高存储密度，仅1克DNA就足以存储1000万小时高清视频数据。此外，若是幸免湿气和紫外线照耀，DNA不错保存数十万年之久。比拟之下，硬盘每每需要每隔几年更换一次以数据损坏。因此，DNA泄走漏动作存储介质的浩繁后劲。

关连词，传统DNA数据存储设施依赖于从新合成DNA序列，这导致其局限性也十分杰出——DNA合成速率慢、失实率高、合成用度激昂。

2024年10月23日，亚利桑那州立大学颜颢、北京大学定量生物学中心钱珑、欧阳颀及北京大学策画机学院张成等东谈主在海外顶尖学术期刊Nature上发表了题为：Parallel molecular data storage by printing epigenetic bits on DNA 的商接洽文，北京大学策画机学院为该论文第一单元。

该商讨描述了一种受表不雅遗传学启发的DNA数据存储新设施——表不雅比特（epigenetic bits），或可普及将数据写入DNA的速率和本钱效益。

在该期间的演示中，商讨团队将一张中国汉代拓片图像（16833比特）和一张熊猫像片（252504比特）存储进了DNA推特反差，其可被准确地印刷和检索出来。该期间有望为可抓续、高密度数据存储期间不休增长的需求提供可限制化的处置决策。

DNA存储泄走漏在存储密度、寿命和动力破费方面寥落刻下硅基数据存储期间的后劲。关连词，通过从新合成的形态将大限制数据平直写入DNA序列，在时辰和本钱上皆不经济。

在这项最新商讨中，商讨团队成就了一种很是规的DNA数据写入框架，该框架允许基于DNA自拼装疏通的酶促甲基化将恣意的表不雅比特（epigenetic bits）以并行形态巩固地写入DNA模板上。

具体来说，商讨团队从当然发生的甲基化（DNA的表不雅遗传修饰）取得灵感，忽视了一种无需合成的设施，通过自拼装疏通的酶促甲基化，通过一组事先制备的DNA活字和甲基迂曲酶DNMT1，终了并行和遴荐性地将表不雅比特写入到DNA模板上，就像在纸上印刷翰墨一样。领先，假想并预制通用的单链DNA （ssDNA）载体和互补短ssDNA“砖块”文库。然后，通过将“砖块”文库装到DNA载体的雷同加载序列上，恣意表不雅比特信息被排版。接下来，碱基修饰（5-甲基胞嘧啶，5mC）通过DNMT1酶的遴荐性甲基化以并行的形态巩固地“打印”在DNA载体上。

这种称为“表不雅比特”的设施，类似于传统的比特，以两个二进制值中的一个（0或1）来存储信息，对应碱基是否甲基化。商讨团队通过使用有限的700种DNA活字和5个模板进行编程，在一个自动平台上终赫然约27.5万个比特的免合成写入，每个反馈的写入输出为350比特，远远逾越依赖DNA从新合成的数据存储系统每个反馈约1比特的输出量。

通过纳米孔测序，以复杂表不雅遗传模式编码的数据不错高通量检索，商讨团队还成就了算法来细巧理解每个测序反馈的240个修饰模式。