微软科学家的新成就将使人们可以创建EB磁盘



得益于新的数据提取方法,基于DNA的巨大数据仓库的前景已变得十分现实。

微软已经将合成DNA视为一种有前途的存储介质,可以满足存储大数据的需求。 先前的研究表明,只有几克的DNA可以存储EB级数据,保质期约为2000年。

但是该技术的主要缺点是记录的高成本和缓慢,其中包括将零和一转换为核苷酸。 从DNA提取数据涉及对文件进行测序并将其转换回零和一。 查找和提取特定文件也是一个大问题。

但这已成为过去-微软研究院和华盛顿大学的科学家首次大规模地随机获得DNA载体。 正如他们所解释的那样,缺乏随机访问或无法从DNA存储中选择性地提取文件的能力导致了这样一个事实,即用户为了找到必要的文件必须对整个数据集进行排序和解码。 获得随机访问将减少测序操作的数量。

为了获得对DNA的随机访问,科学家创建了一个引物库,该引物连接到分子的每个序列,并用作选择其所需片段的靶标。

研究人员还开发了一种算法,用于更有效的解码和数据恢复。 微软高级研究员谢尔盖·叶哈宁(Sergey Yekhanin)指出,新算法更能容忍写入和读取DNA序列的错误,从而减少了恢复数据所需的测序和处理。

合成DNA编码了200兆字节的数据,包括35个文件,大小从29 KB到44 MB不等。 这些文件包含高清视频,音频文件,图像和文本。 科学家认为,他们用于随机访问的方法将扩展到可容纳数TB的物理隔离的DNA池。

Source: https://habr.com/ru/post/zh-CN410549/


All Articles