批量产品:首个商业DNA储存库将于2019年发布

启动服务计划启动目录。 该公司正在开发一种特殊的设施 ,使您每天可以记录500万亿个DNA分子中的TB数据。

接下来,我们讨论Catalog所使用的方法以及DNA领域的其他最新进展。


/图片密西根大学 CC

项目详情


将数据写入DNA的经典方法包括将一系列的位(零和一)转换为四个基本DNA碱基的序列。 例如,氮碱基腺嘌呤(A),胸腺嘧啶(T),鸟嘌呤(G)和胞嘧啶(C)可以表示如下:A = 00,T = 01,G = 10,C = 11。

使用这种方法,2016年,Microsoft 能够使合成的DNA分子永久保留200 MB的文本和视频(正如我们在其中一篇文章中已经提到 )。 然而,这种方法虽然昂贵,但不适合用于海量数据记录。

Catalog研究人员建议不要使用数百万条DNA链,而是产生大量不同的DNA分子,这些分子不超过30个碱基对。 然后,由于酶促反应,这些预先准备的“片段”形成了编码信息的特殊模式。 因此,代替表示单个氮碱基,位以多维矩阵布置。 分子组反映了这些矩阵中位的位置。

目录研究总监Devin Leake 引用了以下类比:“想象一下,有一本书。 您可以手动复制:一个字母一个字母地复制。 类似地,您可以逐个分子地将数据写入DNA。 Microsoft使用了这种方法。 我们建议创建一种“印刷机”,其中DNA分子将作为头戴式耳机 。 因此,重新排列预先生成的分子后,我们会立即处理整个单词,并以正确的顺序排列它们。”

使用此方法,目录研究人员成功地记录和检索了DNA中的数据。 为此,他们使用了罗伯特·弗罗斯特(Robert Frost)的诗《未走的路》 (译为“另一条路”)。 现在,该公司正在解决根据IT公司和政府组织的需求扩展平台的问题。

根据《目录》的创始人之一Hyunjun Park所说,这种方法将在2019年初使TB级DNA存储在商业上可行。 但是,该初创公司将提供的数据存储服务的确切成本仍然未知。

类似的发展


如前所述,创建DNA存储库的问题由Microsoft处理。 自2016年以来,该公司的研究人员在开发方面取得了进步 :2018年2月,他们创建了一个“ 引物库”,用于组织对DNA的随机访问。 每个引物都“连接”到特定链上,因此,使用聚合酶链反应,您可以选择其中任何一个(并访问记录的数据)。


/照片Col Ford和Natasha de Vere CC

该公司希望这种方法,再加上一种新的写和读数据算法,该算法不易出错,将在将来帮助创建容量为数TB的DNA存储。 这家IT巨头计划提供DNA存储即服务。 该公司着手在2020年之前实现这一想法。

双赢的DNA和AI


在DNA载体上记录信息并没有特别困难:公司已经提出了自动化方法。 但是,读取信息的过程仍然很复杂且耗时。 为了解决这个问题,Lifebit 计划使用AI系统。 Lifebit正在开发基于MO算法的Deploit云平台,该平台将自动执行从DNA载体读取信息的过程。

因此,机器学习将有助于DNA存储库的组织。 然而,事实恰恰相反-DNA分子用于创建人工智能系统。 例如,加州理工学院的研究人员正在这一领域工作

它们的神经网络的工作原理基于化学反应,即所谓的线程置换 (一种在某些病毒中已知的DNA复制机制),当称为传入线程的线程置换原始DNA的一根链时。 已经教过智能系统识别手写数字。

该图绘制在一个正方形平面上,分为一百个相同的像元(10x10)-原始像素。 这些细胞中的每一个都由一个DNA分子表示,该DNA分子“知道”该像素上是否有一个数字。 将所有分子混合在一个试管中后,DNA网络使用荧光信号给出答案。 管开始发出辉光,其颜色取决于识别的数字。 例如,绿色和黄色表示5,绿色和红色表示9。

研究人员计划在神经网络中形成一种记忆,以便它“记住”训练向量并将其用于解决其他问题。

O目录

Catalog是一家美国创业公司,成立于2016年,致力于开发将数据存储在DNA分子中的技术。 总部位于马萨诸塞州波士顿。



PS:第一个公司IaaS博客的其他一些资料:




我们活动的主要方向是提供云服务:

虚拟基础架构(IaaS) | PCI DSS托管 | 云FZ-152 | 在云端租用1C

Source: https://habr.com/ru/post/zh-CN419219/


All Articles