🍉 👿 👩‍⚖️ 批量产品：首个商业DNA储存库将于2019年发布 👆🏻 🀄️ 🚣

启动服务计划启动目录。该公司正在开发一种特殊的设施，使您每天可以记录500万亿个DNA分子中的TB数据。

接下来，我们讨论Catalog所使用的方法以及DNA领域的其他最新进展。

/图片密西根大学 CC

项目详情

将数据写入DNA的经典方法包括将一系列的位（零和一）转换为四个基本DNA碱基的序列。例如，氮碱基腺嘌呤（A），胸腺嘧啶（T），鸟嘌呤（G）和胞嘧啶（C）可以表示如下：A = 00，T = 01，G = 10，C = 11。

使用这种方法，2016年，Microsoft 能够使合成的DNA分子永久保留200 MB的文本和视频（正如我们在其中一篇文章中已经提到的）。然而，这种方法虽然昂贵，但不适合用于海量数据记录。

Catalog研究人员建议不要使用数百万条DNA链，而是产生大量不同的DNA分子，这些分子不超过30个碱基对。然后，由于酶促反应，这些预先准备的“片段”形成了编码信息的特殊模式。因此，代替表示单个氮碱基，位以多维矩阵布置。分子组反映了这些矩阵中位的位置。

目录研究总监Devin Leake 引用了以下类比：“想象一下，有一本书。您可以手动复制：一个字母一个字母地复制。类似地，您可以逐个分子地将数据写入DNA。 Microsoft使用了这种方法。我们建议创建一种“印刷机”，其中DNA分子将作为头戴式耳机。因此，重新排列预先生成的分子后，我们会立即处理整个单词，并以正确的顺序排列它们。”

使用此方法，目录研究人员成功地记录和检索了DNA中的数据。为此，他们使用了罗伯特·弗罗斯特（Robert Frost）的诗《未走的路》（译为“另一条路”）。现在，该公司正在解决根据IT公司和政府组织的需求扩展平台的问题。

根据《目录》的创始人之一Hyunjun Park所说，这种方法将在2019年初使TB级DNA存储在商业上可行。但是，该初创公司将提供的数据存储服务的确切成本仍然未知。

类似的发展

如前所述，创建DNA存储库的问题由Microsoft处理。自2016年以来，该公司的研究人员在开发方面取得了进步：2018年2月，他们创建了一个“ 引物库”，用于组织对DNA的随机访问。每个引物都“连接”到特定链上，因此，使用聚合酶链反应，您可以选择其中任何一个（并访问记录的数据）。

/照片Col Ford和Natasha de Vere CC

该公司希望这种方法，再加上一种新的写和读数据算法，该算法不易出错，将在将来帮助创建容量为数TB的DNA存储。这家IT巨头计划提供DNA存储即服务。该公司着手在2020年之前实现这一想法。

双赢的DNA和AI

在DNA载体上记录信息并没有特别困难：公司已经提出了自动化方法。但是，读取信息的过程仍然很复杂且耗时。为了解决这个问题，Lifebit 计划使用AI系统。 Lifebit正在开发基于MO算法的Deploit云平台，该平台将自动执行从DNA载体读取信息的过程。

因此，机器学习将有助于DNA存储库的组织。然而，事实恰恰相反-DNA分子用于创建人工智能系统。例如，加州理工学院的研究人员正在这一领域工作。

它们的神经网络的工作原理基于化学反应，即所谓的线程置换（一种在某些病毒中已知的DNA复制机制），当称为传入线程的线程置换原始DNA的一根链时。已经教过智能系统识别手写数字。

该图绘制在一个正方形平面上，分为一百个相同的像元（10x10）-原始像素。这些细胞中的每一个都由一个DNA分子表示，该DNA分子“知道”该像素上是否有一个数字。将所有分子混合在一个试管中后，DNA网络使用荧光信号给出答案。管开始发出辉光，其颜色取决于识别的数字。例如，绿色和黄色表示5，绿色和红色表示9。

研究人员计划在神经网络中形成一种记忆，以便它“记住”训练向量并将其用于解决其他问题。

O目录

Catalog是一家美国创业公司，成立于2016年，致力于开发将数据存储在DNA分子中的技术。总部位于马萨诸塞州波士顿。

PS：第一个公司IaaS博客的其他一些资料：

我们活动的主要方向是提供云服务：

虚拟基础架构（IaaS） | PCI DSS托管 | 云FZ-152 | 在云端租用1C

批量产品：首个商业DNA储存库将于2019年发布

项目详情

类似的发展

双赢的DNA和AI

O目录

More articles: