Massenprodukt: Das erste kommerzielle DNA-Repository, das 2019 vorgestellt wurde

Starten Sie den Startkatalog für Servicepläne. Das Unternehmen entwickelt eine spezielle Einrichtung , mit der Sie täglich ein Terabyte an Daten in 500 Billionen DNA-Molekülen aufzeichnen können.

Als nächstes sprechen wir über den Ansatz von Catalog und andere aktuelle Entwicklungen auf dem Gebiet der DNA.


/ Foto Universität von Michigan CC

Projektdetails


Der klassische Ansatz zum Schreiben von Daten in DNA besteht darin, eine Folge von Bits - Nullen und Einsen - in eine Folge von vier grundlegenden DNA-Basen umzuwandeln. Beispielsweise können die stickstoffhaltigen Basen Adenin (A), Thymin (T), Guanin (G) und Cytosin (C) wie folgt dargestellt werden: A = 00, T = 01, G = 10, C = 11.

Mit diesem Ansatz konnte Microsoft 2016 200 MB Text und Video in synthetischen DNA-Molekülen „verewigen“ (wie wir bereits in einem der Beiträge beschrieben haben ). Dieses Verfahren ist jedoch nicht für die Aufzeichnung von Massendaten geeignet, obwohl es teuer ist.

Anstatt Millionen von DNA-Strängen zu verwenden, schlagen Katalogforscher vor, eine große Anzahl verschiedener DNA-Moleküle zu erzeugen, die aus nicht mehr als 30 Basenpaaren bestehen. Aufgrund enzymatischer Reaktionen bilden diese vorbereiteten „Stücke“ spezielle Muster, die Informationen codieren. Anstatt eine einzelne Stickstoffbase darzustellen, sind die Bits daher in mehrdimensionalen Matrizen angeordnet. Und Gruppen von Molekülen spiegeln die Position von Bits in diesen Matrizen wider.

Devin Leake, Direktor für Katalogforschung, zitiert die folgende Analogie: „Stellen Sie sich vor, Sie haben ein Buch. Sie können es manuell kopieren: Buchstabe für Buchstabe. Ebenso können Sie Daten Molekül für Molekül in DNA schreiben. Dieser Ansatz wurde von Microsoft verwendet. Wir schlagen vor, eine Art "Druckmaschine" zu schaffen, in der die DNA-Moleküle ein Headset sein werden . Wenn wir also vorgenerierte Moleküle neu anordnen, arbeiten wir sofort mit ganzen Wörtern und ordnen sie in der richtigen Reihenfolge an. “

Mit dieser Methode haben Katalogforscher erfolgreich Daten in DNA aufgezeichnet und abgerufen. Dazu verwendeten sie das Gedicht The Road Not Taken (in einer der Übersetzungen - „Another Road“) von Robert Frost. Jetzt löst das Unternehmen das Problem der Skalierung der Plattform auf die Bedürfnisse von IT-Unternehmen und Regierungsorganisationen.

Laut Hyunjun Park, einem der Gründer des Katalogs, wird dieser Ansatz Terabyte-DNA-Speicher bis Anfang 2019 kommerziell nutzbar machen. Die genauen Kosten des Datenspeicherdienstes, den das Startup anbieten wird, sind jedoch noch nicht bekannt.

Ähnliche Entwicklungen


Wie bereits erwähnt, werden die Probleme beim Erstellen von DNA-Repositorys von Microsoft behandelt. Und seit 2016 haben Forscher des Unternehmens ihre Entwicklung vorangetrieben : Im Februar 2018 haben sie eine „ Primer- Bibliothek“ für die Organisation des zufälligen Zugriffs auf DNA erstellt. Jeder der Primer ist an eine bestimmte Kette „gebunden“. Daher können Sie mithilfe der Polymerasekettenreaktion einen beliebigen Primer auswählen (und Zugriff auf die aufgezeichneten Daten erhalten).


/ Foto Col Ford und Natasha de Vere CC

Das Unternehmen hofft, dass dieser Ansatz in Verbindung mit einem neuen Algorithmus zum Schreiben und Lesen von Daten, der weniger fehleranfällig ist, in Zukunft dazu beitragen wird, DNA-Speicher mit mehreren Terabyte zu erstellen. Der IT-Riese plant, DNA-Speicher als Service bereitzustellen. Das Unternehmen wollte die Idee bis 2020 umsetzen.

Win-Win-DNA und KI


Es gibt keine besonderen Schwierigkeiten bei der Aufzeichnung von Informationen auf einem DNA-Träger: Unternehmen haben Automatisierungsmethoden entwickelt. Das Lesen von Informationen ist jedoch immer noch kompliziert und zeitaufwändig. Um dieses Problem zu lösen, plant Lifebit die Verwendung von KI-Systemen. Lifebit entwickelt die Deploit-Cloud-Plattform basierend auf MO-Algorithmen, die das Lesen von Informationen von DNA-Trägern automatisieren wird.

Somit wird maschinelles Lernen zur Organisation von DNA-Repositories beitragen. Das Gegenteil ist jedoch auch der Fall - DNA-Moleküle werden verwendet, um künstliche Intelligenzsysteme zu erzeugen. In diesem Bereich arbeiten beispielsweise Forscher von Caltech.

Das Funktionsprinzip ihres neuronalen Netzwerks basiert auf chemischen Reaktionen, die als Fadenverschiebung bezeichnet werden (ein bei einigen Viren bekannter DNA-Replikationsmechanismus), wenn ein als eingehender Faden bezeichneter Faden einen der Stränge der ursprünglichen DNA verdrängt. Dem intelligenten System wurde bereits beigebracht, handgeschriebene Zahlen zu erkennen.

Die Figur ist auf einer quadratischen Ebene gezeichnet, die in hundert identische Zellen (10 x 10) - Originalpixel - unterteilt ist. Jede dieser Zellen wird durch ein DNA-Molekül dargestellt, das „weiß“, ob sich auf diesem Pixel ein Stück einer Ziffer befindet. Nachdem alle Moleküle in einem Reagenzglas gemischt wurden, gibt das DNA-Netzwerk seine Antwort unter Verwendung von Fluoreszenzsignalen. Die Röhre beginnt zu leuchten, deren Farbe von der erkannten Ziffer abhängt. Zum Beispiel bedeuten Grün und Gelb fünf und Grün und Rot neun.

Die Forscher planen, eine Art Gedächtnis im neuronalen Netzwerk zu bilden, damit es sich an die Trainingsvektoren „erinnert“ und sie zur Lösung anderer Probleme verwendet.

O Katalog

Catalog ist ein amerikanisches Startup, das 2016 gegründet wurde und Technologien zur Speicherung von Daten in DNA-Molekülen entwickelt. Hauptsitz in Boston, Massachusetts.



PS Ein paar zusätzliche Materialien aus dem First Corporate IaaS Blog:




Die Hauptrichtung unserer Aktivitäten ist die Bereitstellung von Cloud-Diensten:

Virtuelle Infrastruktur (IaaS) | PCI DSS Hosting | Wolke FZ-152 | Mieten Sie 1C in der Cloud

Source: https://habr.com/ru/post/de419219/


All Articles