Neue Errungenschaften von Wissenschaftlern von Microsoft werden es ermöglichen, Exabyte-Festplatten zu erstellen



Die Aussicht auf ein enormes DNA-basiertes Data Warehousing ist dank der neuen Datenextraktionsmethode durchaus real geworden.

Microsoft sieht synthetische DNA bereits als vielversprechendes Speichermedium, das die Anforderungen für die Speicherung von Big Data erfüllen kann. Frühere Studien haben gezeigt, dass nur wenige Gramm DNA Exabyte an Daten speichern können, mit einer Haltbarkeit von etwa 2000 Jahren.

Der Hauptnachteil dieser Technologie sind jedoch die hohen Kosten und die Langsamkeit der Aufzeichnung, einschließlich der Umwandlung von Nullen und Einsen in Nukleotide. Das Extrahieren von Daten aus DNA umfasst das Sequenzieren und Übersetzen von Dateien in Nullen und Einsen. Das Finden und Extrahieren bestimmter Dateien ist ebenfalls ein großes Problem.

Dies gehört jedoch der Vergangenheit an - Wissenschaftler von Microsoft Research und der University of Washington erhielten zum ersten Mal zufälligen Zugriff auf einen DNA-Träger in großem Maßstab. Wie sie erklärt haben, führt der fehlende Direktzugriff oder die Möglichkeit, Dateien selektiv aus dem DNA-Speicher zu extrahieren, dazu, dass der Benutzer den gesamten Datensatz sequenzieren und decodieren muss, um die erforderlichen Dateien zu finden. Durch den wahlfreien Zugriff wird die Anzahl der Sequenzierungsvorgänge verringert.

Um einen zufälligen Zugang zu DNA zu erhalten, haben Wissenschaftler eine Bibliothek von Primern erstellt, die an jede Sequenz des Moleküls gebunden sind und als Ziele für die Auswahl der gewünschten Fragmente verwendet werden.

Die Forscher haben auch einen Algorithmus für eine effizientere Dekodierung und Datenwiederherstellung entwickelt. Sergey Yekhanin, Senior Researcher bei Microsoft, stellte fest, dass neue Algorithmen toleranter gegenüber Fehlern beim Schreiben und Lesen von DNA-Sequenzen sind, was die für ihre Wiederherstellung erforderliche Sequenzierung und Verarbeitung von Daten verringert.

Synthetische DNA codierte 200 Megabyte Daten, bestehend aus 35 Dateien mit einer Größe von 29 Kilobyte bis 44 Megabyte. Diese Dateien enthalten HD-Video, Audiodateien, Bilder und Texte. Wissenschaftler glauben, dass die Methode, die sie für den Direktzugriff verwendeten, auf physikalisch isolierte DNA-Pools skaliert werden kann, die mehrere Terabyte aufnehmen können.

Source: https://habr.com/ru/post/de410549/


All Articles