Une nouvelle réalisation de scientifiques de Microsoft permettra de créer des disques exaoctets



La perspective d'un énorme entrepôt de données basé sur l'ADN est devenue bien réelle grâce à la nouvelle méthode d'extraction des données.

Déjà, Microsoft considère l'ADN synthétique comme un support de stockage prometteur qui peut répondre aux besoins de stockage des mégadonnées. Des études antérieures ont montré que seuls quelques grammes d'ADN peuvent stocker des exaoctets de données, avec une durée de conservation d'environ 2000 ans.

Mais le principal inconvénient de cette technologie est le coût élevé et la lenteur de l'enregistrement, qui comprend la conversion des zéros et des uns en nucléotides. L'extraction des données de l'ADN implique le séquençage et la conversion des fichiers en zéros et en uns. Trouver et extraire des fichiers spécifiques est également un gros problème.

Mais cela appartient au passé - les scientifiques de Microsoft Research et de l'Université de Washington ont pour la première fois eu un accès aléatoire à un support d'ADN à grande échelle. Comme ils l'ont expliqué, le manque d'accès aléatoire ou la capacité d'extraire sélectivement des fichiers du stockage d'ADN conduit au fait que pour trouver les fichiers nécessaires, l'utilisateur doit séquencer et décoder l'ensemble des données. Un accès aléatoire réduira le nombre d'opérations de séquençage.

Pour obtenir un accès aléatoire à l'ADN, les scientifiques ont créé une bibliothèque d'amorces qui sont attachées à chaque séquence de la molécule et sont utilisées comme cibles pour sélectionner les fragments souhaités.

Les chercheurs ont également développé un algorithme pour un décodage et une récupération de données plus efficaces. Le chercheur principal de Microsoft, Sergey Yekhanin, a noté que les nouveaux algorithmes sont plus tolérants aux erreurs d'écriture et de lecture des séquences d'ADN, ce qui réduit le séquençage et le traitement des données nécessaires à leur récupération.

L'ADN synthétique a codé 200 mégaoctets de données, soit 35 fichiers dont la taille varie de 29 kilo-octets à 44 mégaoctets. Ces fichiers contiennent des vidéos HD, des fichiers audio, des images et des textes. Les scientifiques pensent que la méthode qu'ils ont utilisée pour l'accès aléatoire s'adaptera à des pools d'ADN physiquement isolés pouvant accueillir plusieurs téraoctets.

Source: https://habr.com/ru/post/fr410549/


All Articles