Bonjour Le premier entrepôt de données automatique au monde sur les molécules d'ADN



Des chercheurs de Microsoft et de l'Université de Washington ont présenté le premier système d'ADN en lecture seule entièrement automatisé dans l'ADN créé artificiellement. Il s'agit d'une étape clé vers le transfert de nouvelles technologies des laboratoires de recherche vers les centres de données commerciaux.


Les développeurs ont confirmé le concept par un test simple: ils ont réussi à encoder le mot «bonjour» dans des fragments d'une molécule d'ADN synthétique et l'ont reconverti en données numériques à l'aide d'un système de bout en bout entièrement automatisé, qui est décrit dans un article publié le 21 mars dans Nature Scientific Reports.


Cet article est sur notre site.

Dans les molécules d'ADN, vous pouvez stocker des informations numériques avec une densité très élevée, c'est-à-dire dans l'espace physique, qui est beaucoup plus petit que les centres de données modernes. C'est l'une des solutions prometteuses pour stocker une énorme quantité de données que le monde génère chaque jour, des enregistrements commerciaux et des vidéos avec des animaux mignons aux images médicales et aux images de l'espace.


Microsoft explore des moyens de combler l'écart potentiel entre la quantité de données que nous produisons et que nous voulons stocker et notre capacité à les stocker. Parmi ces méthodes figure le développement d'algorithmes et de technologies de calcul moléculaire pour le codage des données dans l'ADN artificiel . Cela permettrait à toutes les informations stockées dans un grand centre de données moderne de tenir dans un espace approximativement égal à la taille de plusieurs dés.


«Notre objectif principal est de mettre en service un système qui, pour l'utilisateur final, ressemblera presque à tout autre système de stockage en nuage: les informations sont envoyées au centre de données et y sont stockées, puis apparaissent simplement lorsque le client en a besoin», explique le responsable. Chercheur Microsoft Karin Strauss. «Pour cela, nous devions prouver que cela avait un sens pratique du point de vue de l'automatisation.»


Les informations sont stockées dans des molécules d'ADN synthétique créées en laboratoire, et non dans l'ADN des humains ou d'autres êtres vivants, et peuvent être cryptées avant d'être envoyées au système. Bien que des machines complexes, telles que les synthétiseurs et les séquenceurs, effectuent déjà des parties clés du processus, de nombreuses étapes intermédiaires nécessitent encore un travail manuel dans le laboratoire de recherche. "Cela ne convient pas à un usage commercial", a déclaré Chris Takahashi, chercheur principal à la Paul Allen School of Computer Science & Engineering de la US University of Computer Science and Technology.


"Les personnes avec des compte-gouttes ne peuvent pas courir autour du centre de données, avec cette approche, la probabilité d'erreur humaine est trop élevée, elle est trop chère et nécessite trop d'espace", a expliqué Takahashi.




Pour que cette méthode de stockage de données ait un sens d'un point de vue commercial, il est nécessaire de réduire les coûts de la synthèse de l'ADN - la création de blocs de construction fondamentaux avec des séquences significatives et le processus de séquençage, qui est nécessaire pour lire les informations stockées. Les chercheurs disent qu'il y a un développement rapide dans cette direction.


Selon des chercheurs de Microsoft, l'automatisation est un autre élément clé de ce puzzle, vous permettant d'organiser le stockage de données à l'échelle commerciale et de le rendre plus accessible.


Dans certaines conditions, l'ADN peut durer beaucoup plus longtemps que les outils de stockage d'archives modernes qui ont été détruits pendant des décennies. Certains ADN ont réussi à survivre dans des conditions loin d'être idéales pendant des dizaines de milliers d'années - dans les défenses de mammouths et dans les os des premiers humains. Ainsi, les données peuvent être stockées de cette manière, tant que l'humanité existe.


Le système de stockage d'ADN automatisé utilise un logiciel développé par Microsoft et l'Université de Washington (UW). Il convertit les unités et les zéros des données numériques en séquences nucléotidiques (A, T, C et G), qui sont les «éléments constitutifs» de l'ADN. Ensuite, le système utilise un équipement de laboratoire peu coûteux, généralement standard, pour fournir les fluides et réactifs nécessaires au synthétiseur, qui recueille les fragments d'ADN préparés et les place dans un réservoir de stockage.


Lorsque le système a besoin d'extraire des informations, il ajoute d'autres produits chimiques pour préparer correctement l'ADN et utilise des pompes microfluidiques pour pousser les liquides dans les parties du système qui lisent les séquences de molécules d'ADN et les reconvertissent en informations lisibles par ordinateur. Les chercheurs affirment que l'objectif du projet n'était pas de prouver que le système peut fonctionner rapidement ou à moindre coût, mais simplement de montrer que l'automatisation est possible.


L'un des avantages les plus évidents d'un système de stockage d'ADN automatisé est qu'il libère les scientifiques pour résoudre des problèmes complexes, éliminant ainsi la nécessité de perdre du temps à chercher des flacons de réactifs ou à ajouter de manière monotone des gouttes de liquide aux tubes à essai.


«Le fait d'avoir un système automatisé pour effectuer des travaux répétitifs permet au personnel du laboratoire de faire directement de la recherche, de développer de nouvelles stratégies pour innover plus rapidement», a déclaré le chercheur de Microsoft, Bihlin Nguyen.


L'équipe du Molecular Information Systems Lab (MISL) Molecular Information Systems Lab a déjà démontré qu'elle peut stocker des photos félines, de grandes œuvres littéraires, des vidéos et des archives dans l'ADN et récupérer ces fichiers sans erreur. À ce jour, ils ont pu enregistrer 1 gigaoctet de données dans l'ADN, battant le précédent record mondial de 200 Mo.


Les chercheurs ont également développé des méthodes pour effectuer des calculs significatifs , tels que la recherche et la récupération uniquement des images qui ont une pomme ou un vélo vert, en utilisant les molécules elles-mêmes pour ce faire, sans reconvertir les fichiers au format numérique.


«Il est sûr de dire que nous assistons à la naissance d'un nouveau type de système informatique dans lequel des molécules sont utilisées pour stocker des données, et l'électronique est utilisée pour le contrôle et le traitement. Cette combinaison ouvre des perspectives très intéressantes pour l'avenir », a déclaré Louis Sese, professeur à la Allen School of Washington University.


Contrairement aux systèmes informatiques à base de silicium, les systèmes de stockage et informatiques à base d'ADN doivent utiliser des liquides pour déplacer les molécules. Mais les liquides sont intrinsèquement différents des électrons et nécessitent des solutions techniques complètement nouvelles.


L'équipe de l'Université de Washington, en collaboration avec Microsoft, développe également un système programmable qui automatise les expériences de laboratoire en utilisant les propriétés de l'électricité et de l'eau pour déplacer des gouttelettes sur une grille d'électrodes. La gamme complète de logiciels et de matériel, connue sous le nom de Puddle et PurpleDrop , peut mélanger, séparer, chauffer ou refroidir divers fluides et exécuter des protocoles de laboratoire.


L'objectif est d'automatiser les expériences de laboratoire qui sont actuellement effectuées manuellement ou par des robots coûteux de manipulation des liquides et de réduire les coûts.


Les prochaines étapes pour l'équipe MISL comprennent l'intégration d'un système automatisé de bout en bout simple avec des technologies telles que Purple Drop, ainsi que d'autres technologies qui permettent des recherches dans les molécules d'ADN. Les chercheurs ont spécifiquement rendu leur système automatisé modulaire afin qu'il puisse évoluer en tant que nouvelles technologies pour la synthèse, le séquençage et le travail d'ADN.


"L'un des avantages de ce système est que si nous voulons remplacer l'une des pièces par quelque chose de nouveau, meilleur ou plus rapide, nous pouvons simplement connecter une nouvelle pièce", a déclaré Nguyen. «Cela nous donne une grande flexibilité pour l'avenir.»


Image du haut: des chercheurs de Microsoft et de l'Université de Washington ont enregistré et lu le mot bonjour en utilisant le premier système de stockage de données ADN entièrement automatisé. Il s'agit d'une étape clé dans le transfert de nouvelles technologies des laboratoires vers les centres de données commerciaux.

Source: https://habr.com/ru/post/fr446496/


All Articles