
La posibilidad de un enorme almacenamiento de datos basado en ADN se ha vuelto bastante real gracias al nuevo método de extracción de datos.
Microsoft ya ve el ADN sintético como un medio de almacenamiento prometedor que puede satisfacer las necesidades de almacenamiento de grandes datos. Estudios anteriores han demostrado que solo unos pocos gramos de ADN pueden almacenar exabytes de datos, con una vida útil de aproximadamente 2000 años.
Pero la principal desventaja de esta tecnología es el alto costo y la lentitud del registro, que incluye la conversión de ceros y unos a nucleótidos. Extraer datos del ADN implica secuenciar y traducir archivos de nuevo a ceros y unos. Encontrar y extraer archivos específicos también es un gran problema.
Pero esto es cosa del pasado: los científicos de Microsoft Research y la Universidad de Washington por primera vez obtuvieron acceso aleatorio a un portador de ADN a gran escala. Como explicaron, la falta de acceso aleatorio o la capacidad de extraer selectivamente archivos del almacenamiento de ADN conduce al hecho de que para encontrar los archivos necesarios, el usuario debe secuenciar y decodificar todo el conjunto de datos. Obtener acceso aleatorio reducirá el número de operaciones de secuenciación.
Para obtener acceso aleatorio al ADN, los científicos han creado una biblioteca de cebadores que están unidos a cada secuencia de la molécula y se utilizan como objetivos para seleccionar sus fragmentos deseados.
Los investigadores también han desarrollado un algoritmo para una decodificación y recuperación de datos más eficientes. El investigador principal de Microsoft, Sergey Yekhanin, señaló que los nuevos algoritmos son más tolerantes a los errores al escribir y leer secuencias de ADN, lo que reduce la secuencia y el procesamiento de los datos necesarios para su recuperación.
El ADN sintético codificó 200 megabytes de datos, que consisten en 35 archivos que varían en tamaño desde 29 kilobytes hasta 44 megabytes. Estos archivos contienen video HD, archivos de audio, imágenes y textos. Los científicos creen que el método que utilizaron para el acceso aleatorio se escalará a grupos de ADN físicamente aislados que pueden acomodar varios terabytes.