El sistema operativo y el video se guardaron en ADN y luego se leyeron sin errores

imagen

Pronto, la humanidad generará tantos datos que los depósitos familiares dejarán de funcionar. Para resolver este problema, los científicos recurrieron a un depósito de información natural casi ilimitado: el ADN. Según los investigadores, el ADN es un medio de almacenamiento ideal, porque es ultracompacto y puede conservar sus propiedades durante cientos de miles de años, si se proporcionan las condiciones de almacenamiento adecuadas. Esto se evidencia por la reciente restauración del ADN de los huesos de un ancestro humano de 43 mil años encontrado en cuevas de España.

En un nuevo estudio, los científicos de la Universidad de Columbia y el Centro del Genoma de Nueva York ( NYGC ) demostraron que un algoritmo diseñado para transmitir video en un teléfono inteligente puede desbloquear casi por completo el potencial del ADN para almacenar y comprimir información adicional en cuatro bases de nucleótidos.


La idea y las consideraciones generales sobre las posibilidades de registrar, almacenar y buscar información en las moléculas de ADN pertenecen a Mikhail Neumann , un físico soviético. En 1964, la revista Radiotechnika publicó material que describe la tecnología de este proceso y el dispositivo de almacenamiento de datos, los oligonucleótidos de Neumann (MNeimON).

En 2012, los genetistas de la Universidad de Harvard lograron codificar un borrador del libro de 53.4 mil palabras, 11 imágenes y un programa. Descubrieron que se pueden almacenar 5,5 petabytes de datos en cada milímetro cúbico de ADN. Un año después, los investigadores del Instituto Europeo de Bioinformática lograron guardar, y luego extraer y reproducir por completo, alrededor de 0.6 megabytes de archivos de texto y video: 154 soneto de Shakespeare, un fragmento de 26 segundos de la famosa charla de Martin Luther King, trabajo científico sobre la estructura ADN de James Watson y Francis Crick, fotografías de la sede de EBI en Hinkston y un archivo que describe las técnicas de conversión de datos. Todos los archivos de ADN fueron reproducidos con una precisión que oscila entre 99.99% y 100%.

Yaniv Erlich y su colega Dina Zielinski, investigadora de NYGC, seleccionaron seis archivos para codificar y escribir en el ADN: sistema operativo informático KolibriOS, película francesa 1896 "Llegada de un tren a la estación de La Ciotat", código 50 La tarjeta de regalo de Amazon $ -dollard, un virus informático, imágenes de los registros de Pioneer y la investigación de Claude Shannon de 1948 sobre teoría de la información.

Los científicos reunieron estos archivos en uno y luego dividieron los datos en líneas cortas de código binario. Usando códigos de fuente , empacaron aleatoriamente las líneas en las "gotas" de los bloques de fuente y convirtieron las combinaciones 00, 01, 10, 11 en cuatro bases de nucleótidos: adenina (A), citosina (C), guanina (G) y timina (T ) Para luego ensamblar estos bloques, un equipo de científicos agregó etiquetas para cada "gota".

En total, los investigadores generaron alrededor de 72 mil de estas cadenas de ADN, cada una de las cuales contenía aproximadamente 200 bases. Recopilaron esta información en un archivo de texto y la enviaron a San Francisco, donde la startup de síntesis de ADN Twist Bioscience convirtió los datos digitales en datos biológicos. Dos semanas después, el equipo de Ehrlich recibió un tubo de ensayo con moléculas de ADN.

Utilizando la tecnología de secuenciación para leer cadenas de ADN y un software especial para traducir el código genético a un archivo binario, restauraron con éxito los archivos. Los científicos aún no han especificado cuánto tiempo lleva leer y escribir.

Un equipo de investigadores dirigido por Erlich también demostró que su algoritmo, al multiplicar una muestra de ADN usando una reacción en cadena de la polimerasa, puede generar y restaurar con precisión un número casi ilimitado de copias de una muestra, e incluso copias de sus copias.


Erlich lanza el sistema operativo en una máquina virtual y juega al Buscaminas

Sin embargo, la capacidad más impresionante del algoritmo resultó ser la capacidad de colocar 215 petabytes de datos en un gramo de ADN, 100 veces más de lo que se logró usando otros métodos y algoritmos.

La capacidad de almacenamiento de datos de ADN está teóricamente limitada a dos dígitos para cada nucleótido, así como a un dispositivo de ADN biológico. Además, para recopilar y leer los fragmentos grabados, es necesario incluir información adicional, que posteriormente reduce la capacidad a 1,8 caracteres binarios en el nucleótido. El algoritmo de la Fuente de ADN le permite colocar un promedio de 1.6 bits en cada nucleótido; esto es un 60% más de lo posible anteriormente, y también cerca del límite de 1.8 bits.

El principal obstáculo para la difusión generalizada de la tecnología sigue siendo su costo. Los investigadores gastaron 7 mil dólares para sintetizar ADN y archivar 2 megabytes de datos, y otros 2 mil para descifrarlo. Y aunque el costo de la secuenciación del ADN está disminuyendo gradualmente, su síntesis sigue costando una suma redonda. Los inversores no están listos para invertir toneladas de dinero solo para hacer que la síntesis baje de precio.

Erlich y su equipo proponen otra forma de resolver el problema: es posible reducir el precio de la síntesis de ADN si se producen moléculas de menor calidad, y luego usar una estrategia de codificación como la "fuente de ADN" para corregir los errores moleculares.

Trabajo científico publicado en la revista Science el 3 de marzo de 2017
DOI: 10.1126 / science.aaj2038

Source: https://habr.com/ru/post/es402079/


All Articles