Sistem operasi dan video disimpan dalam DNA, dan kemudian dibaca tanpa kesalahan

gambar

Segera, manusia akan menghasilkan begitu banyak data sehingga repositori yang sudah dikenalnya akan berhenti mengatasinya. Untuk mengatasi masalah ini, para ilmuwan beralih ke gudang informasi alami yang hampir tak terbatas - DNA. Menurut para peneliti, DNA adalah media penyimpanan yang ideal, karena ultra-kompak dan dapat mempertahankan sifatnya selama ratusan ribu tahun, jika kondisi penyimpanan yang sesuai disediakan. Ini dibuktikan dengan restorasi DNA baru-baru ini dari tulang leluhur manusia berusia 43 ribu tahun yang ditemukan di gua-gua Spanyol.

Dalam sebuah studi baru, para ilmuwan dari Columbia University dan New York Genome Center ( NYGC ) menunjukkan bahwa suatu algoritma yang dirancang untuk melakukan streaming video pada smartphone hampir dapat sepenuhnya membuka kunci potensi DNA untuk menyimpan dan mengompresi informasi tambahan dalam empat basis nukleotida.


Gagasan dan pertimbangan umum tentang kemungkinan merekam, menyimpan, dan mencari informasi dalam molekul DNA adalah milik Mikhail Neumann , seorang ahli fisika Soviet. Pada tahun 1964, jurnal Radiotechnika menerbitkan materi yang menggambarkan teknologi dari proses ini dan perangkat penyimpanan data, Neumann oligonucleotides (MNeimON).

Pada 2012, ahli genetika dari Universitas Harvard berhasil menyandikan buku konsep 53,4 ribu kata, 11 gambar, dan satu program. Mereka menemukan bahwa 5,5 petabyte data dapat disimpan dalam setiap milimeter kubik DNA. Setahun kemudian, para peneliti di European Institute of Bioinformatics berhasil menyelamatkan, dan kemudian sepenuhnya mengekstraksi dan memutar, sekitar 0,6 megabita file teks dan video: 154 soneta Shakespeare, fragmen 26 detik dari pembicaraan terkenal Martin Luther King, karya ilmiah tentang struktur DNA James Watson dan Francis Crick, foto-foto kantor pusat EBI di Hinkston dan file yang menggambarkan teknik konversi data. Semua file DNA direproduksi dengan akurasi berkisar antara 99,99% dan 100%.

Yaniv Erlich dan koleganya Dina Zielinski, peneliti NYGC, memilih enam file untuk pengodean dan penulisan ke DNA - sistem operasi komputer KolibriOS, 1896 film Prancis "Train Tiba Tiba di Stasiun La Ciotat", kode 50 Kartu hadiah $ -dollard Amazon, virus komputer, gambar dari catatan Pioneer, dan penelitian Claude Shannon pada 1948 tentang teori informasi.

Para ilmuwan mengumpulkan file-file ini menjadi satu, dan kemudian membagi data menjadi baris pendek kode biner. Dengan menggunakan kode air mancur , mereka secara acak mengemas garis-garis ke dalam "tetes" air mancur - blok dan mengubah kombinasi 00, 01, 10, 11 menjadi empat basis nukleotida: adenin (A), sitosin (C), guanin (G) dan timin (T) ) Untuk kemudian merakit blok-blok ini bersama-sama, tim ilmuwan menambahkan label untuk setiap "drop".

Secara total, para peneliti menghasilkan sekitar 72 ribu untai DNA ini, yang masing-masing berisi sekitar 200 basa. Mereka mengumpulkan informasi ini dalam file teks dan mengirimkannya ke San Francisco, tempat startup sintesis DNA Twist Bioscience mengubah data digital menjadi data biologis. Dua minggu kemudian, tim Ehrlich menerima tabung reaksi dengan molekul DNA.

Menggunakan teknologi pengurutan untuk membaca untai DNA dan perangkat lunak khusus untuk menerjemahkan kode genetik kembali ke file biner, mereka berhasil memulihkan file. Berapa lama waktu membaca dan menulis, para ilmuwan belum menentukan.

Sebuah tim peneliti yang dipimpin oleh Erlich juga menunjukkan bahwa algoritma-nya, dengan mengalikan sampel DNA menggunakan reaksi berantai polimerase, dapat menghasilkan dan secara akurat mengembalikan jumlah salinan sampel yang hampir tak terbatas, dan bahkan salinan salinannya.


Erlich meluncurkan sistem operasi di mesin virtual dan memainkan Minesweeper

Namun, kemampuan algoritma yang paling mengesankan ternyata adalah kemampuan untuk menempatkan 215 petabyte data dalam satu gram DNA - 100 kali lebih banyak daripada yang dicapai dengan menggunakan metode dan algoritma lain.

Kapasitas penyimpanan data DNA secara teoritis terbatas pada dua digit untuk setiap nukleotida, serta perangkat DNA biologis. Selain itu, untuk mengumpulkan dan membaca fragmen yang direkam, perlu untuk memasukkan informasi tambahan, yang selanjutnya mengurangi kapasitas menjadi 1,8 karakter biner dalam nukleotida. Algoritma DNA Fountain memungkinkan Anda untuk menempatkan rata-rata 1,6 bit di setiap nukleotida - ini adalah 60% lebih dari sebelumnya, dan juga mendekati batas 1,8 bit.

Kendala utama penyebaran diseminasi teknologi adalah biayanya. Para peneliti menghabiskan 7 ribu dolar untuk mensintesis DNA dan mengarsipkan 2 megabita data, dan 2 ribu lainnya untuk mendekripsi. Dan meskipun biaya sekuensing DNA secara bertahap menurun, sintesisnya masih memakan biaya bulat. Investor tidak siap untuk menginvestasikan banyak uang hanya untuk membuat penurunan harga sintesis.

Ehrlich dan timnya mengusulkan cara lain untuk memecahkan masalah: menurunkan harga sintesis DNA adalah mungkin jika molekul berkualitas lebih rendah diproduksi, dan kemudian menggunakan strategi pengkodean β€œair mancur DNA” untuk memperbaiki kesalahan molekuler.

Karya ilmiah diterbitkan dalam jurnal Science pada 3 Maret 2017
DOI: 10.1126 / science.aaj2038

Source: https://habr.com/ru/post/id402079/


All Articles