
Prospek pergudangan data berbasis DNA yang sangat besar telah menjadi sangat nyata berkat metode ekstraksi data yang baru.
Microsoft sudah melihat DNA sintetis sebagai media penyimpanan yang menjanjikan yang dapat memenuhi kebutuhan untuk menyimpan data besar. Penelitian sebelumnya menunjukkan bahwa hanya beberapa gram DNA yang dapat menyimpan exabytes data, dengan masa simpan sekitar 2000 tahun.
Tetapi kelemahan utama dari teknologi ini adalah biaya tinggi dan lambatnya catatan, yang mencakup konversi nol dan yang menjadi nukleotida. Mengekstraksi data dari DNA melibatkan pengurutan dan penerjemahan file kembali ke nol dan yang. Menemukan dan mengekstraksi file tertentu juga merupakan masalah besar.
Tapi ini adalah masa lalu - para ilmuwan dari Microsoft Research dan University of Washington untuk pertama kalinya mendapat akses acak ke pembawa DNA dalam skala besar. Ketika mereka menjelaskan, kurangnya akses acak atau kemampuan untuk secara selektif mengekstrak file dari penyimpanan DNA mengarah pada fakta bahwa untuk menemukan file yang diperlukan, pengguna harus mengurutkan dan mendekode seluruh set data. Mendapatkan akses acak akan mengurangi jumlah operasi sequencing.
Untuk mendapatkan akses acak ke DNA, para ilmuwan telah membuat perpustakaan primer yang melekat pada setiap urutan molekul dan digunakan sebagai target untuk memilih fragmen yang diinginkan.
Para peneliti juga telah mengembangkan algoritma untuk decoding dan pemulihan data yang lebih efisien. Peneliti Senior Microsoft, Sergey Yekhanin mencatat bahwa algoritma baru lebih toleran terhadap kesalahan dalam menulis dan membaca urutan DNA, yang mengurangi urutan dan pemrosesan data yang diperlukan untuk pemulihan mereka.
DNA sintetik menyandikan 200 megabita data, terdiri dari 35 file mulai dari ukuran 29 kilobyte hingga 44 megabita. File-file ini berisi video HD, file audio, gambar, dan teks. Para ilmuwan percaya bahwa metode yang mereka gunakan untuk akses acak akan berskala ke kolam DNA yang terisolasi secara fisik yang dapat menampung beberapa terabyte.