Produk Massal: repositori DNA komersial pertama yang diluncurkan pada 2019

Peluncuran paket layanan startup Katalog. Perusahaan sedang mengembangkan fasilitas khusus yang akan memungkinkan Anda untuk merekam satu terabyte data dalam 500 triliun molekul DNA setiap hari.

Selanjutnya, kita berbicara tentang pendekatan yang digunakan oleh Katalog, dan perkembangan terbaru lainnya di bidang DNA.


/ foto University of Michigan CC

Detail proyek


Pendekatan klasik untuk menulis data ke DNA melibatkan pengubahan urutan bit - nol dan satu - menjadi urutan empat basis DNA dasar. Misalnya, basa nitrogen adenin (A), timin (T), guanin (G) dan sitosin (C) dapat direpresentasikan sebagai berikut: A = 00, T = 01, G = 10, C = 11.

Dengan menggunakan pendekatan ini, pada tahun 2016 Microsoft mampu "melanggengkan" 200 MB teks dan video dalam molekul DNA sintetis (seperti yang telah kami tulis di salah satu posting ). Namun, metode ini tidak cocok untuk perekaman data massal, sementara mahal.

Alih-alih menggunakan jutaan untai DNA, peneliti Katalog menyarankan untuk menghasilkan sejumlah besar molekul DNA yang berbeda, yang terdiri dari tidak lebih dari 30 pasangan basa. Kemudian, karena reaksi enzimatik, "potongan" yang telah disiapkan ini membentuk pola khusus yang menyandikan informasi. Jadi, alih-alih mewakili basis nitrogen tunggal, bit disusun dalam matriks multidimensi. Dan kelompok molekul mencerminkan posisi bit dalam matriks ini.

Devin Leake, Direktur Riset Katalog, mengutip analogi berikut: “Bayangkan Anda punya buku. Anda dapat menyalinnya secara manual: huruf demi huruf. Demikian pula, Anda dapat menulis data dalam DNA - molekul demi molekul. Pendekatan ini digunakan oleh Microsoft. Kami mengusulkan untuk membuat semacam "mesin cetak", di mana molekul DNA akan menjadi headset . Dengan demikian, mengatur ulang molekul yang dihasilkan sebelumnya, kami segera bekerja dengan seluruh kata, mengaturnya dalam urutan yang tepat. ”

Dengan menggunakan metode ini, peneliti Katalog berhasil mencatat dan mengambil data dalam DNA. Untuk melakukan ini, mereka menggunakan puisi The Road Not Taken (dalam salah satu terjemahan - “Another Road”) oleh Robert Frost. Sekarang perusahaan sedang memecahkan masalah penskalaan platform dengan kebutuhan perusahaan IT dan organisasi pemerintah.

Menurut Hyunjun Park, salah satu pendiri Katalog, pendekatan ini akan membuat penyimpanan DNA terabyte menjadi layak secara komersial pada awal 2019. Namun, biaya pasti dari layanan penyimpanan data yang akan ditawarkan oleh startup masih belum diketahui.

Perkembangan serupa


Seperti yang telah dicatat, masalah membuat repositori DNA ditangani oleh Microsoft. Dan sejak 2016, para peneliti dari perusahaan telah maju dalam pengembangan mereka: pada Februari 2018, mereka menciptakan "perpustakaan primer " untuk mengatur akses acak ke DNA. Masing-masing primer “melekat” pada rantai tertentu, oleh karena itu, menggunakan reaksi berantai polimerase, Anda dapat memilih salah satu dari mereka (dan mendapatkan akses ke data yang direkam).


/ foto Kolonel Ford dan Natasha de Vere CC

Perusahaan berharap bahwa pendekatan ini, ditambah dengan algoritma baru untuk menulis dan membaca data, yang kurang rentan terhadap kesalahan, akan membantu di masa depan untuk membuat penyimpanan DNA dengan volume beberapa terabyte. Raksasa IT itu berencana menyediakan penyimpanan DNA sebagai layanan. Perusahaan ini mulai mengimplementasikan ide tersebut pada tahun 2020.

Menang-menang DNA dan AI


Tidak ada kesulitan khusus dalam mencatat informasi tentang pembawa DNA: perusahaan telah menemukan metode otomatisasi. Tetapi proses membaca informasi masih rumit dan memakan waktu. Untuk mengatasi masalah ini, Lifebit berencana untuk menggunakan sistem AI. Lifebit sedang mengembangkan platform cloud Deploit berdasarkan algoritma MO, yang akan mengotomatiskan proses membaca informasi dari pembawa DNA.

Dengan demikian, pembelajaran mesin akan berkontribusi pada organisasi repositori DNA. Namun, yang sebaliknya juga benar - molekul DNA digunakan untuk membuat sistem kecerdasan buatan. Misalnya, para peneliti dari Caltech bekerja di bidang ini.

Prinsip operasi jaringan saraf mereka didasarkan pada reaksi kimia, yang disebut perpindahan benang (mekanisme replikasi DNA yang dikenal dalam beberapa virus), ketika sebuah thread yang disebut yang masuk menggeser salah satu untai dari DNA asli. Sistem Cerdas telah diajarkan untuk mengenali angka tulisan tangan.

Angka tersebut digambar di bidang persegi, dibagi menjadi seratus sel identik (10x10) - piksel asli. Masing-masing sel ini diwakili oleh molekul DNA yang "tahu" apakah ada selembar digit pada piksel ini. Setelah semua molekul dicampur dalam satu tabung reaksi, jaringan DNA memberikan jawabannya menggunakan sinyal fluoresens. Tabung mulai memancarkan cahaya yang warnanya tergantung pada digit yang dikenali. Misalnya, hijau dan kuning berarti lima, dan hijau dan merah berarti sembilan.

Para peneliti berencana untuk membentuk semacam memori dalam jaringan saraf sehingga "mengingat" vektor pelatihan dan menggunakannya untuk memecahkan masalah lain.

O katalog

Katalog adalah startup Amerika yang didirikan pada 2016, yang mengembangkan teknologi untuk menyimpan data dalam molekul DNA. Berkantor pusat di Boston, Massachusetts.



PS Beberapa bahan tambahan dari Blog IaaS Perusahaan Pertama:




Arah utama aktivitas kami adalah penyediaan layanan cloud:

Infrastruktur Virtual (IaaS) | Hosting PCI DSS | Cloud FZ-152 | Sewa 1C di awan

Source: https://habr.com/ru/post/id419219/


All Articles