Pada 2013, seorang spesialis muda dalam biologi komputasi, Yaniv Erlich, mengejutkan komunitas riset dengan
menunjukkan bagaimana cara mengungkapkan identitas orang yang terdaftar dalam database genetik anonim hanya dengan menggunakan
koneksi Internet . Regulator merespons dengan membatasi akses ke set data genetika biomedis anonim. Seorang juru bicara National Institutes of Health kemudian
berkata : "Peluang terjadinya hal ini kecil bagi kebanyakan orang, meskipun tidak nol."
Maju cepat lima tahun kemudian, dan kami menemukan bahwa jumlah informasi DNA yang disimpan dalam basis data digital telah meningkat secara eksplosif, dan pertumbuhan ini tidak akan melambat. Perusahaan konsumen seperti 23andMe dan Ancestry memiliki profil genetik untuk lebih dari 12 juta orang, menurut
perkiraan terbaru . Pengguna yang telah mengunduh informasi mereka secara opsional dapat menambahkannya ke situs silsilah publik, misalnya, GEDmatch, yang tahun ini menjadi terkenal karena perannya dalam mengarahkan polisi ke tersangka dalam kasus "Pembunuh Negara Bagian Emas".
Pohon keluarga yang berpotongan ini, menyatukan orang melalui potongan-potongan DNA, telah tumbuh sangat banyak sehingga dapat digunakan untuk mendeteksi setengah dari populasi AS. Menurut sebuah
studi Ehrlich baru yang diterbitkan dalam Science pada Oktober 2018, lebih dari 60% orang Amerika dengan akar Eropa dapat diidentifikasi oleh DNA mereka menggunakan database genealogi terbuka, terlepas dari apakah mereka mengirim DNA mereka di sana.
"Hasilnya adalah tidak masalah apakah Anda telah menguji atau tidak," kata Erlich, kepala peneliti di MyHeritage, perusahaan genetik konsumen terbesar ketiga, setelah 23andMe dan Ancestry. "Anda dapat diidentifikasi karena database sudah mencakup sebagian besar Amerika Serikat, terutama keturunan Eropa."
Untuk mendapatkan perkiraan ini, Erlich dan rekan-rekannya di Universitas Columbia dan Universitas Ibrani di Yerusalem menganalisis database MyHeritage, yang berisi 1,28 juta pengguna anonim, kebanyakan dengan kulit putih, serta sebagian besar basis data genetik dunia. Mengenai setiap pengguna sebagai "target," mereka menghitung jumlah kerabatnya dengan bagian besar DNA yang cocok, dan menemukan bahwa 60% dari permintaan pencarian menemukan setidaknya sepupu keduanya. Penyelidik untuk mencari "pembunuh Negara Emas" dan menyelesaikan 17 kasus lainnya hanya membutuhkan tingkat kekerabatan yang dikenal dalam penegakan hukum sebagai "pencarian kerabat jauh." Untuk mengkonfirmasi temuan mereka, tim Ehrlich mengunggah 30 profil genetik ke GEDmatch dan menemukan hasil serupa - 76% pencarian dikirim oleh kerabat tidak lebih dari sepupu kedua.
Analisis menghasilkan daftar sekitar 850 orang, tergantung pada kesuburan leluhur objek. Dari titik awal ini, Anda dapat dengan cepat mengurangi informasi demografis dasar. Arsip umum, tempat tempat tinggal seseorang mengikuti dengan akurasi 160 km, membagi dua pemilihan kandidat. Anak berusia lima tahun mengecualikan 9 dari 10 orang. Jenis kelamin berbasis gender memangkas daftar menjadi sekitar 16 orang. Tahun kelahiran yang tepat dapat meninggalkan Anda satu atau dua kandidat.
Untuk menunjukkan kemudahan proses, para peneliti memilih seorang wanita anonim dari Proyek 1000 Genome - proyek kode genomik terbuka - yang menikah dengan seorang pria yang sebelumnya diidentifikasi oleh Erlich dalam karyanya yang populer di 2013. Mereka memformat ulang data pada DNA-nya sehingga mereka menyerupai data klien tipikal dari layanan online dan mengunggahnya ke GEDmatch. Layanan itu menemukan dua kerabat, satu di North Dakota dan satu di Wyoming. Dari kebetulan kekerabatan mereka yang jauh diikuti, dalam 4-6 generasi. Setelah satu jam menyisir arsip publik, tim menemukan suami dan istri mereka. Berdasarkan ini, para peneliti melacak silsilah ratusan keturunan dan menghitung identitas tujuan mereka. Itu semua butuh satu hari.
Erlich percaya bahwa harinya tidak jauh ketika pencarian seperti itu dapat dilakukan pada setiap orang yang telah meninggalkan DNA-nya di suatu tempat. Studi ini menemukan bahwa ketika database genetik mencakup sekitar 2% dari populasi orang dewasa dari setiap populasi etnis, kecocokan tidak lebih dari sepupu kedua dapat ditemukan untuk hampir semua orang. Basis sampel lebih kaya pada orang-orang yang leluhurnya adalah orang Amerika atau Eropa, dan bagi mereka tonggak sejarah ini dapat dicapai dalam beberapa tahun jika minat untuk menghibur pemeriksaan DNA dipertahankan pada tingkat yang sama. Dilihat oleh sensus AS terbaru, dua persen dari populasi hanya akan menjadi empat juta orang.
Sumber daya semacam itu akan secara serius meningkatkan jumlah dan variasi tersangka, yang datanya akan tersedia untuk penegakan hukum selama investigasi. Basis data para pelanggar hukum di mana polisi menyimpan DNA dari hampir 17 juta orang dijatuhi hukuman penjahat, dan di beberapa negara bagian, hanya orang-orang yang telah ditangkap, sebagian besar berisi data tentang orang kulit hitam dan Latin. Dari hari-hari awal pengujian DNA, ketidakcocokan teknologi dari berbagai metode menciptakan tembok antara basis data penjahat dan basis data orang yang menyumbangkan DNA untuk hiburan atau tujuan penelitian. Penegak hukum mengumpulkan dan menganalisis bagian-bagian non-coding genom yang sangat variabel, menghitung jumlah pengulangan bagian "sampah" dari DNA. Ini, sebenarnya, hanyalah urutan angka, dan tidak mengatakan apa-apa tentang kepribadian seseorang. Namun, ini unik untuk setiap orang, seperti barcode atau sidik jari. Juga, metode ini cepat dan murah - ideal untuk keperluan polisi.
Rekaman DNA medis dan rekreasional mencakup dekode atau array genotipe lengkap - seperangkat perubahan yang terjadi di satu tempat gen. Ini adalah
polimorfisme nukleotida tunggal (SNP), dan dialah yang bertanggung jawab untuk memiliki mata hijau atau rambut keriting, atau kecenderungan penyakit jantung. Ini juga jauh lebih berguna untuk menemukan kerabat. Karena kedua jenis basis data ini tidak saling terkait, dalam kasus "Pembunuh Negara Bagian Emas", kami harus mengekstraksi DNA dari sampel lama, membuat profil SNP, dan mengunggahnya ke GEDmatch. Tetapi sekarang bahkan ini tidak lagi diperlukan.
Karya lain yang diterbitkan pada bulan Oktober di majalah Cell pertama kali menunjukkan cara mencari kerabat jauh berdasarkan data dari basis data kriminal. Grup Noah Rosenberg dari Universitas Stanford
telah menunjukkan bahwa dimungkinkan untuk mengaitkan catatan dalam dua basis data ini dengan membandingkan SNP terdekat dengan pengulangan tanpa kode. Karya ini diterbitkan tahun lalu, dan tidak banyak menarik perhatian. "Diam," kata Rosenberg. Tetapi pekerjaan terakhirnya, mempelajari kompatibilitas silang dari dua basis data, sudah mendapatkan makna baru dalam terang kasus "Pembunuh Negara Bagian Emas".
"Metode ini dapat memperluas jangkauan genetika forensik, dan berpotensi membantu menyelesaikan kasus yang lebih lama," kata Rosenberg. "Pada saat yang sama, dia akan mengungkapkan data peserta dalam database ini selama pencarian terkait dengan investigasi kejahatan, yang mungkin tidak mereka duga."
Pakar hukum menganggapnya sebagai masalah yang lebih besar yang menurut penelitian Rosenberg menunjukkan bahwa profil DNA yang disimpan dalam basis data kepolisian mengandung lebih banyak informasi daripada yang diperkirakan sebelumnya. Ini dapat digunakan untuk memprediksi daerah pengkodean genom secara akurat - yang terkait dengan mata hijau, rambut keriting, dan masalah jantung. "Semua keputusan Mahkamah Agung bahwa basis data kriminal yang ada tidak melanggar
Amandemen Keempat didasarkan pada asumsi bahwa tidak ada yang dapat diekstraksi dari DNA sampah ini," kata Andrea Roth, direktur Pusat Hukum dan Teknologi, Universitas California, Berkeley. "Dan sekarang semuanya menjadi debu."
Rosenberg tidak merilis perangkat lunak apa pun dengan pekerjaan itu, sehingga akan membutuhkan waktu untuk melakukan perhitungan nyata. Tetapi dia mengatakan bahwa siapa pun yang memiliki akses ke beberapa database memiliki semua informasi yang diperlukan untuk mulai menggunakan teknologi ini. Jadi, perlindungan privasi bawaan dapat memerciki dengan cukup cepat. Karya ini dimaksudkan sebagai peringatan untuk menunjukkan kepada regulator kemampuan teknologi modern, dan Rosenberg berharap bahwa ia akan meluncurkan diskusi yang telah lama tertunda tentang penyimpanan dan penggunaan informasi genetik.
Ehrlich dkk. Lebih jauh dalam membuat rekomendasi tentang perubahan yang diperlukan untuk sumber daya seperti GEDmatch, yang menyediakan layanan penting bagi orang yang mencari kerabat yang hilang, dan untuk anak-anak asuh yang mencari orang tua kandung, untuk tetap online dan aman. Mereka meminta Departemen Kesehatan dan Layanan Kemanusiaan A.S. untuk meninjau ruang lingkup informasi kesehatan yang terkait dengan data pribadi dan memasukkan genom yang dianonimkan. Mereka menggambarkan strategi enkripsi yang dapat menciptakan rantai tanggung jawab untuk pelestarian informasi sehingga database dapat menandai pengguna yang mencoba menganalisis data genetik orang lain. Tetapi bahkan jika Anda masuk ke sistem ini sepenuhnya semua perusahaan yang menyediakan layanan yang terkait dengan genom, ini mungkin tidak cukup.
βSaya pikir intinya adalah bahwa sekarang semua orang juga akan berada di bawah pengawasan genetik jika kita tidak mengatur kemampuan pemerintah untuk melakukan pencarian genetik,β kata Roth. Dia mengusulkan sistem yang mirip dengan peraturan California tentang pencarian kriminal yang lebih tradisional untuk kerabat. Mereka hanya dapat digunakan untuk menyelidiki kejahatan dengan kekerasan - pembunuhan, kekerasan - dan ruang lingkup pencarian terbatas sehingga tidak melibatkan informasi tentang ratusan orang tak bersalah di dalamnya. Ada komisi pengawasan yang dapat mencegah pengungkapan informasi sensitif secara tidak sengaja jika, katakanlah, ayah seseorang bukan ayah biologis. "Ini semua ironi," kata Roth. "Jika kerabat Anda ada di basis data CODIS [basis data kriminal], Anda memiliki hak yang jauh lebih besar terhadap privasi genetik daripada jika Anda memiliki kerabat di GEDMatch." Tetapi dengan DNA Anda yang cukup, tidak masalah apakah Anda ingin ditemukan atau tidak. Kegagalan tidak lagi diterima.