Im Jahr 2013 schockierte ein junger Spezialist für Computational Biology, Yaniv Erlich, die Forschungsgemeinschaft, indem er
zeigte, wie die Identität von Personen, die in einer anonymen genetischen Datenbank aufgeführt sind, nur über die
Internetverbindung offengelegt werden kann . Die Aufsichtsbehörden haben darauf reagiert, indem sie den Zugang zu anonymen biomedizinischen genetischen Datensätzen eingeschränkt haben. Ein Sprecher der National Institutes of Health
sagte dann: "Die Chancen, dass dies geschieht, sind für die meisten Menschen gering, wenn auch nicht null."
Fünf Jahre später schnell vorwärts, und wir stellen fest, dass die Menge der in digitalen Datenbanken gespeicherten DNA-Informationen explosionsartig zugenommen hat und sich dieses Wachstum nicht verlangsamen wird. Verbraucherunternehmen wie 23andMe und Ancestry haben nach
jüngsten Schätzungen genetische Profile für über 12 Millionen Menschen. Benutzer, die ihre Informationen heruntergeladen haben, können sie optional zu öffentlichen Genealogie-Websites hinzufügen, z. B. GEDmatch, das in diesem Jahr für seine Rolle bei der Weiterleitung der Polizei an einen Verdächtigen im Fall des „Mörders des Goldenen Staates“ berüchtigt wurde.
Diese sich überschneidenden Stammbäume, die Menschen durch DNA-Stücke vereinen, sind so stark gewachsen, dass sie zur Erkennung der Hälfte der US-Bevölkerung verwendet werden können. Laut einer neuen Ehrlich-
Studie, die im Oktober 2018 in Science veröffentlicht wurde, können mehr als 60% der Amerikaner mit europäischen Wurzeln anhand ihrer DNA mithilfe offener Genealogie-Datenbanken identifiziert werden, unabhängig davon, ob sie ihre DNA dorthin geschickt haben.
"Das Ergebnis ist, dass es keine Rolle spielt, ob Sie getestet haben oder nicht", sagt Erlich, Chefforscher bei MyHeritage, dem drittgrößten verbrauchergenetischen Unternehmen nach 23andMe und Ancestry. "Sie können identifiziert werden, da die Datenbanken bereits den größten Teil der USA abdecken, insbesondere europäischer Herkunft."
Um diese Schätzungen abzuleiten, analysierten Erlich und seine Kollegen von der Columbia University und der Hebrew University in Jerusalem die MyHeritage-Datenbank, die 1,28 Millionen anonyme Benutzer, hauptsächlich mit weißer Haut, sowie die überwiegende Mehrheit der genetischen Datenbanken der Welt enthält. In Bezug auf jeden Benutzer als „Ziel“ zählten sie die Anzahl seiner Verwandten mit einem großen Anteil an übereinstimmender DNA und stellten fest, dass 60% der Suchanfragen mindestens seinen zweiten Cousin fanden. Die Ermittler, um nach dem "Mörder des Goldenen Staates" zu suchen und weitere 17 Fälle zu lösen, benötigten nur das Maß an Verwandtschaft, das in den Strafverfolgungsbehörden als "Suche nach entfernten Verwandten" bekannt ist. Um ihre Ergebnisse zu bestätigen, hat das Ehrlich-Team 30 genetische Profile auf GEDmatch hochgeladen und ähnliche Ergebnisse gefunden - 76% der Suchanfragen wurden von Verwandten nicht weiter als von zweiten Cousins gesendet.
Die Analyse ergab eine Liste von ungefähr 850 Personen, abhängig von der Fruchtbarkeit der Vorfahren des Objekts. Von diesem Ausgangspunkt aus können Sie grundlegende demografische Informationen schnell reduzieren. Öffentliche Archive, aus denen der Wohnort einer Person mit einer Genauigkeit von 160 km hervorgeht, reduzieren die Auswahl der Kandidaten um die Hälfte. Fünfjährige schließen 9 von 10 Personen aus. Geschlechtsspezifischer Sex reduziert die Liste auf ungefähr 16 Personen. Das genaue Geburtsjahr kann Ihnen einen oder zwei Kandidaten hinterlassen.
Um die Einfachheit des Prozesses zu demonstrieren, wählten die Forscher eine anonyme Frau aus dem 1000 Genomes Project - einem offenen Genomcode-Projekt - aus, die mit einem Mann verheiratet war, den Erlich zuvor in seiner populären Arbeit von 2013 identifiziert hatte. Sie formatierten die Daten auf ihrer DNA neu, sodass sie den Daten eines typischen Kunden eines Onlinedienstes ähnelten, und luden sie auf GEDmatch hoch. Der Dienst fand zwei Verwandte, einen in North Dakota und einen in Wyoming. Zufällig folgte ihre entfernte Verwandtschaft innerhalb von 4-6 Generationen. Nach einer Stunde Durchsuchen der öffentlichen Archive entdeckte das Team ihren Mann und ihre Frau. Auf dieser Grundlage verfolgten die Forscher die Genealogie von Hunderten von Nachkommen und berechneten die Identität ihres Ziels. Es dauerte alles einen Tag.
Erlich glaubt, dass der Tag nicht mehr fern ist, an dem eine solche Suche bei einer Person durchgeführt werden kann, die ihre DNA irgendwo zurückgelassen hat. Die Studie ergab, dass, wenn eine genetische Datenbank ungefähr 2% der erwachsenen Bevölkerung einer ethnischen Bevölkerung abdeckt, für fast jede Person eine Übereinstimmung gefunden werden kann, die nicht weiter als die der zweiten Cousine ist. Die Stichprobenbasis ist reicher an Menschen, deren Vorfahren Amerikaner oder Europäer waren, und für sie kann dieser Meilenstein innerhalb weniger Jahre erreicht werden, wenn das Interesse an unterhaltsamen DNA-Kontrollen auf dem gleichen Niveau gehalten wird. Nach der jüngsten US-Volkszählung werden zwei Prozent der Bevölkerung nur vier Millionen Menschen sein.
Eine solche Ressource wird die Anzahl und Vielfalt der Verdächtigen erheblich erhöhen, deren Daten den Strafverfolgungsbehörden während der Ermittlungen zur Verfügung stehen werden. Datenbanken von Gesetzesbrechern, in denen die Polizei die DNA von fast 17 Millionen Menschen speichert, sind verurteilte Kriminelle, und in einigen Staaten enthalten nur Personen, die verhaftet wurden, hauptsächlich Daten über Schwarze und Latinos. Seit den Anfängen der DNA-Tests bildeten die technologischen Inkompatibilitäten verschiedener Methoden eine Mauer zwischen den Datenbanken von Kriminellen und den Datenbanken von Personen, die DNA für Unterhaltungs- oder Forschungszwecke spenden. Strafverfolgungsbehörden sammeln und analysieren hochvariable nichtkodierende Teile des Genoms und zählen die Anzahl der Wiederholungen von "Müll" -Teilen der DNA. Dies ist in der Tat einfach eine Folge von Zahlen und sagt nichts über die Persönlichkeit einer Person aus. Es ist jedoch für jede Person einzigartig, so etwas wie ein Barcode oder ein Fingerabdruck. Auch diese Methode ist schnell und billig - ideal für polizeiliche Zwecke.
Medizinische und Freizeit-DNA-Aufzeichnungen umfassen eine vollständige Dekodierung oder Anordnung von Genotypen - eine Reihe von Änderungen, die an einer Stelle eines Gens auftreten. Dies ist ein
Einzelnukleotid-Polymorphismus (SNP), und er ist verantwortlich für grüne Augen oder lockiges Haar oder eine Veranlagung für Herzerkrankungen. Es ist auch viel nützlicher, um Verwandte zu finden. Da diese beiden Arten von Datenbanken nicht miteinander verwandt sind, mussten wir im Fall des „Golden State Killer“ DNA aus alten Proben extrahieren, ein SNP-Profil erstellen und auf GEDmatch hochladen. Aber jetzt ist auch das nicht mehr nötig.
Eine andere im Oktober im Cell Magazine veröffentlichte Arbeit zeigte erstmals, wie man anhand von Daten aus kriminellen Datenbanken nach entfernten Verwandten sucht. Die Noah Rosenberg-Gruppe von der Stanford University
hat bereits gezeigt, dass es möglich ist, Datensätze in diesen beiden Datenbanken zuzuordnen, indem die nächsten SNPs mit nicht codierenden Wiederholungen verglichen werden. Die Arbeit wurde letztes Jahr veröffentlicht und erregte nicht viel Aufmerksamkeit. "Stille", sagt Rosenberg. Doch seine letzte Arbeit, die sich mit der Kreuzkompatibilität zweier Datenbanken befasst, gewinnt im Lichte des „Golden State Killer“ bereits eine neue Bedeutung.
„Diese Methode kann die Reichweite der forensischen Genetik erweitern und möglicherweise dazu beitragen, noch ältere Fälle zu lösen“, sagt Rosenberg. "Gleichzeitig wird er die Daten der Teilnehmer dieser Datenbanken bei Recherchen im Zusammenhang mit der Ermittlung von Straftaten offenlegen, die sie wahrscheinlich nicht erwartet hatten."
Rechtsexperten halten es für ein größeres Problem, dass Rosenbergs Arbeit impliziert, dass das in Polizeidatenbanken gespeicherte DNA-Profil mehr Informationen enthält als bisher angenommen. Es kann verwendet werden, um die kodierenden Regionen des Genoms genau vorherzusagen - diejenigen, die mit grünen Augen, lockigem Haar und Herzproblemen verbunden sind. "Alle Entscheidungen des Obersten Gerichtshofs, dass bestehende kriminelle Datenbanken nicht gegen die
vierte Änderung verstoßen, basieren auf der Annahme, dass aus dieser Junk-DNA nichts extrahiert werden kann", sagt Andrea Roth, Direktorin des Zentrums für Recht und Technologie der University of California in Berkeley. "Und jetzt geht alles zu Staub."
Rosenberg hat keine Software mit der Arbeit veröffentlicht, daher wird es einige Zeit dauern, um echte Berechnungen durchzuführen. Er sagt jedoch, dass jeder, der Zugriff auf mehrere Datenbanken hat, über alle erforderlichen Informationen verfügt, um diese Technologie nutzen zu können. So kann der eingebaute Datenschutz sehr schnell besprühen. Die Arbeit soll den Regulierungsbehörden die Möglichkeiten moderner Technologie aufzeigen, und Rosenberg hofft, dass sie eine längst überfällige Diskussion über die Speicherung und Verwendung genetischer Informationen einleiten wird.
Ehrlich et al. Gingen noch weiter, um Empfehlungen zu den Änderungen abzugeben, die für Ressourcen wie GEDmatch erforderlich sind, die einen wichtigen Service für Menschen bieten, die nach vermissten Verwandten suchen, und für Pflegekinder, die nach leiblichen Eltern suchen, um online zu bleiben und sicher zu sein. Sie forderten das US-Gesundheitsministerium auf, den Umfang der Gesundheitsinformationen in Bezug auf personenbezogene Daten zu überprüfen und anonymisierte Genome einzubeziehen. Sie beschrieben eine Verschlüsselungsstrategie, die eine Verantwortungskette für die Aufbewahrung von Informationen schaffen könnte, sodass Datenbanken Benutzer markieren könnten, die versuchen, die genetischen Daten anderer Personen zu analysieren. Aber selbst wenn Sie absolut alle Unternehmen in dieses System einbeziehen, die Dienstleistungen im Zusammenhang mit Genomen anbieten, reicht dies möglicherweise nicht aus.
"Ich denke, das Fazit ist, dass jetzt alle Menschen auch unter der Haube der genetischen Überwachung stehen werden, wenn wir die Fähigkeit der Regierung, genetische Suchen durchzuführen, nicht regulieren", sagt Roth. Er schlägt ein System vor, das der kalifornischen Regelung für traditionellere kriminelle Durchsuchungen von Verwandten ähnelt. Sie können nur zur Untersuchung von Gewaltverbrechen verwendet werden - Morde, Gewalt - und der Umfang der Suche ist begrenzt, um keine Informationen über Hunderte unschuldiger Menschen einzubeziehen. Es gibt Aufsichtskommissionen, die die unbeabsichtigte Offenlegung sensibler Informationen verhindern können, wenn beispielsweise der Vater einer Person kein leiblicher Vater ist. "Das ist alles Ironie", sagt Roth. "Wenn sich Ihr Verwandter in der CODIS-Datenbank befindet, haben Sie weitaus mehr Rechte auf genetische Privatsphäre als wenn Sie einen Verwandten in GEDMatch haben." Bei genügend DNA spielt es jedoch keine Rolle, ob Sie gefunden werden möchten oder nicht. Fehler werden nicht mehr akzeptiert.