Merkmalsauswahlalgorithmus für den DNA-Test

In der wissenschaftlichen Forschung ist wie in jeder anderen Form einer sinnvollen menschlichen Beschäftigung ein Aktionsplan wichtig. Es gibt Leute, die sich mit reiner Wissenschaft beschäftigen, aber das ist eine ganz andere Geschichte. Wenn es um die Anwendung geht, dh um die Anwendung der wissenschaftlichen Methode im Alltag, ist eine klare Abfolge von Maßnahmen erforderlich, nach denen der Förderer arbeiten wird. Genotek befasst sich mit angewandter Genforschung, analysiert und interpretiert in DNA aufgezeichnete Daten. Unsere Forschungsabteilung hat einen Artikel darüber veröffentlicht, wie man die richtigen Gene auswählt und warum man den Ergebnissen der Analyse dieser Gene vertrauen kann. Hier ist eine Zusammenfassung der Veröffentlichung.

Bild

Manchmal passieren in unserem Leben unerwartete Dinge (und sogar Probleme), aber wenn wir verantwortungsbewusst handeln, können wir zugeben, dass ein wesentlicher Teil des Geschehens eine Folge unserer eigenen Handlungen ist und keine Kette zufälliger Ereignisse. Im Allgemeinen geht es um Selbstvertrauen. Sie können sich überhaupt keine Sorgen machen, nicht zweifeln, nicht über diese Dinge nachdenken und etwas Schönes tun. Andererseits eröffnet die Möglichkeit, eigene Anweisungen für einen effizienten Betrieb zu finden, neue Möglichkeiten. Alles ist sehr einfach: Es gibt mehrere Dinge, die eine Person sicher wissen möchte.

  • Erstens: für welche Krankheiten er am meisten prädisponiert ist. Altersbedingte Krankheiten sind eine Folge des Lebensstils und nicht die Absicht eines anderen.
  • Zweitens: die Gesundheit der Kinder. Auch hier ist es sinnvoll, darüber zu sprechen, wenn es sich um eine verantwortliche Person handelt, die ihre Familie bewusst plant und nicht an Empfängnisverhütung spart und die Konsequenzen ignoriert.
  • Drittens: Was tun, um besser zu leben? Der menschliche Körper ist ein Mechanismus. Und obwohl die Prinzipien der Arbeit für alle gleich sind, können sie von Körper zu Körper leicht variieren. Was zu einer Person passt, kann für eine andere Person schädlich sein.
  • Viertens: Was "ich" ist. In Bezug auf die Funktionsweise hilft es nicht, länger oder besser zu leben, wenn man die Herkunft kennt. Sie fühlen sich vielmehr wie eine Figur in der Geschichte der Menschheit, wie ein Held, der unabhängig von den kurzfristigen Interessen oder persönlichen Überzeugungen eines Menschen handelt und sich entwickelt.

All dies kann aus der DNA gelernt werden, indem bestimmte Abschnitte von Genen gelesen werden. Ein Gen ist ein separates semantisches DNA-Fragment, das im einfachsten Fall ein einzelnes Zeichen codiert. Unter dem Wort „Phänotyp“ ist übrigens die Gesamtheit aller Anzeichen des beobachteten Zustands zu verstehen (z. B. Augenfarbe, Form des Lappens, Neigung zu Diabetes, Verdaulichkeit von Laktose). Und dann stellt sich die gleiche Frage wie in den Schuljahren: Was genau gelesen werden muss, ist es möglich, nicht alles zu lesen und wie man mit dem Gelesenen umgeht.

Um aus der prognostischen DNA-Testtechnologie einen medizinischen Massendienst zu machen, müssen Sie einige subtile Punkte in der Datenanalyse berücksichtigen. Erstens ist dies ein Personalisierungsproblem: Token müssen sorgfältig ausgewählt werden. Die meisten Studien zur Feststellung der Assoziation "Genotyp - Phänotyp" werden an großen Proben durchgeführt. Stichproben (analysierte Personengruppen) sind in der Regel nicht sehr heterogen : Sie können umfangreich sein, bestehen jedoch aus Vertretern einer ethnischen Gruppe. Dies vereinfacht einerseits die statistische Analyse im Rahmen der Studie und wirft andererseits die Frage nach der Relevanz des Vereins für andere Personengruppen auf.

Das zweite Problem ist die Anzahl der Marker - dies ist der Fall, wenn Sie einen Mittelweg finden müssen. Und hier kann man nicht auf das ewige Gleichgewicht zwischen zwei Testparametern verzichten: Sensitivität und Spezifität. Eine Erhöhung der Anzahl genetischer Marker erhöht zweifellos die Empfindlichkeit der Analyse gegenüber bestimmten Krankheiten. Gleichzeitig kann die Spezifität des Tests sinken. Da es sich beispielsweise um die Identifizierung einer Veranlagung für schwerwiegende Krankheiten handelt, ist ein falsch positiver Fehler bei der Identifizierung einer schrecklichen Diagnose gefährlicher als die Klärung der Wahrscheinlichkeit, eine Krankheit zu entwickeln. Darüber hinaus führt eine Erhöhung der Anzahl der Marker zu einer Erhöhung der Kosten des Testsystems, was auch den Eintritt in den Massenmarkt erschwert.

Eine universelle Lösung für diese Probleme gibt es nicht. In der Anfangsphase der Arbeit ist der Forscher mit einer Situation konfrontiert, in der "es viele Artikel gibt und alle gelesen werden müssen". Aus diesem Grund hat die wissenschaftliche Abteilung von Genotek einen Auswahlalgorithmus vorgeschlagen, der die Auswahl von Polymorphismen für die Charakteranalyse erheblich vereinfacht. Es ist wichtig, dass wir über Polymorphismen und nicht über Gene als Ganzes sprechen: Zwei Männer auf jedem der X-Chromosomen haben das gleiche Androgenrezeptor-Gen, aber der erste Mann hat Adenine (AA) am rs6152-Locus und der zweite hat Guanine (GG). Die Wahrscheinlichkeit, dass der letzte Haarschopf im Alter von 40 Jahren gleich großartig bleibt, liegt bei etwa 30% . Um dies zu verstehen, müssen Sie in diesem Fall nicht die gesamte Gensequenz lesen. Suchen und lesen Sie nur einen Punkt auf der DNA und vergleichen Sie ihn mit dem gegenüberliegenden.

Worauf zu achten ist


Die Genetik nennt die charakteristischen Merkmale, die wir von unseren Vorfahren übernehmen, phänotypische Merkmale. Das grundlegende Problem der Biologie als Ganzes ist die Beziehung zwischen Genotyp und Phänotyp sowie die Art und Weise, wie einer den anderen codiert. In unserem Fall gibt es zwei Ansichten zur Heritabilität phänotypischer Merkmale. Einerseits kann die Art der Vererbung variieren. Ein einzelnes Merkmal darf also überhaupt nicht vererbt werden, und seine Manifestation wird in keiner Weise mit dem genetischen Beitrag verbunden sein. Solche Anzeichen, die unter dem Einfluss des Lebensstils oder der Umweltbedingungen auftreten, sind für Entwickler von DNA-Tests nicht von Interesse.

Wenn andererseits ein Merkmal vererbt wird, ist es wichtig zu verstehen, welche Art von genetischer Interaktion dem beobachteten Zustand zugrunde liegt. Im einfachsten Fall kann nur ein Gen die Entwicklung der Krankheit beeinflussen - dann sprechen wir über monogene Vererbung. Beispielsweise ist Phenylketonurie eine Stoffwechselerkrankung, die sich im Zusammenhang mit einem „Abbau“ in einem Gen entwickelt. In diesem Fall kann man nicht von einer Veranlagung sprechen: Wenn eine Person bereits zwei Kopien eines gebrochenen Gens hat, entwickelt sie immer noch eine Krankheit. In einer solchen Situation kann die genetische Diagnose jedoch die Diagnose klären, um eine angemessenere Behandlung auszuwählen.

Es ist schwieriger, wenn mehrere Gene zum phänotypischen Merkmal beitragen. Es ist wichtig zu verstehen, wie genau die Bildung des Merkmals erfolgt, ob es polygen oder multifaktoriell ist. Ein polygenes Merkmal entwickelt sich als Ergebnis mehrerer Polymorphismen - es gibt auch keine Wahrscheinlichkeit für die Entwicklung des Merkmals. Mit einer bestimmten Kombination von Polymorphismen kann eine bestimmte Augenfarbe einer Person zuverlässig erhalten werden. Das Problem der Vorhersage der Augenfarbe (und anderer externer Merkmale) liegt nun in der Forensik. Es wird sowohl mit Hilfe mathematischer Modelle als auch durch Training neuronaler Netze in großen Datenmengen gelöst. Der multifaktorielle Phänotyp entwickelt sich neben der genetischen Basis unter dem Einfluss bestimmter Umweltbedingungen. Es sind solche Anzeichen, die für die medizinische Prognoseanalyse von größtem Interesse sind, da dies Zustände sind, die mit Hilfe eines bestimmten Lebensstils korrigiert werden können.

Der Algorithmus selbst sieht folgendermaßen aus:


Bild

Der erste Schritt besteht darin, das Vorhandensein einer genomweiten Assoziationsstudie (GWAS) zu überprüfen. Dieser Bereich der Genforschung begann mit der Entwicklung der Mikrochip-Technologie aktiv genutzt zu werden. Der Zweck der Studie ist es, Unterschiede zwischen den Genomen von Menschen mit und ohne ein bestimmtes Merkmal zu finden. GWAS-Studien zeichnen sich durch große Stichproben aus. Zum Beispiel nahmen ungefähr 300.000 Menschen an GIANT ( Genomuntersuchung antropometrischer Merkmale - eine genomische Studie anthropometrischer Merkmale) teil. Die Studie bestätigte den schwerwiegenden Einfluss des genetischen Faktors auf die Entwicklung von Fettleibigkeit. Die Wahrscheinlichkeit, das Assoziations- "Genotypzeichen" bei Patienten und gesunden Probanden zu beobachten, sofern der Assoziationshypothese falsch ist, ist der p-Wert des Experiments. Wenn dieser Wert der GWAS-Studie weniger als 0,01 beträgt (angepasst an die Multiplizität), fällt der Polymorphismus in die kurze Liste der Krankheitsmarker. Wenn es in den Bereich von 0,01 bis 0,05 fällt, ist die Einhaltung eines der Kriterien von funktionaler Bedeutung erforderlich.

Es gibt nur ein Kriterium: Ein direkter oder indirekter Mechanismus des Einflusses des Polymorphismus auf ein Merkmal ist bekannt. Wenn der Stoffwechselweg einer bestimmten Substanz bekannt ist (dh die Kette der Umwandlung von Substanz A in Substanz X), kann die Kenntnis, welche Enzyme an dieser Kette beteiligt sind, auf die Relevanz dieses Polymorphismus hinweisen. Zum Beispiel kennen wir ein Enzym, das Folsäure aktiviert, um die Umwandlung von Homocystein zu Methionin zu katalysieren. Methionin ist eine essentielle Aminosäure, und durch die Anreicherung von Homocystein kann das Endothel der Blutgefäße geschädigt werden. Das heißt, wir können von einer Substitution am Ort, der das aktive Zentrum des Enzyms codiert, als Grund für die Abnahme des Homocystein-Metabolismus sprechen. Darüber hinaus garantiert das Vorhandensein eines einzigen Polymorphismus dieser Art nicht die Entwicklung der Krankheit.

Wenn der p-Wert der Assoziation gemäß den GWAS-Ergebnissen größer als 0,05 ist, ist eine Metaanalyse erforderlich. Eine Metaanalyse ist eine Studie, in der die Identifizierung eines Zusammenhangs durch Zusammenfassung der Ergebnisse vieler Studien durchgeführt wurde. Wird in der Metaanalyse der Zusammenhang „Genotyp - Phänotyp“ gezeigt, wird der Polymorphismus berücksichtigt. Liegen keine Metaanalysedaten vor, wird der Polymorphismus erneut anhand des Kriteriums der funktionalen Signifikanz getestet.

Da der Hauptteil der Arbeit das Studium von Veröffentlichungen ist, gibt es strenge Kriterien für die Auswahl wissenschaftlicher Artikel, um Assoziationen zu finden. Für GWAS-Studien dieser Kriterien 3:

  1. Stichprobengröße - mindestens 750 Patienten in der ersten Studie;
  2. P-Wert <0,01;
  3. Assoziationen müssen in mindestens einer Studie bestätigt werden (nicht erforderlich für seltene Krankheiten), und der Einflussfaktor der Veröffentlichung muss mindestens 2 betragen.

Für Veröffentlichungen zur Identifizierung der Einhaltung des Kriteriums der funktionalen Signifikanz lauten die Kriterien wie folgt:

  1. Daten sollten bei der Untersuchung von Geweben (intravitaler Biopsie, Autopsiematerial, postoperatives Material) oder biologischen Flüssigkeiten der Teilnehmer erhalten werden;
  2. Assoziationen sollten experimentell in der fraglichen wissenschaftlichen Veröffentlichung erhalten werden;
  3. P-Wert <0,05;
  4. Die Stichprobengröße der Teilnehmer sollte groß genug sein, um Assoziationen genetischer Marker mit bestimmten Auftrittshäufigkeiten erkennen zu können.
  5. Wenn es mehrere Veröffentlichungen gibt, die den Zusammenhang dieses genetischen Markers mit dem Risiko der Entwicklung der Krankheit untersucht haben, wählen Sie zur Analyse Folgendes aus: a) eine spätere (z. B. aus zwei Artikeln in den Jahren 2009 und 2015 - ein Artikel für 2015); b) eine Veröffentlichung, in der die Studie an einer größeren Anzahl von Proben durchgeführt wurde.

Die Ergebnisse der Metaanalyse, falls vorhanden, haben Priorität. Die Anforderungen an die Metaanalyse sind ebenfalls sehr hoch: In der Publikation selbst müssen Quellen sorgfältig ausgewählt werden, unter denen die Assoziation von Polymorphismus mit einem Zeichen sowohl bestätigt als auch widerlegt wird. Die für die Suche verwendeten Informationsquellen und Schlüsselwörter sowie die Begründung der Kriterien für das Einschließen und Ausschließen von Veröffentlichungen (Stichprobengröße, Artikel nur in englischer Sprache, demografische Merkmale der Teilnehmer usw.) sollten angegeben werden. Besonderes Augenmerk wird auf die sogenannte Bias-Analyse einzelner Publikationen anhand eines trichterförmigen Graphen oder einer Sensitivitätsanalyse gelegt. Wenn ein Marker in die Analyse einbezogen wird, konzentrieren wir uns darauf, welche Populationen an der Studie teilgenommen haben.

Trotz der Tatsache, dass die Technologie selbst schon lange auf dem Markt ist, handelt es sich nicht um eine Art „Routinepraxis“, nach der Tonnen von Handbüchern geschrieben werden. Die DNA-Testpipeline funktioniert, und dies ist einer ihrer Abschnitte. Wir werden Ihnen nach und nach jedes seiner Fragmente vorstellen.

Source: https://habr.com/ru/post/de401619/


All Articles