Atlas hat ein neues Produkt auf den
Markt gebracht - The
Complete Genome . Jetzt können wir nicht nur einzelne Punkte im Genom wie im Gentest untersuchen, sondern auch die gesamte Sequenz der Nukleotide des Genoms ablesen. In diesem Artikel erklären wir, was es ist und warum es benötigt wird.
Achtung! Wir werden das komplette Genom einem unserer Leser geben, der alle Aufgaben erledigen wird. Weitere Details am Ende des Artikels.

Was bedeutet das volle Genom?
Um das gesamte Genom oder die Sequenzierung des gesamten Genoms (WGS) zu behandeln, erklären wir Ihnen zunächst kurz die konventionelle Gentesttechnologie.
Mikrochip- und Routine-Gentest
Der Atlas-Gentest wird wie viele ähnliche Tests mit einem DNA-Microarray (DNA-Microarray, Beadchip) durchgeführt. Die Oberfläche des DNA-Mikrochips enthält viele kleine Vertiefungen (etwa 700.000), von denen jede eine Siliziumkugel mit einem Durchmesser von etwa 3 Mikrometern enthält. Auf der Oberfläche dieses Balls befinden sich Hunderttausende identischer kurzer einzelsträngiger DNA-Sequenzen, die dem Teil des menschlichen Genoms entsprechen, der sich neben der untersuchten Variation befindet (SNP, SNV). Jede Kugel entspricht nur einer genetischen Variation, und die Koordinaten der Löcher auf dem Chip für jede Kugel sind bekannt (Abbildung 2D).
Bildungsblock 1
Snip oder SNV (Single Nucleotide Varition) ist eine genetische Variation, dh eine Änderung der DNA-Sequenz in nur einem Nukleotid. Beispielsweise kann eines der drei Nukleotide (Allele) A, G oder T an einer bestimmten Position im X-Gen vorhanden sein, und die Nukleotide sind im Rest der Sequenz bei verschiedenen Personen identisch (1). Von diesem einen Buchstaben kann ein bestimmtes Merkmal einer Person abhängen.

Abbildung 1 Bild von Rentonorama
Zum Beispiel hat der rs4481887-Polymorphismus, der sich auf dem ersten Chromosom neben dem olfaktorischen Rezeptorgen OR2M7 befindet, drei Allele: A, G und T. Das Vorhandensein des A-Allels auf einem oder beiden Chromosomen (Genotypen A / G, A / T und A / A) bestimmt die Geruchsempfindlichkeit des Urins nach dem Verzehr von Spargel. In Abwesenheit des A-Allels wird eine Person nicht einmal bemerken, dass nach dem Verzehr von Spargel im Urin eine Substanz mit einem charakteristischen Geruch freigesetzt wird.
Indel oder INDEL (Insertion / Deletion) ist eine andere Art genetischer Variation, bei der ein oder mehrere Nukleotide entfernt oder eingefügt werden. Snips und Indels zusammen, zusammen mit möglichen strukturellen Veränderungen: Grosse Deletionen, Insertionen, Translokationen, Inversionen sind der eigentliche Unterschied im Genom verschiedener Menschen.
Beim Bestehen des Atlas-Gentests werden genomische und mitochondriale DNA aus Speichel isoliert, die Anzahl der Kopien erhöht (amplifiziert) und das Fragment in kleine Segmente geschnitten (Abbildung 2A). Zahlreiche einzelsträngige Fragmente menschlicher DNA werden mit ihren entsprechenden Sequenzen auf Siliziumkugeln verbunden (Abbildung 2B), wonach diese Sequenzen um 1 künstliches fluoreszierendes Nukleotid verlängert werden (Abbildung 2C). Verschiedene Nukleotide leuchten in verschiedenen Farben: rot und grün. Anhand des Verhältnisses der Lichtstärken jeder Farbe (Abbildung 2E) kann man den Genotyp bestimmen, der der Kugel entspricht.
Abbildung 2Nach dem Scannen des gesamten Chips erhalten wir ungefähr 700.000 Genotypen von Variationen und leiten sie durch unser Interpretationssystem. Häufig versuchen Benutzer, die Ergebnisse verschiedener Tests zu vergleichen, stellen jedoch einen starken Unterschied fest. Dies geschieht aus mehreren Gründen. Erstens verwenden verschiedene Unternehmen unterschiedliche Chipversionen und SNV-Sets. Infolgedessen gibt es bei einigen Chips eindeutige Variationssätze, die bei anderen Chips nicht zu finden sind. Zweitens gibt es immer einen Genotypisierungsfehler, der aus verschiedenen Gründen auftreten kann, obwohl er den geringsten Beitrag zur Ergebnisdifferenz leistet. Forschungsdaten zeigen, dass die Genauigkeit der Genotypisierung auf DNA-Microarrays, die Atlas verwendet, höher als 99,5% ist. Der Hauptgrund für die unterschiedlichen Ergebnisse von Gentests bei der Interpretation liegt jedoch darin, dass verschiedene Unternehmen auch für dieselben ursprünglichen Genotypisierungsdaten unterschiedliche Werte festlegen.
Was ist Genomsequenzierung?
Der Hauptunterschied zwischen Genomsequenzierung und Genotypisierung auf Microarrays besteht in der Technologie und Verarbeitung der erhaltenen Daten. Bei der genomweiten Sequenzierung wird nahezu die gesamte DNA-Sequenz bestimmt. Fast - weil es Abschnitte im Genom gibt, die aus verschiedenen Gründen nicht gelesen werden können. Oft handelt es sich dabei um Orte von Telomeren und Zentromeren - von Enden und Zentrum von Chromosomen. Um die Sequenzen solcher Regionen des Genoms zu bestimmen, werden unzugängliche hochspezialisierte Technologien eingesetzt. Solche Studien sind hauptsächlich Forschung in der Natur.
Durch die Bestimmung der DNA-Sequenz können Sie die Genotypen von Variationen im gesamten Genom ermitteln, einschließlich der untersuchten Variationen des DNA-Microarrays im Atlas-Gentest. Die NGS-Technologie (Next Generation Sequencing) dient zur schnellen und effizienten Bestimmung der Genomsequenz. Es gibt mehrere grundlegend unterschiedliche Methoden, die von verschiedenen Unternehmen entwickelt wurden.
Das Wesen der Atlas-Methode ist wie folgt: Die extrahierte und gereinigte DNA wird viele Male amplifiziert und auf eine bestimmte Länge fragmentiert. Für jedes Fragment werden spezielle Sequenzen erstellt, mit denen Sie dieses Fragment steuern können. Es sind diese verarbeiteten Fragmente, die gelesen werden (Abbildung 3).
Abbildung 3 Schrittweiser Sequenzierungsprozess: Jedes nachfolgende Nukleotid fluoresziert in seinem einzigartigen Farbkanal.
Bei jedem Schritt tritt eine Verlängerung eines Nukleotids auf, mit dem eine fluoreszierende Sonde assoziiert ist. Jedes der vier Nukleotide ist mit einer Sonde einer bestimmten Farbe verbunden. So kann man Schritt für Schritt anhand der Farbe des Lichts die Reihenfolge der Nukleotide im untersuchten Fragment bestimmen. Die resultierenden Sequenzen jedes Fragments werden als Reads bezeichnet und produzieren etwa 1 Milliarde für jede Probe der untersuchten DNA. Lesevorgänge und Messwerte für die Lesequalität werden im FASTQ-Textformat gespeichert.
Als nächstes werden die Lesevorgänge auf das Referenzgenom ausgerichtet (abgebildet). Mit einer speziellen Software, z. B. dem Burrows-Wheeler Aligner, wird für jeden Lesevorgang eine Stelle im Referenzgenom gesucht, zu der er gehört. Das Lesen zusammen mit Informationen über die Position im Genom wird in einem Dateiformat SAM oder BAM aufgezeichnet. Die Visualisierung der Gene, die in der SAM-Datei (BAM) auf das Genom abgebildet sind, mit dem IGV-Genombrowser ist in Abbildung 4 dargestellt.
Abbildung 4 Visualisierung der BAM-Datei im IGV-Programm (One Person Chromosome Site). Abgebildete Lesevorgänge werden durch horizontale Blöcke angezeigt, die Position wird auf der obigen Spur angezeigt.
Die Abbildung zeigt auch die Abdeckungstiefe, wenn mehrere ausgerichtete Lesevorgänge eine beliebige Position im Referenzgenom abdecken. Der Wert wird über das gesamte Genom gemittelt und dient als Indikator für die Qualität der Studie. Atlas garantiert eine durchschnittliche Genomabdeckung von Tiefen über 30, was eine qualitativ hochwertige Genotypisierung gewährleistet. Das Erhöhen der Lesetiefe erhöht die Kosten für die Sequenzierung und die Genauigkeit der Bestimmung genetischer Variationen erheblich und wird in engen onkologischen Studien verwendet, beispielsweise im Atlas of Oncology Diagnostics.
Bildungsblock 2
Ein Referenzgenom ist eine künstlich zusammengesetzte Sequenz von DNA einer biologischen Spezies. Die meisten Sequenzen, aus denen das Referenz-Humangenom zusammengesetzt wurde, stammten von einer Person afrikanisch-europäischer Herkunft. Das Referenzgenom wird regelmäßig aktualisiert: Die neueste Version, GRCh38, wurde 2013 veröffentlicht und enthält 3,3 Milliarden Nukleotide. Trotz der Verfügbarkeit der neuen Version verwenden viele Gentests und Analysedienste für genetische Daten die vorherige - GRCh37. Atlas verwendet die GRCh38-Version, um die genauesten Analyseergebnisse bereitzustellen.
Dateien, die nach dem Mapping erhalten wurden (SAM-Dateien, Sequenzierungs-Alignment-Map oder binäre BAM-Alignment-Map), werden gefiltert und zur Suche nach Variationen im Genom verwendet, einschließlich einzelner Nukleotidvariationen und kurzer Insertionen und Deletionen. Das Vorhandensein der Einzelnukleotidvariante auf Chromosom 1 an Position 248333561 (das obige Beispiel rs4481887 ist die Variante, die die Empfindlichkeit gegenüber Uringeruch nach dem Verzehr von Spargel bestimmt) ist in 5 gezeigt.
Abbildung 5 Visualisierung einer BAM-Datei in einem IGV-Programm. Darstellung von Chromosom 1. An Position 248333561 befindet sich Polymorphismus rs4481887: Das Nukleotid an dieser Position entspricht nicht dem Referenzgenom und ist hervorgehoben. In allen Reads, die diesen Teil des Genoms abdecken, befindet sich ein Nukleoid G, das die Homozygotie des Genotyps anzeigt. Eine Person mit diesen Sequenzierungsergebnissen hat nach dem Verzehr von Spargel einen G / G-Genotyp und eine Unempfindlichkeit gegenüber dem Geruch von Urin.
Gefundene genetische Variationen werden in einer VCF-Datei gespeichert (Variantenaufrufformat). Es enthält nachgewiesene Allele für jede Position des Genoms sowie Indikatoren für die Qualität der Genotypisierung. Die VCF-Datei wird gefiltert: Aufzeichnungen über das Vorhandensein / Fehlen von Abweichungen, die nicht den Qualitätsschwellenwerten entsprechen und möglicherweise falsch sind, werden daraus gelöscht. Jeder gefundenen Variation werden aus dbSNP bekannte Daten zugeordnet, insbesondere eindeutige Kennungen rsID.
Über die folgenden Links können Sie sich mit den Besonderheiten der Formate zum Speichern von Sequenzierungs- und Genotypisierungsdaten vertraut machen:
FASTQ -
maq.sourceforge.netSAM -
samtools.imtqy.comVCF -
samtools.imtqy.comZur Visualisierung der Zuordnung von Lesevorgängen (SAM- oder BAM-Dateien) wird verschiedene Software verwendet. Am beliebtesten ist IGV (Integrative Genomics Viewer vom Broad Institute). Laden Sie IGV herunter und machen Sie sich unter dem
Link damit vertraut.
Welche Daten interpretiert der Atlas?
Das gesamte Genom enthält Daten zu den im Atlas-Gentest enthaltenen Genvarianten sowie zu Merkmalen, die mit der Genotypisierungstechnologie unter Verwendung von DNA-Microarrays nicht berechnet werden können. Zu diesen Symptomen gehört beispielsweise das Krebsrisiko.
Gesundheit
383 ErbkrankheitenDas Hauptaugenmerk aller Atlas-Tests liegt auf dem Gesundheitsbereich, und unser neuer Vollgenom-Test war keine Ausnahme. Zu den Symptomen unseres Haupttests haben wir weitere 65 Erbkrankheiten hinzugefügt.
Zu den erblichen oder monogenen Krankheiten zählen Krankheiten, die von den Eltern auf die Kinder übertragen werden und deren Entwicklung nicht vom Lebensstil einer Person abhängt. Für die Entstehung einer solchen Krankheit sind Mutationen von einem oder beiden Elternteilen in Abhängigkeit von der Art der Vererbung der Krankheit ausreichend.
21 multifaktorielle krankheitDie Entwicklung multifaktorieller Erkrankungen wird durch Gene, Lebensstil und Umweltfaktoren beeinflusst. Solche Krankheiten umfassen beispielsweise Diabetes mellitus, Fettleibigkeit, Parkinson und Alzheimer, Neurodermitis. In Ihrem persönlichen Konto kann der Benutzer das relative Risiko für die Entwicklung der Krankheit anhand von Testdaten und einem Fragebogen zum Lebensstil berechnen.
6 andere gesundheitsbezogene SymptomeHier haben wir Zeichen gesammelt, die den Lebensstil einer Person beeinflussen. Zum Beispiel Schlafdauer, Chronotyp, chronisches Müdigkeitssyndrom, Angst vor Schmerzen.

Klinische Genetik
43 KrebsrisikenAufgrund der Tatsache, dass mehr Varianten von Genen im gesamten Genom untersucht werden, erhalten wir mehr Daten und können das Risiko einer Krebsentstehung abschätzen. Entsprechend den Testergebnissen beurteilen wir die Veranlagung zu erblichen Krebssyndromen.
Hereditäre onkologische Syndrome sind genetisch bedingte Krankheiten, die von Generation zu Generation in einer Familie übertragen werden können und das Risiko bestimmter Krebsarten erhöhen. Etwa 10% der Fälle von Onkologie sind erblich bedingt.
Die Suche nach erblichen Krebssyndromen ist vor allem für diejenigen nützlich, die Krebs in der Familie hatten. Die erbliche Natur kann durch das frühe Alter des Ausbruchs der Krankheit (bis zu 50 Jahre), das Vorhandensein mehrerer Verwandter in der gleichen Linie mit der gleichen Diagnose, seltene Formen von Krebs angezeigt werden. Auf der Grundlage der Testergebnisse legt der Arzt den Umfang der zusätzlichen Forschung fest und erstellt ein persönliches Krebsrisikomanagementprogramm. Weitere Informationen zur Entstehung bösartiger Tumoren finden Sie in unserer Artikelserie.
53 Anzeichen für eine Empfindlichkeit gegenüber WirkstoffkomponentenJede Person reagiert unterschiedlich auf Drogen: In einigen Fällen wirkt die Droge gut, andere leiden unter schwerwiegenden Nebenwirkungen, und in anderen Fällen ist die Behandlung wirkungslos. In einigen Fällen liegt dies an der Arbeit von Genen, die den Metabolismus von Wirkstoffen und das Risiko von Nebenwirkungen beeinflussen.
Zum Beispiel reduziert das Medikament Omeprazol die Sekretion von Salzsäure im Magen. Verwendet bei der Behandlung von Magengeschwüren und Zwölffingerdarmgeschwüren, Refluxkrankheit. Das CYP2C19-Gen kodiert für ein Enzym, das für den Metabolismus von Omeprazol verantwortlich ist. Daher ist es abhängig von den Varianten des Gens erforderlich, die Dosis von Omeprazol anzupassen oder ein alternatives Medikament zu verwenden.
Im Test untersuchen wir Genvarianten, die mit dem Metabolismus von 53 Medikamenten assoziiert sind. Unter ihnen sind Antidepressiva, hormonelle Verhütungsmittel, ein Medikament zur Verringerung der Blutgerinnung und einige andere.
Fachbericht über ErbkrankheitenDer Bericht ist das Ergebnis des Labors für klinische Bioinformatik Fedor Konovalov. Bioinformatiklabors suchen nach Transport von rezessiven Krankheiten. Eine solche Beförderung beeinträchtigt häufig nicht die Gesundheit eines Menschen, kann jedoch zu Krankheiten bei seinen ungeborenen Kindern führen. Das Labor kann auch eine einzigartige Mutation identifizieren, die zuvor nicht beschrieben wurde, und eine Schlussfolgerung darüber ziehen, ob sie wahrscheinlich pathogen ist.
Experten führen eine gründliche Analyse der relevanten wissenschaftlichen Informationen über Mutationen und Krankheiten in jedem Fall durch. Die Schlussfolgerung enthält alle notwendigen Informationen für den Genetiker. Mit diesem Bericht können Sie sich im Bedarfsfall an einen Spezialisten wenden.
Solche genetischen Berichte ähneln einem Rechtsdokument mit einer Fülle komplexer Begriffe, die nur ein Spezialist richtig beurteilen kann, in unserem Fall ein Genetiker. Daher zeigen wir keine klinische Genetik vor der Konsultation. Während des Treffens teilt Ihnen der Genetiker ausführlich mit, worauf Sie achten sollten, wobei Ihre Familienanamnese und das Vorhandensein von Symptomen zu berücksichtigen sind. Dies kann beispielsweise dazu beitragen, das Alter zu klären, in dem das Screening auf bestimmte Krankheiten beginnt, oder bei der Planung einer Familie.
Ernährung
28 BerichteLaut Gentests und sogar dem gesamten Genom ist es unmöglich, die optimale Ernährung auszuwählen und eine Diät zu machen. Es gibt so viele Produkte, Kochmethoden und Gerichte, dass es für Forscher schwierig ist, Korrelationen mit den Genvarianten zu finden. Einige Daten sind jedoch noch vorhanden.
Anhand bestimmter Genvarianten können wir herausfinden, ob eine Person zu Unverträglichkeiten gegenüber Laktose oder Gluten neigt, ob der Körper schnell oder langsam mit Alkohol oder Koffein zurechtkommt, und die Veranlagung zu einem bestimmten Gehalt an Eisen-, Calcium-, Omega-3- und 6-Fettsäuren beurteilen. Anhand dieser Daten kann eine Person entscheiden, welche Produkte sie entfernen oder umgekehrt der Ernährung hinzufügen soll.
Sport
16 BerichteEs ist genauso schwierig, den Sport zu bestimmen, der genetisch besser zu Ihnen passt wie das Aufnehmen von Lebensmitteln. Es gibt viele Arten von körperlicher Aktivität und das Konzept des Sports wird jedes Jahr erweitert. Skateboarding und Surfen haben also das Programm des olympischen Sports erweitert. Es gibt zu viele Arten von körperlicher Aktivität, um genetisch determiniert zu sein. Glauben Sie daher nicht den Gentests, die versprechen, die für Sie am besten geeignete Sportart zu finden. Wählen Sie den Sport, den Sie gerade mögen.
Die Genetik-Community ist besorgt, dass Eltern Gentests für ihre Kinder durchführen, um herauszufinden, welcher Sport für sie am besten ist. In diesem Fall kann das Kind zu einer Gruppe geschickt werden, die es nicht mag, die sich aber aufgrund der Testergebnisse eignet. Wenn jemand im Sport hervorragende Ergebnisse erzielen will, hängt der Erfolg in hohem Maße von seinen Ambitionen, seiner Willenskraft und seinem Charakter ab. Genvarianten spielen hier eine geringere Rolle.
Mithilfe eines Gentests können Sie herausfinden, wie Gene das Risiko von Sportverletzungen, die Menge an freiem insulinähnlichem Wachstumsfaktor 1, den Spiegel an roten Blutkörperchen und Erythropoetin sowie die Eigenschaften des Aminosäurestoffwechsels - Valin, Leucin und L-Carnitin - beeinflussen. Zu den Ergebnissen des vollständigen Genoms haben wir auch das Risiko für Ischiasnerv-Neuralgie, IGFBP-3-Spiegel, Exspirationsvolumen und andere hinzugefügt.
Andere Symptome
15 BerichteIn diesem Abschnitt haben wir Zeichen gesammelt, die sich auf die Eigenschaften des Körpers beziehen: Aussehen, Lichtempfindung, Empfindlichkeit gegenüber Kräutern und Gerüchen. In unserem Test werden Sie keine Anzeichen finden, die mit Emotionen, Verhalten oder Charakter zusammenhängen. Grundsätzlich hängen diese Merkmale von den Merkmalen der Erziehung, der Umwelt und der Gewohnheiten ab und sind in geringerem Maße von Genvarianten betroffen. Darüber hinaus können viele persönliche Qualitäten im Erwachsenenalter verändert oder weiterentwickelt werden.
Herkunft
3 BerichteIn der Genetik wird der Begriff der Ethnizität oder Nationalität nicht verwendet. In größerem Maße sind sie auf kulturelle Unterschiede und nicht auf unterschiedliche Genvarianten zurückzuführen. Stattdessen verwendet die Genetik das Konzept einer Population - einer Gruppe von Menschen, die seit langer Zeit auf demselben Gebiet leben. Heute sind die Genomdaten bestimmter Populationen verfügbar, von denen Wissenschaftler Sequenzen und Varianten von Genen identifiziert haben, die für jede Population charakteristisch sind. Genetische Herkunftsuntersuchungen sind die Suche nach solchen Varianten im Genom und die Bestimmung der genetischen Ähnlichkeit mit bekannten Populationen in Prozent.
Neben der Populationszusammensetzung nach dem genetischen Code können Sie Ihre Haplogruppe ermitteln. Eine Haplogruppe ist eine Gruppe von Menschen mit derselben Genvariante, die vor Tausenden von Jahren bei einem gemeinsamen Vorfahren aufgetreten ist. Auch der prozentuale Anteil der Neandertaler-DNA kann aus dem Genom bestimmt werden. Etwa 1–4% der Neandertaler-DNA wurden im Genom des modernen Menschen gefunden. Derzeit sind nur wenige Anzeichen bekannt, die von der Verfügbarkeit von Neandertalervarianten abhängen - Rückenhaarwachstum und der Konzentration von LDL-Lipoproteinen mit niedriger Dichte (schlechtes Cholesterin).

Vergleich des vollständigen Genom- und Atlas-Gentests
Warum das volle Genom?
Das Hauptplus des vollständigen Genoms ist, dass Sie alle Informationen über Ihre DNA erhalten. Wenn neue Daten angezeigt werden, fügen wir sie einfach Ihrem Konto hinzu. Es funktioniert nicht immer mit dem üblichen Gentest, da ungefähr 660.000 Varianten untersucht werden - 0,1% der gesamten DNA.
Um die neuen Zeichen zu interpretieren, reichen sie möglicherweise nicht aus.Die Testergebnisse werden dazu beitragen, Maßnahmen zur Vorbeugung von Krankheiten und zur Familienplanung zu ergreifen, und der Arzt wird in der Lage sein, die Diagnose in Zukunft oder jetzt zu klären. Der Test wird zu Ihnen nach Hause geliefert. Der Benutzer muss lediglich eine Speichelprobe entnehmen und einen Kurier rufen, um das Reagenzglas in das Labor zu überführen.Die Basis des Atlas Complete Genoms: hochpräzise genetische Analyse (99,5%), Qualitätskontrolle der erhaltenen Daten, patentiertes Dateninterpretationssystem, Zugriff auf Quelldaten, genetische Beratung sowie ausgewählte wissenschaftliche Artikel, die jedem Benutzer zur Verfügung stehen. All dies erhält der Nutzer für 94.500 Euro - den niedrigsten Preis für solche Leistungen in Russland. Der Test kann bereits auf der Atlas- Website gekauft werden .Wenn Sie wissen, wie man mit Big Data und insbesondere mit Bioinformatik umgeht, können Ihre Rohdaten des gesamten Genoms Plastilin sein, mit dem Sie nach Belieben spielen und mehr über sich selbst erfahren können. Sie können beispielsweise die Varianten von Genen, die andere Unternehmen untersuchen, aussortieren und Interpretationen in ihre Datenbank laden, die Beziehung zu einer anderen Person ermitteln, die Referenz-DNA eines Schimpansen oder Neandertalers entnehmen und vergleichen, wie ähnlich Sie sind.Und auch
Atlas hat ein tolles Geschenk für Habr-Leser vorbereitet! In den folgenden Artikeln geben wir 3 Aufgaben mit Beispielen und Eingabedaten sowie Informationen zur benötigten Software. Der erste, der alle Probleme löst - erhält das vollständige Genom als Geschenk !