Wie DNA sequenziert wird
Die DNA-Sequenzierung hat sich in den letzten Jahrzehnten von einem engen Feld, das von einer kleinen Anzahl von Wissenschaftlern bearbeitet wurde, zu einer der am schnellsten wachsenden Technologien entwickelt. ProduktivitĂ€tswachstum und sinkende Kosten liegen sogar vor Moores Gesetz, und aufgrund des starken Wettbewerbs auf dem Markt und der groĂen Nachfrage wird die Entwicklung weiterhin in hohem Tempo fortgesetzt. DarĂŒber hinaus fĂŒhrte die Entwicklung der Sequenzierung zu demselben Boom in der Bioinformatik und einer radikal verĂ€nderten Biologie und verĂ€nderte allmĂ€hlich auch die Medizin grundlegend.
Von kat, ich erzĂ€hle dir mehr darĂŒber, wie sie es machen.Was ist DNA?Um den Prozess selbst zu verstehen, ist zunĂ€chst eine wenig notwendige Theorie erforderlich.DNA ist eine Polymerkette, die aus vier Arten von Monomeren besteht, die als Nukleotide bezeichnet werden und deren Sequenz Informationen ĂŒber den Körper codiert. Mit anderen Worten, DNA kann als Text dargestellt werden, der in einem Alphabet aus vier Buchstaben geschrieben ist. DNA ist ein MolekĂŒl, das aus zwei Ketten besteht, und obwohl ihre Nukleotidsequenz unterschiedlich ist, kann die Sequenz einer Kette eindeutig wiederhergestellt werden, wenn die Sequenz der anderen bekannt ist. Daher werden Ketten als komplementĂ€r bezeichnet. (Eng. Complement - Supplement) Diese Eigenschaft wird verwendet, wenn eine Zelle kopiert wird, wenn DNA-StrĂ€nge abgewickelt werden, und auf jeder wie auf einer Matrix wird die zweite synthetisiert, und jede von zwei Tochterzellen erhĂ€lt ihre doppelstrĂ€ngige DNA. Die gesamte DNA-Sequenz eines Organismus wird als Genom bezeichnet. Zum Beispiel besteht das menschliche Genom aus 46 Chromosomen.Trotz der groĂen Anzahl verschiedener, sowohl experimenteller als auch veralteter Methoden sind die gĂ€ngigen kommerziellen Methoden ziemlich Ă€hnlich, und um nicht jedes Mal Vorbehalte zu machen, werde ich sofort sagen, dass es um diese gĂ€ngigen Methoden geht.Wie es im Allgemeinen aussiehtBevor ich die Sequenziertechnologie beschreibe, werde ich fĂŒr ein intuitives VerstĂ€ndnis die folgende Analogie ziehen: Sie sprengen einen Stapel identischer Zeitungen in die Luft, so dass sie in kleine StĂŒcke mit Textfragmenten zerfallen, und dann wird jedes dieser StĂŒcke gelesen und aus diesen Lesungen wird der Text wiederhergestellt Originalzeitung.Um DNA zu sequenzieren, wird sie zuerst aus der Testprobe isoliert und dann zufĂ€llig in kleine Fragmente geschnitten. Die Fragmente werden als Reads bezeichnet. Von jedem Lesevorgang bleibt eine Kette ĂŒbrig, und die zweite wird an dieser Kette wie auf einer Matrix synthetisiert, und der Typ jedes nachfolgenden Nukleotids, das gebunden ist, wird irgendwie nachgewiesen. Wenn Sie also die Sequenz der verbundenen Nukleotide aufzeichnen, stellen Sie deren Sequenz bei jedem Lesevorgang wieder her. Dann wird das Genom aus Computerablesungen unter Verwendung von Computerprogrammen rekonstruiert.Ein wichtiger Punkt. Die GesamtlĂ€nge der LesevorgĂ€nge sollte um ein Vielfaches gröĂer sein als die LĂ€nge der untersuchten DNA. Dies geschieht, weil beim Extrahieren der DNA aus der Probe und beim Schneiden ein Teil davon verloren geht, sodass niemand garantiert, dass jeder seiner Abschnitte in mindestens einen Lesevorgang fĂ€llt. Daher wird DNA mit einem groĂen Rand entnommen, damit garantiert wird, dass jeder Abschnitt gelesen wird. DarĂŒber hinaus können wĂ€hrend der Sequenzierung Fehler auftreten. Um die DNA zuverlĂ€ssiger lesen zu können, sollte jeder Abschnitt mehrmals gelesen werden.
DNA wird in LesevorgĂ€nge geschnitten, die lesen, und von diesen wird die ursprĂŒngliche Sequenz wiederhergestelltDiese Technik wird nicht fĂŒr ein gutes Leben verwendet. Dies bringt viele Schwierigkeiten mit sich, und wenn die Forscher die gesamte Sequenz des Genoms gleichzeitig erfassen und lesen könnten, wĂ€ren sie froh, dass dies derzeit jedoch nicht möglich ist.DafĂŒr gibt es zwei GrĂŒnde. Das erste sind Fehler, die beim Lesen jedes Nukleotids auftreten. Sie akkumulieren allmĂ€hlich und jedes nachfolgende Nukleotid wird schlechter gelesen als das vorherige, und irgendwann ist die LesequalitĂ€t so verringert, dass es sinnlos ist, den Prozess fortzusetzen. FĂŒr verschiedene Sequenzierungsmethoden liegt die LĂ€nge des Lesevorgangs, die sie gut lesen können, in der GröĂenordnung von zehn oder Hunderten von Nukleotiden. Das zweite ist, dass DNA ein sehr langes MolekĂŒl ist und bei einer gewissenhaften LektĂŒre jedes Buchstabens nach einem Freund die Sequenzierung eine unanstĂ€ndige Zeit in Anspruch nehmen wĂŒrde. In diesem Fall lĂ€sst sich dieser Prozess leicht parallelisieren, und Millionen und Milliarden von LesevorgĂ€ngen können gleichzeitig gelesen werden.
IlluminaEin solches Schema beschreibt alle gĂ€ngigen Sequenzierungstechniken. Sie unterscheiden sich nur in den Methoden zum Nachweis verbundener Nukleotide wĂ€hrend der Synthese und in der Methode zur Herstellung des Materials.Bisher wird die hĂ€ufigste Methode bei Illumina-Sequenzern verwendet. Bei diesem Verfahren werden zunĂ€chst viele verschiedene Messwerte an der Glasplatte angebracht. Dann werden von jedem Lesevorgang viele Kopien auf der OberflĂ€che der Platte gemacht, so dass sich nur identische Kopien auf jedem kleinen Abschnitt davon befinden. Dies geschieht so, dass wĂ€hrend der nachfolgenden Sequenzierung ein Signal nicht von einem einzelnen MolekĂŒl, sondern von einer Gruppe identischer MolekĂŒle in der NĂ€he empfangen wird. So ist das Signal leichter zu lesen und die ZuverlĂ€ssigkeit des Lesens steigt. Diese MolekĂŒle sind einzelstrĂ€ngige DNA, und wĂ€hrend der Sequenzierung werden komplementĂ€re Ketten darauf synthetisiert. Die Synthesereaktion wird wie folgt durchgefĂŒhrt: Ein Nukleotid ist an den Anfang jedes MolekĂŒls gebunden. Dieses Nukleotid ist also chemisch blockiertdass nach seiner Zugabe die Synthese nicht weiter geht. ZusĂ€tzlich ist daran ein Tag angebracht, das unter Einwirkung eines Lasers luminesziert. DarĂŒber hinaus ist fĂŒr jede Art von Nukleotiden die Farbe der Lumineszenz unterschiedlich. Nachdem das Nukleotid angebracht ist, wird die Platte mit einem Laser beleuchtet und die Kamera erfasst die Farben, mit denen die Platte luminesziert. Danach wird die Sperre entfernt, die Markierung wird ebenfalls entfernt und das nĂ€chste Nukleotid wird auf die gleiche Weise angebracht. Die Folge von Lichtsignalen an jedem Abschnitt der Platte im Computer wird in eine Folge von Nukleotiden ĂŒbersetzt, und am Ausgang wird eine Datei erhalten, die die Folge von LesevorgĂ€ngen enthĂ€lt.Nachdem das Nukleotid angebracht ist, wird die Platte mit einem Laser beleuchtet und die Kamera erfasst die Farben, mit denen die Platte luminesziert. Danach wird die Sperre entfernt, die Markierung wird ebenfalls entfernt und das nĂ€chste Nukleotid wird auf die gleiche Weise angebracht. Die Folge von Lichtsignalen an jedem Abschnitt der Platte im Computer wird in eine Folge von Nukleotiden ĂŒbersetzt, und am Ausgang wird eine Datei erhalten, die die Folge von LesevorgĂ€ngen enthĂ€lt.Nachdem das Nukleotid angebracht ist, wird die Platte mit einem Laser beleuchtet und die Kamera erfasst die Farben, mit denen die Platte luminesziert. Danach wird die Sperre entfernt, die Markierung wird ebenfalls entfernt und das nĂ€chste Nukleotid wird auf die gleiche Weise angebracht. Die Folge von Lichtsignalen an jedem Abschnitt der Platte im Computer wird in eine Folge von Nukleotiden ĂŒbersetzt, und am Ausgang wird eine Datei erhalten, die die Folge von LesevorgĂ€ngen enthĂ€lt.
Illumina
1 â 2 â 3 â , 4 â 5 â 6 â 7 âWenn die Genome enger Organismen zuvor nicht sequenziert wurden, versuchen sie aus den LesevorgĂ€ngen unter Verwendung von Programmen, eine einzelne Nukleotidsequenz zusammenzusetzen. BlĂ€tter ĂŒberlappen sich teilweise und versuchen mit diesen Ăberlappungen, eine einzelne Sequenz zu erstellen. Es gibt viele Punkte, die die Angelegenheit erheblich erschweren. Sie können beispielsweise eine Probe kontaminieren, und das Programm versucht, eine Sequenz aus der DNA verschiedener Organismen zu erstellen. Der Sequenzer kann beim Lesen des Lesevorgangs einen Fehler machen oder die beiden Stellen im Genom falsch verknĂŒpfen, da sie sehr Ă€hnlich sind. TatsĂ€chlich gibt es so viele Schwierigkeiten, dass Sie hier nicht alle auflisten werden. Und einige von ihnen sind so schwer zu eliminieren, dass selbst das menschliche Genom, das wichtigste und am weitesten untersuchte Genom, noch nicht bis zum Ende sequenziert ist.
liest und unter der Genomsequenz, die basierend auf ihnen rekonstruiert wird.Wenn die Genomsequenz zusammengesetzt ist, mĂŒssen Sie verstehen, was es bedeutet. Darauf befinden sich Bereiche, die wie Gene aussehen. Dies geschieht wie folgt: Am Anfang und Ende der Gene befinden sich bestimmte âMarkierungenâ von Nukleotiden. Wenn die DNA solche Sequenzen in einem solchen Abstand enthĂ€lt, dass ein Gen zwischen sie passen kann, wird dieser Ort in die Liste der potenziellen Gene eingetragen. Dann wird dieser Antragsteller mit einer Datenbank bereits bekannter Gene anderer Organismen verglichen, und wenn darin ein Gen gefunden wird, das dieser Stelle ziemlich Ă€hnlich ist, wird ihm die Funktion dieses Gens zugewiesen.Wenn das Genom eines anderen Organismus dieser Art bereits sequenziert wurde, wird es zur Assemblierung verwendet. Da sich die Genome verschiedener Organismen derselben Art nur geringfĂŒgig unterscheiden, finden sie bei jedem Lesevorgang einen Platz auf dem sequenzierten Genom, dem es am nĂ€chsten liegt, und auf der Grundlage dieses Genoms wird ein neuer zusammengesetzt. Source: https://habr.com/ru/post/de385865/
All Articles