Hallo allerseits, mein Name ist Alexander Sokolov und ich möchte Ihnen erzählen, wie ich zu Hause einen Sequenzer hergestellt habe - ein Gerät zum Entschlüsseln von DNA. Der Marktpreis eines solchen Geräts beträgt etwa 10 Millionen Rubel.

Ein kurzer Ausflug in die Genetik. Wenn Sie sich plötzlich erinnern, wurde 2003 eine sensationelle Aussage gemacht: Wissenschaftler entschlüsselten schließlich das menschliche Genom. Das Genom besteht aus DNA und DNA ist der Quellcode des Körpers. DNA ist eine Doppelkette, die aus 4 Arten von Nukleotiden besteht, die sich im menschlichen Genom etwa 3 Milliarden Mal wiederholen. So wie alle Informationen auf Ihrem Computer in Bits verschlüsselt sind, ist die Anweisung zum Zusammensetzen aller Proteine des menschlichen Körpers in Nukleotiden verschlüsselt. Das heißt, wenn wir wissen, in welcher Reihenfolge sich die Nukleotide in der DNA befinden, können wir theoretisch alle notwendigen Proteine sammeln und ein menschliches Modell erhalten. Im üblichen Sinne haben die Wissenschaftler die DNA nicht entschlüsselt, sondern lediglich die chemische Sequenz in eine Reihe von Nullen und Einsen auf dem Computer übersetzt. Was als nächstes zu tun ist, ist ein separates Gespräch. Zum Beispiel ist uns im Moment klar, dass nur 5% des gesamten Genom-Arrays funktionieren (dies ist die Proteinkodierung). Was die restlichen 95% tun, kann man nur spekulieren.
Im Jahr 2003 beliefen sich die Kosten für die Sequenzierung menschlicher DNA auf etwa 100 Millionen US-Dollar. Im Laufe der Zeit ist diese Zahl gesunken und nähert sich jetzt tausend Dollar. Sie zahlen, Ihre DNA wird sequenziert und Ihnen eine Festplatte mit 3 GB Informationen übergeben - Ihr Genom in digitaler Form.
Es gibt heute drei Hauptsequenzer auf dem Markt. Der produktivste Hiseq und sein NovaSeq-Empfänger bieten die billigste (fluoreszierende) Sequenzierung. Einer der Startvorgänge dauert mehrere Tage, und während dieser Zeit werden die Genome mehrerer Personen gleichzeitig verarbeitet. Der Start selbst kostet jedoch etwa zehntausend Dollar. Übrigens kostet das Gerät selbst ungefähr 1 Million US-Dollar, und da es in ungefähr 3 Jahren veraltet ist, muss es Ihnen 1000 US-Dollar pro Tag bringen, damit es sich auszahlt.
Das zweite Gerät kam erst letzten Sommer auf den Markt. Es heißt Nanopore und basiert auf einer sehr interessanten Technologie, wenn DNA durch Passieren einer Nanopore sequenziert wird. Die billigste Nanopore-Variante ist als Einweg-Heimsequenzer positioniert und kostet 1000 US-Dollar.
Das dritte Gerät ist PGM, ein Halbleitersequenzer, der in seiner Heimat 50.000 US-Dollar und in Russland etwa 10 Millionen Rubel (mit Lieferung, Zollabfertigung usw.) kostet. Der Sequenzierungsprozess dauert ungefähr mehrere Stunden.
Ich hatte keine zehn Millionen, aber ich wollte PGM. Ich musste es selbst machen. Zunächst kurz, wie die Halbleitersequenzierung erfolgt. Die gesamte DNA-Kette ist in Fragmente mit einer Länge von 300 bis 400 Nukleotiden unterteilt, die als Reads bezeichnet werden. Dann werden die Lesevorgänge an kleine Kugeln angehängt und viele Male kopiert. Infolgedessen „hängt“ eine ganze Reihe identischer DNA-Fragmente an jeder Kugel. Das Kopieren ist erforderlich, um das Signal von jedem bestimmten Lesevorgang zu verstärken. Eine Reihe verschiedener Bereiche wird als DNA-Bibliothek bezeichnet.
Das Herzstück von PGM ist ein einmaliger Chip - eine Matrix ähnlich der Matrix in der Kamera, aber anstelle von Pixeln, die auf Licht reagieren, gibt es hier pH-Transistoren, die auf Änderungen des Säure-Basen-Gleichgewichts reagieren. Die resultierende DNA-Bibliothek wird auf einen Chip geladen, der 10 Millionen Vertiefungen enthält, und am Boden jeder von ihnen befindet sich ein pH-Transistor. Nur eine Kugel passt in ein Loch und liest daher nur einen Typ (mit einer bestimmten Nukleotidsequenz). Dann werden Reagenzien dem Chip zugeführt, so dass die DNA beginnt, sich selbst zu kopieren. Und es wird linear kopiert, dh Nukleotide werden in der Reihenfolge, in der sie in der Mutterkette stehen, an die neu erzeugte Kette gebunden. Daher wird dem Chip eine Art von Nukleotiden zugeführt - und die pH-Änderung in einigen Vertiefungen wird sofort aufgezeichnet (dies bedeutet, dass das Nukleotid an sie gebunden wurde). Dann wird eine andere Art von Nukleotiden zugeführt und die pH-Änderungen in den Vertiefungen usw. werden aufgezeichnet. Indem wir also alle 4 Arten von Nukleotiden mehrmals auf den Chip auftragen, können wir bei jedem Lesevorgang Informationen über die Nukleotidsequenz erhalten. Dann werden durch mathematische Methoden die gelesenen kurzen Segmente auf einem Computer in einer einzelnen Kette gesammelt. Um es mehr oder weniger sicher zu erfassen, sollte jeder Lesevorgang ungefähr 100 Mal gelesen werden.
Abb. 1. HalbleitersequenzierungLassen Sie uns nun herausfinden, woraus das Gerät selbst besteht. Wie wir bereits wissen, gibt es einen Chip sowie ein Reagenzienversorgungssystem und ein Motherboard. Die gesamte Sequenzierung erfolgt präzise auf dem Chip - der Rest des Geräts überträgt nur bestimmte Signale an den Chip, liefert Reagenzien, liest analoge Signale von diesem, digitalisiert sie und leitet den empfangenen Informationsstrom an einen Computer weiter, wo Daten gesammelt und verarbeitet werden.
Abb. 2. SequenzergerätDer Chip wird einmalig positioniert und nach Gebrauch weggeworfen. Wenn PGM funktioniert, können solche Chips dementsprechend kostenlos in beliebiger Menge bezogen werden. Warum sie bekommen, fragst du? Tatsache ist, dass ich es bereits geschafft habe, den Chip wiederholt zu verwenden. Tatsächlich ist es ewig: Spülen Sie es gut genug aus - und können Sie es immer wieder verwenden. In der Genauigkeit wird es nicht vom neuen abweichen. Meine Idee war es, ein Gerät für diesen Shareware-Chip herzustellen.
Also stand ich vor der Aufgabe, den Chip zurückzuentwickeln. Natürlich konnte keine Dokumentation für die begehrte Mikroschaltung gefunden werden - der Hersteller wollte die Geheimnisse der Produktion nicht teilen, wollte aber seine Geräte leise für 50.000 US-Dollar verkaufen. Zunächst tat ich das offensichtlichste und einfachste: Die Kontakte klingelten mit einem Tester. Es wurde klar, wo sich die digitalen und analogen E / A, die Stromversorgung und mehr befinden. Einige Informationen wurden aus Patenten auf dem Chip erhalten. Aber all dies reichte natürlich nicht aus, um ein vollwertiges Produkt zu schaffen. Ich spielte immer noch mit dem Chip, überprüfte meine verschiedenen Vermutungen, experimentierte mit Signalen, kam aber im Grunde nirgendwo hin. Ich musste das Projekt pausieren.
Abb. 3. ChipUnd dann stieß ich plötzlich auf Habrahabr
auf einen Artikel des berühmten Bloggers
BarsMonster darüber, wie er Chips
rückentwickelt ! Er war inspiriert, schrieb ihm, schrieb an andere Enthusiasten, schickte eine Anfrage nach Kiew, wo er Chips fotografierte. Sie antworteten aus Kiew, dass sie nicht wissen, wie man in Schichten poliert, sie können nur die oberste Schicht aufnehmen, und da mein Chip mehrschichtig ist, ist nicht klar, wohin die Spuren von den Kontakten führen. Dann traf er einen Amerikaner, der sich auch mit Reverse Engineering von Chips beschäftigt, schickte ihm seine Mikroschaltungen, aber selbst hier ging es nicht über das Fotografieren der oberen Schicht hinaus. Dann stieß ich im Internet auf einen Artikel über diejenigen, die den Sony PlayStation-Chip usw. umkehren konnten ("Ruhm den Helden!" Und das ist alles, wenn jemand weiß). Ich beschloss, sie mit Fragen zu schreiben, fand ihre Spitznamen - und dann wurde mir klar, dass einer von ihnen mir vertraut war. Kürzlich brachte mich ein Freund zu einem Freund, der sich auch „auf Amateurebene mit Genetik beschäftigt“. Wir haben mit diesem Freund über Skype gesprochen und diesen Dialog beendet. Und jetzt verstehe ich, dass mein neuer Freund ein mega-cooler Meister der Reverse Engineering-Chips ist. Ich habe ihm genau dort geschrieben. Es stellte sich jedoch heraus, dass er, obwohl er bereit war zu helfen, kein Mikroskop hatte. Wieder Sackgasse.
Einige Monate später wurde das notwendige Mikroskop in einem nahe gelegenen Labor gefunden! Die eingebaute Kamera war zwar schrecklich, ich habe Bilder auf einem Mobiltelefon durch ein Okular aufgenommen und Bilder dieser Qualität erhalten:
Abb. 4. Der Chip unter dem MikroskopDann, am letzten Neujahrstag, erschien bei meiner Arbeit ein ausgezeichnetes Mikroskop für 130.000 (ich bin Spezialist für Quantenkryptographie). Träume werden wahr. Schließlich konnte ich den Chip normalerweise von oben fotografieren.
Abb. 5. Mein ArbeitsmikroskopUnd dann ... Dann musste ich die Technik des Polierens noch selbst beherrschen. Die Schwierigkeit beim Polieren besteht darin, Metallschichten mit einer Dicke in der Größenordnung von 1 Mikron zu entfernen - während die Breite des Chips 1 Zentimeter beträgt. Zum Vergleich sage ich, dass es ungefähr so ist, als würde man einen Fehler von nicht mehr als 10 cm pro 1 km zulassen. Ich habe mich sehr bemüht. Die Ergebnisse meiner Arbeit sind auf folgendem Foto dargestellt:
Abb. 6. Reverse Engineering unter einem optischen MikroskopDie untere Siliziumschicht, die obere Schicht mit Transistoren, die erste, zweite, dritte und vierte Metallschicht sind deutlich sichtbar.
Der Chip besteht aus sich wiederholenden Zonen (wie Schieberegistern), und aus solchen Bildern war es sehr bequem, ihn zu analysieren: Es wurde sofort klar, was auf verschiedenen Ebenen geschah. Ich habe die am meisten „ausgestopften“ Abschnitte mit einer Fülle von Logik „umgekehrt“, die viele Male wiederholt wurden. Am schwierigsten war es jedoch, die Spuren zu verfolgen, die entlang des gesamten Chips verlaufen, um zu verstehen, welcher externe Kontakt sich auf was bezieht. Von den Neujahrsferien bis Ende Februar habe ich mit einem neuen schönen Mikroskop über diese Aufgabe nachgedacht - ich saß bis zehn Uhr nachts bei der Arbeit, „umgekehrt“, dachte ich. Und dann geschah ein neues Wunder: Ein Freund konnte bei MIREA das kostenlose Fotografieren des Chips in Schichten auf einem Elektronenmikroskop organisieren. "Photosession" Krümel im 1. Quartal cm waren 50 GB Schwarzweißfotos.
Jetzt mussten all diese einzelnen Fotos irgendwie zu einem ganzen Bild kombiniert werden. Fast am selben Tag schrieb ich ein Programm auf Python, das eine HTML-Datei generierte - als ich es in einem Browser öffnete, bekam ich, was ich brauchte. (Übrigens, die älteste 10. Oper hat es am besten gemacht, ich empfehle es!) Dann habe ich ein weiteres Programm auf Javascript geschrieben, mit dem Sie Ebenen vergleichen, reibungslos zwischen ihnen wechseln, sie ausrichten, die Skala auswählen usw. Schließlich in meinen Händen Es gab alle Werkzeuge zur Lösung der Hauptprobleme. Ich verfolgte die Pfade, die den Chip durchbohrten, und stellte seine gesamte Struktur bis zum letzten Transistor wieder her.
Ein weiteres Foto einer Chipscheibe, die unter einem Röntgenbild aufgenommen wurde (in MIREA):
Abb. 7. ElektronenmikroskopieBrunnen sind sichtbar, wo die Kugeln mit Lesungen fallen. Darunter befinden sich drei Metallschichten und noch darunter eine Schicht mit Transistoren.
Die nächste Stufe im Kampf um eine bessere Zukunft war die Schaffung eines Motherboards für den Chip. Entwarf es und schickte einen Fertigungsauftrag. In der Zwischenzeit verwendeten das Gericht und der Fall das Mars Rover-2-Board mit FPGA, um mit dem Chip zu arbeiten. (FPGA ist ungefähr ein Array von 10.000 universellen Logikelementen. Durch Programmieren von FPGA können wir jede Logik erhalten, die Gigabit-Informationsströme leicht verarbeiten kann.) Ich habe die Firmware für FPGA selbst geschrieben und außerdem Software für die dynamische Steuerung des Systems geschrieben Hiermit wird die gesamte Konfiguration für FPGA festgelegt. Dann erschien wieder eine halbe Jahrpause (er machte eine Geschäftsreise zum Baikalsee, bereitete eine Anlage im Labor vor, die Putin vorgeführt wurde). Aber am Ende kamen die Sterne zusammen: Ich hatte Zeit, die fertigen Bretter kamen - und ich baute mein System zusammen.
Abb. 8. Die Schaffung von "Eisen"Er gab alle notwendigen Signale und - oh, ein Wunder! - Ich habe ein Signal vom Chip am Oszilloskop gesehen. (Ich habe einmal ein Oszilloskop für 6.000 Rubel bei eBay gekauft, weitere 1.000 sind die Firmware wert.) Die Flecken sind auf dem Bild deutlich sichtbar - Tröpfchen eines Reagenzes.
Abb. 9. Das Signal vom Chip am OszilloskopJetzt musste ich herausfinden, wie ich dieses Bild digitalisieren und auf einen Computer übertragen kann. Ich habe dieses Setup zusammengestellt:
Abb. 10. Instrumentenschaltung
Abb. 11. Bereit für die InstallationEs gibt einen Computer, der mit FPGA Steuerdaten an die Karte liefert. Die Karte erzeugt digitale Signale und sendet sie an den Chip. Das Signal vom Chip geht zum Verstärker und dann zum ADC auf der Karte. Es wird digitalisiert und über den COM-Port an den Computer übertragen. Im Allgemeinen ist die Bandbreite des COM-Ports gering: 15 Kilobit pro Sekunde (da ein Chip 1 bis 10 Millionen „Pixel“ enthält und die maximale Übertragungsgeschwindigkeit 115200 Baud beträgt). Trotzdem gelangt das Bild schließlich zum Computer.
Abb. 12. Das verarbeitete Signal auf dem Computer.Das Foto oben zeigt, dass bei Lieferung einer DNA-Bibliothek an den verwendeten gebrauchten Chip der Chip ungleichmäßig gefüllt ist: bis zu den Rändern - in geringerem Maße. Unterschiedliche Farben sind auf unterschiedliche Spannungen an den pH-Transistoren zurückzuführen. Das heißt, wir können die Löcher klar unterscheiden, in denen die Kugeln mit Lesevorgängen treffen - später können wir so die Spülung des Chips kontrollieren.
Dementsprechend war die nächste Aufgabe das Spülen des Chips. Es musste sichergestellt werden, dass er wie neu wurde. Zum Glück hatte ich einen völlig neuen Chip als Referenzmuster. In Abb. Und es ist zu sehen, dass ein solcher Chip im aktiven Bereich fast dieselbe Farbe hat (vertikale sich wiederholende Streifen sind nur Rauschen, Interferenz).
Abb. 13. Spülen Sie den ChipIn Abb. 13 B Der Chip ist nicht gut gewaschen - er ist mehrfarbig. In 13 ist D ein gebrauchter, aber gut gewaschener Chip. Es ist zu sehen, dass der Gradient entlang der Kanten verschwunden ist. Trotzdem lohnt es sich zu beweisen, dass es wirklich sauber ist und wiederverwendet werden kann.
Da DNA-Bibliotheken in einem sauren Medium an die Tantalbeschichtung des Chips gebunden und in alkalischem (d. H. Bei hohem pH) abgelöst sind, wird der Chip unter Verwendung spezieller halbautomatischer Pipetten mit Lösungen mit unterschiedlichem pH gewaschen. Bisher gelang es mir, eine nahezu vollständige Spanreinigung zu erreichen.
Ich war daran interessiert, warum ich, als ich die Struktur des Chips vollständig verstand, seine Herstellung nicht bestellte, sondern es vorzog, weiter zu suchen und gebrauchte zu bekommen, an deren Wäsche zu basteln usw. Ja, wegen der Entwicklung der Mikroschaltung Es kostet viel Geld, Millionen von Dollar, und ein wesentlicher Teil dieses Betrags fließt in das physische Debuggen des resultierenden Produkts: Anpassen, Einstellen aller Parameter der Transistoren usw. Das heißt, das einfache Kopieren der Logikschaltung reicht nicht aus. Daher nehme ich bedingt freie, vorgefertigte - entworfene, hergestellte, debuggte - Mikroschaltungen und spare so erheblich Geld, um das Projekt ernsthaft zu verbilligen.
Meine nächste Aufgabe bestand darin, ein fortschrittlicheres Gerät zusammenzustellen, das eine schnellere Übertragung von Informationen auf einen Computer ermöglicht und gleichzeitig nicht aus einer großen Anzahl separater Karten besteht.
Abb. 14 Entwicklung der nächsten Version des GerätsIch habe ein neues Motherboard mit FPGA genommen - auf demselben Chip gab es 2 ARM-Kerne mit Linux, Gigabit-Ethernet und andere "Goodies", aber im Gegensatz zur vorherigen Version gab es keinen ADC. Später entwarf er ein weiteres Board mit Hochgeschwindigkeits-ADCs und allen anderen notwendigen Elementen. Gestartet - alles hat funktioniert.
Was bleibt für das Erscheinungsbild des Endgeräts zu tun? Nur drei Dinge.
Der erste. Benötigen Sie Gigabit-Internet, schnelle Datenübertragung auf einen Computer. Das habe ich erst gestern gemerkt.
Der zweite. Reagenzienversorgungssystem. Die Entwicklung eines speziellen Ventils ist bereits im Gange.
Der dritte. Software zur Verarbeitung von Informationen vom Chip. Ich habe immer noch Fragen zur Software und lade Programmierer zur Zusammenarbeit ein.
Das Endgerät kostet 10 Millionen Rubel. Die Kosten für die Sequenzierung betragen mehrere tausend Dollar. Chips kosten zwischen 100 und 1.000 US-Dollar - abhängig von der Anzahl der darin enthaltenen "Pixel". (Übrigens kann die Wiederherstellung von Chips an sich schon ein gutes Einkommen sein, insbesondere wenn man bedenkt, dass zum Spülen nur ein paar Klicks erforderlich sind.) Reagenzien werden ebenfalls gekauft, aber in Zukunft werden sie erzeugt.
Im Allgemeinen ist das alles sehr interessant, aber die Hauptsache ist die Zukunft. Heute nimmt die Biotechnologie im wissenschaftlichen und technologischen Fortschritt der Welt den gleichen Platz ein wie die Computertechnologie in den 80er Jahren. letztes Jahrhundert. Darüber hinaus ist die Sequenzierung einer der Schlüsselbereiche für die moderne Biologie und Medizin. Und natürlich ist die Biotechnologie sehr profitabel.
Vor kurzem ist der S5-Halbleitersequenzer auf den Markt gekommen, und in naher Zukunft plane ich, darauf umzusteigen.
Ich werde mich freuen, mit allen zu plaudern, die auf die eine oder andere Weise an der Entwicklung dieses Projekts teilnehmen möchten!
Das Projekt wäre ohne die theoretische Ausbildung von
Vladimir Zubov nicht möglich gewesen. Ich bedanke mich bei ihm.
Vielen Dank für Ihre Aufmerksamkeit!