Séquençage d'ADN à la maison: comment assembler un appareil sur votre genou pour 10 millions

Bonjour à tous, mon nom est Alexander Sokolov, et je veux vous dire comment j'ai fabriqué un séquenceur à la maison - un appareil pour décoder l'ADN. Le prix du marché d'un tel appareil est d'environ 10 millions de roubles.

image

Une brève excursion en génétique. Si vous vous souvenez soudain, en 2003, une déclaration sensationnelle a été faite: les scientifiques ont finalement déchiffré le génome humain. Le génome est construit à partir de l'ADN et l'ADN est le code source du corps. L'ADN est une double chaîne composée de 4 types de nucléotides, qui sont répétés dans le génome humain environ 3 milliards de fois. Tout comme toutes les informations de votre ordinateur sont cryptées en bits, l'instruction d'assemblage de toutes les protéines du corps humain est cryptée en nucléotides. Autrement dit, sachant dans quelle séquence se trouvent les nucléotides de l'ADN, nous pouvons théoriquement collecter toutes les protéines nécessaires et obtenir un modèle humain. Ainsi, au sens habituel, les scientifiques n'ont pas déchiffré l'ADN, mais ont simplement traduit la séquence chimique en un ensemble de zéros et de uns sur l'ordinateur. Que faire ensuite est une conversation distincte. Par exemple, à l'heure actuelle, nous ne comprenons pas la fonction de seulement 5% de l'ensemble du génome (c'est le codage des protéines). Ce que font les 95% restants, on ne peut que spéculer.

En 2003, le coût du séquençage de l'ADN humain était d'environ 100 millions de dollars. Au fil du temps, ce chiffre a diminué et il approche maintenant de mille dollars. Vous payez, votre ADN est séquencé et vous donne un disque dur avec 3 Go d'informations - votre génome sous forme numérique.

Il existe aujourd'hui trois principaux séquenceurs sur le marché. Le plus productif, Hiseq, et son récepteur NovaSeq, fournissent le séquençage (fluorescent) le moins cher. Un de ses lancements dure plusieurs jours, et pendant ce temps les génomes de plusieurs personnes sont traités en même temps. Cependant, le lancement lui-même coûte environ dix mille dollars. Soit dit en passant, l'appareil lui-même coûte environ 1 million de dollars, et comme il devient obsolète dans environ 3 ans, pour qu'il soit rentable, il doit vous rapporter 1000 dollars par jour.

Le deuxième appareil est apparu sur le marché l'été dernier. Il s'appelle Nanopore et est basé sur une technologie très intéressante lorsque l'ADN est séquencé en passant à travers un nanopore. La variante Nanopore la moins chère se positionne comme un séquenceur domestique jetable et coûte 1000 $.

Le troisième appareil est PGM, un séquenceur à semi-conducteurs qui coûte 50 000 $ dans son pays d'origine et environ 10 millions de roubles (avec livraison, dédouanement, etc.) en Russie. Le processus de séquençage prend environ plusieurs heures.

Eh bien, je n'en avais pas dix millions, mais je voulais du PGM. Je devais le faire moi-même. Tout d'abord, brièvement sur la façon dont le séquençage des semi-conducteurs se produit. La chaîne d'ADN entière est divisée en fragments de 300 à 400 nucléotides de longueur, appelés lectures. Ensuite, les lectures sont attachées à de petites sphères et sont copiées plusieurs fois - en conséquence, tout un tas de fragments d'ADN identiques «se bloque» sur chaque sphère. La copie est nécessaire pour amplifier le signal de chaque lecture particulière. Un ensemble de zones différentes est appelé une bibliothèque d'ADN.

Le cœur du PGM est une puce à usage unique - une matrice similaire à la matrice de l'appareil photo, mais au lieu de pixels qui répondent à la lumière, voici des transistors de pH qui répondent aux changements de l'équilibre acido-basique. La bibliothèque d'ADN résultante est chargée sur une puce contenant 10 millions de puits; au bas de chacun d'eux se trouve un transistor de pH. Une seule sphère s'insère dans un trou et, par conséquent, lit d'un seul type (avec une séquence nucléotidique spécifique). Ensuite, les réactifs sont introduits dans la puce afin que l'ADN commence à se copier. Et il est copié linéairement, c'est-à-dire que les nucléotides sont attachés à la chaîne nouvellement créée dans l'ordre dans lequel ils se trouvent dans la chaîne mère. Par conséquent, un type de nucléotides est introduit dans la puce - et le changement de pH dans certains puits est immédiatement enregistré (cela signifie que le nucléotide y était attaché). Ensuite, un type différent de nucléotides est alimenté et les changements de pH dans les puits, etc. sont enregistrés. Ainsi, en appliquant à la puce les 4 types de nucléotides plusieurs fois, nous pouvons obtenir des informations sur la séquence nucléotidique à chaque lecture. Ensuite, par des méthodes mathématiques, les segments courts lus sont collectés sur un ordinateur en une seule chaîne. Pour le collecter plus ou moins en toute confiance, chaque lecture doit être lue environ 100 fois.


Fig.1. Séquençage semi-conducteur

Voyons maintenant en quoi consiste l'appareil lui-même. Il y a, comme nous le savons déjà, une puce, ainsi qu'un système d'alimentation en réactifs et une carte mère. Tout le séquençage est effectué précisément sur la puce - le reste de l'appareil ne lui transmet que certains signaux, fournit des réactifs, lit des signaux analogiques, les numérise et dirige le flux d'informations reçu vers un ordinateur, où les données sont accumulées et traitées.


Fig. 2. Dispositif séquenceur

La puce est positionnée en une seule fois et est jetée après utilisation. Par conséquent, lorsque PGM fonctionne, ces puces peuvent être obtenues gratuitement en n'importe quelle quantité. Pourquoi les obtenir, demandez-vous? Le fait est que j'ai déjà réussi à utiliser la puce à plusieurs reprises. En fait, il est éternel: rincez-le assez bien - et peut être utilisé encore et encore. En termes de précision, il ne sera pas différent du nouveau. Mon idée était de créer un appareil pour cette puce shareware.

J'ai donc été confronté à la tâche d'ingénierie inverse de la puce. Bien sûr, aucune documentation pour le microcircuit convoité n'a pu être trouvée - le fabricant n'allait pas partager les secrets de la production, mais voulait vendre calmement leurs appareils pour 50 000 $. Pour commencer, j'ai fait le plus évident et le plus simple: les contacts ont sonné avec un testeur. Il est devenu clair où se trouvent les E / S numériques et analogiques, l'alimentation, etc. Certaines informations ont été obtenues à partir de brevets sur la puce. Mais tout cela, bien sûr, n'était pas suffisant pour créer un produit à part entière. Je jouais toujours avec la puce, vérifiais mes différentes hypothèses, expérimentais la transmission de signaux, mais je n'avais fondamentalement avancé nulle part. J'ai dû suspendre le projet.


Fig. 3. Puce

Et puis tout à coup sur Habrahabr, je suis tombé sur un article du célèbre blogueur BarsMonster sur la façon dont il procède à l'ingénierie inverse des puces! Il a été inspiré, lui a écrit, a écrit à d'autres passionnés, a envoyé une demande à Kiev, où il était engagé dans la photographie de puces. Ils ont répondu de Kiev qu'ils ne savaient pas comment polir en couches, ils ne pouvaient tirer que sur la couche supérieure, et puisque ma puce est multicouche, il ne sera pas clair où vont les pistes des contacts. Il a ensuite rencontré un Américain également engagé dans la rétro-ingénierie des puces, lui a envoyé ses microcircuits, mais même ici, cela n’a pas dépassé la simple photographie de la couche supérieure. Ensuite, je suis tombé sur un article sur Internet à propos de ceux qui ont pu inverser la puce Sony PlayStation, etc. ("Gloire aux héros!" Et c'est tout, si quelqu'un le sait). J'ai décidé de leur écrire avec des questions, j'ai trouvé leurs surnoms - puis j'ai réalisé que l'un d'eux m'était familier. Récemment, un ami m'a amené à un ami qui est également «engagé dans la génétique au niveau amateur», nous avons parlé avec cet ami sur Skype et nous avons terminé ce dialogue. Et maintenant, je comprends que mon nouvel ami est un maître méga-cool des puces d'ingénierie inverse. Je lui ai écrit juste là. Cependant, il s'est avéré que, bien qu'il soit prêt à aider, il n'avait pas de microscope. Impasse à nouveau.

Quelques mois plus tard, le microscope nécessaire a été trouvé dans un laboratoire voisin! Certes, l'appareil photo intégré était terrible, j'ai pris des photos sur un téléphone portable à travers un oculaire et j'ai reçu des photos de cette qualité:


Fig. 4. La puce sous le microscope

Puis, le dernier nouvel an, un excellent microscope pour 130 000 est apparu à mon travail (je suis spécialiste de la cryptographie quantique). Les rêves deviennent réalité. Enfin, j'ai pu normalement photographier la puce d'en haut.


Fig. 5. Mon microscope de travail

Et puis ... Ensuite, je devais encore maîtriser la technique du polissage moi-même. La difficulté du polissage est de retirer des couches de métal d'une épaisseur de l'ordre de 1 micron - alors que la largeur de la puce est de 1 centimètre. À titre de comparaison, je dirai que c'est à peu près la même chose que de permettre une erreur ne dépassant pas 10 cm par 1 km. J'ai essayé très fort. Les résultats de mon travail sont présentés sur la photo suivante:


Fig. 6. Ingénierie inverse sous microscope optique

La couche inférieure de silicium, la couche supérieure à transistors, les première, deuxième, troisième et quatrième couches de métal sont assez clairement visibles.

La puce consiste à répéter des zones (comme des registres à décalage), et à partir de ces images, il était très pratique de l'analyser: il est immédiatement devenu clair ce qui se passait sur différentes couches. J'ai «inversé» les sections les plus «farcies» avec une abondance de logique, qui ont été répétées plusieurs fois. Mais le plus difficile a été de suivre les pistes le long de la puce entière, de comprendre à quoi correspond un contact externe. Depuis les vacances du Nouvel An jusqu'à fin février, moi, armé d'un nouveau beau microscope, je me suis penché sur cette tâche - je me suis assis au travail jusqu'à dix heures du soir, «inversé», pensais-je. Et puis un nouveau miracle s'est produit: un ami a pu organiser la photographie gratuite de la puce en couches sur un microscope électronique au MIREA. Miettes "photosession" au 1er trimestre cm était 50 Go de photographies en noir et blanc.

Maintenant, toutes ces photographies individuelles devaient en quelque sorte être combinées en une seule image. Presque le même jour, j'ai écrit un programme sur python qui générait un fichier HTML - lorsque je l'ai ouvert dans un navigateur, j'ai obtenu ce dont j'avais besoin. (Soit dit en passant, le 10e Opéra le plus ancien a fait de son mieux, je le recommande!) Ensuite, j'ai écrit un autre programme sur javascript qui vous permet de comparer les calques, de passer en douceur entre eux, de les aligner, de sélectionner l'échelle, etc. Enfin, entre mes mains il y avait tous les outils pour résoudre les principaux problèmes. J'ai suivi les chemins qui ont percé la puce et j'ai restauré toute sa structure jusqu'au dernier transistor.

Une autre photographie d'une tranche de puce prise sous rayons X (dans MIREA):


Fig. 7. Microscopie électronique

Les puits sont visibles là où tombent les sphères avec les lectures. Ci-dessous se trouvent trois couches de métal, et même plus bas - une couche avec des transistors.

La prochaine étape de la lutte pour un avenir meilleur a été la création d'une carte mère pour la puce. Conçu et envoyé un ordre de fabrication. Entre-temps, le tribunal et l'affaire ont utilisé la carte Mars Rover-2 avec FPGA pour travailler avec la puce. (FPGA est, en gros, un tableau de 10 000 éléments logiques universels; en programmant FPGA, nous pouvons obtenir n'importe quelle logique qui peut facilement traiter des flux d'informations gigabits.) J'ai écrit moi-même le firmware pour FPGA, et en plus, j'ai écrit un logiciel pour contrôler dynamiquement le système qui définit toute la configuration du FPGA. Puis une pause d'une demi-année est réapparue (il est parti en voyage d'affaires au lac Baïkal, a préparé une usine dans le laboratoire, qui a été démontrée à Poutine). Mais au final, les stars se sont réunies: j'ai eu le temps, les planches toutes faites sont arrivées - et j'ai assemblé mon système.


Fig. 8. La création du "fer"

Il a donné tous les signaux nécessaires et - oh, un miracle! - J'ai vu un signal de la puce sur l'oscilloscope. (J'ai acheté une fois un oscilloscope pour 6000 roubles sur eBay, 1000 autres valent le firmware pour cela.) Les taches sont clairement visibles sur l'image - des gouttelettes de réactif.


Fig. 9. Le signal de la puce sur l'oscilloscope

Maintenant, j'avais besoin de comprendre comment numériser cette image et la transférer sur un ordinateur. J'ai mis en place cette configuration:


Fig.10. Circuit instrument


Fig. 11. Installation prête

Il y a un ordinateur qui fournit des données de contrôle à la carte avec FPGA. La carte génère des signaux numériques et les envoie à la puce. Le signal de la puce va à l'amplificateur, puis à l'ADC sur la carte, il est numérisé et transmis via le port COM à l'ordinateur. En général, la bande passante du port COM est petite: 15 kilobits par seconde (car il y a de 1 million à 10 millions de «pixels» dans une puce, et la vitesse de transmission maximale est de 115200 bauds). Néanmoins, l'image parvient finalement à l'ordinateur.


Fig. 12. Le signal traité sur l'ordinateur.

La photo ci-dessus montre que lorsqu'une bibliothèque d'ADN est fournie à la puce utilisée, la puce est remplie de manière inégale: sur les bords - dans une moindre mesure. Différentes couleurs sont dues à une tension différente aux bornes des transistors pH. Autrement dit, nous pouvons clairement distinguer les trous où les sphères avec les lectures ont frappé - plus tard, cela nous aidera à contrôler le rinçage de la puce.

En conséquence, la tâche suivante consistait à rincer la puce. Il fallait s'assurer qu'il redevenait comme neuf. Heureusement, j'avais une toute nouvelle puce comme échantillon de référence. Dans la Fig. Et on peut voir que dans la région active, une telle puce est presque de la même couleur (les rayures verticales répétitives ne sont que du bruit, des interférences).


Fig. 13. Rinçage de la puce

Dans la fig. 13 B La puce n'est pas bien lavée - elle est multicolore. Sur la figure 13, D est une puce usagée mais bien lavée. On voit que le dégradé le long des bords a disparu. Néanmoins, il vaudrait la peine de prouver qu'il est vraiment propre et peut être réutilisé.

Étant donné que les bibliothèques d'ADN sont attachées au revêtement de tantale de la puce dans un environnement acide et détachées dans les alcalins (c'est-à-dire à pH élevé), la puce est lavée à l'aide de pipettes semi-automatiques spéciales avec des solutions avec un pH différent. À ce jour, j'ai réussi à réaliser un nettoyage des copeaux presque complet.

Je voulais savoir pourquoi, quand j'ai complètement compris la structure de la puce, je n'ai pas commandé sa fabrication, mais j'ai préféré continuer à chercher et à m'en servir, à bricoler avec leur lavage, etc. Oui, car le développement du microcircuit cela coûte beaucoup d'argent, des millions de dollars, et une partie substantielle de ce montant va au débogage physique du produit résultant: ajustement, réglage de tous les paramètres des transistors, etc. Autrement dit, la simple copie du circuit logique ne suffit pas. Par conséquent, je prends conditionnellement un microcircuit prêt à l'emploi - conçu, fabriqué, débogué - et économise donc beaucoup d'argent, ce qui réduit considérablement le coût du projet.

Ma prochaine tâche consistait à assembler un appareil plus avancé, qui permettrait un transfert plus rapide des informations vers un ordinateur et en même temps ne serait pas composé d'un grand nombre de cartes distinctes.


Fig.14 Développement de la prochaine version de l'appareil

J'ai pris une nouvelle carte mère avec FPGA - sur la même puce, il y avait 2 cœurs ARM avec Linux, il y avait Gigabit Ethernet et d'autres "goodies", mais, contrairement à la version précédente, il n'y avait pas d'ADC. Plus tard, il a conçu une autre carte, avec des ADC à haute vitesse et tous les autres éléments nécessaires. Lancé - tout a fonctionné.

Que reste-t-il à faire pour l'apparence de l'appareil final? Seulement trois choses.

Le premier. Besoin d'Internet gigabit, transfert de données rapide vers un ordinateur. Je l'ai réalisé hier.

Le deuxième. Système d'alimentation en réactifs. La conception d'une vanne spéciale est déjà en cours.

Le troisième. Logiciel de traitement des informations de la puce. J'ai encore des questions avec le logiciel, j'invite donc les programmeurs à collaborer.

Le dernier appareil coûte 10 millions de roubles. Le coût du séquençage est de plusieurs milliers de dollars. Les puces coûtent de 100 $ à 1 000 $ - selon le nombre de "pixels" qu'elles contiennent. (Soit dit en passant, la restauration des puces en elle-même peut être un bon revenu, d'autant plus que seuls quelques clics sont nécessaires pour le rinçage.) Les réactifs sont également achetés, mais à l'avenir, ils seront créés.

En général, tout cela est très intéressant, mais l'essentiel est l'avenir. Aujourd'hui, la biotechnologie occupe la même place dans le progrès scientifique et technologique mondial que la technologie informatique dans les années 80. siècle dernier. De plus, le séquençage est l'un des domaines clés de la biologie et de la médecine modernes. Et, bien sûr, la biotechnologie est très rentable.

Récemment, le séquenceur à semi-conducteurs S5 est apparu sur le marché, et dans un avenir proche, je prévois d'y passer.

Je serai ravi de discuter avec tous ceux qui souhaitent participer d'une manière ou d'une autre au développement de ce projet!
Le projet n'aurait pas été possible sans la formation théorique de Vladimir Zubov . Je lui exprime ma gratitude.
Merci de votre attention!

Source: https://habr.com/ru/post/fr405703/


All Articles