Qu'est-ce que le génome complet et pourquoi est-il nécessaire

Atlas a lancé un nouveau produit - Le génome complet . Maintenant, nous pouvons étudier non seulement des points individuels dans le génome, comme dans le test génétique, mais également lire la séquence entière des nucléotides du génome. Dans cet article, nous expliquons ce que c'est et pourquoi cela est nécessaire.

Attention! Nous remettrons le génome complet à l'un de nos lecteurs qui accomplira toutes les tâches. Plus de détails à la fin de l'article.

Génome complet


Que signifie le génome complet?


Pour traiter du génome complet ou du séquençage du génome entier (WGS), nous vous parlerons d'abord brièvement de la technologie d'un test génétique conventionnel.

Microchip et test génétique de routine


Le test génétique Atlas, comme de nombreux tests similaires, est effectué à l'aide d'une puce à ADN (puce à ADN, Beadchip). La surface de la puce à ADN contient de nombreuses petites dépressions (environ 700 000), chacune contenant une boule de silicium d'un diamètre d'environ 3 micromètres. A la surface de cette boule se trouvent des centaines de milliers de courtes séquences d'ADN simple brin identiques cousues avec elle, correspondant à la partie du génome humain située à côté de la variation étudiée (SNP, SNV). Chaque balle correspond à une seule variation génétique, et les coordonnées des trous sur la puce pour chaque balle sont connues (figure 2D).

Bloc pédagogique 1
Snip ou SNV (Single Nucleotide Varition) est une variation génétique, c'est-à-dire un changement dans la séquence d'ADN dans un seul nucléotide. Par exemple, l'un des trois nucléotides (allèles) A, G ou T peut exister à une certaine position dans le gène X, et les nucléotides sont identiques chez différentes personnes dans le reste de la séquence (figure 1). De cette seule lettre, une caractéristique spécifique d'une personne peut dépendre.


Figure 1 Image de Rentonorama

Par exemple, le polymorphisme rs4481887, qui est situé sur le premier chromosome à côté du gène du récepteur olfactif OR2M7, a trois allèles: A, G et T.La présence de l'allèle A sur un ou les deux chromosomes (génotypes A / G, A / T et A / A) détermine la sensibilité aux odeurs d'urine après avoir consommé des asperges. En l'absence de l'allèle A, une personne ne réalisera même pas qu'après avoir mangé des asperges dans l'urine, une substance ayant une odeur caractéristique est libérée.

Indel ou INDEL (Insertion / Deletion) est un autre type de variation génétique qui implique l'élimination ou l'insertion d'un ou plusieurs nucléotides. Snips et indels ensemble, avec des changements structurels possibles: de grandes suppressions, insertions, translocations, inversions, sont la différence réelle dans le génome de différentes personnes.


Lors de la réussite du test génétique Atlas, l'ADN génomique et mitochondrial sont isolés de la salive, augmenter le nombre de copies (amplifier) ​​et fragment - coupé en petits segments (figure 2A). De nombreux fragments d'ADN humain simple brin sont connectés avec leurs séquences correspondantes sur des billes de silicium (figure 2B), après quoi ces séquences sont prolongées par 1 nucléotide fluorescent artificiel (figure 2C). Différents nucléotides brillent de différentes couleurs: rouge et vert. Par le rapport des intensités lumineuses de chaque couleur (figure 2E), on peut déterminer le génotype qui correspond à la boule.


Figure 2

Après avoir scanné la puce entière, nous obtenons environ 700 000 génotypes de variations et les passons par notre système d'interprétation. Souvent, les utilisateurs essaient de comparer les résultats de différents tests, mais remarquent une forte différence. Cela se produit pour plusieurs raisons. Premièrement, différentes sociétés utilisent différentes versions de puces et jeux SNV. En conséquence, sur certaines puces, il existe des ensembles de variations uniques qui ne peuvent pas être trouvés sur d'autres puces. Deuxièmement, il existe toujours une erreur de génotypage, qui peut se produire pour diverses raisons, bien qu'elle contribue le moins à la différence de résultats. Les données de recherche montrent que la précision du génotypage sur des puces à ADN qu'Atlas utilise est supérieure à 99,5%. Mais la principale raison des différences dans les résultats des tests génétiques d'interprétation est que différentes sociétés font les choses différemment même pour les mêmes données de génotypage initiales.


Qu'est-ce que le séquençage du génome?


La principale différence entre le séquençage du génome et le génotypage sur microarrays est la technologie et le traitement des données obtenues. Avec le séquençage à l'échelle du génome, la quasi-totalité de la séquence d'ADN est déterminée. Presque - parce qu'il y a des sections dans le génome qui, pour diverses raisons, ne peuvent pas être lues. Ce sont souvent des sites de télomères et de centromères - des extrémités et du centre des chromosomes. Afin de déterminer les séquences de ces régions du génome, des technologies hautement spécialisées inaccessibles sont utilisées. Ces études sont principalement des recherches dans la nature.

La détermination de la séquence d'ADN vous permet de connaître les génotypes de variations n'importe où dans le génome, y compris les variations étudiées sur la puce à ADN dans le test génétique Atlas. La technologie NGS (Next Generation Sequencing) est utilisée pour déterminer rapidement et efficacement la séquence du génome. Il existe plusieurs méthodes fondamentalement différentes créées par différentes entreprises.

L'essence de la méthode Atlas est la suivante: l'ADN extrait et purifié est amplifié plusieurs fois et fragmenté à une certaine longueur. Pour chaque fragment, des séquences spéciales sont cousues qui vous permettent de contrôler ce fragment. Ce sont ces fragments traités qui sont lus (figure 3).


Figure 3 Processus de séquençage étape par étape: chaque nucléotide suivant émet une fluorescence dans son canal de couleur unique.

À chaque étape, une extension d'un nucléotide se produit, à laquelle une sonde fluorescente est associée. Chacun des quatre nucléotides est associé à une sonde d'une couleur spécifique. Ainsi, étape par étape, par la couleur de la lueur, on peut déterminer l'ordre des nucléotides dans le fragment étudié. Les séquences résultantes de chaque fragment sont appelées lectures et produisent environ 1 milliard pour chaque échantillon de l'ADN étudié. Les lectures et les métriques de qualité de lecture sont stockées au format texte FASTQ.

Ensuite, les lectures sont alignées (cartographiées) sur le génome de référence. En utilisant un logiciel spécial, par exemple l'aligneur Burrows-Wheeler, pour chaque lecture, une place est recherchée sur le génome de référence auquel elle correspond. La lecture ainsi que des informations sur la position dans le génome sont enregistrées dans un format de fichier SAM ou BAM. La visualisation des gènes cartographiés sur le génome dans le fichier SAM (BAM) à l'aide du navigateur génomique IGV est illustrée à la figure 4.


Figure 4 Visualisation du fichier BAM dans le programme IGV (site chromosomique pour une personne). Les lectures mappées sont indiquées par des blocs horizontaux, la position est indiquée sur la piste ci-dessus.

La figure montre également quelle est la profondeur de la couverture lorsque plusieurs lectures alignées couvrent n'importe quelle position dans le génome de référence. La valeur est moyennée dans tout le génome et est utilisée comme indicateur de la qualité de l'étude. Atlas garantit une couverture génomique moyenne de profondeurs supérieures à 30, ce qui garantit un génotypage de haute qualité. L'augmentation de la profondeur de lecture augmente considérablement le coût du séquençage, la précision de la détermination des variations génétiques et est utilisée dans des études oncologiques étroites, par exemple, dans l'Atlas of Oncology Diagnostics.

Bloc pédagogique 2
Un génome de référence est une séquence d'ADN assemblé artificiellement d'une espèce biologique. La plupart des séquences à partir desquelles le génome humain de référence a été assemblé ont été prélevées sur une personne d'origine afro-européenne. Le génome de référence est régulièrement mis à jour: la dernière version, GRCh38, est sortie en 2013 et contient 3,3 milliards de nucléotides. Malgré la disponibilité de la nouvelle version, de nombreux tests génétiques et services d'analyse des données génétiques utilisent le précédent - GRCh37. Atlas utilise la version GRCh38 pour fournir les résultats d'analyse les plus précis.


Les fichiers obtenus après la cartographie (fichiers SAM, carte d'alignement de séquençage, ou sous forme binaire BAM - carte d'alignement binaire) sont filtrés et utilisés pour rechercher des variations dans le génome, y compris à la fois des variations d'un seul nucléotide et de courtes insertions et suppressions. La figure 5 montre la présence de la variante nucléotidique unique sur le chromosome 1 à la position 248333561 (l'exemple ci-dessus rs4481887 est la variante qui détermine la sensibilité à l'odeur d'urine après avoir mangé des asperges).


Figure 5 Visualisation d'un fichier BAM dans un programme IGV. Tracé du chromosome 1. À la position 248333561 se trouve le polymorphisme rs4481887: le nucléotide à cette position ne correspond pas au génome de référence et est mis en évidence en couleur. Dans toutes les lectures qui couvrent cette partie du génome, il y a un nucléoïde G, qui indique l'homozygotie du génotype. Une personne avec ces résultats de séquençage aura un génotype G / G et une insensibilité à l'odeur d'urine après avoir mangé des asperges.

Les variations génétiques trouvées sont stockées dans un fichier VCF (format d'appel variant). Il contient des allèles détectés pour chaque position du génome, ainsi que des indicateurs de la qualité du génotypage. Le fichier VCF est filtré: les enregistrements sur la présence / absence de variations qui ne correspondent pas aux seuils de qualité et qui sont potentiellement faux en sont supprimés. Chaque variation trouvée se voit attribuer des données de dbSNP connues de lui, en particulier, des identifiants uniques rsID.

Vous pouvez vous familiariser avec les spécificités des formats de stockage des données de séquençage et de génotypage via les liens suivants:
FASTQ - maq.sourceforge.net
SAM - samtools.imtqy.com
VCF - samtools.imtqy.com

Pour la visualisation de la cartographie des lectures (fichiers SAM ou BAM), divers logiciels sont utilisés. Le plus populaire est IGV (Integrative Genomics Viewer de Broad Institute). Téléchargez IGV et familiarisez-vous avec le lien .


Quelles données l'Atlas interprète-t-il?


Le génome complet contient des données sur les variantes des gènes qui sont dans le test génétique Atlas, ainsi que sur les caractéristiques qui ne peuvent pas être calculées à l'aide de la technologie de génotypage utilisant des puces à ADN. Par exemple, ces symptômes incluent les risques de cancer.

La santé


383 maladies héréditaires
Le principal objectif de tous les tests Atlas est la section santé, et notre nouveau test de génome complet n'a pas fait exception. Aux symptômes de notre test principal, nous avons ajouté 65 autres maladies héréditaires.

Les maladies héréditaires ou monogéniques comprennent les maladies qui sont transmises des parents aux enfants et dont le développement n'est pas affecté par le mode de vie d'une personne. Pour le développement d'une telle maladie, les mutations d'un ou des deux parents sont suffisantes, selon le type de transmission de la maladie.



21 Maladie multifactorielle
Le développement de maladies multifactorielles est influencé par les gènes, le mode de vie et les facteurs environnementaux. De telles maladies comprennent, par exemple, le diabète sucré, l'obésité, la maladie de Parkinson et la maladie d'Alzheimer, la dermatite atopique. Dans votre compte personnel, l'utilisateur peut calculer le risque relatif de développer la maladie sur la base de données de test et d'un questionnaire sur le mode de vie.

6 autres symptômes liés à la santé
Ici, nous avons collecté des signes qui affectent le mode de vie d'une personne. Par exemple, durée du sommeil, chronotype, syndrome de fatigue chronique, peur de la douleur.



Génétique clinique


43 Risques de cancer
Étant donné que plus de variantes de gènes sont étudiées dans le génome complet, nous obtenons plus de données et pouvons évaluer les risques de développer un cancer. Selon les résultats des tests, nous évaluons la prédisposition aux syndromes héréditaires du cancer.

Les syndromes oncologiques héréditaires sont des maladies génétiques qui peuvent être transmises dans une famille de génération en génération et augmentent les risques de certains types de cancer. Environ 10% des cas d'oncologie sont héréditaires.

La recherche de syndromes héréditaires de cancer est utile principalement pour ceux qui ont eu des cas de cancer dans la famille. Le caractère héréditaire peut être indiqué par l'âge précoce d'apparition de la maladie (jusqu'à 50 ans), la présence de plusieurs proches dans la même lignée avec le même diagnostic, des formes rares de cancer. Sur la base des résultats des tests, le médecin déterminera le volume de recherches supplémentaires et élaborera un programme personnel de gestion des risques de cancer. Découvrez comment les tumeurs malignes se développent dans notre série d'articles.



53 Indications de sensibilité aux composants actifs du médicament
Chaque personne réagit différemment aux médicaments: dans certains cas, le médicament fonctionne bien, d'autres souffrent d'effets secondaires graves et dans d'autres, le traitement est inefficace. Dans certains cas, cela est dû au travail des gènes qui affectent le métabolisme des substances actives et les risques de réactions indésirables.

Par exemple, le médicament Omeprazole réduit la sécrétion d'acide chlorhydrique dans l'estomac. Utilisé dans le traitement de l'ulcère gastro-duodénal et du duodénum, ​​la maladie de reflux. Le gène CYP2C19 code pour une enzyme responsable du métabolisme de l'oméprazole. Par conséquent, selon les variantes du gène, il est nécessaire d'ajuster la dose d'oméprazole ou d'utiliser un autre médicament.

Dans le test, nous examinons les variantes génétiques associées au métabolisme de 53 médicaments. Parmi eux figurent des antidépresseurs, des contraceptifs hormonaux, un médicament pour réduire la coagulation sanguine et quelques autres.



Rapport spécialisé sur les maladies héréditaires
Le rapport est la conclusion du Laboratoire de bioinformatique clinique Fedor Konovalov. Les laboratoires de bioinformatique sont à la recherche de porteurs de maladies récessives. Un tel portage n'affecte souvent pas la santé d'une personne, mais il peut entraîner des maladies chez ses enfants à naître. En outre, le laboratoire peut identifier une mutation unique qui n'a pas été décrite précédemment et donner une conclusion à ce sujet si elle est probablement pathogène.

Les experts effectuent une analyse approfondie des informations scientifiques pertinentes sur les mutations et les maladies dans chaque cas. La conclusion contient toutes les informations nécessaires pour le généticien. Avec ce rapport, vous pouvez contacter un spécialiste en cas de besoin.

De tels rapports génétiques sont similaires à un document juridique avec une abondance de termes complexes, que seul un spécialiste peut correctement évaluer, dans notre cas, un généticien. Par conséquent, nous ne montrons pas la génétique clinique avant la consultation. Au cours de la réunion, le généticien vous explique en détail à quoi vous devez faire attention, en tenant compte de vos antécédents familiaux et de la présence de symptômes. Cela peut aider, par exemple, à clarifier l'âge auquel commence le dépistage de certaines maladies ou lors de la planification d'une famille.

La nutrition


28 Rapports
Selon les tests génétiques et même le génome complet, il est impossible de sélectionner la nutrition optimale et de faire un régime. Il y a tellement de produits, de méthodes de cuisson et de plats qu'il est difficile pour les chercheurs de trouver des corrélations avec les variantes des gènes. Cependant, certaines données sont toujours là.

À partir de certaines variantes de gènes, nous pouvons savoir si une personne a une prédisposition à l'intolérance au lactose ou au gluten, rapidement ou lentement le corps fait face à l'alcool ou à la caféine, et également évaluer la prédisposition à un certain niveau d'acides gras en fer, calcium, oméga-3 et 6. Selon ces données, une personne peut décider quels produits elle doit retirer ou vice versa ajouter à son alimentation.

Le sport


16 Rapports
Déterminer le sport qui vous convient le mieux génétiquement est aussi difficile que de prendre de la nourriture. Il existe de nombreux types d'activité physique et le concept de sport s'élargit chaque année. Le skateboard et le surf ont donc été ajoutés au programme des sports olympiques. Il existe trop de types d'activité physique pour être plus génétiquement déterminés. Par conséquent, ne croyez pas aux tests génétiques qui promettent de trouver le sport le plus adapté pour vous. Choisissez le sport que vous aimez.

La communauté des sciences génétiques craint que les parents effectuent des tests génétiques pour leurs enfants afin de découvrir quel sport leur convient le mieux. Dans ce cas, l'enfant peut être envoyé dans un groupe qu'il n'aime pas, mais qui convient selon les résultats du test. Si une personne veut obtenir des résultats exceptionnels dans le sport, le succès dépendra en grande partie de ses ambitions, de sa volonté et de son caractère. Les variantes génétiques jouent ici un rôle moins important.

En utilisant un test génétique, vous pouvez découvrir comment les gènes affectent les risques de blessures sportives, la quantité de facteur de croissance insulino-1 libre, le niveau de globules rouges, l'érythropoïétine, ainsi que les caractéristiques du métabolisme des acides aminés - valine, leucine et L-carnitine. Aux résultats du génome complet, nous avons également ajouté le risque de névralgie sciatique, le niveau d'IGFBP-3, le volume expiratoire et autres.

Autres symptômes


15 Rapports
Dans cette section, nous avons collecté des signes liés aux caractéristiques du corps: apparence, perception de la lumière, sensibilité aux herbes et aux odeurs. Dans notre test, vous ne trouverez pas de signes liés aux émotions, au comportement ou au caractère. Fondamentalement, ces traits dépendent des caractéristiques de l'éducation, de l'environnement et des habitudes et, dans une moindre mesure, ils sont affectés par des variantes génétiques. De plus, de nombreuses qualités personnelles peuvent être modifiées ou développées à l'âge adulte.

Origine


3 rapports
La génétique n'utilise pas le concept d'appartenance ethnique ou de nationalité. Dans une plus large mesure, ils sont dus à des différences culturelles et non à des variantes génétiques différentes. Au lieu de cela, la génétique utilise le concept d'une population - un groupe de personnes qui vivent sur le même territoire depuis longtemps. Aujourd'hui, les données génomiques de certaines populations sont disponibles, dont les scientifiques ont identifié des séquences et des variantes de gènes caractéristiques de chacune. Les études génétiques d'origine sont la recherche de telles variantes dans le génome et la détermination de la similitude génétique avec les populations connues en termes de pourcentage.

En plus de la composition de la population par le code génétique, vous pouvez connaître votre haplogroupe. Un haplogroupe est un groupe de personnes avec la même variante de gène qui s'est produite chez un ancêtre commun il y a des milliers d'années. En outre, le pourcentage d'ADN de Néandertal peut être déterminé à partir du génome. Environ 1 à 4% de l'ADN néandertalien a été trouvé dans le génome des humains modernes. Maintenant, seuls quelques signes sont connus qui dépendent de la disponibilité des variantes du gène de Néandertal - la croissance des cheveux en arrière et le niveau de lipoprotéines LDL de faible densité (mauvais cholestérol).


Comparaison du test génétique complet du génome et de l'atlas


Pourquoi le génome complet?


Le principal avantage du génome complet est que vous obtenez toutes les informations sur votre ADN. Lorsque de nouvelles données apparaissent, nous les ajoutons simplement à votre compte. Il ne fonctionne pas toujours avec le test génétique habituel, car il examine environ 660 000 variantes - 0,1% de tout l'ADN.Pour interpréter les nouveaux signes, ils peuvent ne pas suffire.

Les résultats des tests aideront à prendre des mesures pour la prévention des maladies, la planification familiale et le médecin pourra clarifier le diagnostic à l'avenir ou maintenant. Le test sera livré à votre domicile et tout ce qui est requis de l'utilisateur est de prélever un échantillon de salive et d'appeler un service de messagerie pour transférer le tube à essai au laboratoire.

Les bases de l'Atlas Complete Genome: analyse génétique de haute précision (99,5%), contrôle qualité des données obtenues, système d'interprétation des données breveté, accès aux données sources, conseil génétique, ainsi que des articles scientifiques sélectionnés accessibles à chaque utilisateur. L'utilisateur reçoit tout cela pour 94 500 - le prix le plus bas pour des services similaires en Russie. Le test peut déjà être acheté sur le site Web d' Atlas .

Si vous savez travailler avec les mégadonnées, et en particulier la bioinformatique, vos données brutes du génome complet peuvent être de la pâte à modeler, avec laquelle vous pouvez jouer à votre guise et en savoir plus sur vous-même. Par exemple, vous pouvez éliminer les variantes de gènes que d'autres sociétés étudient et charger des interprétations dans leur base de données, découvrir la relation avec une autre personne, prendre l'ADN de référence d'un chimpanzé ou de Néandertal et comparer votre similitude.

Et aussi


Atlas a préparé un excellent cadeau pour les lecteurs Habr! Dans les articles suivants, nous donnerons 3 tâches avec des exemples et des données d'entrée, ainsi que des informations sur le logiciel nécessaire. Le premier à résoudre tous les problèmes - recevra le génome complet en cadeau !

Source: https://habr.com/ru/post/fr479602/


All Articles