Algorithme de sélection des fonctionnalités pour le test ADN

Dans la recherche scientifique, comme dans toute autre forme d'occupation humaine significative, un plan d'action est important. Il y a des gens qui sont engagés dans la science pure, mais c'est une histoire complètement différente. En ce qui concerne l'application, c'est-à-dire l'utilisation de la méthode scientifique dans la vie quotidienne, une séquence claire d'actions est nécessaire, selon laquelle le convoyeur fonctionnera. Genotek s'occupe de la recherche génétique appliquée, analyse et interprète les données enregistrées dans l'ADN. Notre département de recherche a publié un article sur la façon de choisir les bons gènes et pourquoi les résultats de l'analyse de ces gènes peuvent être fiables. Voici un résumé de la publication.

image

Parfois, dans notre vie, des choses inattendues se produisent (et même des problèmes), mais si nous prenons nos actions de manière responsable, nous pouvons admettre qu'une partie importante de ce qui se passe est une conséquence de nos propres actions, et non une chaîne d'événements aléatoires. En général, c'est une question de confiance en soi. Vous ne pouvez pas vous inquiéter du tout, ne pas douter, ne pas penser à ces choses et faire quelque chose de beau. D'un autre côté, la possibilité de trouver vos propres instructions pour un fonctionnement efficace ouvre de nouvelles possibilités. Tout est très simple: il y a plusieurs choses qu'une personne veut savoir avec certitude.

  • Premièrement: à quelles maladies il est le plus prédisposé. Les maladies liées à l'âge sont une conséquence du mode de vie et non de l'intention de quelqu'un d'autre.
  • Deuxièmement: la santé des enfants. Encore une fois, parler de cela a du sens si nous parlons d'une personne responsable qui planifie consciemment sa famille et qui n'économise pas sur la contraception, en ignorant les conséquences.
  • Troisièmement: que faire pour mieux vivre. Le corps humain est un mécanisme. Et bien que les principes du travail soient les mêmes pour tous, ils peuvent varier légèrement d'un corps à l'autre. Ce qui convient à une personne peut être nocif pour une autre.
  • Quatrièmement: ce qu'est "je". En termes de fonctionnement, connaître son origine n’aidera pas à vivre plus longtemps ou mieux. Au contraire, cela vous fera vous sentir comme un personnage de l'histoire de l'humanité, un héros, agissant et se développant indépendamment des intérêts à court terme ou des convictions personnelles de quelqu'un.

Tout cela peut être appris de l'ADN en lisant certaines sections de gènes. Un gène est un fragment d'ADN sémantique distinct qui code pour un seul caractère dans le cas le plus simple. Soit dit en passant, le mot «phénotype» doit être compris comme la totalité de tous les signes de la condition observée (par exemple, la couleur des yeux, la forme du lobe, la tendance au diabète, la digestibilité du lactose). Et puis la même question se pose comme pendant les années scolaires: qu'est-ce qui doit être lu exactement, est-il possible de ne pas tout lire et comment gérer ce qui a été lu.

Afin de rendre un service médical de masse à partir de la technologie de test ADN pronostique, vous devez faire attention à plusieurs points subtils dans l'analyse des données. Tout d'abord, il s'agit d'un problème de personnalisation: les jetons doivent être sélectionnés avec soin. La plupart des études visant à établir l'association "génotype - phénotype" sont menées sur de grands échantillons. Les échantillons (groupes de personnes analysés), en règle générale, ne sont pas très hétérogènes : ils peuvent être volumineux, mais se composer de représentants d'un groupe ethnique. D'une part, cela simplifie l'analyse statistique dans le cadre de l'étude, et d'autre part, cela pose la question de la pertinence de l'association constatée pour d'autres groupes de personnes.

Le deuxième problème est le nombre de marqueurs - c'est le cas lorsque vous devez trouver un terrain d'entente. Et ici, vous ne pouvez pas vous passer de l'éternel équilibre entre deux paramètres de test: la sensibilité et la spécificité. Une augmentation du nombre de marqueurs génétiques augmente sans aucun doute la sensibilité de l'analyse à certaines maladies. Et en même temps, la spécificité du test peut baisser. Puisqu'il s'agit, par exemple, d'identifier une prédisposition à des maladies graves, une fausse erreur positive dans l'identification d'un diagnostic terrible sera plus dangereuse que de clarifier la probabilité de développer une maladie. De plus, une augmentation du nombre de marqueurs entraîne une augmentation du coût du système de test, ce qui rend également difficile l'entrée sur le marché de masse.

Il n'existe pas de solution universelle à ces problèmes. Au stade initial des travaux, le chercheur est confronté à une situation où "il y a beaucoup d'articles, et ils ont tous besoin d'être lus". Pour cette raison, le département scientifique de Genotek a proposé un algorithme de sélection qui simplifie considérablement la sélection des polymorphismes pour l'analyse des caractères. Il est important que nous parlions de polymorphismes, et non des gènes dans leur ensemble: deux hommes sur chacun des chromosomes X ont le même gène récepteur des androgènes, mais le premier homme a des adénines (AA) au locus rs6152 et le second des guanines (GG). La probabilité que la dernière chevelure à 40 ans reste la même magnifique est d'environ 30% . Dans ce cas, pour comprendre cela, vous n'avez pas besoin de lire toute la séquence du gène - il suffit de trouver et de lire un seul point sur l'ADN, puis de le comparer avec celui opposé.

Que chercher


La génétique appelle les traits caractéristiques que nous adoptons des traits phénotypiques de nos ancêtres. Le problème fondamental de la biologie dans son ensemble est la relation entre le génotype et le phénotype, ainsi que la façon dont l'un code pour l'autre. Dans notre cas, il existe deux points de vue sur l'héritabilité des caractéristiques phénotypiques. D'une part, la nature de l'héritage peut varier. Ainsi, un seul trait peut ne pas être hérité du tout et sa manifestation ne sera en aucun cas liée à la contribution génétique. Ces signes qui surviennent sous l'influence du mode de vie ou des conditions environnementales ne présentent pas d'intérêt pour les développeurs de tests ADN.

D'un autre côté, si un trait est hérité, il est important de comprendre quel type d'interaction génétique sous-tend l'état observé. Dans le cas le plus simple, un seul gène peut affecter le développement de la maladie - alors nous parlons d'hérédité monogénique. Par exemple, la phénylcétonurie est une maladie métabolique qui se développe en relation avec une «dégradation» d'un gène. Dans ce cas, on ne peut pas parler de prédisposition: si une personne a déjà deux copies d'un gène cassé, elle développera quand même une maladie. Cependant, dans une telle situation, le diagnostic génétique peut clarifier le diagnostic afin de sélectionner un traitement plus adéquat.

C'est plus difficile lorsque plusieurs gènes contribuent au caractère phénotypique. Il est important de comprendre comment se produit exactement la formation du trait, qu'il soit polygénique ou multifactoriel. Un trait polygénique se développe à la suite de plusieurs polymorphismes - il n'y a pas non plus de nature probabiliste du développement du trait. Avec une certaine combinaison de polymorphismes, une certaine couleur des yeux d'une personne peut être obtenue de manière fiable. Maintenant, le problème de la prédiction de la couleur des yeux (et d'autres caractéristiques externes) est en médecine légale. Il est résolu à la fois à l'aide de modèles mathématiques et en entraînant des réseaux de neurones sur de grands ensembles de données. Le phénotype multifactoriel, en plus de la base génétique, se développe sous l'influence de certaines conditions environnementales. Ce sont ces signes qui présentent le plus grand intérêt pour l'analyse pronostique médicale, car ce sont des conditions qui peuvent être corrigées à l'aide d'un certain style de vie.

L'algorithme lui-même ressemble à ceci:


image

La première étape consiste à vérifier la présence d'une étude d'association à l'échelle du génome (GWAS). Ce domaine de la recherche génétique a commencé à être activement utilisé avec le développement de la technologie de micropuce. Le but de l'étude est de trouver des différences entre les génomes des personnes avec et sans un certain trait. Les études GWAS se caractérisent par de grands échantillons. Par exemple, environ 300 000 personnes ont participé à GIANT (Genome Investigation of Antropometric Traits - une étude génomique des traits anthropométriques). L'étude a confirmé la grave influence du facteur génétique sur le développement de l'obésité. La probabilité d'observer l'association "génotype - signe" chez les patients et les sujets sains, à condition que l'hypothèse d'association soit incorrecte, est la valeur de p de l'expérience. Si cette valeur de l'étude GWAS est inférieure à 0,01 (ajustée pour la multiplicité), le polymorphisme entre dans la liste restreinte des marqueurs de la maladie. Si elle se situe dans la plage de 0,01 à 0,05, la conformité à l'un des critères d'importance fonctionnelle est requise.

Il n'y a qu'un seul critère: un mécanisme direct ou indirect de l'influence du polymorphisme sur un trait est connu. Si la voie métabolique d'une substance donnée est connue (c'est-à-dire la chaîne de transformations de la substance A en substance X), alors savoir quelles enzymes sont impliquées dans cette chaîne peut indiquer la pertinence de ce polymorphisme. Par exemple, nous connaissons une enzyme qui active l'acide folique pour catalyser la conversion de l'homocystéine en méthionine. La méthionine est un acide aminé essentiel, et avec l'accumulation d'homocystéine, l'endothélium des vaisseaux sanguins peut être endommagé. Autrement dit, nous pouvons parler d'une substitution au locus codant pour le centre actif de l'enzyme comme une raison de la diminution du métabolisme de l'homocystéine. De plus, la présence d'un seul polymorphisme de ce type ne garantit pas le développement de la maladie.

Si la valeur de p de l'association est supérieure à 0,05 selon les résultats du GWAS, une méta-analyse est alors requise. Une méta-analyse est une étude dans laquelle l'identification d'une association a été réalisée en résumant les résultats de nombreuses études. Si dans la méta-analyse l'association «génotype - phénotype» est montrée, le polymorphisme est pris en compte. S'il n'y a pas de données de méta-analyse, le polymorphisme est à nouveau testé par le critère de signification fonctionnelle.

La partie principale du travail étant l'étude des publications, il existe des critères stricts de sélection des articles scientifiques pour la recherche d'associations. Pour les études GWAS de ces critères 3:

  1. taille de l'échantillon - au moins 750 patients dans l'étude initiale;
  2. Valeur p <0,01;
  3. les associations doivent être confirmées dans au moins une étude (non nécessaire pour les maladies rares), et le facteur d'impact de la publication doit être d'au moins 2.

Pour les publications visant à identifier la conformité au critère de signification fonctionnelle, les critères sont les suivants:

  1. les données doivent être obtenues dans l'étude des tissus (biopsie intravitale, matériel d'autopsie, matériel postopératoire) ou des fluides biologiques des participants;
  2. les associations doivent être obtenues expérimentalement dans la publication scientifique en question;
  3. Valeur p <0,05;
  4. la taille des échantillons des participants doit être suffisamment grande pour pouvoir détecter des associations de marqueurs génétiques avec des fréquences d'occurrence spécifiques;
  5. s'il y a plusieurs publications qui ont examiné l'association de ce marqueur génétique avec le risque de développer la maladie, alors pour l'analyse choisissez: a) un plus tard (par exemple, à partir de deux articles en 2009 et 2015 - un article pour 2015); b) une publication dans laquelle l'étude a été menée sur un plus grand nombre d'échantillons.

Les résultats de la méta-analyse, le cas échéant, sont prioritaires. Les exigences de la méta-analyse sont également très élevées: dans la publication elle-même, les sources doivent être soigneusement sélectionnées, parmi lesquelles il faut à la fois confirmer et réfuter l'association du polymorphisme avec un signe. Les sources d'informations et les mots clés utilisés pour la recherche doivent être indiqués, ainsi que la justification des critères d'inclusion et d'exclusion des publications (taille de l'échantillon, articles en anglais uniquement, caractéristiques démographiques des participants, etc.). Une attention particulière est accordée à l'analyse dite de biais de publications individuelles à l'aide d'un graphique en forme d'entonnoir ou d'une analyse de sensibilité. Lorsqu'un marqueur est inclus dans l'analyse, nous nous concentrons sur les populations qui ont participé à l'étude.

Malgré le fait que la technologie elle-même existe depuis longtemps sur le marché, il ne s'agit pas d'une sorte de «pratique courante», selon laquelle des tonnes de manuels sont rédigés. Le pipeline de tests ADN fonctionne, et c'est l'une de ses sections. Nous vous présenterons progressivement chacun de ses fragments.

Source: https://habr.com/ru/post/fr401619/


All Articles