Comment une start-up russe de biotechnologie aide Ă  lutter contre le cancer

Bioinformatique Andrey Afanasyev est l'un des fondateurs de la start-up yRisk biotech. Dans une interview, Andrei a déclaré quelles technologies ils utilisent pour déterminer si une personne a une prédisposition aux formes héréditaires de cancer, comment en sont les biotechnologies en Russie et s'il y a du travail pour les programmeurs en biotechnologie.



Ă€ propos de yRisk


Andrey, vous êtes le fondateur du laboratoire de génétique yRisk, vous recherchez des mutations dans les gènes et une prédisposition à l'oncologie. Dites-moi, s'il vous plaît, comment cela se produit-il dans la pratique?

Nous testons la présence de syndromes tumoraux dits héréditaires, cela se traduit par un risque élevé de développer un cancer au cours de la vie à un âge relativement jeune, même jusqu'à 50 ans.

Comment faisons-nous ce test? Nous prélevons le sang d'une personne dans une veine, comme dans un test sanguin normal, nous extrayons l'ADN de ce sang et analysons l'ADN sur un appareil spécial appelé séquenceur. De nombreuses données sont obtenues à partir du séquenceur, des gigaoctets et même des dizaines de gigaoctets par échantillon. Ensuite, nous les analysons à l'aide d'algorithmes spéciaux, de bases de données, de recommandations pour analyser ces données et générons un rapport de plusieurs pages dans lequel nous indiquons s'il y a des risques accrus par rapport à la moyenne, et que faire avec eux s'il y a des risques.

Dans cette interview, Andrey parle en détail des syndromes tumoraux héréditaires.

Comment tout cela est-il organisé en termes de technologie? Comment traitez-vous ces données? Avez-vous votre propre logiciel?

Nous avions de l'expérience dans l'écriture de tels logiciels dans ma dernière entreprise, au démarrage d'iBinom. Nous avons réalisé un service cloud pour le traitement bioinformatique des données du séquenceur, et nous avons profité de notre expérience pour mettre en œuvre ce traitement par nous-mêmes.

Chez iBinom, nous avons effectué le traitement cloud, utilisé Amazon S3 comme stockage, Amazon Elastic Computing Cloud comme nœuds de calcul. Maintenant, tout fonctionne sur un serveur local, où nous déployons un ensemble de programmes de bioinformatique.

Tout d'abord, la qualité des données d'entrée provenant du séquenceur est analysée. Il existe un programme spécial pour analyser la qualité des données FastQC: avec son aide, diverses statistiques, distributions, etc. sont construites.

Si la qualité est bonne à ce stade, les soi-disant alignements de données sont effectués - alignement, ou mappage, ou mappage. Il n'y a pas de mot russe établi. L'alignement est une tâche difficile du point de vue des calculs, cela prend beaucoup de temps pour chaque échantillon.

Une fois les données mappées, ce que l'on appelle l'appel de variante est effectué à l'aide de divers algorithmes statistiques. Après cela, les options trouvées sont annotées pour toutes les bases de données disponibles.

Après l'annotation, une grande plaque Excel avec options et fonctions est obtenue. Et dans cette grande plaque Excel, nous choisissons déjà les options avec nos yeux, en les analysant selon les critères ACMG (critères de l'American College of Medical Genetics).

Cette analyse ne peut plus être automatisée, il faut aller directement aux publications, les lire. Si l'un y est écrit, alors une coche est mise, si une autre, alors, par exemple, une coche n'est pas mise. Et cela se fait pour chaque échantillon, plusieurs centaines d'enregistrements doivent être visualisés manuellement.

Et ici, l'apprentissage automatique n'aide pas, seulement le travail manuel?

Oui, l'apprentissage automatique ne fonctionne pas ici, car les articles écrits par des personnes sont écrits sous une forme lisible par l'homme et non sous une forme lisible par machine. Nous avons essayé de jouer à l'extraction de données en utilisant des réseaux de neurones, en utilisant différentes approches pour extraire les significations du texte. Nous l'avons fait dans le cadre du laboratoire d'analyse fonctionnelle du génome il y a 3 ans, mais nous avons constaté qu'aucun progrès significatif n'avait été réalisé ici.

En biologie, c'est généralement une histoire assez importante: les données ne sont pas lisibles par machine, et le balisage des données lui-même est très complexe. Vous ne pouvez pas simplement embaucher un groupe de personnes qui disent que voici un chat, et voici un chien, voici un feu de circulation, et voici une transition. Ceci devrait être lu par des personnes qui ont une bonne éducation biologique.

Il y a des tentatives de collecte de bases de données automatisées là-bas, mais en tant que personne qui utilise certaines de ces bases, je peux dire que la qualité y est terrible. Très souvent, les gens, relativement parlant, lisent quelque chose dans l'annotation, l'ont compris d'une manière ou d'une autre et ont écrit, par exemple, que l'option est pathogène, bien que vous alliez au texte de l'article et qu'il soit dit en clair qu'il n'est pas pathogène. C'est exactement le contraire. Par conséquent, les possibilités d'une sorte de traitement informatique s'arrêtent ici, et toutes les informations pertinentes doivent être examinées avec les yeux.

Votre site Web indique que le test est précis à 99,99%, et cela semble vraiment cool. Si ce texte est si efficace, pourquoi ne peut-il pas être fait dans un hôpital ordinaire?

Ce test nécessite du matériel - les séquenceurs, les séquenceurs sont toujours des instruments de recherche, et le test que nous faisons est de la recherche.

Les laboratoires médicaux ne veulent pas jouer avec les appareils de recherche. Il y a plusieurs raisons à cela: à commencer par le fait qu'ils ne peuvent pas recevoir de remboursement de la TVA, se terminant par le fait qu'ils risquent d'être inspectés par Roszdravnadzor pour tout réactif ou dispositif non enregistré comme médical.

Ici, l'histoire est très simple. Ces tests qui sont de nature médicale sont effectués sur de vieux équipements et de vieux réactifs. Les tests qui ne sont pas médicaux ne peuvent pas être commercialisés ou commercialisés d'une manière spécifique. Par exemple, un test non médical ne peut pas être acheté avec l'argent du gouvernement alloué pour les médicaments, ou l'ISV ne peut pas être couvert.

Par conséquent, nous sommes ici au premier plan. Dire que des tests comme le nôtre, basés sur le séquençage d'une nouvelle génération, devraient être rendus médicaux pendant un certain temps, au moins quatre ans. Mais les choses sont toujours là.

Y a-t-il des prévisions quand il sera rendu public?

Je ne pense pas qu'en Russie, il deviendra un jour accessible au public. Un jour, probablement, ce sera le cas, mais pas dans un avenir proche à coup sûr. Notre ministre de la Santé dit que nous avons un système de santé de référence. Nous avons un tas de problèmes plus urgents, par exemple, l'accès de base à de nombreux médicaments. Si vous lisez ce que les gens écrivent des fonds, vous pouvez voir que tout est terrible dans le domaine de la fourniture de médicaments.

Ce test est un problème pour les blancs. Lorsqu'une personne se porte bien, elle a de l'argent et peut recommencer.

Envisagez-vous de développer autre chose?

Nous avons des plans liés à différents produits pour la planification familiale, la gestion de la grossesse. Ici, nous voulons travailler en partenariat avec d'autres cliniques.

Nous avons fabriqué le produit initial lié à l'oncologie, dans l'espoir qu'il soit en demande en Russie, mais en deux ans, nous avons réalisé que la demande était surévaluée, et maintenant nous voulons passer à des produits légèrement différents.

Conférence d'Andrey sur les théories existantes du vieillissement, des animaux à vie longue et extravagants et des produits pharmaceutiques qui peuvent aider l'humanité à faire face au vieillissement

Ă€ propos de la bioinformatique


Que fait la bioinformatique dans le monde aujourd'hui? Quelles sont les tâches les plus appliquées auxquelles ils sont confrontés?

La bioinformatique est généralement appelée personnes qui résolvent certains problèmes informatiques appliqués à la biologie. Autrement dit, les tâches auxquelles la bioinformatique est confrontée sont celles des biologistes.

Les plus belles tâches scientifiques sont des progrès dans la compréhension de l'évolution et dans le développement de la théorie de l'évolution. Parce qu'à partir de ces comparaisons de séquences génomiques, vous pouvez obtenir beaucoup de choses intéressantes sur la façon dont s'est déroulée l'évolution des espèces, sur la détermination de la relation entre certaines espèces et d'autres, sur différentes questions sur l'accumulation de mutations, sur les mutations légèrement nocives, etc. C'est probablement le plus intéressant du point de vue de la science.

Du point de vue des choses appliquées, pour ce que la bioinformatique est maintenant utilisée, c'est pour l'analyse des séquences génomiques. L'analyse des séquences génomiques est la tâche des maladies héréditaires ou du cancer. Les données des génomes des personnes souffrant de maladies héréditaires sont analysées afin d'établir un diagnostic, d'élaborer un traitement, de comprendre à quelle fréquence cela se produit. C'est une tâche.

La deuxième tâche est oncologique. Les données des génomes tumoraux sont analysées afin de comprendre quelles sont les mutations du conducteur, quelles mutations passagers, quelles mutations peuvent être utilisées pour développer une nouvelle thérapie, comment la tumeur évolue et quelle variété de tumeurs se produit.

La troisième chose, c'est la génomique des populations. C'est une tentative de comprendre comment nous sommes génétiquement différents, quelles sont les caractéristiques des différentes populations et quoi faire avec tout cela.

Quelle découverte récente en bioinformatique vous a particulièrement impressionné?

Il est difficile de parler de la découverte en bioinformatique, car elle est le plus souvent à portée de main. Je dirai une chose plus proche de la réalité, car il est peu probable que les choses scientifiques soient très intéressantes.

Il y a eu un travail intéressant de Snyder sur l'analyse bioinformatique du microbiome de son corps pendant un an. Presque tous les jours, il a mesuré l'évolution de son microbiome et publié des données sur cette dispersion. Cela a changé tout au long de l'année assez fortement.

Depuis lors, on peut s'attendre à des données sur le microbiome de la population. Il est très intéressant de voir comment différents microbiomes diffèrent pour différentes personnes au cours de l'année, mais entre eux, en fonction de leur lieu de résidence, de leur mode de vie, etc.

Comment se développent les biotechnologies en Russie?

À ce sujet, je ne peux que bien parler ou de quelque manière que ce soit :) Dans un sens large, quelque chose se passe en Russie. Sur le plan médical, bien sûr, quelque chose se passe aussi, mais il est incomparablement plus petit et plus lent que ce qui se passe aux États-Unis. Pourquoi? Soyons honnêtes, car la médecine russe est petite et arriérée.

Nous n'avons pratiquement aucun développement de nos propres médicaments. Le maximum que nous faisons est générique et biosimilaire. Presque tous les médicaments originaux du développement russe sont la fuflomycine, qui n'a pas de preuves d'efficacité confirmées normales. Bien sûr, tout est assez triste ici.

Nous, en tant que marché médical isolé, sommes très petits, nous n'avons aucun motif particulier ici. Néanmoins, nous avons plusieurs entreprises intéressantes à la jonction de l'informatique et de la biotechnologie. Pourquoi sont-ils là? Parce que nous avons de nombreux bons informaticiens, et les informaticiens se battent pour la biotechnologie. Et quand ils comprennent que le prochain Uber pour les dentistes pour une raison quelconque ne décolle pas en Russie ou le prochain dossier médical électronique, ils ont parfois de meilleures idées.

J'aime vraiment l'UNIM. Ils ont fait une chose assez simple: ils ont numérisé l'histologie. Tous les diagnostics de cancer sont confirmés par examen histologique. L'examen histologique consiste à prélever des cellules, à les colorer d'une manière spéciale et à les examiner au microscope. L'UNIM a numérisé ces images microscopiques en haute résolution, avec zoom et stockage cloud.

Et maintenant, la section histologique n'est pas examinée au microscope, mais sur un écran d'ordinateur, et non pas un médecin, mais trois. Et pas seulement un médecin qui a reçu un certificat médical, mais qui a également suivi une formation interne à l'UNIM et réussi des examens, quel que soit l'État. Tout cela augmente considérablement la précision du diagnostic.

Ce n'est pas une chose très difficile du point de vue de la technologie, mais les avantages sont puissants et cool. Bien que le stockage de grandes images soit également assez difficile, il n'y a pas de merveille pour l'apprentissage automatique ici.

Pouvez-vous donner d'autres exemples de projets biotechnologiques russes que vous aimez?

J'aime ce que font les gars d'Atlas. Ils font des tests génétiques. Leur idée initiale est de créer une clinique privée dans laquelle les décisions seront également basées sur les données des tests génétiques. Au début, ils ont trouvé la mauvaise technologie pour les tests génétiques, ont fait des tests de micropuces - à partir de ces données, peu d'informations médicales peuvent être obtenues.

Ils ont récemment annoncé qu'ils fabriquaient le produit Complete Genome, cher, mais des informations plus pertinentes sur le plan médical peuvent être obtenues à partir de ce produit. J'aime la façon dont ils font le service client, les choses visuelles. Beau, solide, cool.

En règle générale, les produits numériques en médecine en Russie ne sont pas technologiques, banaux, simples. Stanislav Sazhin a un bon vieux réseau social pour les médecins. C'est une histoire claire, car les sociétés pharmaceutiques ne peuvent pas annoncer des médicaments sur ordonnance comme ça sur Internet, et elles ne peuvent faire de la publicité qu'aux médecins. Et vous créez ici un réseau social dans lequel seul un médecin peut s'inscrire, en joignant une copie de votre diplôme. Et là, vous pouvez déformer la publicité des sociétés pharmaceutiques. Et il se porte bien. Sur le plan commercial, c'est probablement l'une des entreprises les plus performantes en médecine numérique. Mais ce n'est pas à couper le souffle quand on en parle.

Ou Zoon service - un marché pour les services médicaux. Histoire numérique normale: les laboratoires et les cliniques affichent leurs descriptions, etc. Cela aide à générer des prospects, mais encore une fois, ce n'est pas à couper le souffle.

Une conférence détaillée sur ce que les entreprises de bioinformatique existent maintenant en Russie et dans le monde

Parlons de la deuxième partie du mot «bioinformatique». Quel travail pour les programmeurs en biotechnologie? Et y en a-t-il?

Bien sûr. Après tout, quelqu'un doit construire l'infrastructure pour exécuter tous nos logiciels de bioinformatique. Quelqu'un a besoin d'écrire un nouveau logiciel de bioinformatique.

Il existe plusieurs approches. Le premier: prendre un biologiste et lui apprendre à programmer, le second: prendre l'informatique et lui enseigner la biologie. Eh bien et le troisième: prendre la personne et l'étudier et la biologie et la programmation. Ici, l'histoire est telle que si vous prenez un biologiste et lui apprenez à programmer, un résultat normal n'est pas toujours obtenu. Si vous prenez un programmeur et apprenez la biologie, vous lui apprenez en fait l'analyse des données et il se rend rapidement à la science des données dans un endroit très rémunérateur.

Je dois dire honnêtement qu'il n'y a pas un tel niveau de salaire qu'en informatique. Partout, il y aura des salaires plus bas. Et en bioinformatique aussi, les salaires sont inférieurs à ceux de l'analyse de données numériques. Et cela, bien sûr, est un problème, car beaucoup de gens, un groupe de mes amis en bioinformatique ont travaillé, se sont assurés d'avoir quelques sous et sont retournés à l'informatique. Ici, la compétition n'est pas maintenue. Les gens y vont généralement pour des raisons idéologiques, mais pendant longtemps ils ne font pas éclore ces considérations idéologiques.

Si un développeur a décidé qu'il voulait également aider dans la lutte contre le cancer, que faire, où aller? Ou aller nulle part?

Eh bien, il peut travailler sur la reconnaissance d'image, travailler sur l'analyse des données, acquérir des compétences et une expérience intéressantes. Il n'y a pas de grandes entreprises ici, donc ce sera toujours une sorte de démarrage. Si vous êtes fatigué ou que le salaire semble faible, vous pouvez toujours revenir en arrière.

Ă€ propos de la vulgarisation de la science


Vous êtes l'un des vulgarisateurs de la bioinformatique. Comment et pourquoi as-tu commencé à faire ça?

J'ai commencé à faire ça parce que j'aime ça. J'aime parler, j'aime parler, parler avec le public, transmettre certaines de mes idées. Je suis content, alors je le fais.

J'ai commencé avec Science Slam en 2014, les gars m'ont invité à parler et ont dit qu'après cela, votre vie allait changer et ne serait plus la même qu'auparavant. Ne vous laissez pas berner :)

Ils sont géniaux, ce qui donne aux locuteurs novices d'être immédiatement dans la classe la plus conviviale et chaleureuse. Ça touche, et après ça je veux continuer à parler.

La même performance sur Science Slam, qui a commencé l'amour de vulgariser la science

Pensez-vous que l'intérêt pour ce sujet augmente?

Je pense que oui. Les choses liées à la formation et au divertissement - elles, bien sûr, sont en augmentation. Cela se remarque à la fois dans le nombre de cours que mes amis et moi suivons, dans le nombre de conférences qui existent et dans le nombre de personnes qui m'appellent pour parler.

Quand cela a commencé, il me semblait que c'était une sorte de sujet ringard, et maintenant je vois que c'est le courant dominant le plus complet. Les gens aiment faire le tour et poser des questions. J'aime moi-même apprendre par la communication avec les gens, j'aime aussi lire des livres, mais il vaut mieux entrer rapidement un sujet dans une sorte de contact humain. Et je suis très heureux que tout cela se développe.

Lentement, on peut même dire le marché scientifique. Cela cesse d'être une activité pour les étudiants diplômés pendant leur temps libre.

Souvent, vous ne jouez pas Ă  Moscou?

Bien sûr! Je parle constamment et avec grand plaisir dans différentes villes. Cette année seulement, j'ai joué à Nijni Novgorod, Tver, Iekaterinbourg, Krasnoïarsk, Saint-Pétersbourg, Novossibirsk, dans la ville de Plyos. Au cours des dernières années, c'est aussi Mourmansk, Tcheliabinsk, Tyumen, Bratsk, Sayanogorsk, Vladivostok.

Comment va la vulgarisation dans les régions?

Dans les régions, tout va bien. J'ai un ami, Misha Kaptyug, il réalise le projet «Smart Cities», il a maintenant une couverture - environ la moitié de toutes les régions. Il s'agit d'un spectacle scientifique pour les enfants, mais en fait pour toute la famille. Et tout va bien avec eux.

Autrement dit, ce sujet est loin d'être uniquement Moscou, ce sujet se déplace dans les régions, et se déplace de côtés complètement différents. Je collabore souvent avec mes centres d'information sur l'énergie atomique préférés - ICAE, il s'agit d'un projet Rosatom sur la vulgarisation de la science. Autrement dit, il ne s'agit pas de populariser l'atome et les réalisations des scientifiques atomiques, ils appellent tout le monde, organisent des festivals scientifiques et, en passant, montrent que la Rosatom Corporation est pour le bien. C'est, à mon avis, l'un des bons exemples de projet d'entreprise.

Eh bien, dans de nombreuses villes, il y a des gens du pays qui organisent et promeuvent tout cela. Par exemple, une communauté très cool à Tver, ils ont même commencé à publier un magazine. À Iekaterinbourg, il y a un magnifique centre Eltsine, dans lequel de nombreux événements ont lieu, et toute la réunion scientifique s'y rend également.

En général, il y a une demande, il y a une demande pour moi en tant que professeur, et je suis très heureux qu'il y ait un certain mouvement dans toutes les régions.

Le 24 janvier, Andrei interviendra lors d'une conférence sur la relation entre l'informatique et la science Mieloconf . Andrei vous dira ce que vous pouvez réellement apprendre d'un test génétique et à quoi ressemble le travail avec les données en génétique.

Venez faire connaissance!

Source: https://habr.com/ru/post/fr481894/


All Articles