Sous-marin informatique dans les steppes de la biologie

La bioinformatique gagne rapidement en popularité et se transforme d'un refuge pour les geeks en une discipline bien connue. Je pense que la plupart des lecteurs de Geektimes peuvent affirmer avec confiance qu'un lapin est non seulement une fourrure précieuse et 3-4 kilogrammes de viande diététique, mais aussi 44 chromosomes, une grande variété de protéines, des mécanismes de transcription et de traduction, et rien d'autre. Je suis également peu susceptible de surprendre qui que ce soit si je dis que tout cela peut être étudié et analysé, non seulement debout dans une blouse blanche sous un microscope dans un laboratoire stérile, mais aussi allongé sur un canapé avec un ordinateur portable, buvant quelque chose d'écossais avec de la glace. Cependant, ils ne dépassent généralement pas ces connaissances. J'ai décidé d'essayer de corriger ce malentendu gênant et de faire une courte excursion sur la façon dont la bioinformatique regarde de l'intérieur d'un point de vue pratiquebasé sur mon expérience.

Dans cet article, je vais rassembler les questions que j'ai moi-même posées il y a trois ans, alors que j'étais encore étudiant à la Faculté de Mathématiques, et j'essaierai d'y répondre.



Pourquoi la bioinformatique est-elle nécessaire?


La tâche de la bioinformatique, de manière informelle, est de trouver la logique dans les données biologiques. Ces données sont obtenues lors d'expériences, et si pour le biologiste les données peuvent ressembler à un poisson lumineux ou à une belle tache multicolore sur la photo, alors pour la bioinformatique les données sont présentées comme:

  • chaînes (séquences de caractères décrivant l'ADN / ARN / protéines);
  • coordonnées tridimensionnelles et bidimensionnelles (données de microscopie);
  • des tableaux de nombres réels (par exemple, chaque nombre peut être une masse mesurée expérimentalement d'une protéine ou d'une partie de celle-ci);
  • vecteurs d'entiers non négatifs (par exemple, la profondeur de couverture avec des objets discrets, les soi-disant lectures );
  • matrices de zéros et de uns (par exemple, différents types de bactéries peuvent-ils s'entendre);

Et bien d'autres représentations possibles de phénomènes biologiques réels à l'aide d'objets mathématiques.

Les biologistes ont-ils des données plus intéressantes?


Sans aucun doute. Mais la bioinformatique n'a pas besoin de courir au laboratoire le week-end (les cultures cellulaires, par exemple, ne connaissent pas le week-end et ont tendance à mourir sans précaution). Et la recherche en biologie dure souvent des années (selon les propriétés des organismes modèles), tandis qu'en bioinformatique, les progrès dépendent principalement de la capacité à résoudre des problèmes algorithmiques et à écrire du code «intelligent». Eh bien, la possibilité de travailler à distance depuis n'importe où dans le monde est également un avantage certain en faveur de la bioinformatique.



Quelle est la bio dans la bioinformatique, et quelle est l'informatique?


Cela dépend beaucoup du centre de recherche et du groupe de recherche spécifiques. Vous devez comprendre la biologie à un niveau minimum - personne ne vous mâchonnera un projet scientifique au niveau d'un problème de mathématiques à l'école. Vous devrez vous-même modéliser la situation en fonction de votre compréhension de la biologie. Cependant, une compréhension vraiment profonde n'est pas attendue, donc le fait que vous ne vous souveniez que des pistils et des étamines ne sera pas un obstacle si vous décidez de traiter avec cette science particulière. Les bases essentielles de la biologie sont faciles à apprendre déjà dans le processus de travail sur un projet bioinformatique.

Ce qui est vraiment utile et nécessaire pour la future bioinformatique «à partir de l'informatique», c'est une connaissance de la biotechnologie, c'est-à-dire, comment vos données ont été obtenues, et quels problèmes pourraient avoir surgi pendant l'expérience. À mon avis, il suffit d'aller galoper le long d'un cours de biologie moléculaire, mais de passer du temps et de comprendre sérieusement les principes de fonctionnement des appareils modernes utilisés pour les expériences.

Je conseillerais à la bioinformatique future «de la biologie» dans le processus d'apprentissage de sauter d'abord les preuves et les descriptions des méthodes et des algorithmes et de les étudier comme des «boîtes noires», c'est-à-dire dans un aspect purement appliqué: «A à l'entrée - B à la sortie», sinon il y a un risque » se noyer »dans les calculs théoriques depuis plusieurs années. Cependant, après avoir raté la théorie et avoir appris quelque chose dans la pratique, il vous sera facile de revenir et de la regarder avec des yeux différents.

Mais si je deviens bioinformatique, alors je connais la bioinformatique?


Malheureusement non. La bioinformatique dans son état actuel est constituée de nombreuses sections plutôt volumineuses, comme dans toute autre science. Si nous comparons, par exemple, avec la physique, il est bien évident qu'un spécialiste de la mécanique théorique rencontrera probablement certaines difficultés pour comprendre les derniers articles sur la physique quantique, et de plus, il n'aura probablement pas le temps de lire ces articles.

Et il existe de nombreuses sections en bioinformatique pour tous les goûts:

  • Evolution (non seulement sous la forme de «pithecanthropus first», mais aussi de problèmes moins connus, tels que l'évolution qui se produit dans une tumeur cancéreuse)
  • Recherche d'options génétiques menant à la maladie
  • Construction et sélection de médicaments qui se lient à certains types de protéines «dangereuses pour le corps»
  • L'étude des fonctions des gènes, leur annotation
  • Bioinformatique structurale (manipulations avec des structures 2D et 3D, comme par exemple des protéines ou de l'ARN)
  • Assemblage du génome
  • Construire des cartes de la façon dont tout ce gâchis de protéines / ARN / ADN / graisse / pensées intelligentes / cours de gym / le régime du Kremlin et d'autres choses réagissent les uns aux autres (quelque chose comme dans cette vidéo , mais encore plus intéressant et compliqué)
  • Modélisation de systèmes complexes (tels que le développement d'un organisme à partir d'un embryon)
  • Neurobiologie (ou plutôt, analyse de données obtenues par des neurobiologistes);

et bien plus encore (pardonnez-moi la bioinformatique, dont j'ai oublié de mentionner le domaine).

Les trois derniers points sont souvent référés à la biologie des systèmes, mais ces sciences, comme on dit, «à la jonction», et vous pouvez faire des allers-retours avec un minimum d'effort.

Est-il judicieux de choisir la bioinformatique comme profession?


Pour répondre à cette question, arrangez les caractéristiques suivantes selon le degré d'importance pour vous (attribuez le rang 6 à la caractéristique la plus importante, 1 au moins important), puis résumez avec le signe indiqué.

+ J'ai toujours voulu être scientifique et avoir le sentiment d'apporter une certaine contribution à l'avenir de l'humanité.
+ Je m'intéresse aux sciences de la vie, j'aimerais pouvoir apprendre chaque jour quelque chose de nouveau sur la biologie, mais mes études à l'université n'étaient pas liées à la biologie - ou - je suis biologiste, mais j'en ai assez des manipulations techniques monotones avec des pipettes et j'en veux plus comprendre le type de données que j'ai reçues et pouvoir travailler avec elles.
+ La bioinformatique m'intéresse en tant que sous-section de l'informatique, il me semble qu'il y a beaucoup de tâches auxquelles vous devez penser.
- Je veux recevoir un gros salaire juste après avoir obtenu mon diplôme universitaire.
- J'aimerais marcher constamment en blouse blanche, comme un vrai scientifique.
- J'aime penser aux tâches et lire des articles intéressants sur la biologie, mais je n'aime pas la programmation.

Si vous obtenez un résultat inférieur à 0, vous ne devriez certainement pas vous lancer dans la bioinformatique. Ressentez-vous la douleur de la souplesse et de la polyvalence de ce test, mais comprenez-vous son idée et l'aimez-vous même? Ajoutez-vous +3 points au résultat.



À quoi ressemble une échelle de carrière pour la bioinformatique?


"Si vous le voulez vraiment, vous pouvez voler dans l'espace", mais si vous mesurez 2 mètres et pesez 150 kg, il est peu probable que vous soyez emmené dans l'équipe de cosmonautes. Mais qu'en est-il de la bioinformatique?

Enseignement primaire


La carrière se déroule dans l'enseignement supérieur. Les études de premier cycle peuvent être tout sauf non humanitaires. Économie, physique, chimie, mathématiques, sans oublier l'informatique et la biologie.

Le choix le plus favorable pour un programme de maîtrise est soit un programme de maîtrise en bioinformatique ou un «ajout» à votre programme de premier cycle afin que vous ayez quelque chose de biologique et quelque chose de informatique après ces deux étapes. Certes, s'inscrire dans une magistrature avec un profil complètement différent n'est pas une tâche facile.

Quant à la possibilité d'obtenir immédiatement le premier cycle de l'enseignement supérieur (licence / spécialiste) avec une spécialisation en bioinformatique - mon attitude à cet égard est ambiguë.

La bioinformatique devrait être un choix conscient, et faire un tel choix après l'école semble plutôt difficile, mais si vous êtes sûr que c'est votre vocation, alors pourquoi pas. Mais je suis plus impressionné par l'approche consistant à «obtenir une formation générale et ensuite choisir une spécialisation», plutôt que de commencer immédiatement à travailler dans une direction étroite. Je ne suis pas sûr de la possibilité de se recycler facilement en tant que spécialiste dans un profil différent après 4 à 6 ans de formation, mais il existe des exemples de razioinformatisation réussie.

Éducation supplémentaire


De nombreux cours en ligne (Stepic.org russe, Stepse.org russe, Coursera, edX, etc.) ont déjà été créés pour une familiarisation avec la bioinformatique. Parmi les cours en ligne, il y en a des très utiles (je recommanderais un cours de l'UCSD sur les algorithmes en bioinformatique et un cours sur l'évolution de Duke University), inscrivez-vous, passez par si cela devient ennuyeux ou difficile - vous quitterez calmement cette entreprise sans perdre de temps ni vos nerfs. En effet, pour une éducation à plein temps, il est décent d’être motivé - au sens figuré, dans un costume trois pièces, avec un bouquet dans les mains et un œillet dans la boutonnière - pour que la bioinformatique comprenne immédiatement que cette relation est sérieuse pour vous.

L'éducation complémentaire est une chose merveilleuse, qui a pratiquement les mêmes avantages - des cours le week-end ou le soir (n'interfère pas avec les études de base ou le travail), une équipe enthousiaste et souvent même pas de frais de scolarité. Mais - la sélection pour de tels programmes est assez difficile, les cours sont volumineux et le rythme est rapide. C'est pourquoi, si vous voulez juste savoir si vous devez vous engager davantage dans la bioinformatique, il vaut mieux le faire avant - voir des cours en ligne, parler avec des gens de la profession, lire quelque chose de science populaire (d'après ce que des gens que je connais personnellement ont écrit - un article sur Habrahabr , un article sur Geektimes , une revue de « Si je suis allé en bioinformatique, laissez-les m'apprendre» sur la biomolécule).



Pour autant que je sache, en Russie, il existe deux programmes supplémentaires -Institut de bioinformatique (IB) à Saint-Pétersbourg et dans la capitale - Moscou School of Bioinformatics (MBS) . À mon avis, ils sont à peu près égaux à la magistrature dans le niveau de connaissances acquises dans la spécialité, mais seulement "un oiseau rare atteindra le milieu du Dniepr" - de nombreux étudiants tombent après avoir suivi une douzaine de cours - oh, ce n'est pas facile de collecter l'hippopotame.

Je suis moi-même diplômé de l'Institut de Bioinformatique dans le cadre du programme de master de l' Université Académique (SPbAU), par conséquent, je vais vous en dire plus sur la sécurité des informations (je ne sais rien de MBSB après leur départ de Yandex). Le programme dure un an, cours le samedi. J'ai aimé presque tous les séminaires et conférences, mais la partie la plus remarquable de la formation est les projets scientifiques. Les conseillers scientifiques sont des principaux centres scientifiques de Russie et des pays étrangers perfides. En théorie, les projets devraient être éducatifs en premier lieu, mais le plus souvent c'est une vraie science. Il y a eu un moment glorieux: des nuits blanches remplies de contes de fées arabes «1000 et 1 script» (en fait, les contes étaient au départ hindous), une défense féroce des projets et un sens de l'engagement dans la ligne de front d'où proviennent les articles scientifiques, dont les traductions peuvent souvent rendez-vous à Geektimes. Oh, au fait, il y a un buffet là-bas. Et l'ensemble y va maintenant. Dans le même temps, l'avantage et l'inconvénient de la sécurité de l'information sont le manque de disciplines fondamentales - uniquement la bioinformatique, et rien de plus.

Si vous souhaitez plus de matières et une formation de base, les titulaires de diplômes de bachelier / spécialiste technique peuvent, comme moi, entrer immédiatement dans un programme de master de 2 ans en bioinformatique algorithmique . Le processus d'admission est standard: candidatures en ligne jusqu'au milieu de l'été, puis entretien. L'acceptation des candidatures pour 2016/18 est déjà ouverte . Mais il est complètement inutile que les biologistes s'y rendent.

Pour terminer l'histoire, j'ai dû utiliser mon réseau d'agents. A la veille de la publication, l'un des éclaireurs a finalement violé le mode silence radio et remis au siège un radiogramme sur le MBS. Les principaux points du message décrypté sur le processus d'apprentissage au MBS étaient: a) la possibilité d'obtenir un diplôme officiel du HSE; b) la présence de disciplines fondamentales telles que matan (à mon avis, c'est une moquerie, mais matan est utile alors qu'il met l'esprit en ordre); c) les projets de recherche sont menés sous la direction de chefs de file de la bioinformatique à Moscou; d) en raison de l'abondance des devoirs, les élèves doivent s'égarer et penser collectivement aux problèmes; e) les étudiants grincent de joie et demandent plus de bioinformatique. Le recrutement au MBS débutera en mai.

Écoles d'été


Un autre type de formation continue. D'après ce que je sais: pour les écoliers, il y a une école de biologie moléculaire et théorique (plus en biologie, mais pour l'avenir de la bioinformatique, il y a sans aucun doute l'avantage), pour les étudiants et les étudiants diplômés "novices", il y a l' école d'été de l'Institut de bioinformatique (LSB) , de l'étranger - Research Summer School in Omique statistique (RSSSO). Si je parle brièvement des écoles que j'ai fréquentées - le LSP est idéal pour une courte introduction intensive à la bioinformatique, le RSSSO s'adresse à ceux qui comprennent déjà ce qu'est la biologie computationnelle et veulent «pomper» leur base statistique. Chez LSB / RSSSO, on peut / devrait participer à des projets scientifiques intéressants, au cours desquels on peut se sentir comme un vrai travailleur scientifique pendant une courte période. C'est aussi un excellent moyen de s'amuser en été en bonne compagnie. LSB est effectuée alternativement à Moscou et à Saint-Pétersbourg, RSSSO - en Croatie, la ville de Split. SHMTB sera à Barcelone.

Bioinformatique de carrière


La carrière commence ensuite - après les études supérieures, vous pouvez obtenir un emploi en tant que spécialiste en bioinformatique (oui, oui, j'entends des voix indignées, vous pouvez le faire même après le premier cycle, après l'école et après la maternelle, mais convenons que la remise des diplômes est la meilleure de nombreux paramètres point de référence). Cela peut être fait à la fois en Russie (la base de données des offres d'emploi est collectée sur le site Web blastim.ru) et à l'étranger. La deuxième option est d'aller chercher un doctorat ou un doctorat. Trouver une école supérieure (dans presque tous les pays - même en Russie, même au Costa Rica) est assez simple, à condition que vous soyez un bon spécialiste. Les notes d'un diplôme jouent un rôle, mais pas déterminant. Quoi de mieux - à l'étranger ou à la maison? Suspendez cette question. Peut-être qu'au moment où vous atteindrez la maturité pour entrer dans les études supérieures, vous déciderez par vous-même.Quoi qu'il en soit, dans le cadre des études de troisième cycle, vous êtes susceptible de faire un stage une ou plusieurs fois dans un autre pays pendant plusieurs mois.

Après le doctorat. Il y a déjà 3 options:

La première consiste à comprendre que la vie est périssable, à abandonner la science et à aller au Yamalo-Nenets Autonomous Okrug pour élever des cerfs. Nous ne nous attarderons pas sur cette option, car elle n'est plus liée au sujet de l'article (mais je vous conseille de vous méfier des loups et non de la colère des cerfs, leurs cornes ont l'air plutôt dangereuses).

La deuxième option consiste à poursuivre votre carrière universitaire et la troisième- se lancer dans l'industrie (de nombreuses entreprises recherchent désormais des spécialistes du profil approprié). Une carrière académique implique de recevoir plusieurs stages, qui sont appelés, sous forme abrégée, postdoc. Les salaires des post-doctorants sont plusieurs fois plus élevés que ceux des étudiants diplômés, mais, en règle générale, inférieurs aux salaires des spécialistes qui se lancent dans l'industrie. Trouvez un emploi dans l'industrie après avoir obtenu un doctorat. et (éventuellement) plusieurs post-doc sont beaucoup plus simples. Ensuite, vous pouvez obtenir un poste permanent de chercheur ou essayer de créer votre propre laboratoire et de le diriger. C'est une affaire compliquée et, franchement, je ne sais rien de ce qui se passe "au-delà du post-doctorat".

Au lieu d'une conclusion


Je continuerai de répondre à vos questions posées dans les commentaires sur cet article. De plus, si cela intéresse, je peux parler de ce que je fais (étudier les liens entre la variabilité génétique et épigénétique et les maladies) dans un article séparé.

À propos de l'auteur: spécialiste, mechmat de l'Université d'État de Moscou, 2013; Master (Bioinformatique), MIIT SPbAU, 2015; actuellement étudiant diplômé au CRG, Barcelone, le groupe Variation génomique et épigénomique des maladies.

J'espère que ce texte vous a été instructif.

PS Avant d'envoyer cet article, mes collègues ont lu et déclaré qu'il était écrit trop pessimiste. J'ose assurer aux lecteurs que lorsque j'ai posé ces questions il y a plusieurs années, j'ai reçu des réponses beaucoup plus sombres.

Source: https://habr.com/ru/post/fr390563/


All Articles