🤲🏿 🚒 👋🏼 Conférences sur la bioinformatique: des statistiques aux constructions génétiques 🎨 🔇 🌃

Pour vous immerger dans un domaine scientifique relativement nouveau, il existe un grand nombre d'événements et de projets différents. Ces dernières années, leur nombre et leurs formats se sont considérablement développés: conférences ouvertes et festivals scientifiques entiers, cours et programmes en ligne, stages et écoles d'été, conférences informelles dans les bars, projets open source, etc.

Depuis cinq ans maintenant, l' Institut de bioinformatique rassemble des scientifiques et des étudiants en bioinformatique de tout le pays et envoie des biologistes, des médecins, des informaticiens et des mathématiciens en bioinformatique, qui est encore un domaine très dynamique, au cours d'une semaine d'étude intensive en dehors de la ville lors d'une école d'été. Depuis 2013, nous enregistrons des conférences vidéo et collectons une sélection de matériel utile pour ceux qui ne sont pas impliqués dans des événements, mais qui souhaitent se développer dans ce domaine.

Le programme scolaire est conçu de manière à unir le monde de la biologie et de la programmation et à stimuler non seulement le développement professionnel, mais aussi la communication interdisciplinaire.

Nous continuons de partager les archives des vidéos des cours d'été. Les conférences qui peuvent être visionnées sans préparation supplémentaire sont marquées d'un "*". La visualisation du reste des cours nécessite des connaissances dans le domaine de la biologie et de la programmation. Sous le chat est une description du contenu des conférences, des liens vers des diapositives et des vidéos.

Statistiques en bioinformatique

Analyse statistique des données biomédicales (Mikhail Pyatnitsky, Institut de recherche Orekhovich de chimie biomédicale)
Vidéo | Diapositives

La conférence se concentre sur les aspects pratiques de l'analyse statistique des données «-mix». En particulier, les méthodes d'analyse exploratoire, de reconnaissance de formes et d'analyse de grappes sont décrites.

Comment travailler avec des données et ne pas se sentir impuissant? (Nikita Alekseev, Université George Washington)
Vidéo | Diapositives

D'une part, les sciences naturelles fournissent d'énormes quantités de données et posent diverses questions concernant ces données. D'un autre côté, les statistiques ont de nombreuses méthodes pour résoudre ces problèmes. Une telle abondance, bien sûr, entraîne des difficultés - comment choisir une méthode qui convient pour résoudre votre problème particulier, comment prendre en compte toutes les nuances et ne pas se confondre dans tout cela. Il n'y a pas de recette universelle. La conférence discute différentes approches de ce problème.

Comment poser une question à un statisticien familier (Nikita Alekseev, postdoctorante, Université George Washington)
Vidéo | Diapositives

La conférence sera utile à tous ceux qui sont confrontés à des problèmes de traitement des données statistiques. Quelles solutions sont possibles pour eux, quelles difficultés surgissent, et que demander aux statistiques avec qui ils ont réussi à coopérer afin d'obtenir le maximum d'avantages pour leur projet.

Immunoinformatique

Analyse des répertoires des récepteurs immunitaires (Vadim Nazarov, École supérieure d'économie, Institut de chimie bioorganique RAS)
Vidéo | Diapositives

L'utilisation des technologies NGS en immunologie a permis un séquençage très profond des répertoires des récepteurs cellulaires. Mais, malheureusement, on ne peut pas simplement regarder et recevoir des informations sur les données obtenues - il est nécessaire de développer différentes méthodes pour analyser les répertoires. À propos des méthodes développées, de leur adéquation, de l'évolution du monde et de l'endroit où vous pouvez vous y appliquer.

Immunoinformatique: une approche algorithmique pour résoudre les problèmes d'immunologie appliquée (Yana Safonova, Center for Algorithmic Biotechnology, St. Petersburg State University)
Vidéo | Diapositives

L'analyse du système immunitaire adaptatif est une étape essentielle dans le développement de médicaments, l'évaluation de l'efficacité du traitement et l'étude de diverses maladies. Les technologies NGS modernes ont permis d'effectuer une analyse approfondie du répertoire des anticorps et des récepteurs des cellules T, ce qui a contribué au développement d'un nouveau domaine de la bioinformatique: l'immunoinformatique.

L'immunoinformatique résout les problèmes qui sont utilisés dans divers domaines immunologiques: suivi du développement de la réponse immunitaire, analyse du développement évolutif des répertoires, compréhension de la diversité du système immunitaire adaptatif. Dans le cadre de la conférence, les tâches de l'immuno-informatique moderne sont examinées et les perspectives de son développement discutées.

Barcoding moléculaire, analyse des répertoires des récepteurs et des anticorps des lymphocytes T (Dmitry Chudakov, chef du laboratoire de génomique de l'immunité adaptative à l'Institut de chimie bioorganique de l'Académie russe des sciences, chef du groupe Immunité adaptative au CEITEC MU, Université Masaryk)
Vidéo | Diapositives

Le séquençage haute performance des fragments d'intérêt du génome (reséquençage ciblé) permet potentiellement une analyse approfondie pour identifier la présence de sous-variantes de séquence rares dans l'échantillon, ainsi que pour donner une image complète de la structure de la diversité des séquences dans l'échantillon.

Cependant, les «goulots d'étranglement» aux stades de préparation et de préparation des échantillons pour le séquençage massif, les distorsions quantitatives associées à la nature stochastique de la PCR, l'amplification inégale et le séquençage des différentes séquences, ainsi que l'accumulation d'erreurs de PCR et le séquençage proprement dit, limitent considérablement les possibilités d'une telle analyse.

Le code à barres moléculaire unique (bacrodes moléculaires uniques, identificateurs moléculaires uniques, UMI) vous permet d'améliorer radicalement la qualité du séquençage, y compris le séquençage étendu, de corriger efficacement les erreurs accumulées sans perdre une réelle variété d'options, d'éliminer les distorsions quantitatives et également de normaliser pratiquement idéalement les échantillons pour une analyse comparative.

La conférence décrit comment les approches de codes à barres moléculaires fonctionnent avec des exemples tirés de l'expérience personnelle de travail avec les répertoires des récepteurs des cellules immunitaires - les récepteurs des cellules T et les anticorps.

Biologie des systèmes

Introduction à la biologie des systèmes (Ilya Serebriisky, Fox Chase Cancer Center, USA)
Vidéo | Diapositives

La conférence donne une idée générale des propriétés du système des objets biologiques. Une brève description des principaux composants de la biologie des systèmes. Interactomique, construction de modèles. Quelques avancées en biologie des systèmes (sélectivement, principalement dans le domaine de l'oncologie) et des ressources publiques associées (TCGA / cBioPortal, CCLE)

Biologie computationnelle des systèmes pour l'étude et le traitement du cancer (Andrey Zinoviev, Institut Curie)
Vidéo | Diapositives

La biologie systémique computationnelle du cancer est l'application d'approches générales de biologie des systèmes liées à la collecte systématique de données à l'échelle du génome et à leur modélisation mathématique pour l'étude de la cancérogenèse, la prédiction et le développement de nouvelles méthodes de traitement du cancer. L'approche des données est associée à un certain nombre de caractéristiques telles que la prise en compte de l'évolution rapide du système biologique dans des conditions d'instabilité génomique et épigénomique, l'interaction avec des cellules de stroma normales et l'exposition à divers facteurs de l'environnement intercellulaire, la diversité et la qualité du matériel clinique. La conférence décrit brièvement plusieurs approches caractéristiques de l'analyse et de la modélisation des données en biologie du cancer. En particulier, les principes de formalisation et d'utilisation dans la modélisation des connaissances sur la biochimie du cancer ( Atlas of Signal Networks in Cancer ), les approches de déconvolution des profils moléculaires à l'échelle du génome dans le cancer, la construction de modèles mathématiques discrets pour prédire l'évolution d'une tumeur cancéreuse.

Le problème de la reproductibilité des résultats en biologie systémique et pas seulement (Ilya Serebriisky, Fox Chase Cancer Center, USA)
Vidéo | Diapositives

Le problème de la reproductibilité des résultats est un problème clé pour la biologie moderne, en particulier pour la biologie des systèmes. La conférence est consacrée à une revue de la situation actuelle, des principaux problèmes de reproductibilité, de leurs causes. Responsabilité des organisations, revues scientifiques, chercheurs. Caractéristiques du problème en biologie des systèmes. Les principales directions pour résoudre le problème de reproductibilité.

Divers

«Motifs» - modèles dans les séquences génomiques (Ivan Kulakovsky, IMB RAS; IOGEN RAS)
Vidéo | Diapositives

Du point de vue de la biologie moléculaire, la conférence discute de la régulation de l'activité de transcription des gènes chez les eucaryotes supérieurs et du rôle des facteurs de transcription régulateurs des protéines. Du point de vue de la bioinformatique, l'enseignant explique comment la représentation informatisée des motifs - motifs caractéristiques dans les textes génomiques - aide à reconnaître les signaux régulateurs reconnus par les facteurs de transcription dans l'ADN. Du point de vue de l'informatique, il considère le problème de la construction d'un modèle «moteur» comme une tâche de recherche de similitudes locales de nombreuses séquences.

Résumé des séquences de promoteurs (Tatyana Tatarinova, Université de Californie du Sud)
Vidéo | Diapositives

La conférence aborde les modèles et les propriétés des séquences de promoteurs. Motifs et méthylation des promoteurs. Algorithmes pour prédire et analyser les séquences de promoteurs. Application en biotechnologie.

Prédiction de l'origine basée sur les algorithmes de mélange GPS et de réadmission (Tatyana Tatarinova, Université de Californie du Sud)
Vidéo | Diapositives

La conférence est consacrée au génotypage et à la sélection de positions informatives sur le génome, une revue des technologies modernes, la prédiction de l'origine biogéographique des humains et des autres organismes selon l'analyse du génome. Ainsi que l'analyse et la comparaison des algorithmes existants pour la biogéographie.

Algorithmes en bioinformatique (Anton Bankevich, Center for Algorithmic Biotechnology, St. Petersburg State University)
Vidéo | Diapositives

Conférence introductive sur les algorithmes en bioinformatique, qui discute les principales approches et exemples de leur utilisation.

La relation entre le cerveau et le Deep Learning (Dmitry Fishman, Quretec, Université de Tartu, Estonie)
Vidéo | Diapositives

La conférence se compose de quatre parties: la première traite du cerveau qui traite les différents signaux du monde extérieur et de la formation d'une prise de décision basée sur les signaux reçus. Le second est l'évolution des méthodes d'apprentissage automatique, qui a conduit à l'émergence de la technologie Deep Learning, qui a révolutionné de nombreux domaines scientifiques. La troisième partie abordera les similitudes et les différences entre les principes de base du Deep Learning. En conclusion, le conférencier donne plusieurs exemples de l'application réussie du Deep Learning en bioinformatique, et ce qui peut être réalisé dans le domaine de l'imagerie médicale en utilisant les réseaux de neurones profonds.

Cette conférence a été créée par des représentants du Tartu University Computing Neuroscience Research Group . En particulier, l'idée et les diapositives appartiennent à Raul Vincente et Ilya Kuzovkin. Présentation originale en anglais .

Perspectives de modification artificielle des génotypes humains (Alexey Kondrashov, Université d'État de Moscou, MSU)
Vidéo

Aucune loi de la nature n'interdit la synthèse de longues molécules d'ADN avec une séquence donnée. Quel sera le phénotype d'une personne dont le génotype ne porte pas de jeunes allèles dérivés? Cela dépend de la fréquence du signe et du rétrécissement de l'épistase. La conférence discute des approches de l'étude de cette question.

Bioinformatique dans la synthèse de constructions génétiques (Pavel Yakovlev, BIOCAD)
Vidéo | Diapositives

Le développement de méthodes de conception moléculaire in silico vous permet de construire toutes les constructions protéiques avec les propriétés souhaitées. Les séquences d'acides aminés obtenues sont plus susceptibles de former des protéines avec la fonctionnalité souhaitée. Mais un nouveau défi se pose: construire une lignée cellulaire qui synthétiserait de telles protéines. La conférence aborde les problèmes qui se posent lors de la résolution de ce problème: pourquoi ne pouvez-vous pas simplement prendre une transcription inverse, comment assembler le gène requis, comment l'insérer dans un vecteur et, bien sûr, d'où vient la bioinformatique?

Aperçu des mesures génomiques modernes de cellules individuelles (Petr Harchenko, Université Harvard)
Vidéo | Diapositives

L'étude des tissus complexes et la classification des types cellulaires reposent traditionnellement sur des propriétés morphologiques et cytologiques. Plusieurs types de nouvelles technologies expérimentales nous permettent désormais d'étudier les caractéristiques génomiques de cellules individuelles et de mesurer simultanément des centaines ou des milliers de cellules individuelles. La conférence donne un aperçu de ces technologies et méthodes bioinformatiques utilisées pour classer les types de cellules, les conditions et les lignées génétiques à partir de données similaires.

L'utilisation de données omixiques dans l'étude de l'évolution humaine (Filip Khaitovich, Shanghai Institutes for Biological Sciences, SkolTech)
Vidéo | Diapositives

La concentration de métabolites et de lipides peut être utilisée pour évaluer l'état physiologique des tissus. La conférence présente plusieurs études approfondies du niveau de concentration des métabolites et des lipides dans les tissus humains et animaux, qui fournissent de nouvelles connaissances sur les mécanismes moléculaires qui sous-tendent les caractéristiques physiologiques propres aux humains.

Postface

En 2016, l'école d'été sur la bioinformatique a été soutenue par JetBrains , RVC , BIOCAD , EPAM Systems , Parseq Lab , pour lesquels un grand merci à eux.

En 2017, l'école d'été de bioinformatique se tiendra du 31 juillet au 5 août à Dolgoprudny à l'Institut de physique et de technologie de Moscou . L'école de cette année se concentre sur l'exploration de données en bioinformatique. Date limite de soumission des candidatures - 10 juin . Dépêchez-vous de demander votre participation.

Conférences sur la bioinformatique: des statistiques aux constructions génétiques

Statistiques en bioinformatique

Immunoinformatique

Biologie des systèmes

Divers

Postface

More articles: