Para mergulhar em um campo científico relativamente novo, há um grande número de eventos e projetos diferentes. Nos últimos anos, seu número e formatos se expandiram significativamente: palestras abertas e festivais científicos inteiros, cursos e programas on-line, estágios e escolas de verão, palestras informais em bares, projetos de código aberto e assim por diante.
Há cinco anos, o
Instituto de Bioinformática reúne cientistas e estudantes de
bioinformática de todo o país e envia biólogos, médicos, cientistas da computação e matemáticos para a bioinformática, que ainda é um campo muito dinâmico, durante um estudo intensivo de uma semana fora da cidade em uma escola de verão. Desde 2013, gravamos palestras em vídeo e colecionamos uma seleção de materiais úteis para aqueles que não estão envolvidos em eventos, mas que gostariam de se desenvolver nessa área.
O currículo escolar é elaborado de forma a unir o mundo da biologia e da programação e estimular não apenas o desenvolvimento profissional, mas também a comunicação interdisciplinar.

Continuamos a compartilhar o arquivo de vídeos das palestras das escolas de verão. As aulas que podem ser assistidas sem preparação adicional estão marcadas com "*". A visualização do restante das palestras requer conhecimentos no campo da biologia e da programação. Abaixo do gato, há uma descrição do conteúdo das palestras, links para slides e vídeos.
Estatísticas em bioinformática
Análise estatística de dados biomédicos (Mikhail Pyatnitsky, Instituto de Pesquisa Orekhovich de Química Biomédica)Vídeo |
SlidesA palestra foca nos aspectos práticos da análise estatística de dados '-mix'. Em particular, são descritos os métodos de análise exploratória, reconhecimento de padrões e análise de agrupamentos.
Como trabalhar com dados e não se sentir impotente? (Nikita Alekseev, Universidade George Washington)Vídeo |
SlidesPor um lado, as ciências naturais fornecem enormes quantidades de dados e fazem uma variedade de perguntas sobre esses dados. Por outro lado, as estatísticas têm muitos métodos para resolver esses problemas. Essa abundância, é claro, traz consigo dificuldades - como escolher um método adequado para resolver seu problema específico, como levar em conta todas as nuances e não se confundir com tudo isso. Não há receita universal. A palestra discute várias abordagens para esse problema.
Como fazer uma pergunta a um estatístico familiar (Nikita Alekseev, pós-doutorado, George Washington University)Vídeo |
SlidesA palestra será útil para todos que enfrentam problemas de processamento estatístico de dados. Quais soluções são possíveis para eles, quais dificuldades surgem e o que perguntar às estatísticas com quem eles começaram a cooperar para obter o máximo benefício para seu projeto.
Imunoinformática
Análise de repertórios de receptores imunes (Vadim Nazarov, Escola Superior de Economia, Instituto de Química Bioorganica RAS)Vídeo |
SlidesO uso de tecnologias NGS em imunologia permitiu um sequenciamento muito profundo dos repertórios de receptores celulares. Infelizmente, porém, não se pode apenas olhar e receber insights sobre os dados obtidos - é necessário desenvolver vários métodos para analisar repertórios. Sobre quais métodos foram desenvolvidos, quão adequados eles são, para onde este mundo está se movendo e onde você pode se aplicar a ele.
Imunoinformática: uma abordagem algorítmica para resolver problemas de imunologia aplicada (Yana Safonova, Centro de Biotecnologia Algorítmica, Universidade Estadual de São Petersburgo)Vídeo |
SlidesA análise do sistema imunológico adaptativo é uma etapa essencial no desenvolvimento de medicamentos, na avaliação da eficácia do tratamento e no estudo de várias doenças. As modernas tecnologias NGS tornaram possível fazer uma varredura profunda do repertório de anticorpos e receptores de células T, o que contribuiu para o desenvolvimento de um novo campo da bioinformática: a imunoinformática.
A imunoinformática resolve problemas utilizados em diversas áreas imunológicas: monitorando o desenvolvimento da resposta imune, analisando o desenvolvimento evolutivo de repertórios, entendendo a diversidade do sistema imunológico adaptativo. No âmbito da palestra, são consideradas as tarefas da imuno-informática moderna e discutidas as perspectivas de seu desenvolvimento.
Código de barras molecular, análise de repertórios de receptores de células T e anticorpos (Dmitry Chudakov, Chefe do Laboratório de Genômica da Imunidade Adaptativa do Instituto de Química Bioorgânica da Academia Russa de Ciências, Chefe do Grupo de Imunidade Adaptativa do CEITEC MU, Universidade Masaryk)Vídeo |
SlidesO sequenciamento de alto desempenho de fragmentos de genoma de interesse (sequenciamento direcionado) potencialmente permite uma análise aprofundada para identificar a presença de subvariantes raros de sequência na amostra, além de fornecer uma imagem completa da estrutura da diversidade de sequências na amostra.
No entanto, "gargalos" nas etapas de preparação e preparação de amostras para sequenciamento maciço, distorções quantitativas associadas à natureza estocástica da PCR, amplificação desigual e sequenciamento de diferentes sequências, bem como o acúmulo de erros de PCR e o sequenciamento adequado, limitam significativamente as possibilidades dessa análise.
O código de barras molecular exclusivo (bacrodes moleculares exclusivos, identificadores moleculares exclusivos, UMI) permite melhorar radicalmente a qualidade do seqüenciamento, incluindo o sequenciamento estendido, efetivamente corrige erros acumulados sem perder uma variedade real de opções, elimina distorções quantitativas e também normaliza praticamente amostras idealmente para análise comparativa.
A palestra descreve como as abordagens do código de barras molecular funcionam com exemplos de experiência pessoal trabalhando com os repertórios de receptores de células imunes - receptores de células T e anticorpos.
Biologia de sistemas
Introdução à Biologia de Sistemas (Ilya Serebriisky, Fox Chase Cancer Center, EUA)Vídeo |
SlidesA palestra fornece uma idéia geral das propriedades do sistema de objetos biológicos. Uma breve descrição dos principais componentes da biologia de sistemas. Interactômica, construção de modelos. Alguns avanços na biologia de sistemas (seletivamente, principalmente no campo da oncologia) e recursos públicos relacionados (TCGA / cBioPortal, CCLE)
Biologia dos sistemas computacionais para o estudo e tratamento do câncer (Andrey Zinoviev, Institut Curie)Vídeo |
SlidesA biologia sistêmica computacional do câncer é a aplicação de abordagens gerais da biologia de sistemas relacionadas à coleta sistemática de dados em todo o genoma e sua modelagem matemática para o estudo da carcinogênese, previsão e desenvolvimento de novos métodos de tratamento do câncer. A abordagem dos dados está associada a uma série de características, como levar em consideração a rápida evolução do sistema biológico sob condições de instabilidade genômica e epigenômica, interação com células estromais normais e exposição a vários fatores do ambiente intercelular, diversidade e qualidade do material clínico. A palestra descreve brevemente várias abordagens características para a análise e modelagem de dados na biologia do câncer. Em particular, os princípios de formalização e uso na modelagem do conhecimento da bioquímica do câncer (
Atlas of Signal Networks in Cancer ) abordam a desconvolução de perfis moleculares em todo o genoma no câncer, a construção de modelos matemáticos discretos para prever a evolução de um tumor cancerígeno.
O problema da reprodutibilidade dos resultados em biologia sistêmica e não apenas (Ilya Serebriisky, Fox Chase Cancer Center, EUA)Vídeo |
SlidesO problema da reprodutibilidade dos resultados é fundamental para a biologia moderna, especialmente para a biologia de sistemas. A palestra é dedicada a uma revisão do estado atual das coisas, os principais problemas de reprodutibilidade e suas causas. Responsabilidade das organizações, revistas científicas, pesquisadores. Características do problema em biologia de sistemas. As principais direções para resolver o problema da reprodutibilidade.
Diversos
“Motivos” - padrões em sequências genômicas (Ivan Kulakovsky, IMB RAS; IOGEN RAS)Vídeo |
SlidesDo ponto de vista da biologia molecular, a palestra discute a regulação da atividade de transcrição de genes em eucariotos superiores e o papel dos fatores reguladores de transcrição. Do ponto de vista da bioinformática, o palestrante conta como a representação computadorizada de motivos - padrões característicos em textos genômicos - ajuda a reconhecer sinais regulatórios reconhecidos por fatores de transcrição no DNA. Do ponto de vista da ciência da computação, ele considera o problema de construir um modelo de 'motivo' como uma tarefa de encontrar semelhança local de muitas seqüências.
Resumo de sequências promotoras (Tatyana Tatarinova, University of Southern California)Vídeo |
SlidesA palestra aborda os padrões e propriedades das seqüências de promotores. Motivos e metilação dos promotores. Algoritmos para prever e analisar sequências promotoras. Aplicação em biotecnologia.
Previsão de origem com base nos algoritmos GPS de mistura e Readmix (Tatyana Tatarinova, Universidade do sul da Califórnia)Vídeo |
SlidesA palestra é dedicada à genotipagem e seleção de posições informativas sobre o genoma, uma revisão de tecnologias modernas, a previsão da origem bio-geográfica de seres humanos e outros organismos, de acordo com a análise do genoma. Bem como a análise e comparação de algoritmos existentes para biogeografia.
Algoritmos em bioinformática (Anton Bankevich, Centro de Biotecnologia Algorítmica, Universidade Estadual de São Petersburgo)Vídeo |
SlidesPalestra introdutória sobre algoritmos em bioinformática, que discute as principais abordagens e exemplos de seu uso.
A relação entre o cérebro e o Deep Learning (Dmitry Fishman, Quretec, Universidade de Tartu, Estônia)Vídeo |
SlidesA palestra consiste em quatro partes: a primeira lida com o cérebro processando os vários sinais do mundo exterior e a formação da tomada de decisões com base nos sinais recebidos. O segundo é a evolução dos métodos de aprendizado de máquina, que levaram ao surgimento da tecnologia Deep Learning, que revolucionou muitas áreas da ciência. A terceira parte discutirá as semelhanças e diferenças entre os princípios básicos do Deep Learning. Em conclusão, o palestrante fornece vários exemplos da aplicação bem-sucedida do Deep Learning em bioinformática e o que pode ser alcançado no campo da imagem médica usando as Redes Neurais Profundas.
Esta palestra foi criada por representantes do
Grupo de Pesquisa em Neurociência em Computação da Universidade de Tartu . Em particular, a ideia e os slides pertencem a Raul Vincente e Ilya Kuzovkin.
Apresentação original em inglês .
Perspectivas para a modificação artificial de genótipos humanos (Alexey Kondrashov, Universidade Estadual de Moscou, MSU)VídeoNenhuma lei da natureza proíbe a síntese de longas moléculas de DNA com uma dada sequência. Qual será o fenótipo de uma pessoa cujo genótipo não possui alelos derivados jovens? Depende de quão comum é o sinal e o estreitamento da epistasia. A palestra discute abordagens para o estudo desta questão.
Bioinformática na síntese de construções genéticas (Pavel Yakovlev, BIOCAD)Vídeo |
SlidesO desenvolvimento de métodos de projeto molecular in silico permite que você construa qualquer construção de proteína com as propriedades desejadas. As sequências de aminoácidos obtidas são mais prováveis de formar proteínas com a funcionalidade desejada. Mas surge um novo desafio: construir uma linha celular que sintetize essas proteínas. A palestra aborda as questões que surgem ao resolver esse problema: por que você não pode simplesmente fazer transcrição reversa, como montar o gene necessário, como inseri-lo em um vetor e, é claro, de onde vem a bioinformática?
Visão geral das medições genômicas modernas de células individuais (Petr Harchenko, Harvard University)Vídeo |
SlidesO estudo de tecidos complexos e a classificação de tipos celulares têm sido tradicionalmente baseados em propriedades morfológicas e citológicas. Vários tipos de novas tecnologias experimentais agora nos permitem estudar as características genômicas de células individuais e simultaneamente medir centenas ou milhares de células individuais. A palestra fornece uma visão geral dessas tecnologias e métodos de bioinformática que são usados para classificar tipos de células, condições e linhas genéticas a partir de dados semelhantes.
O uso de dados omixicos no estudo da evolução humana (Filip Khaitovich, Institutos de Ciências Biológicas de Xangai, SkolTech)Vídeo |
SlidesA concentração de metabólitos e lipídios pode ser usada para avaliar o estado fisiológico dos tecidos. A palestra apresenta vários estudos abrangentes sobre o nível de concentração de metabólitos e lipídios nos tecidos humanos e animais, que fornecem novos conhecimentos sobre os mecanismos moleculares subjacentes às características fisiológicas exclusivas dos seres humanos.
Posfácio
Em 2016, a escola de verão em bioinformática foi apoiada por
JetBrains ,
RVC ,
BIOCAD ,
EPAM Systems ,
Parseq Lab , pela qual agradecemos muito.
Em 2017, a escola de bioinformática de verão será realizada de 31 de julho a 5 de agosto em Dolgoprudny no Instituto de Física e Tecnologia de Moscou . O foco da escola deste ano é a mineração de dados em bioinformática.
Prazo para envio de inscrições - 10 de junho . Apresse-se para solicitar a participação.