Palestras sobre bioinformática: análise de dados, redes neurais e sua aplicação em biologia e medicina

Há quase um ano, no verão de 2017, uma escola tradicional de verão do Instituto de Bioinformática foi realizada no MIPT. O principal tópico da escola deste ano foi mineração de dados . Porque A quantidade de dados obtidos em biologia e medicina está crescendo a um ritmo incrível. Ao mesmo tempo, é fisicamente impossível detectar coisas previamente desconhecidas em um volume de informações manualmente (e com algoritmos clássicos também é difícil), então você precisa usar estatísticas e suplementar a inteligência natural com artificial.

Era isso que os participantes da escola de verão estavam fazendo ativamente. Este post contém 22 vídeos de palestras com slides e descrições para todos os interessados ​​no tópico de análise de dados em bioinformática. As palestras que podem ser assistidas sem preparação adicional são marcadas com um asterisco "*" (metade delas).

imagem

1 *. Introdução à Bioinformática (Alexander Predeus, Instituto de Bioinformática)

Vídeo | Slides

A palestra discute as principais áreas nas quais a bioinformática trabalha na ciência e na indústria, especialmente a bioinformática e as razões de sua popularidade atualmente.


imagem

2 *. Introdução ao aprendizado de máquina (Grigory Sapunov, Intento)

Vídeo | Slides

O aumento constante da quantidade de dados contribui para o desenvolvimento de processos cada vez mais complexos de processamento, pesquisa e recuperação de informações. Uma maneira de resolver esses problemas é usar inteligência artificial. Esta palestra é dedicada a uma breve introdução aos conceitos básicos de aprendizado de máquina. Gregory contou a terminologia geral nesta área e também descreveu os tipos de tarefas resolvidas pelo aprendizado de máquina. Além disso, a palestra apresenta os principais estágios do aprendizado de máquina, tipos de modelos e métricas de qualidade dos dados recebidos.

3 *. Introdução à aprendizagem profunda (Grigory Sapunov, Intento)

Vídeo | Slides

Atualmente, o aprendizado profundo (ou aprendizado profundo) está ganhando popularidade devido à capacidade de não prescrever algoritmos específicos para resolver o problema, mas de usar o treinamento em representações. O desenvolvimento desses métodos também é facilitado por um aumento no poder de processamento dos processadores. A palestra é dedicada aos conceitos básicos de redes neurais: seus tipos (redes neurais totalmente conectadas, auto-codificadores, convolucionais, recorrentes) e as tarefas que eles resolvem. Separadamente, Gregory descreveu o estado e as tendências atuais.


imagem

4 *. Introdução à oncogenômica e análise de dados omix em oncologia (Mikhail Pyatnitsky, Instituto de Pesquisa VN Orekhovich de Química Biomédica)

Vídeo | Slides

Sequenciar o genoma humano, estudar variações genéticas humanas, sequenciar o metagenoma humano, análise transcricional de tecidos humanos - todos esses métodos biológicos na aplicação ao “Big Data” deram aos cientistas muitas informações valiosas sobre o que torna os humanos diferentes de outros animais. Esta palestra é dedicada a ômicos e seu uso prático. Separadamente, Michael abordou o uso desses dados em oncologia.


imagem

5. Multiômica em biologia: integração tecnológica (Konstantin Okonechnikov, Centro Alemão de Pesquisa do Câncer)

Vídeo | Slides

O rápido desenvolvimento de tecnologias experimentais em biologia molecular, como, por exemplo, seqüenciamento, possibilitou combinar o estudo de uma ampla gama de processos funcionais que ocorrem em células, órgãos ou mesmo em todo o corpo. A palestra discute como combinar corretamente dados experimentais maciços obtidos de genômica, transcriptômica e epigenômica para estabelecer relações entre componentes de processos biológicos em andamento. Exemplos ilustrativos do uso de multiomics são selecionados no campo altamente exigido da pesquisa sobre câncer, com foco na oncologia pediátrica.


imagem

6. Genética quantitativa: história e perspectivas (Yuri Aulchenko, Laboratório de Genômica Funcional Teórica e Aplicada, FEN NSU, grupo de métodos de análise genética, ICG SB RAS)

Vídeo | Slides

A genética quantitativa é uma ciência exata, baseada em um pequeno número de observações importantes e modelos básicos que permitem fornecer uma descrição quantitativa dos fenômenos naturais (micro) evolutivos e prever os resultados de experimentos genéticos. Ela usa um poderoso aparelho matemático. Muitos métodos estatísticos modernos foram desenvolvidos originalmente para resolver os problemas da genética quantitativa. O desenvolvimento inovador das tecnologias biológicas moleculares na última década tornou possível caracterizar centenas de milhares de organismos vivos por milhões de parâmetros genômicos e outros "omix". O número total de experimentos e dados já acumulados é enorme. A tarefa urgente da genética quantitativa moderna é o desenvolvimento de modelos que descrevam a herança da alta dimensão fenotípica multinível. Em sua palestra, Yuri deu uma breve visão geral da história da genética quantitativa e dos problemas que essa ciência enfrenta.


imagem

7 *. Tecnologias de sequenciamento (Kirill Grigoriev, Caribe Genome Center, Universidade de Porto Rico)

Vídeo | Slides

O desenvolvimento e a evolução dos processos de seqüenciamento estão indissociavelmente ligados à evolução das capacidades tecnológicas. A palestra mostra o histórico e o processo de desenvolvimento das tecnologias de seqüenciamento de Sanger até os dias atuais. Separadamente, Cyril falou sobre as vantagens e desvantagens de cada um dos métodos atualmente existentes, bem como a natureza dos dados obtidos e sua aplicação em vários campos.



8. Transcriptômica: métodos práticos e algoritmos aplicados (Alexander Predeus, Instituto de Bioinformática)

Vídeo | Slides

A transcriptômica participou da lista das tarefas mais populares da NGS-bioinformática. A análise diferencial da expressão gênica, o agrupamento de dados de expressão e a interpretação dos dados em termos de cascatas metabólicas e de sinalização fornecem informações valiosas sobre quase qualquer sistema. A palestra aborda os melhores tópicos, as principais áreas problemáticas no projeto de experimentos e processamento, bem como casos práticos de aplicação bem-sucedida de abordagens de transcriptoma.


imagem

9. Análise de dados NGS em genética médica: definição, anotação e interpretação de variantes genéticas (Yuri Barbitov, Universidade Estadual de São Petersburgo, Alexander Predeus, Instituto de Bioinformática)

Vídeo | Slides

O uso do seqüenciamento de uma nova geração já ultrapassou os limites da ciência clássica e foi aplicado com sucesso em muitos outros campos, inclusive na área da saúde. A palestra é dedicada a aspectos-chave da análise de dados de seqüenciamento de uma nova geração em genética médica. Yuri mostrou todo o caminho, desde a obtenção de leituras brutas até o diagnóstico, mencionando as dificuldades encontradas na determinação, anotação e interpretação de variantes genéticas. Separadamente, ele abordou os erros comuns cometidos em cada estágio do processamento de dados. Em conclusão, é apresentada uma breve visão geral de áreas promissoras de pesquisa que podem melhorar a precisão do diagnóstico usando métodos de sequenciamento de alto desempenho.


10. Aplicação prática do ChIP-Seq e métodos relacionados (Alexander Predeus, Instituto de Bioinformática)

Vídeo | Slides

Os métodos ChIP-Seq, bem como a "pegada genômica" (ATAC-Seq, FAIRE-Seq, DNase-Seq) são amplamente utilizados para encontrar mecanismos de regulação de processos biológicos, em particular para a regulação transcricional. O espaço potencial dos fatores estudados é muito multidimensional, mas a abordagem seletiva permite obter informações ricas sobre a regulação no sistema com base em apenas alguns experimentos. Usando o exemplo de teorias modernas conflitantes, Alexander mostrou as principais dificuldades na interpretação das informações regulatórias e como consolidar os resultados.


imagem

11 *. O que posso fazer com os dados do iScan (Tatyana Tatarinova, Universidade de La Verne)

Vídeo | Slides

A empresa Illumina produz um grande número de dispositivos para diversas necessidades. A fragmentação permite detectar rapidamente polimorfismos de nucleotídeo único (SNPs) para um grande número de amostras. A palestra é dedicada à revisão dos dados dos chips iScan e sua aplicação no diagnóstico clínico.


imagem

12. Aprendizagem Profunda em Biologia Computacional (Dmitry Fishman, Universidade de Tartu)

Vídeo | Slides

O aprendizado profundo é usado ativamente não apenas para melhorar a tradução automática ou o reconhecimento de fala, mas também permite solucionar muitos problemas no campo da biologia computacional. A palestra é dedicada à aplicação de métodos de aprendizado profundo em exemplos biológicos específicos. Dmitry falou sobre o que há de novo em biologia e medicina usando aprendizado profundo, e é possível dizer que as máquinas revolucionam a medicina e a biologia.


imagem

13 *. Aplicação de métodos de aprendizado de máquina para procurar possíveis mutações patogênicas no genoma humano (Anna Ershova, Instituto de Física e Tecnologia de Moscou, Instituto de Pesquisa de Biologia Física e Química, Universidade Estadual de Moscou com o nome de MV Lomonosov, Centro Federal de Pesquisa em Epidemiologia e Microbiologia com o nome de N.F. Gamalei)

Vídeo | Slides

A busca por mutações patogênicas tornou-se relevante em conexão com o seqüenciamento do genoma humano. No entanto, é simplesmente impossível resolver esse problema manualmente. A palestra é sobre como o aprendizado de máquina pode ajudá-lo a fazer isso.


imagem

14 *. Imunoinformática (Vadim Nazarov, HSE, IBCh RAS)

Vídeo | Slides

O aprendizado de máquina tem sido usado ativamente em vários campos da vida, mas em imunologia eles encontraram um lugar para isso recentemente. Nesta palestra, Vadim falou sobre vários exemplos do uso de máquina e aprendizado profundo em imunologia, incluindo a tarefa de prever a ligação de complexos MHC-peptídeo e a análise de repertórios de receptores de células T.


imagem

15 *. Estudo da adaptação do hospedeiro e desenvolvimento da resistência ao vírus HIV e hepatite C usando métodos estruturais de bioinformática (Olga Kalinina, Instituto Max Planck de Informática)

Vídeo | Slides

O vírus da imunodeficiência humana (HIV) e o vírus da hepatite C causam doenças graves e difíceis de tratar. Como muitos outros vírus retro e RNA, esses vírus evoluem rapidamente e, portanto, podem se adaptar tanto aos efeitos de medicamentos antivirais específicos quanto à resposta imune adaptativa do organismo hospedeiro. Nesta palestra, Olga mostrou como, combinando a análise de seqüências de proteínas virais com uma análise de sua estrutura espacial, é possível fazer previsões sobre o desenvolvimento de mecanismos de resistência e a interação de vírus com o sistema imunológico do hospedeiro.


imagem

16. Previsão do efeito de mutações (Vasily Ramensky, MIPT)

Vídeo | Slides

Os métodos modernos de seqüenciamento fornecem uma enorme quantidade de informações sobre o polimorfismo do genoma, ou seja, as diferenças entre os genomas individuais um do outro. Essas diferenças (variantes) surgem como resultado de mutações durante a replicação do DNA e são parcialmente fixadas na população. A prevalência, localização e efeito funcional das variantes genômicas variam muito - da mortalidade completa à ausência de qualquer efeito em um fenótipo individual. A palestra discute abordagens modernas para prever o efeito funcional das opções usadas em medicina personalizada, medicina e genética de populações.


imagem

17. Modelagem e design em múltiplas escalas de moléculas biológicas (Nikolai Dokholyan, Universidade da Carolina do Norte em Chapel Hill)

Vídeo

A vida das moléculas biológicas abrange escalas de tempo e comprimento correspondentes a escalas de tempo e comprimentos de atômico a celular. Consequentemente, novas abordagens para modelagem molecular devem ser inerentemente multiescala. Em sua palestra, Nikolai descreveu várias metodologias desenvolvidas em seu laboratório: um algoritmo para modelagem dinâmica dinâmica rápida e discreta, projeto de proteínas e ferramentas de refinamento estrutural. Usando essas metodologias, várias aplicações podem ser descritas que esclarecem a etiologia molecular da fibrose cística e encontram novas estratégias farmacêuticas para combater esta doença, modelam a estrutura do RNA tridimensional e desenvolvem novas abordagens para controlar proteínas em células e organismos vivos.


imagem

18. Dobragem homóloga de proteínas (Pavel Yakovlev, BIOCAD)

Vídeo

Na biologia estrutural moderna, existem vários métodos computacionais que permitem caracterizar moléculas biológicas com alta confiabilidade, suas similaridades e diferenças, métodos de interação e funções. Para construir tais cálculos, o parâmetro espacial da proteína sempre atua como parâmetro de entrada, no entanto, sua preparação pode ser difícil, apesar de meio século de progresso no campo da cristalografia. A palestra é dedicada a resolver esse problema com a ajuda da modelagem homóloga de estruturas de proteínas - a construção de estruturas tridimensionais a partir de fragmentos semelhantes. Por exemplo, consideramos os domínios variáveis ​​dos anticorpos - proteínas com uma diversidade estrutural única de ciclos variáveis.


imagem

19. Como parar de meditar e começar a modelar (Arthur Zalevsky, Universidade Estadual de Moscou com o nome de MV Lomonosov)

Vídeo | Slides

Uma grande quantidade de dados obtidos pelo método NGS permite não apenas obter conclusões biológicas disso, mas também usá-las para modelagem. Os modelos construídos tornam possível entender melhor os dados biológicos e obter ainda mais significado biológico do experimento. A palestra é dedicada à modelagem e aos estágios iniciais deste processo.


imagem

20 *. De pé sobre os ombros dos gigantes, ou por que precisamos de consórcios (Demidov alemão, Centro de Regulação Genômica, Instituto de Ciência e Tecnologia de Barcelona, ​​Universitat Pompeu Fabra)

Vídeo | Slides

Nas últimas décadas, o desenvolvimento da biologia tem sido associado ao acúmulo de matrizes de dados, tão grandes que grupos de pesquisa individuais não conseguem mais lidar com suas análises bioinformáticas. Para solucionar esse problema, começaram a ser criados consórcios a partir de dezenas de laboratórios, como o Projeto Genoma Humano, 1000GP, ENCODE e outros. Graças a essas colaborações, existem vários tipos de dados em domínio público, obtidos usando várias tecnologias. Como resultado, comparar novos dados experimentais com os existentes tornou-se parte padrão de qualquer estudo. Os consórcios produzem não apenas dados, mas também dutos bioinformáticos para seu processamento, formatos padrão e procedimentos de avaliação da qualidade. Esta palestra discute como os consórcios funcionam, como usar os resultados do trabalho deles e o que fazer se você de repente se tornar membro de um consórcio e precisar processar terabytes de dados e compartilhar os resultados com todos os outros participantes.


imagem

21 *. Visão geral das empresas de bioinformática na Rússia e no mundo (Andrey Afanasyev, yRisk)

Vídeo | Slides

No mundo moderno, ciência e negócios estão cada vez mais entrelaçados. Esta tendência e o campo da bioinformática não foram ignorados. Andrey falou sobre as expectativas e a realidade do mercado, histórias de sucesso e histórias de fracasso, sobre pessoas e lugares relacionados à bioinformática.




22. Análise avançada de variações (SNV, InDel, SV) usando o navegador genômico NGB (Gennady Zakharov, EPAM, IP Pavlov Institute of Physiology, RAS)

Vídeo | Slides

A palestra aborda o processo de análise visual de variações simples (SNV, InDel) e estruturais no navegador genômico. Todos os exemplos são demonstrados usando o navegador NGB, que atende à maioria dos requisitos e recomendações da análise de variações estruturais, incluindo vários tipos de visualizações e obtenção de anotações de bancos de dados externos. Em uma palestra sobre exemplos reais, são mostrados cenários de validação e análise das consequências de variações simples e estruturais.



Posfácio


Para aqueles que não entendem nada, eles querem se desenvolver no campo da bioinformática - até 27 de maio, as inscrições para a escola de verão deste ano de 2018 ainda estão abertas. A própria escola será realizada de 23 a 28 de julho, perto de São Petersburgo. Há uma chance de pular para o último carro e mostrar orgulhosamente a todos um post com uma visão geral das palestras do próximo ano, dizendo que eles o viram pessoalmente.

Em 2017, a escola foi realizada com o apoio de nossos parceiros regulares - JetBrains , BIOCAD e EPAM Systems , pelos quais muitos agradecem a eles.

By the way, um post com palestras do ano anterior às últimas escolas .

Toda bioinformática!

imagem

Source: https://habr.com/ru/post/pt412453/


All Articles