Bioinformática Andrey Afanasyev é um dos fundadores da startup de biotecnologia yRisk. Em uma entrevista, Andrei contou quais tecnologias elas usam para determinar se uma pessoa tem predisposição para formas hereditárias de câncer, como estão as coisas com as biotecnologias na Rússia e se há trabalho para programadores em biotecnologia.

Sobre o yRisk
Andrey, você é o fundador do laboratório de genética yRisk, está procurando por mutações nos genes e uma predisposição para a oncologia. Diga-me, por favor, como isso acontece na prática?
Fazemos um teste para a presença das chamadas síndromes tumorais hereditárias, o que se traduz em um alto risco de desenvolver câncer durante a vida em uma idade relativamente jovem, até 50 anos.
Como fazemos esse teste? Coletamos sangue de uma pessoa a partir de uma veia, como em um exame de sangue normal, extraímos DNA desse sangue e analisamos o DNA em um dispositivo especial chamado sequenciador. Muitos dados são obtidos do seqüenciador, gigabytes e até dezenas de gigabytes por amostra. Em seguida, analisamos-os usando algoritmos especiais, bancos de dados, recomendações para analisar esses dados e geramos um relatório de várias páginas, no qual informamos se há riscos aumentados em relação à média e o que fazer com eles se houver algum risco.
Nesta entrevista, Andrey fala em detalhes sobre síndromes hereditárias de tumores.
Como tudo isso é organizado em termos de tecnologia? Como você processa esses dados? Você tem algum software próprio?Tivemos experiência em escrever esse software em minha última empresa, na inicialização do iBinom. Fizemos um serviço em nuvem para o processamento bioinformático de dados do seqüenciador e aproveitamos nossa experiência para implementar esse processamento por nós mesmos.
No iBinom, realizamos o processamento na nuvem, usamos o Amazon S3 como armazenamento e o Amazon Elastic Computing Cloud como nós de computação. Agora tudo funciona em um servidor local, onde implantamos um conjunto de programas de bioinformática.
Primeiro, a qualidade dos dados de entrada que vêm do seqüenciador é analisada. Existe um programa especial para analisar a qualidade dos dados do FastQC: com sua ajuda, várias estatísticas, distribuições etc. são construídas.
Se a qualidade é boa nesse estágio, os chamados alinhamentos de dados são executados - alinhamento, mapeamento ou mapeamento. Não existe uma palavra russa estabelecida. O alinhamento é uma tarefa difícil do ponto de vista dos cálculos; leva muito tempo para cada amostra.
Após o mapeamento dos dados, a chamada de variante é realizada usando vários algoritmos estatísticos. Depois disso, as opções encontradas são anotadas para todos os bancos de dados disponíveis.
Após a anotação, é obtida uma placa grande do Excel com opções e funções. E nesta grande placa Excel, já estamos escolhendo as opções com nossos olhos, analisando-as de acordo com os critérios da ACMG (critérios do American College of Medical Genetics).
Essa análise não pode mais ser automatizada; você precisa ir diretamente para as publicações, ler através delas. Se um estiver escrito lá, um tick será colocado; se outro, por exemplo, um tick não será colocado. E isso é feito para cada amostra; várias centenas de registros devem ser visualizados manualmente.
E aqui, o aprendizado de máquina não ajuda, apenas o trabalho manual?
Sim, o aprendizado de máquina não funciona aqui, porque os artigos escritos por pessoas são escritos em formato legível por humanos e não em legível por máquina. Tentamos reproduzir extração de dados usando redes neurais, usando abordagens diferentes para obter significados do texto. Fizemos isso no âmbito do laboratório para análise funcional do genoma há 3 anos, mas vimos que não houve progresso significativo aqui.
Na biologia, essa geralmente é uma história muito importante: os dados não são legíveis por máquina e a marcação dos dados em si é muito complexa. Você não pode simplesmente contratar um monte de gente que diz que aqui está um gato, e aqui está um cachorro, aqui está um semáforo e aqui está uma transição. Isso deve ser lido por pessoas que tenham uma boa educação biológica.
Existem tentativas de coletar bancos de dados automatizados lá, mas como uma pessoa que usa algumas dessas bases, posso dizer que a qualidade é terrível. Frequentemente, as pessoas, relativamente falando, leem algo na anotação, de alguma forma a entendem e escrevem, por exemplo, que a opção é patogênica, embora você vá para o texto do artigo e diga em texto simples que não é patogênico. Isso é exatamente o oposto. Portanto, as possibilidades de algum tipo de processamento do computador terminam aqui, e você precisa procurar todas as informações relevantes com seus olhos.
Seu site diz que o teste é 99,99% preciso e isso soa muito legal. Se este texto é tão eficaz, por que não pode ser feito em um hospital regular?Esse teste requer equipamentos - seqüenciadores, sequenciadores ainda são instrumentos de pesquisa e o teste que estamos fazendo é pesquisa.
Os laboratórios médicos não querem mexer com os dispositivos de pesquisa. Há muitas razões para isso: a partir do fato de que eles não podem receber um reembolso do IVA, terminando com o risco de que sejam inspecionados pela Roszdravnadzor para reagentes ou dispositivos que não estejam registrados como médicos.
Aqui a história é muito simples. Os testes médicos por lei são realizados em equipamentos antigos e reagentes antigos. Testes que não são médicos não podem ser comercializados ou comercializados de uma maneira específica. Por exemplo, um teste não médico não pode ser comprado com dinheiro do governo alocado para medicamentos ou o VHI não pode ser coberto.
Portanto, estamos aqui na vanguarda. Fale que testes como o nosso, baseados no sequenciamento de uma nova geração, devem ser realizados por algum tempo, pelo menos quatro anos. Mas as coisas ainda estão lá.
Existe previsão de quando será disponibilizado ao público?Não creio que na Rússia um dia se torne publicamente disponível. Em algum momento, provavelmente será, mas não no futuro próximo, com certeza. Nosso Ministro da Saúde diz que temos um sistema de saúde de referência. Temos um monte de problemas mais prementes, por exemplo, acesso básico a muitos medicamentos. Se você ler o que as pessoas escrevem com os fundos, poderá ver que tudo é terrível no campo da provisão de drogas.
Este teste é um problema para pessoas brancas. Quando uma pessoa está indo bem, ela tem dinheiro e pode fazê-lo novamente.
Você tem planos de desenvolver outra coisa?Temos planos relacionados a diferentes produtos para planejamento familiar, gerenciamento de gravidez. Aqui queremos trabalhar em parceria com outras clínicas.
Fizemos o produto inicial relacionado à oncologia, na esperança de que ele seja procurado na Rússia, mas em dois anos percebemos que a demanda era superestimada e agora queremos mudar para produtos ligeiramente diferentes.
A palestra de Andrey sobre as teorias existentes sobre envelhecimento, animais estranhos de longa duração e produtos farmacêuticos que podem ajudar a humanidade a lidar com o envelhecimentoSobre bioinformática
O que a bioinformática está fazendo em todo o mundo hoje? Quais são as tarefas mais aplicadas que enfrentam?A bioinformática geralmente é chamada de pessoas que resolvem alguns problemas computacionais aplicados à biologia. Ou seja, as tarefas que a bioinformática enfrenta são tarefas dos biólogos.
As tarefas científicas mais bonitas são o progresso no entendimento da evolução e no desenvolvimento da teoria da evolução. Porque a partir das comparações de sequências genômicas, pode-se obter muitas coisas interessantes sobre como foi a evolução das espécies, sobre a determinação do relacionamento de algumas espécies e outras, sobre questões diferentes sobre o acúmulo de mutações, sobre mutações levemente prejudiciais etc. Este é provavelmente o mais interessante do ponto de vista da ciência.
Do ponto de vista das coisas aplicadas, para o que a bioinformática é usada agora, é para a análise de seqüências genômicas. A análise de sequências genômicas é tarefa de doenças hereditárias ou de câncer. Os dados dos genomas das pessoas que sofrem de doenças hereditárias são analisados, a fim de estabelecer um diagnóstico, desenvolver um tratamento, a fim de entender com que frequência isso ocorre. Esta é uma tarefa.
A segunda tarefa é oncológica. Os dados dos genomas do tumor são analisados na tentativa de entender quais mutações causadoras existem, quais mutações de passageiros, quais mutações podem ser usadas para desenvolver uma nova terapia, como o tumor está evoluindo e que variedade de tumores acontece.
A terceira coisa é genômica populacional. Esta é uma tentativa de entender o quão geneticamente somos diferentes, quais são as características de diferentes populações e o que fazer com tudo isso.
Que recente descoberta em bioinformática o impressionou particularmente?
É difícil falar sobre a descoberta em bioinformática, porque geralmente é um trabalho ao seu alcance. Vou dizer algo mais próximo da realidade, porque é improvável que coisas científicas sejam muito interessantes.
Houve um trabalho interessante de Snyder na análise bioinformática do microbioma de seu corpo por um ano. Quase todos os dias, ele media como seu microbioma estava mudando e publicava dados sobre essa dispersão. Mudou bastante ao longo do ano.
Desde então, dados de microbioma da população podem ser esperados. É muito interessante como diferentes microbiomas diferem para pessoas diferentes durante o ano, mas entre si, dependendo do local de residência, estilo de vida e similares.
Como as biotecnologias estão se desenvolvendo na Rússia?
Sobre isso, só posso falar bem ou de qualquer maneira :) Em um sentido amplo, algo está acontecendo na Rússia. Do lado médico, é claro, algo acontece também, mas é incomparavelmente menor e mais lento do que o que está acontecendo nos Estados Unidos. Porque Sejamos honestos, porque a medicina russa é pequena e atrasada.
Praticamente não temos desenvolvimento de nossos próprios medicamentos. O máximo que fazemos é genéricos e biossimilares. Quase todos os medicamentos originais do desenvolvimento russo são fuflomicina, que não têm evidências confirmadas normais de eficácia. Claro, tudo é muito triste aqui.
Nós, como um mercado médico isolado, somos muito pequenos, não temos motivos especiais aqui. No entanto, temos várias empresas interessantes na junção de TI e biotecnologia. Por que eles estão lá? Porque temos muitos bons especialistas em TI, e os especialistas em TI se esforçam para biotecnologia. E quando eles entendem que o próximo encontro de dentistas, por algum motivo, não decola na Rússia ou no próximo registro médico eletrônico, às vezes eles têm melhores idéias.
Eu realmente gosto do UNIM. Eles fizeram uma coisa bastante simples: eles digitalizaram a histologia. Todos os diagnósticos de câncer são confirmados por exame histológico. O exame histológico ocorre quando as células são colhidas, coradas de maneira especial e examinadas ao microscópio. O UNIM digitalizou essas imagens microscópicas em alta resolução, com zoom e armazenamento em nuvem.
E agora a seção histológica não é vista através de um microscópio, mas na tela do computador, e não em um médico, mas em três. E não apenas um médico que recebeu um atestado médico, mas também passou por treinamento interno no UNIM e passou nos exames, independentemente do estado. Tudo isso aumenta drasticamente a precisão do diagnóstico.
Isso não é algo muito difícil do ponto de vista da tecnologia, mas os benefícios são poderosos e interessantes. Embora armazenar imagens grandes também seja bastante difícil, não há maravilhas para o aprendizado de máquina aqui.
Você pode dar outros exemplos de projetos biotecnológicos russos que você gosta?Eu gosto do que os caras do Atlas estão fazendo. Eles fazem testes genéticos. Sua idéia inicial é criar uma clínica privada na qual as decisões também serão baseadas em dados de testes genéticos. Inicialmente, eles criaram a tecnologia errada para testes genéticos, fizeram testes de microchips - a partir desses dados, pouca informação médica pode ser obtida.
Eles recentemente anunciaram que fabricaram o produto Complete Genome, querida, mas informações mais relevantes em termos médicos podem ser obtidas com esse produto. Eu gosto da maneira como eles prestam serviço ao cliente, coisas visuais. Bonito, sólido, legal.
Como regra, os produtos digitais em medicina na Rússia são algo não tecnológico, banal, simples. Stanislav Sazhin tem uma boa e velha rede social para médicos. É uma história clara, porque as empresas farmacêuticas não podem anunciar medicamentos com receita médica assim na Internet e só podem anunciar aos médicos. E aqui você está criando uma rede social na qual apenas um médico pode se registrar, incluindo uma cópia do seu diploma. E aí você pode torcer o anúncio de empresas farmacêuticas. E ele está indo bem. Comercialmente, esta é provavelmente uma das empresas de maior sucesso em medicina digital. Mas não é de tirar o fôlego quando falamos sobre isso.
Ou serviço Zoon - um mercado para serviços médicos. História digital normal: laboratórios e clínicas publicam suas descrições e assim por diante. Isso ajuda a gerar leads, mas, novamente, não é de tirar o fôlego.
Uma palestra detalhada sobre quais empresas de bioinformática existem atualmente na Rússia e no mundoVamos falar sobre a segunda parte da palavra "bioinformática". Qual é o trabalho dos programadores em biotecnologia? E existe algum?Claro. Afinal, alguém precisa construir a infraestrutura para executar todo o nosso software de bioinformática. Alguém precisa escrever um novo software de bioinformática.
Existem várias abordagens. O primeiro: pegar um biólogo e ensiná-lo a programar, o segundo: pegar ciência da computação e ensinar biologia. Bem e o terceiro: pegar a pessoa e estudá-la, biologia e programação. Aqui a história é tal que, se você pegar um biólogo e ensiná-lo a programar, um resultado normal nem sempre é obtido. Se você pega um programador e aprende biologia, na verdade você o ensina análise de dados, e ele rapidamente vai para a ciência de dados em um local com altos salários.
Devo dizer honestamente que não existe um nível de salário como o de TI. Em todos os lugares haverá salários mais baixos. E também na bioinformática, os salários são mais baixos do que apenas na análise de dados para um digital. E isso, é claro, é um problema, porque muitas pessoas, muitos amigos meus de bioinformática, trabalharam, se certificaram de receber alguns centavos e voltaram para a TI. Aqui a competição não é mantida. As pessoas geralmente seguem por algumas razões ideológicas, mas por muito tempo elas não se chocam com essas considerações ideológicas.
Se algum desenvolvedor decidiu que ele também quer ajudar na luta contra o câncer, o que ele deve fazer, para onde ir? Ou não vai a lugar nenhum?Bem, ele pode trabalhar no reconhecimento de imagens, trabalhar na análise de dados, obter habilidades e experiências interessantes. Não há grandes empresas aqui, portanto ainda haverá algum tipo de startup. Se você se cansar ou se o salário parecer pequeno, você sempre poderá voltar.
Sobre a popularização da ciência
Você é um dos popularizadores da bioinformática. Como e por que você começou a fazer isso?
Comecei a fazer isso porque eu gosto. Eu gosto de falar, gosto de conversar, conversar com o público, para transmitir algumas das minhas idéias. Estou satisfeito, então faço isso.
Comecei no Science Slam em 2014, os caras me convidaram para falar e disseram que depois disso sua vida mudará e não será a mesma de antes. Não se deixe enganar :)
Eles são ótimos, para que os palestrantes iniciantes estejam imediatamente na sala de aula mais amigável e acolhedora. Toca, e depois disso quero continuar falando.
O mesmo desempenho no Science Slam, que começou o amor pela popularização da ciênciaVocê sente que o interesse neste tópico está crescendo?Eu acho que sim. Coisas relacionadas a treinamento e entretenimento - elas, é claro, estão em ascensão. Isso é notável tanto no número de cursos que eu e meus amigos realizamos, quanto no número de palestras que existem e no número de pessoas que me ligam para falar.
Quando tudo começou, pareceu-me que esse era um tipo de tópico nerd, e agora vejo que esse é o mainstream mais completo. As pessoas gostam de sair e fazer perguntas. Eu mesmo gosto de aprender através da comunicação com as pessoas, também gosto de ler livros, mas é melhor inserir rapidamente um tópico em algum tipo de contato humano. E estou muito feliz que tudo isso esteja se desenvolvendo.
Lentamente, pode-se até dizer o mercado científico. Isso deixa de ser uma atividade para estudantes de pós-graduação em seu tempo livre.
Muitas vezes você não se apresenta em Moscou?Claro! Falo constantemente e com grande prazer em diferentes cidades. Somente este ano eu me apresentou em Nizhny Novgorod, Tver, Yekaterinburg, Krasnoyarsk, São Petersburgo, Novosibirsk, na cidade de Plyos. Nos últimos anos, é também Murmansk, Chelyabinsk, Tyumen, Bratsk, Sayanogorsk, Vladivostok.
Como estão as coisas com a popularização nas regiões?Nas regiões, está tudo bem. Eu tenho um amigo, Misha Kaptyug, ele está fazendo o projeto “Cidades Inteligentes”, ele agora tem cobertura - cerca de metade de todas as regiões. Este é um programa científico para crianças, mas de fato para toda a família. E tudo está indo bem com eles.
Ou seja, esse tópico está longe de ser apenas Moscou, está se movendo nas regiões e se movendo de lados completamente diferentes. Costumo colaborar com meus centros favoritos de informação sobre energia atômica - ICAE, este é um projeto da Rosatom sobre a popularização da ciência. Ou seja, não se trata de popularizar o átomo e das realizações dos cientistas atômicos, eles chamam todos, organizam festivais de ciências e, enquanto isso, mostram que a Rosatom Corporation é para o bem. Este, na minha opinião, é um dos bons exemplos de um projeto corporativo.
Bem, em muitas cidades existem pessoas locais que organizam e promovem tudo. Por exemplo, uma comunidade muito legal em Tver, eles começaram a publicar uma revista. Em Ecaterimburgo, há um maravilhoso Yeltsin Center, no qual muitos eventos acontecem, e todo o encontro científico também está indo para lá.
Em geral, há um pedido, há uma demanda para mim como professor e estou muito feliz por haver algum movimento em todas as regiões.
24 de janeiro, Andrei discursará em uma conferência sobre o relacionamento de TI e ciência Mieloconf . Andrei lhe dirá o que você realmente pode aprender com um teste genético e como é o trabalho com dados em genética.
Venha se familiarizar!