Olá Habr! Hoje vou mostrar minha tradução de uma maravilhosa entrevista com
Alexander Zhavoronkov . Espero que seja tão interessante para você ler quanto eu traduzir.

A inteligência artificial nos promete melhor saúde, desenvolvimento e teste de drogas mais rápidos. Tudo isso é feito com o objetivo de melhorar os resultados dos pacientes. Hoje, estamos conversando com um especialista mundial no uso da inteligência artificial nas ciências da vida, cujo objetivo é encontrar e desenvolver medicamentos de forma mais rápida e barata.
Alexander Zhavoronkov é o fundador e CEO da Insilico Medicine. A empresa é líder no campo da inteligência artificial da próxima geração, cujos métodos visam a descoberta de novos medicamentos, o desenvolvimento de biomarcadores e a pesquisa sobre o envelhecimento. Antes da Insiliko, ele atuou em funções de gerenciamento na ATI Technologies, NeuroG Neuroinformatics, Fundação para Pesquisa Biogerontológica e YLabs.AI. Desde 2012, ele publicou mais de 130 artigos científicos revisados por pares e 2 livros. Por seis anos, ele organizou os fóruns anuais “Pesquisa sobre envelhecimento para descoberta de drogas e inteligência artificial para serviços de saúde” na Basel Life / EMBO em Basel. Alexander é professor associado do Instituto Buck para Pesquisa em Envelhecimento.
Michael Kriegsman: Conte-nos brevemente sobre a Medicina Insilico e no que você está trabalhando.
Alexander Zhavoronkov: Estamos focados principalmente na aplicação de métodos de inteligência artificial da próxima geração para desenvolvimento de medicamentos, desenvolvimento de biomarcadores e pesquisa de envelhecimento. Nosso foco é especificamente em duas técnicas de aprendizado de máquina: redes adversárias generativas (
GAN ) e
aprendizado reforçado . Esses são os métodos nos quais temos mais experiência em nosso campo.
Usamos esses métodos para dois propósitos. Uma delas é a identificação de alvos biológicos e a criação de biomarcadores a partir de vários tipos de dados, bem como a criação de novas moléculas, novas estruturas moleculares com um conjunto específico de propriedades. Fomos uma das primeiras empresas, talvez a primeira a criar novas moléculas usando uma nova tecnologia chamada redes geradoras-competitivas e testar essas moléculas experimentalmente.
O que é um pipeline de desenvolvimento de medicamentos?
Michael Kriegsman: Conte-nos um pouco de contexto. O que é um pipeline de desenvolvimento de medicamentos? Por que isso é tão difícil? Vamos conversar sobre isso. Então podemos seguir como a IA a torna melhor e mais fácil.
Alexander Zhavoronkov: A descoberta e desenvolvimento de medicamentos é um processo muito longo. É também um daqueles processos em que você tem mais falhas do que sucessos. De fato, há muito mais falhas do que sucessos.
São necessários mais de US $ 2,6 bilhões para desenvolver um medicamento e trazê-lo ao mercado para tratar uma doença específica. Isso ocorre após a molécula ter sido testada em animais. Além disso, após a molécula ter sido testada em animais, a taxa de falha é de 92%. Quando um medicamento é testado em humanos, ele falha em 92% dos casos. Portanto, o processo não é apenas demorado, mas também arriscado.
Normalmente, o tempo necessário para a descoberta e desenvolvimento de uma molécula é de cerca de dez anos. As pessoas que iniciam o processo nem sempre estão presentes quando a molécula invade. O processo consiste em várias etapas.
O primeiro é a geração de hipóteses. Você propõe uma hipótese, uma teoria de uma doença específica e determina os alvos apropriados. Você está falando sobre quais proteínas estão envolvidas na doença e quais proteínas são a causa.
Depois disso, você desenvolve um anticorpo ou molécula pequena para essa proteína alvo. Se você está desenvolvendo uma molécula pequena, geralmente começa verificando grandes bibliotecas de compostos que podem atingir esse alvo em particular e faz todos os tipos de experimentos para ver como essas moléculas pequenas se ligam a esse alvo.
Depois disso, você seleciona várias opções. Você determina quais moléculas são mais adequadas para esse alvo protéico e começa a realizar todos os tipos de experimentos com essas moléculas para determinar se elas funcionam bem no sistema biológico, em uma análise relacionada à doença, em um rato, cachorro ou outros animais, e então você solicita um IND (
pesquisa de novos medicamentos ) com o FDA para obter a molécula em ensaios clínicos.
Após a conclusão desse processo, começamos a desenvolver medicamentos e a iniciar ensaios clínicos. Tudo começa com a fase I, relacionada à segurança. Na fase II, você testa a eficácia da droga. Na fase III, você testa as duas fases em grandes ambientes clínicos, em grandes populações. Depois, você pode prosseguir para a fase IV ou iniciar o lançamento do produto.
Descoberta de medicamentos e pesquisa pós-comercialização
Alexander Zhavoronkov: E depois da pesquisa de marketing. Esse processo geralmente leva mais de dez anos e falha em 92% dos casos.
Com a IA, você pode realmente tocar em quase todos os segmentos, começando com a descoberta de medicamentos em um estágio inicial, quando a IA pode ajudá-lo com o modelo de hipóteses e, de fato, tirar as agulhas do palheiro com o identificador do alvo, com a identificação de pequenas moléculas, com triagem virtual, com a criação de novas moléculas com propriedades especiais, com o planejamento do desenho de um ensaio clínico e a inclusão em um ensaio clínico. E então, também, para prever os resultados de ensaios clínicos.
Michael Kriegsman: Onde a IA começa a encurtar o processo, melhora?
Alexander Zhavoronkov: Se você está nos estágios iniciais do desenvolvimento de medicamentos, comece a trabalhar na geração de hipóteses e na identificação de alvos, geralmente você tem várias maneiras de seguir. Uma maneira é procurar literatura e identificar áreas promissoras que foram descobertas por cientistas no passado e publicadas.
A IA pode ajudá-lo a produzir uma enorme quantidade de literatura, bem como outras fontes relacionadas, para identificar sinais e alvos que podem estar associados à doença. Normalmente, no Insilico, começamos com dados de doações. Estamos analisando doações biomédicas no valor de US $ 1,7 trilhão nos últimos 25 anos. Em seguida, analisamos como essas doações se transformam em publicações, em patentes de ensaios clínicos e depois em produtos no mercado.
Seguimos de idéia em idéia e de dinheiro em dinheiro, ou seja, de dinheiro no mercado. Também observamos como o dinheiro se torna dados. Portanto, geralmente, quando o governo apóia um determinado estudo, os dados devem ser armazenados em um repositório público para que outras pessoas possam copiá-los, bem como para o bem comum.
Tentamos acompanhar o dinheiro nos dados. Se não houver dados, tentamos entrar em contato com o cientista e obter dados do cientista e / ou instamos o cientista a colocar os dados em um armazenamento público.
Começamos com bancos de dados de texto, mas também associamos esses dados com dados omix. De fato, tudo o que termina com "ôhmico" (transcriptômica, genômica, metabolômica, metagenômica) é chamado de dados omix.
Trabalhamos principalmente com dados sobre a expressão gênica, e analisamos como o nível de expressão de certos genes ou redes inteiras muda, digamos, de um estado saudável para uma doença. Transformamos essas mudanças, esses sinais da doença em alvos separados e determinamos que tipos de proteínas podem ser alvos usando uma molécula pequena.
Depois, voltamos à arte anterior no texto e verificamos se alguém publicou algo que reforçasse nossa hipótese. Isso não significa necessariamente que nossa hipótese esteja incorreta se não houver sinal no texto, porque às vezes as pessoas simplesmente não conseguiam realmente associar um alvo específico à doença usando métodos mais antigos, mas isso nos dá um pouco mais de confiança para ver que alguém já está tocou neste problema e neste alvo antes.
Coletamos enormes quantidades de dados que são simplesmente impossíveis de processar com a ajuda da inteligência humana. Também coletamos e combinamos esses tipos de dados. Às vezes, esses tipos de dados são completamente incompatíveis e é impossível costurá-los usando ferramentas padrão. Você realmente precisa treinar redes neurais profundas simultaneamente em vários pacotes de dados para que eles possam ser generalizados e para que possamos extrair as funções correspondentes presentes em vários tipos de dados ao mesmo tempo.
Alguns dos tipos de dados com os quais trabalhamos são completamente incompreensíveis para a mente humana. Como, por exemplo, dados de expressão de genes ou dados de movimento, ou dados de varredura de atividade cardiovascular ou dados de ultrassom. Conseguimos combinar esses tipos de dados usando a IA e depois determinamos os destinos correspondentes.
Biologia vs Inteligência Artificial
Michael Kriegsman: No Insilico, sua principal especialização é biologia e medicina ou o desenvolvimento de métodos de inteligência artificial? É possível separar essas duas direções?
Alex Zhavoronkov: No nosso caso, as duas áreas são boas e contratamos pessoas de forma competitiva internacionalmente. Nas competições, realizamos testes muito complexos que as pessoas precisam resolver muito rapidamente. Esses problemas geralmente estão associados ao desenvolvimento do método da IA e à solução de um problema biológico ou químico complexo.
No entanto, quando você olha para os realmente grandes cientistas da IA, eles geralmente não são muito bons em biologia ou química. Eles são bons em matemática. É por isso que uma certa porcentagem de nossa empresa é simplesmente matemáticos maravilhosos que desenvolvem novos métodos, por exemplo, para combinar química e biologia usando aprendizado profundo.
Parte da empresa é especializada na aplicação de métodos existentes, como o GAN, e no aprimoramento do treinamento em problemas existentes em química e biologia. Essas pessoas geralmente estão do lado aplicado e conhecem química e biologia. Eles podem se comunicar com matemáticos, bem como realizar algumas pesquisas básicas no campo da IA.
Obviamente, temos apenas biólogos e químicos puros que também são necessários para testar alguns dos resultados de nossa IA. É por isso que temos uma equipe tão grande, diversificada e internacional, porque realmente precisamos cobrir essas três áreas: métodos, aplicativos e validação.
Michael Kriegsman: Temos uma pergunta interessante de Chris Peterson no Twitter, dizendo: “Os programas paralelos em Fortran baseados em grade ainda são usados para alguns estudos farmacocinéticos e farmacodinâmicos. Você vê que a IA substitui o código da velha escola, o aprimora ou evolui em paralelo? ”
Alexander Zhavoronkov: Acho que agora precisamos nos mover em paralelo. Obviamente, alguns dos métodos mais antigos ainda são usados por especialistas realmente importantes no campo da descoberta de medicamentos. Mas a maioria desses métodos é significativamente acelerada pela computação de alto desempenho e inteligência artificial; portanto, esse é um software típico que existe há muito tempo, por exemplo, Schrodinger. A empresa existe desde 92 anos.
A empresa fez um grande avanço em muitas áreas e conseguiu avançar com algoritmos antigos para resolver problemas muito complexos. Eu acho que no Insilico estamos tentando reinventar tudo e escrever nosso próprio software. Mas, é claro, conhecemos muitos de nossos funcionários que simplesmente gostariam de pegar pequenos pedaços do nosso salame grande, que estamos desenvolvendo, e brincar com ele. Talvez eles estejam usando ferramentas mais clássicas que não podemos contornar agora.
Idealmente, você deve ter um transportador de peça única que identifique alvos, gere moléculas e conduza essas moléculas através de um grande número de simulações em um transportador contínuo. É isso que estamos construindo, e este é o nosso Santo Graal. Mas, é claro, muitas empresas, muitos grupos estão tentando criar o jogo Lego e tentando usar várias ferramentas com resultados diferentes para resolver o mesmo problema.
Desenvolvimento de ferramentas de IA dentro da empresa
Michael Kriegsman: Por que você está desenvolvendo suas próprias ferramentas?
Alexander Zhavoronkov: Sim, simplesmente porque muitos dos métodos que usamos são tão novos que são incompatíveis com ferramentas mais antigas. Existem muitos grupos que afirmam estar envolvidos em inteligência artificial, mas, de fato, estão envolvidos em trabalhos mecânicos, pegando software pronto e tentando colmatar algumas lacunas na pesquisa e desenvolvimento farmacológicos usando essas ferramentas. Nós não fazemos isso. Desenvolvemos tudo do zero, desde o identificador do alvo até a geração de pequenas moléculas.
Michael Kriegsman: Agora falamos sobre o uso de seus métodos para identificar possíveis candidatos. O próximo passo é avaliar. Primeiro, precisamos liberar as possibilidades, e você faz isso agregando todos esses dados e analisando-os usando vários métodos. Suponha que você fez isso. Como você avalia os candidatos que revelou inicialmente?
Alexander Zhavoronkov: Geralmente, quando você tem uma lista de proteínas-alvo para uma doença específica e tenta priorizar, tenta anotar essas proteínas com o maior número possível de pontos. Você está olhando para ver se essa proteína alvo já esteve envolvida em toxicidade. Como isso se relaciona com todo o resto? Em que tecido ele desempenha um grande papel? Como uma proteína interage com outras proteínas? Isso é uma cura? É um medicamento de molécula pequena ou um anticorpo? Alguém mais usou isso? Qual é o espaço de patente em torno da molécula? Alguém tentou levá-lo à clínica com uma pequena molécula ou anticorpo para uma doença específica?
Existem muitas, muitas, muitas funções de avaliação que você deve considerar. No final, quando você tem basicamente um conjunto muito pequeno de alvos, também os testa em vários sistemas biológicos para determinar qual deles é mais adequado para a doença em que está interessado.
Vou dar um exemplo da prática. Por exemplo, estamos muito interessados em fibrose. A fibrose não é um processo muito simples de descrever, e existem vários tipos de fibrose. Há
FPI ou fibrose pulmonar. Nos pulmões, observa-se fibrose induzida pelo fumo, além disso, fibrose senil. Identificamos mais de 120 tipos de fibrose, comparando tecido normal com tecido fibroso associado a uma condição específica.
Recentemente, conduzimos um estudo de caso no qual analisamos a IPF, identificamos uma lista de metas para essa condição e nossa lista tinha 50 metas. Vimos quando esses alvos são mais ativos e mais relevantes para a doença, em que estágio da doença, porque, penso que, se você entender isso mais tarde ou resolver esses problemas mais tarde, tratará os sintomas, não a causa.
No nosso caso, estamos definindo uma grande lista de metas que provavelmente serão muito relevantes nos estágios iniciais da progressão da doença. Depois, analisamos quais metas são novas, quais as pessoas não prestaram atenção. Não queremos nos concentrar em alvos antigos. Depois, analisamos quais alvos são adequados para medicamentos, onde podemos encontrar uma molécula pequena da biblioteca ou podemos criar uma molécula a partir do zero. Em seguida, analisamos quais alvos podem ser testados em um conjunto específico de ensaios de fibrose.
Michael Kriegsman: Onde está a influência das tecnologias de inteligência artificial que você usa nesse processo?
Alexander Zhavoronkov: Geralmente para calcular os pontos da avaliação do resultado. Você distribui vários pontos para os destinos. No nosso caso, o alvo tem mais de 50 pontos. Determinamos se ele já esteve envolvido em um determinado estado antes, se interage com outras proteínas de uma certa maneira e se isso pode levar à toxicidade. Os preditores que basicamente lhe dão essa avaliação e a probabilidade de que esse objetivo seja o mais relevante são profundamente estudados e desenvolvidos por várias organizações. Desenvolvemos nossos preditores usando aprendizado de máquina.
Academia vs indústria
Michael Kriegsman: Temos outra pergunta interessante do Twitter, de Shreya Amin. Ela escreve: "Como os tipos de pesquisa que você descreveu e os processos diferem entre a academia e a indústria?"
Alexander Zhavoronkov: Essa é uma pergunta muito, muito boa. Na indústria, nos grandes produtos farmacêuticos, as pessoas são um pouco menos empreendedoras. Eles estão tentando desenvolver vários métodos para realmente resolver o problema e fazer alterações graduais. Seus métodos não visam a publicação em uma revista científica.
Na academia, as pessoas são muito mais inventivas e empreendedoras. Eles estão tentando publicar os resultados. É daí que a inovação vem, em primeiro lugar.
No Insilico, estamos entre ciência e indústria, por isso publicamos cerca de dois artigos científicos por mês. Isso é suficiente para alguns grupos acadêmicos também provar o conceito e explicar para onde estamos indo.
Acho que os acadêmicos são muito mais produtivos hoje em dia, seja desenvolvendo novos métodos e mostrando novos rumos. No entanto, a diferença entre realmente bons cientistas da computação que estão desenvolvendo novos métodos que podem ser relevantes para a descoberta de medicamentos está muito longe da biologia e da química. , . , - , , , , - .
, ,
, , Google . , , , , , . , , , , , . , , .
: , , , — , . , , , ?
: . , . 5 , 66 . , , , . , . , , API - .
, , , — . . , , , . , , .
, , . , , . , . , , , .
- Insilico
: , -. . , . : « ?»
: , -. , , , -, .
, , , , . , , , .
- . , . , . .
, , , . . , BioBox , , , , .
, , , , ; .
- — . , Juvenessence. , .
: , , -.
: . . . , .
: . @TrovatoChristian. , . , , , . : « , ?»
: . . , , , , . . , , . , .
: ?
: , - , . , , . . , - . . , , , , , . , .
: , , , .
: . , , , . , .
: . , , . : « , , , . . , ?»
: , , .
JAK , GAN . , de novo.
, , , , . , GAN, , . - , .
: , , , , - ? . ?
: , , , , , , — , , , , . , , , , , . , , , , . 15-20% , . .
, , , . , , ,
Nimbus Therapeutics . , .
, , , . , , . . , .
- , , . , , , . . .
: , ? , , .
: . , , . , , , , , , , . , , , , , .
. , , . , , , , , , , , , , .
, , , . , , . , , . , .
: . . , , . . . -.