👩🏽‍🤝‍👨🏿 👨‍👨‍👦‍👦 🚴 Bigdata de campo arado em medicamentos e produtos farmacêuticos 🐳 👨🏿‍🍳 🦄

O diretor de distribuição de tecnologia da Yandex, promotor de programação, um dos criadores e apresentador permanente do podcast da Radio-T, Grigory Bakunov, falou na conferência DUMP do ano passado sobre quais mudanças fundamentais estão acontecendo na medicina e na farmacologia no momento, quais problemas práticos a ciência enfrenta e qual a aparência da medicina do futuro.

Sob o relatório de vídeo cortado e sua versão em texto.

Olá Brevemente sobre patrocinadores. Não faz muito tempo, fui convidado a participar de uma conferência relacionada à medicina e tecnologia. Eles dizem: "Precisamos de uma palestra curta por 15 minutos". Antes da apresentação, eles me param por um segundo, dizem, um breve anúncio. Acontece que um homem diz: “Uma ótima conferência médica, muito legal! Minha água do mar é literalmente vendida em um estande vizinho, cura todas as doenças, a eficácia é 150% maior que um medicamento usual, não deixe de vir. " Olho e penso: Senhor, se essa pessoa saísse em uma conferência de desenvolvimento, ficaria chapada. E os médicos estão sentados e são normais ou estão acostumados, eu não sei.

Para que estou fazendo tudo isso? Quando estava me preparando para esta apresentação, para ser sincero, pensei em falar sobre outra coisa. Mas, cerca de uma semana e meia atrás, ocorreu-me que eu não queria contar um boletim típico sobre aprendizado de máquina na ciência. Não no sentido de que seja besteira, mas no sentido de que, em média, se você estiver interessado nisso, você já sabe disso.

Se você não souber, simplesmente não está interessado.

Sobre o que quero lhe falar? Quero falar sobre quais problemas práticos a ciência está enfrentando agora, para que seja compreensível para você, programadores e, além disso, até agradável.

Perdoe-me pelas ilustrações. Eu sempre tenho ilustrações que você nem pode olhar para elas, mas ficarei satisfeito se você ao menos sorrir algumas vezes.

A mensagem principal, com a qual você provavelmente deve começar, é esta. Quando, há três anos, comecei a trabalhar em um tópico relacionado à medicina, saúde, produtos farmacêuticos e uso de métodos algorítmicos, fui a vários grandes institutos e conheci muitas pessoas inteligentes por lá, e cada vez fazia a mesma pergunta. Como posso dialogar com pessoas envolvidas em medicina e farmácia, remédios? Como fazê-los falar? Eles dizem: bem, eles devem ser provocados.

E comecei a vir à conferência com esse slogan.

Sempre parecia assim. Você entra no salão e diz: "Olá, queridos médicos e queridos cientistas, devo lhe dizer isso: a medicina não é uma ciência".

Claro, isso não é inteiramente verdade. Eu tenho uma definição simples de por que a medicina não é uma ciência. Como a medicina moderna se parece com a seguinte: até você se formar em um instituto médico, você não pratica medicina, não sabe nada sobre medicina. Você precisa não apenas terminar. Há um estágio, um procedimento complicado, você estuda há quase 9 anos e, a partir disso, começa a ser considerado um médico iniciante. Existe uma linguagem esotérica especial que apenas os médicos falam. E às vezes sinto que eles têm sua própria linguagem escrita.

Nesse caso, a princípio, você apenas aprende, adquire conhecimento e, em seguida, ele fornece um professor, a quem você segue e repete o que ele faz. E só então eles lhe dão um jaleco branco, um chapéu, um estetoscópio (que, como você sabe, os médicos não usam mais, isso é pura parafernália) e dizem: é isso, agora você é médico.

Pense por um segundo, isso lembra alguma coisa? Por muitos anos você foi ensinado pela primeira vez, dificilmente aceito no exame, depois foi atrás do professor e repetiu tudo o que precisava depois dele. E depois de algum tempo você se torna um professor.

A estrutura um para um repete a estrutura das ordens secretas do século 12-14. Um para um. Quem jogou o credo de Assassino provavelmente deveria se lembrar dessa história. Um para um - uma ordem secreta.

Nesse caso, você precisa saber disso. A ordem secreta tem uma tarefa - não criar novos conhecimentos, não aumentar os antigos, mas simplesmente preservar o conhecimento dos antigos. Por esse motivo, a medicina desacelera há muitos anos. Graças a Deus acabou. Na minha opinião, acabou agora e não graças a remédios e médicos, mas porque a humanidade começou a acumular dados.

Esses dados, que acumulamos, muitas vezes começaram a contradizer a medicina. E eles começaram a contradizer fortemente. Especificamente, é difícil contradizer.

A maioria das mudanças importantes e importantes na medicina que ocorreram nos últimos 20 a 30 anos estão associadas exclusivamente a dados.

Além disso, a medicina, apesar de, na minha opinião, a partir do século XXI ter começado a ser científica, tem um grande problema.

Não há uma definição rígida do que é ciência. Mas existem várias técnicas científicas importantes. Parece-me que o mais importante deles é que, se você faz ciência, realiza constantemente experimentos, conta a outras pessoas sobre eles e outras pessoas devem poder reproduzir seu experimento.

O ponto chave da ciência no mundo moderno é a reprodutibilidade do experimento. Além disso, reprodutibilidade de várias maneiras. Você pode repetir o experimento que eu fiz. Outra pessoa pode repetir o experimento que você fez.

E agora, o que é mais importante. Alguém repete suas experiências o tempo todo. Sem isso, não há ciência, não há verificação.

Quando chegamos a esse tópico (há vários entusiastas envolvidos neste tópico), a primeira coisa que descobrimos: a maioria das pessoas que trabalha com dados em torno da ciência não sabe nada sobre como isso funciona no mundo normal dos programadores.

Acredito que este seja um dos experimentos mais bem-sucedidos que fizemos, começamos a trabalhar com farmácia e biologia celular, iniciamos uma cultura do experimento. Cada experimento e os resultados de cada experimento foram projetados na forma de um teste existente. Um teste escrito finalizado em Python. Cada experimento foi projetado dessa maneira.

Os dados de cada ação experimental, ou seja, o uso de um medicamento em uma proteína ou o uso de um medicamento em uma célula, foram realizados em um teste. E é isso que é importante. Todos esses testes foram executados em paralelo, o tempo todo, sem parar. Esse é um padrão clássico chamado Integração Contínua.

Quando começamos a conversar sobre o assunto com os cientistas, eles começaram a falar sobre o assunto: “Bem, isso é incrivelmente difícil. Para fazer isso, você precisa escrever algum software. ” Verificou-se que a maioria dos softwares que os programadores usam há anos para todas essas coisas, como alguns Travis, que usamos há muitos anos, alguns Jenkins, que usamos há muitos anos, também são individuais para os cientistas.

Se você se conecta e começa a pensar, um experimento é um código. As mesmas histórias clássicas de regressão funcionam. Por exemplo, se de repente você decidir em algum momento que são necessárias alterações em seu experimento científico, vamos executar todos os testes antigos em um novo experimento e verificar se eles funcionam.

O teste de regressão clássica não foi a lugar nenhum. Os cientistas ficaram chocados porque descobriram que, se os experimentos fossem realizados da maneira antiga e nova, a diferença nas medições experimentais era de até 20%.

O que é 20% na fazenda? Bem, parece que a farmácia está acostumada a erros. Bem, eles lançaram um medicamento mal sucedido, um ano depois pagaram a alguém, esse medicamento não começou a funcionar para alguém. Na realidade, erros detectados na farmácia em estágios posteriores geralmente levam ao fechamento da empresa. Como se você revelou um efeito colateral complexo 4-5 anos após o lançamento do medicamento e, por sua própria estupidez, o vendeu, por exemplo, nos Estados Unidos ou em qualquer outro mercado civilizado, o número de ações judiciais contra você, como empresa, será de dezenas e centenas, cada dos quais consistirá em dezenas de milhões de dólares. Você gasta mais com advogados.

A introdução de testes de regressão nesse ambiente permitiu, em muitas situações, reduzir o custo dos erros em 20 a 30%. Qual é 20-30% do fluxo total de uma empresa farmacêutica bastante grande com a qual eu interagi com isso? Bem, são 4-5 bilhões de dólares. Segundo eles, o dinheiro é pequeno. Para meu gosto, ao introduzir uma pequena ferramenta, o dinheiro é direto.

A mesma história é uma em uma versão e a abordagem do experimento como tal. A partir do momento em que você começa a pensar no experimento e na ação científica, assim como no código, imediatamente começa a pensar que precisa colocar tudo em algum lugar. Acontece que a maioria dos cientistas com quem estou trabalhando agora olha com entusiasmo no Github e diz: "Bem, o que foi possível?"

As pessoas que trabalham com o Github e o gith há muito tempo entendem que aqui você lançou um novo teste, aqui o Travis conectado, o que levou tudo isso, o estimulou e fez novos testes. A propósito, parece muito bonito! Travis se contrai, uma mão mecanizada se move, que começa a enfiar drogas velhas em pipetas. Imagem incrível!

De fato, a coisa mais importante na história de "vejamos os testes como código" é que o versionamento apareceu. De maneira diferente, eles começaram a trabalhar com hipóteses. Não como "em algum lugar que parecemos estar enganados", mas "vamos dar um git, fazer uma bissecção, descobrir em qual parte do código temos um erro, em qual teste cometemos um erro, em que ponto paramos".

Não sei você, mas essas histórias me excitam muito. Quando começo a pensar nisso, penso: Deus, bem, o estoque de ferramentas que os programadores criaram era incrivelmente grande. Ele é apenas gigantesco.

E Deus o abençoe, com a versão pura dentro da estrutura do Github. Primeiro de tudo, testes são código. Se descrevermos experimentos e hipóteses como código, teremos ótimas ferramentas para análise estática. Temos ótimas ferramentas de análise de código. Vamos procurar erros lógicos sem sequer iniciar um experimento? Vamos mesclar todos os testes em um grande algoritmo e procurar erros lógicos neles? Não tem problema

Aqui você precisa entender que, no farm, a integração contínua é um processo bastante caro, porque cada teste custa algum dinheiro. A realização de um ciclo de IC na história atual com uma grande empresa agrícola com a qual trabalho, leva cerca de 80 mil dólares. Vamos traduzir de outra maneira. Se pudermos cometer um erro lógico no experimento antes do teste, economizando instantaneamente 80 mil dólares.

Os programadores estão bem cientes: a análise estática e o linter podem ser executadas antes da confirmação. Apenas não deixe que as hipóteses inicialmente erradas sejam testadas. Ou dizer que o erro não está na hipótese que você deseja adicionar agora. E isso também acontece.

E também neste momento vem uma coisa muito importante.

Quando uma pessoa trabalha em uma cadeia de experimentos, não há problema. É como se um programador escrevesse o código - sem problemas, coloque em uma pasta no Samba ou no Dropbox e sem problemas, tudo está bem. Nesse momento, quando há dois programadores, os conflitos já estão começando. Quando os programadores são 50 pessoas, e todos trabalham em aproximadamente um pedaço de código, leia um conjunto de testes, é claro, surgem problemas. Aqui, uma folia incrível de criatividade para o uso de ferramentas prontas para uso que os programadores desenvolveram nas últimas décadas.

Ao mesmo tempo, voto no Github com as duas mãos. Eu sinceramente acredito que usar o Github além de apenas armazenar código é simplesmente inacreditável. Apesar de, é claro, não ser representante da empresa Github em nenhum lugar.

O surgimento de ferramentas para o trabalho coletivo de experimentos em combinação com o versionamento tornou possível fazer coisas muito interessantes. Por exemplo, os caras com quem trabalho começaram a se solicitar com ofertas. Só porque, bem, ele foi ver como estão as coisas com a outra equipe, descobriu uma hipótese interessante e, em vez de jogá-la em uma sala para fumantes, como é habitual para os envolvidos em biologia e física, ele fez tudo de forma simples, ele projetou uma solicitação de recebimento, abaixe-a. Por outro lado, os caras disseram: “Oh, ideia legal”, eles congelaram e, depois de algum tempo, vimos um novo teste com um novo experimento no banco de dados.

Infelizmente, devido ao fato de a maioria das relações entre empresas técnicas e farmacêuticas não ser muito pública, não podemos dizer tudo. Posso dizer que conheço pelo menos um medicamento que começou com solicitação de extração há três anos e agora está recebendo a certificação da FDA.

A certificação da FDA significa que em um ano esse medicamento pode aparecer em farmácias. Ainda não é nosso.

Infelizmente, essa mudança na mente dos jovens cientistas ainda é muito difícil de superestimar. Esta é uma transição do desenvolvimento fechado, como é aceito há muitos anos como parte de pequenas equipes de pesquisa, para abrir procedimentos. Tenho certeza de que 3-4 anos se passarão e você verá pequenos laboratórios de pesquisa que todos mantêm no Github e que estão prontos para aceitar solicitações de recebimento de pessoas de fora. E será apenas uma bomba. É apenas um mundo diferente, onde cada pessoa pode, de uma forma ou de outra, participar de atividades científicas normais.

Por que isso é importante? Portanto, por que o código aberto é importante. Não, não estou dizendo agora que o código aberto é o software mais legal do mundo, não. Além disso, parece-me que isso pertence à frase de efeito de quinze anos atrás, com a assinatura "Brilha e pobreza de código aberto". Mas sem o código aberto, não haveria uma quantidade enorme de coisas que usamos todos os dias. Metade do Android. Sem código aberto, não haveria Android.

A mesma história está acontecendo agora com drogas e será legal, será incrivelmente legal quando nos encontrarmos neste mundo.

Aqui, é claro, nem tudo é tão rápido. Mas há uma área em que essa abordagem atual é provavelmente a mais fácil de aplicar.

Existe uma abordagem interessante que diz que é possível começar, para não alterar toda a sua estrutura, não forçá-lo a reescrever tudo, começar a digitalizar os resultados dos experimentos que você já está realizando. E transformá-los, por exemplo, em um conjunto de arquivos de texto simples. E, em seguida, use ferramentas prontas para trabalhar com logs.

Para fazer você entender, eu tenho uma história incrível. Fico feliz em contar a ela todas as vezes. Quando os resultados de experimentos científicos são amontoados no Kibana e no ClickHouse - bancos de dados prontos contendo geralmente um grande número de registros, diferentes testes, medições, experimentos são realizados neles e, entre outras coisas, são utilizados algoritmos padrão para a "detecção de anomalias". Como é chamado em russo? Em russo, a "detecção de anomalias" é chamada "busca de frustrações". Eu mesmo estou chocado com a palavra, mas eu gosto muito.

A busca por frustrações, como se viu, é incrivelmente boa quando aplicada à ciência experimental. O lugar mais legal onde agora é usado - o Yandex tem uma interação com o CERN. Dentro do CERN, existem várias grandes experiências no Large Hadron Collider. O menor deles é chamado LHCb, no qual ocorrem bilhões de colisões de partículas. Os resultados de cada uma dessas colisões são registrados no banco de dados.

Depois disso, é executado um conjunto de algoritmos prontos para encontrar anomalias. Objetos e eventos que não se encaixam na idéia de beleza. Não posso dizer que grandes descobertas sejam feitas lá agora, mas se alguma descoberta foi feita lá como parte desse experimento, ela será feita exclusivamente graças a essa abordagem de TI para uma área aparentemente clássica, como a análise de colisão de partículas.

Essas, é claro, são mudanças fundamentais na ciência. E na ciência qualquer. Voltando ao tópico farmácia, medicina e biologia, quero dizer que, de fato, quanto mais ciência científica é, mais difícil é aplicar abordagens programáticas.

Porque, no entanto, por exemplo, na física, há muito tempo, uma cultura diferente do experimento. Eles se acostumaram com métodos matemáticos e abordagens matemáticas. Mas em produtos farmacêuticos, medicina e biologia, não. Portanto, quando você diz a eles que existem meios de trabalho coletivo, e uma parte do experimento pode ser realizada em uma parte do continente e a outra na outra, existe um sistema que permite que isso seja combinado. E mais do que isso: mesmo que uma pessoa escreva uma e outra, você pode de alguma forma unir esse conflito. Existe um sistema que permite realizar automaticamente constantemente os experimentos adicionados e dizer que alguns deles não aconteceram ou algo aconteceu. Os médicos que interagem com a medicina experimental iluminam os olhos.

Quando você faz isso, sente (espero que não seja falso) que está mudando o mundo.É possível, depois de 20 a 30 anos, porque você acabou de ensinar os farmacêuticos a usar Travis, as pessoas morrerão menos.

A história toda tem outro lado triste. Existem muito poucas pessoas que, como eu, estão tentando levar métodos, métodos e metodologias de trabalho de TI para outras áreas fora da TI. Eu vim aqui para contar toda a história, em grande parte porque, talvez, você possa transmitir aos cientistas, especialistas, advogados, qualquer pessoa, aquelas infinitas possibilidades que nossas ferramentas já têm.

Por um segundo, toda a história sobre farmácia, biologia e física foi adiada. Imagine por um segundo que você está trabalhando com um escritório de advocacia. Você entende que a maioria dos contratos modernos pode ser escrita em linguagem algorítmica? Você entende que os códigos de leis modernos são bibliotecas para esses tratados? Você entende que a constituição é o sistema operacional desses contratos? Você entende que os métodos de análise estática, se tudo isso for convertido em uma linguagem algorítmica, encontrarão defeitos, erros e problemas nesta legislação que são muito mais eficazes do que qualquer advogado profissional?

Trabalho com TI há muitos anos, acho que sou bom em cumprir os prazos de qualquer tarefa. Portanto, para digitalizar toda a história, digitalizar toda a legislação, trazê-la para a forma digital, você precisa de um bom programador, de um bom advogado e de um ano e meio, provavelmente. Aqui está o conceito de uma startup, se você quiser, aceite.

De fato, estamos perto de terminar. Em geral, essa abordagem, chamada "pegue as ferramentas de TI e leve-as para o resto do mundo", é um pouco messiânica. Tipo, nós temos uma religião, é chamada, agora a palavra "ágil" já está suja, vamos usar outra palavra? Vamos apenas "Ferramentas de trabalho em equipe".

Trazer ferramentas de trabalho automatizadas para qualquer outra especialidade é uma missão que permite às pessoas salvar horas de vida e, às vezes, apenas vidas humanas. É por isso que agora estou fazendo isso tão ativamente.

Era sobre isso que eu queria falar.

Você pode me encontrar assim, sou eu.

Estou pronto para responder suas perguntas. Antes de seguirmos em frente, quero dizer que sempre me preocupo com uma audiência como aqui. Vocês são todos muito diferentes. E também há muitas pessoas de Ecaterimburgo, eu mesmo sou daqui e sei que não é muito usual sorrir aqui. Obrigado por um de vocês sorrindo. Foi ótimo, obrigado.

Por um lado, ouvi a palavra Python, por outro, ouvi "análise estática", "o preço do erro é alto". Por que então Python, e não alguns Haskell?

Eu gostaria muito de Haskell, o único problema é que era mais fácil passar pelo Python, estupidamente, porque eles já tinham uma certa quantidade de código Python escrita, devido ao fato de termos usado o aprendizado de máquina em alguns lugares, que, é claro, foi banido em Python. Com Haskell, era mais fácil para os matemáticos, com Python, era mais fácil para biólogos e farmacêuticos.

— , — -. . , :) , . - , : « ? ». , . . , , , open source, , , ? ?

A medicina até o final do século 20 se desenvolveu em um ritmo muito lento. Que exemplo você daria? Todo mundo sabe que a humanidade aprendeu a tratar úlceras estomacais. De repente, descobriu-se que a maioria dos casos de úlceras estomacais é causada por uma bactéria específica, uma bactéria chamada Helicobacter pylori, eles encontraram uma maneira de lidar com isso, tudo é elementar, tudo é ótimo. Alguém até recebeu o Prêmio Nobel. Mas se você ler os detalhes, descobrirá que antes eles o descobriram na criação de animais e aprenderam como tratá-lo 60 anos antes. 60 anos as pessoas estão morrendo.

Agora, o ciclo de tomada de decisão para transferir dados de uma ciência para outra diminuiu para 10 anos. Agora, se houver pontos entre Novosibirsk e Khabarovsk, lugares onde as pessoas fazem ciência, mas elas nem sequer têm computador, depois de 10 anos tudo mudará. Marque minha palavra. Mais de 10 anos não vão passar.

No entanto, existem áreas em que simplesmente não há aplicação da ciência. A maioria dos médicos com quem estou trabalhando atualmente e que desejam se envolver ativamente na ciência e participar de experimentos, mas que não vivem nas cidades centrais, usam seus próprios telefones celulares pessoais como computadores. Mais do que suficiente. Um programa mesmo no telefone.

"A medicina não é uma ciência", é bom. Em outros discursos, há cerca de um ano, você podia ouvir uma frase sua dizendo que apenas 24% dos diagnósticos são definitivamente feitos. E o que fazer com isso? Quais são as soluções possíveis?

Um breve anúncio para quem ainda não ouviu essa história. Há uma figura oficial da OMS - a Organização Mundial de Saúde - que, em média, no mundo, se você procura um médico e o médico coloca uma hipótese de diagnóstico, a probabilidade de que ela esteja correta é de 24%. Ou seja, nem 50, nem mesmo um sorteio. 24%

O que fazer sobre isso? Aqui está o que fazer com isso. Salve o máximo de dados possível. De fato, o problema não está no médico. E o fato de que, de acordo com os padrões russos, 6 ou 9 minutos em que o médico fala com você, além de preencher o cartão, os dados que o médico pode aprender sobre você para analisá-lo são insignificantes. Mas se você aprender a fazer isso automaticamente, a quantidade de dados será incrivelmente grande.

Gosto de contar essa história incrível, aconteceu comigo no ano anterior. Estou sentado em uma sala de cinema, tenho um Apple Watch. Meu cardiologista, com quem trabalho, recebe dados do meu Apple Watch. A certa altura, ele me liga. Pergunto cuidadosamente: "Sim, o que é isso?" Ele diz: “Ouça, você está bem? Acabei de ver que você tem um pulso de 160 e não está na academia. "

Eu preciso disso É assim que o remédio do futuro se parece. E essa abordagem não é como “eu vim ao médico, reclamei e ele começou a me diagnosticar”, mas “o médico, olhando meus indicadores orgânicos, disse que algo estava errado, talvez alguma ação devesse ser tomada”. , permite alterar radicalmente esta figura. Penso que dentro de 20 a 30 anos aumentaremos, grosso modo, o coeficiente de diagnóstico para 50%. Eu posso não sobreviver, mas você sobreviverá.

Primeira pergunta. Quais são alguns exemplos de áreas não relacionadas à TI, nas quais existe uma necessidade real de colaboração distribuída? E a segunda pergunta. Como se livrar da ideia de que a imagem do belo futuro da Rússia que você desenha não é a Rússia?

Metade dos exemplos de que falei são da Rússia. Avançamos em muitas áreas técnicas, inclusive científicas. E por isso, precisamos mudar menos. Há muitos lugares em que você não precisa consertar o pedido estabelecido há 50 anos, basta entrar e oferecer pelo menos algum pedido.

Quanto aos locais onde há necessidade de trabalho coletivo. Por favor, não esqueça que, se no início do século 20 se perguntasse aos taxistas como você imagina o carro e o que você quer dele, eles diriam que queremos um grande carrinho atrás do cavalo para transportar fezes. Isso seria uma grande inovação.

No sentido de que você não espera que os cientistas respondam com entusiasmo às suas sugestões. Haverá algum tipo de pressão primeiro. Você vem e diz: parece-me que não é ruim fazer isso em seu método particular, neste lugar em particular. "Este" é, por exemplo, um trabalho coletivo em um artigo ou em um teste. Não espere prazer. Felizmente, após duas ou três iterações de interação, elas perceberão o que é felicidade e, antes disso, haverá rejeição.

É muito interessante quais testes estão sendo realizados. Entendo corretamente que a empresa possui um conjunto específico de testes farmacêuticos para determinados produtos? Como introduzir novos testes lá?

De jeito nenhum agora.

Por exemplo, testamos alergias, esse tipo de teste?

Existem testes de afiliados. Digamos, por simplicidade, que, por exemplo, existe um conjunto de materiais biológicos afetados por esse alérgeno e existe um farm automático que introduz um conjunto de medicamentos e verifica se a reação a esses medicamentos após a administração de outro medicamento não é mudou. Ou mudou para melhor. Ou para pior. Ou seja, apenas medições regulares são feitas.

Acontece que todo o sistema de gerenciamento elementar automatiza e coleta dados?

Automatize a coleta de dados e a continuidade do processo.

Ou seja, não está conectado com a própria biologia?

Não está associado a uma mudança na própria ciência, mas você vê o surgimento de uma tecnologia tão óbvia como escrever, escrever cartas, mudar radicalmente a ciência no futuro. A mesma história acontece aqui. O surgimento de novas ferramentas praticamente muda a própria ciência. Apenas acontece através de um passo.

É uma empresa farmacêutica privada ou é de alguma forma apoiada pelo estado?

Parece que nós no mundo não temos empresas farmacêuticas estatais. Minha experiência é baseada na interação com duas grandes empresas farmacêuticas. Um deles é de classe mundial, com raízes alemãs.

Eu tenho uma pergunta simples. Onde obter os dados se você não é o Yandex?

Parece-me que os dados devem ser obtidos de empresas parceiras, assim como a Yandex, porque, na realidade, ninguém no mundo possui dados suficientes em uma fonte para mover a ciência.

A ciência é sempre algo que se forma na interseção de uma grande quantidade de dados com diferentes proprietários.

Com dados médicos, pelo que entendi, tudo é muito mais complicado ...

É o contrário. Com os dados médicos dos últimos anos, tudo é muito mais simples, porque esses dados são anonimizados em grandes quantidades, mas, infelizmente, não em russo. Bem, aqui você precisa fazer algo com eles: traduzir, de alguma forma interagir. Ou esses dados são obtidos diretamente dos pacientes. Com cada um dos quais você precisa assinar um pedaço de papel que ele concorda com a transferência de dados. E isso é tudo.

A ciência moderna é a maioria dos ricos. Toda a minha história sobre código aberto também é sobre o fato de que talvez isso permita a um grande número de cientistas jovens e sem dinheiro que não pertencem a nenhuma seita grande e não trabalham com nenhuma grande empresa farmacêutica para criar algo novo coletivamente.

Mas como você pensou em combinar duas coisas que não estavam muito conectadas à primeira vista - TI e medicina? Estas são tecnologias que não se cruzam nas mentes da maioria das pessoas. Quais foram os primeiros passos que você tomou para seguir o caminho escolhido?

Como você provavelmente vê na minha aparência, eu não apenas durmo pouco, também não sou uma pessoa muito saudável. E quando comecei a lidar com o tópico de medicina, farmácia e tudo mais, estava apenas tentando resolver os problemas que os caras envolvidos em pesquisas específicas têm. E a única maneira de resolver o que tenho em minhas mãos era essa.

Você sabe, havia um grande filósofo e psicólogo chamado Maslow, que formulou com bastante precisão. Traduzido para o russo, ele disse o seguinte: "Quando você tem um martelo nas mãos, é difícil resistir à tentação de considerar tudo ao redor como pregos". Eu tinha um github em minhas mãos, era difícil não considerar tudo ao redor como um código. E assim aconteceu.

Por que você não pensou em cruzar diferentes esferas de atividade com a TI antes? E um pouco de demagogia para reconhecer. Se houver um cruzamento nítido de vários campos de atividade com a TI, e cruzaremos advogados e assim por diante, na verdade muitas pessoas que agora ocupam seus empregos sairão.

Isso é demais.

A questão é diferente: o que fazer com eles?

Existem muitas hipóteses diferentes. Eu li um livro maravilhoso, onde quer que o solent, que foi feito das pessoas, como você se lembra. Nos anos 90, um biorreator foi muito discutido em nosso país. Sério, não tenho uma resposta para esta pergunta. A coisa mais interessante, eu não acho que as pessoas de TI devam decidir o que fazer com essas pessoas.

Eu tenho um homem ídolo, infelizmente, ele morreu, mas ele tinha uma frase brilhante. De alguma forma, em uma reunião em que eu estava, na qual os programadores juraram muito, saiu, escreveu duas linhas. Linha um: nada vai funcionar. Ponto número dois: o progresso não pode ser parado. E com esse pensamento de que tudo será necessariamente ruim, mas o progresso não pode ser interrompido, eu vivo.

Sim, um grande número de pessoas como resultado do progresso tecnológico perderá seus empregos. Mas o progresso não é necessário parar por causa disso. A humanidade encontrará alguma saída. Renda incondicional, tratamento obrigatório pela programação de pessoas que perderam o emprego.

Eu não entendo direito. O que exatamente é descrito na medicina por testes em Python?

Nesse caso em particular, por exemplo, usamos testes para descrever os dados de entrada e resultado de um teste de alérgeno. Ou seja, qual dosagem do medicamento é introduzida na célula e qual o resultado no lúmen que recebemos como resultado.

Ou seja, através da Integração Contínua, você tem algum tipo de máquina física em execução?

Laboratório Físico, sim. Aqui você precisa entender que, em média, eles já possuem laboratórios físicos. É apenas que os testes neles são descritos não nesta forma, mas na forma de um grande programa no qual está escrito: vamos colocar esse conjunto de características com nossas mãos e verificar na saída se o resultado é tal e tal.

Este ano, a conferência DUMP será realizada em 19 de abril em Ecaterimburgo. Tradicionalmente, haverá uma seção de ciências. O programa deste ano: Oleg Bartunov (Universidade Estadual de Moscou, Profissional de Postgres), Peter Fedichev (Instituto de Física e Tecnologia de Moscou, Gero), Pavel Skripnichenko (UrFU, KantrSkrip), Gennady Shtekh (Naumen), Igor Mamay (Kontur), Vladislav Blinov e Valery Baranova (Tinkoff). ru), Tatyana Zobnina (Naumen). O programa completo está no site da conferência .

Bigdata de campo arado em medicamentos e produtos farmacêuticos

More articles: