Você pode confiar nos conselhos médicos dos bots? Os médicos ainda não têm certeza.

A Babylon Health, cuja capitalização é estimada em US $ 2 bilhões, oferece um serviço de chatbot que fornece aconselhamento médico com base nos sintomas descritos. Foi usado 1,7 milhões de vezes. No entanto, os especialistas estão preocupados que isso não funcione exatamente como prometido na publicidade.



Hamish Fraser encontrou a Babylon Health pela primeira vez em 2017, quando ele e um colega de um artigo na Wired ajudaram a verificar a precisão dos diagnósticos de vários sistemas de IA baseados em sintomas, projetados para aconselhar qualquer pessoa com um smartphone. Entre os concorrentes com reconhecimento de doenças comuns, incluindo asma e telhas, o Babylon Health Symptom Checker foi o pior. Fraser, que trabalhou como inspetor de informática em saúde na Universidade de Leeds, na Inglaterra, concluiu que as empresas precisam melhorar seriamente seus serviços para não sair do mercado.

"Naquele momento, eu não tinha preconceitos com nenhum deles, e simplesmente não conhecia nenhum, então não tinha nenhum propósito de me vingar de alguém e pensei: Nda, este não é um resultado muito bom, - diz Fraser, agora trabalhando na Brown University. "Eu pensei que eles desapareceriam." Mas como eu estava errado.

Desde o lançamento desse artigo, muita coisa mudou. Desde o início de 2018, a Babylon Health, de Londres, cresceu de 300 funcionários para cerca de 1.500. A empresa está avaliada em US $ 2 bilhões e afirma “fornecer serviços médicos acessíveis e acessíveis a todas as pessoas no planeta”. Na Inglaterra, a Babylon Health conduz a quinta maior prática médica sob a supervisão de um sistema nacional de saúde, financiado principalmente pelo governo, que permite que pacientes que moram perto de Londres e Birmingham conversem por vídeo com os médicos ou venham à clínica conforme necessário. A empresa alega ter processado mais de 700.000 consultas digitais de pacientes com médicos e planeja fornecer serviços semelhantes em outras cidades britânicas no futuro.

A Babylon Health promete economizar dinheiro em serviços médicos cada vez mais caros, usando a IA para filtrar pacientes, para que tempo e recursos sejam dedicados apenas a pessoas que realmente precisam de ajuda médica. A Babylon Health, tanto na Inglaterra quanto no exterior, diz que seu programa de rastreamento de sintomas foi usado mais de 1,7 milhão de vezes em lugares como Inglaterra, União Européia, Canadá, Sudeste Asiático e Arábia Saudita. Em breve, a Babylon Health planeja expandir ainda mais e entrar nos Estados Unidos e na China.

A expansão rápida pode ser um problema porque "essa tecnologia - e não apenas os programas de teste de sintomas, mas também outras intervenções digitais - pode ser rapidamente promovida e alterada", diz David Vaughn, que faz palestras sobre o uso da IA ​​na área de saúde na Universidade de Manchester, na Inglaterra, e trabalhou com Fraser no teste de tais sistemas para um artigo. “No entanto, eles podem fazer uma grande diferença”, diz Vaughn, e em particular, a Babylon Health é “um exemplo de empresa que conseguiu alcançar muito rapidamente”.

Um desenvolvimento tão rápido desses eventos suscita certas perguntas de especialistas, alegando que a Babylon Health se apressou a entrar no mercado sem evidências adequadas da saúde de seus produtos. Até o momento, não houve avaliações de especialistas de seus serviços, com grupos de testes e controle randomizados - métodos que são o padrão ouro na ciência médica - que mostrariam o quão bem a IA lida com pacientes reais em condições reais. No entanto, o programa de testes de sintomas da Babylon Health já está afetando milhares de pessoas todos os dias - recebendo aprovação dos reguladores do governo nos países onde oferece serviços.



"Eles conseguiram obter aprovação do sistema nacional de saúde sem sequer testar o produto em pacientes reais, sem passar por testes de terceiros - e isso não impede os reguladores", disse Margaret McCartney, clínica geral de Glasgow, Escócia, e crítica da Babylon Health . "Parece incrível para mim."

A Babylon Health alega atender aos requisitos do sistema nacional de saúde e, em todos os países onde o serviço opera, atende a todos os requisitos regulamentares. A empresa também alega estar recrutando pesquisadores universitários para organizar testes de controle randomizados. "Demos passos importantes para testar e validar a segurança e a eficácia dessa tecnologia", disse Keith Grimes, diretor de inovação clínica da Babylon Health. "Não é apenas na forma de ensaios clínicos".

Chamando um médico Chatbot


O verificador de sintomas do Babylon Health parece um chatbot com o qual os usuários conversam por meio de um aplicativo ou site. Quando um usuário digita seus principais sintomas na forma de uma frase ou frase curta, o verificador de sintomas faz perguntas relacionadas à possível presença de sintomas relacionados. Como resultado, o programa de verificação de sintomas identifica possíveis causas e recomenda ações adicionais - uma reserva para consulta em vídeo com um terapeuta ou uma visita ao hospital.



A tecnologia subjacente ao programa de teste de sintomas é conhecida como gráfico do conhecimento e funciona como uma enciclopédia digital da medicina, na qual é marcada a relação de várias doenças, sintomas e condições. O relacionamento é representado por milhões de pontos de referência de centenas de fontes médicas e é constantemente atualizado. Um programa de verificação de sintomas também pode gerenciar registros de registros médicos - incluindo dados coletados enquanto os usuários estão trabalhando com o programa - para identificar possíveis associações entre doenças de diferentes usuários.

O gráfico de conhecimento pode ser ajustado adicionando dados para ajudar a avaliar a probabilidade de várias doenças em determinadas populações e áreas geográficas.

A Babylon Health está criando "um modelo de medicina aplicável não apenas no Reino Unido e nos EUA, mas em todo o mundo", diz Saurabh Johri, cientista sênior da Babylon Health. Ele diz que o modelo deve ser personalizável para "refletir as especificidades locais da doença - de modo que, se um paciente se queixa de vômito, febre e diarréia em Londres, é menos provável que tenha malária do que se morasse em Ruanda".

Muitas outras empresas médicas usam a tecnologia de aprendizado de máquina, popular no campo da inteligência artificial, e sua opção, como aprendizado profundo, para treinar software para analisar dados de pacientes para determinar sintomas e fazer diagnósticos. Examinando enormes quantidades de dados médicos brutos, esses sistemas às vezes podem treinar software para encontrar padrões e relacionamentos ocultos entre pontos de referência em dados que as pessoas e nosso conhecimento médico às vezes sentem falta. A abordagem da Babylon Health não é assim - suas estimativas de IA refletem diretamente o conhecimento médico atual das pessoas e a compreensão humana da relação entre os sintomas e suas causas, sem depender de desempenho promissor, mas às vezes inexplicável da máquina.

Até agora, o Babylon Health tem usado o aprendizado profundo para interpretar mensagens de bate-papo de pacientes com um chatbot. A IA também usa aprendizado profundo para acelerar a pesquisa de dados exigida computacionalmente na coluna de conhecimento, onde você precisa verificar todas as combinações possíveis de sintomas, doenças e fatores de risco que são apropriados para o caso específico. Mas, em geral, a Babylon Health AI trabalha principalmente através do conhecimento médico acumulado pelas pessoas, não confiando na máquina para trabalhar na construção de relacionamentos lógicos.



Pode haver vantagens nessa abordagem. Uma das desvantagens do aprendizado de máquina e profundo é que eles exigem grandes quantidades de dados de treinamento relevantes e poder de processamento para aprender padrões. Dependendo do país e do sistema de saúde, nem sempre é fácil acessar todos os dados médicos relevantes necessários para aprender o software de computador. Outra desvantagem dessa abordagem é a opacidade. As tecnologias de aprendizado de máquina geralmente não permitem que especialistas humanos entendam exatamente como o software conectou os diferentes pontos de referência nos dados.

A abordagem da Babylon Health com transparência é melhor. A empresa usa modelos que permitem que médicos e programadores em tempo integral “examinem o assunto”, diz Johri, e entendam como o programa de testes de sintomas chegou a alguma conclusão.

Os resultados estão em dúvida


Apesar de todos os benefícios, a Babylon Health ainda não se mostrou um modelo com comportamento responsável. A empresa tentou calar a crítica com litígios e foi repreendida pelos reguladores britânicos por publicidade "enganosa". Em uma entrevista com a Wired UK e a Forbes, os ex-funcionários da empresa descreveram uma situação em que a cultura corporativa entra em conflito com a necessidade de testes rigorosos da segurança e eficácia da IA ​​na área da saúde. A Forbes escreveu: “Entrevistas com atuais e antigos funcionários da Babylon Health e médicos independentes mostram a preocupação generalizada de que a empresa rapidamente lançou o software que não foi completamente testado e depois exagerou sua eficácia” (a empresa expressa forte protesto a essas declarações).

A Babylon Health também se envolveu em debates públicos, fazendo declarações que alguns críticos posteriormente chamaram de enganosas. Em 27 de junho de 2018, a empresa chamou a atenção da mídia, dizendo durante uma transmissão ao vivo no Royal College of Medicine, em Londres, que sua IA é capaz de diagnosticar doenças comuns tanto quanto os terapeutas humanos. Essa afirmação foi baseada em um estudo da empresa comparando IA com diagnósticos feitos por sete médicos. Também no estudo, o programa de teste de sintomas foi testado em partes de perguntas de um exame realizado para obter um GP na Grã-Bretanha, um exame para ingresso no Royal College of General Practitioners e registros históricos de um estudo independente de 2015 que avaliou vários programas de verificação de sintomas.

Logo, porém, cientistas e organizações médicas começaram a mostrar preocupação. O Royal College of General Practitioners , a Associação Britânica de Médicos e o Royal College of Physicians emitiram declarações contestando as alegações da Babylon Health, enquanto o Royal College of Physicians organizou uma apresentação da empresa e ajudou a conduzir o estudo. Para começar, neste estudo, a IA foi testada apenas em parte das perguntas do exame, e o programa não foi testado em pessoas reais em um ambiente clínico.

Fraser e Vaughn, os pesquisadores que ajudaram a Wired UK a testar o programa de rastreamento de sintomas em 2017, também tiveram perguntas para este estudo, pois envolvia um pequeno número de médicos e não foi examinado por especialistas independentes. O casal decidiu estudar este estudo mais de perto. Em um relatório publicado na revista The Lancet em 2018, eles concluíram que o estudo Babylon Health não fornece evidências conclusivas de que seu programa de triagem de sintomas "é capaz de fazer melhor do que os médicos em qualquer situação realista, e é mais provável que ele vai fazer muito pior. "

Esses achados afetam diretamente pacientes reais. “Se o seu programa de rastreamento de sintomas o aconselha a ficar em casa e não procurar um médico, essa decisão tem consequências nos casos em que a ajuda necessária é atrasada ou não é fornecida”, diz Enrico Coeira, diretor do Centro de Informática Médica da Universidade McUyra em Sydney, Austrália e autor de um trabalho de 2018 publicado na revista Lancet.

Mesmo antes de uma onda de críticas, a Babylon Health iniciou negociações preliminares com a Universidade de Stanford para realizar pesquisas piloto adicionais, diz Megan Mahoney, pesquisadora clínica de Stanford, coautora do Babylon Health em 2018.

"Aparentemente, a IA pode ter um certo potencial", diz Mahoney, explicando que "temos uma responsabilidade real de atingir um novo nível de rigor na avaliação desse potencial, pois a IA pode ser realmente útil para apoiar e suplementar serviços médicos" .

Mahoney descreveu o Babylon Health de 2018 como "excelente para pesquisas internas". Apesar de seu otimismo, ela alertou que nunca ousaria integrar essa IA em serviços de saúde ou práticas médicas reais, com base apenas nos resultados deste estudo.

Quando a revista Undark perguntou sobre disputas sobre este trabalho, a Babylon Health respondeu com uma declaração dizendo, inter alia: "Alguns meios de comunicação podem ter interpretado mal nossas declarações, mas continuamos com nossos resultados iniciais e evidências científicas". Também foi declarado lá que o trabalho de 2018 é "preliminar" e comparou a IA da empresa com uma "pequena amostra de médicos". A Babylon Health também se referiu à conclusão do estudo: “Mais pesquisas serão necessárias usando grupos maiores de pessoas reais para comparar a eficácia desses sistemas com médicos humanos”.

Cálculos: medicina do século XXI


Até a Babylon Health admite que a pesquisa preliminar não atende aos padrões-ouro da pesquisa médica. No entanto, isso não impediu a empresa - ou órgãos reguladores - de dar aos pacientes acesso a um programa de teste de sintomas.

Essa abordagem é comparável a testes em humanos de um novo medicamento sem testes rigorosos, diz Isaac Cohan, pesquisador biomédico de ciência da computação da Harvard Medical School. E ele acrescenta que os cálculos "podem ser considerados um medicamento do século XXI - então vamos tratá-los com a mesma responsabilidade".

Se a Babylon Health organizar testes de controle aleatórios, de acordo com Fraser, fará muito para estabelecer confiança em sua expansão nos mercados americano e asiático. A empresa planeja enviar um protocolo de teste a uma revista com uma revisão preliminar dos artigos nos próximos meses, diz Johri, acrescentando: "Realizaremos esses testes na Grã-Bretanha e também discutiremos esse assunto com parceiros na China e nos EUA".

Os regulamentos atuais da Food and Drug Administration dos EUA estão recomendando clemência nos programas de rastreamento de sintomas baseados em IA porque os riscos associados a eles são mais baixos do que outros serviços de saúde. A gerência “decidiu lançar programas de teste de sintomas - e serviços similares - da supervisão para incentivar a inovação”, diz Fraser. "No entanto, eles parecem ter a oportunidade de regular muito mais essa área, se assim o desejarem."

Até agora, alguns especialistas independentes continuam preocupados com a versão atual do programa de rastreamento de sintomas da Babylon Health. No início de setembro, um consultor independente do sistema nacional de saúde britânico, muitas vezes criticando a Babylon Health no Twitter sob o pseudônimo de Dr. Murphy demonstrou a presença de um possível viés sexual no programa de rastreamento de sintomas da Babylon Health.

Uma mulher fumante de 59 anos queixou-se de súbita dor no peito e tontura, o programa de teste de sintomas diagnosticou depressão ou um ataque de pânico como um diagnóstico provável. Para o mesmo paciente, cujo perfil indicava sexo masculino, o programa de sintomas indicou adicionalmente possíveis problemas cardíacos graves, recomendando uma visita ao hospital ou ligando para uma ambulância.

Em vez de discutir com essas alegações, como antes, a Babylon Health escolheu um tom conciliatório de comunicação para obter uma resposta no Twitter . Em um post subseqüente no blog, a Babylon Health reconheceu o viés na área da saúde, enquanto defendia a eficácia de um programa de verificação de sintomas.

Isso não convenceu o Dr. Murphy quer que a empresa trabalhe em possíveis problemas com sua IA: "O mais perigoso de todos os médicos é alguém que não vê seus erros ou não aprende com eles".

Source: https://habr.com/ru/post/pt482810/


All Articles