
Recentemente, o uso da IA na medicina tem sido cada vez mais discutido. E, é claro, o campo da medicina que implora diretamente por essa aplicação é o campo do diagnóstico.
Parece que anteriormente era possível aplicar sistemas especialistas e algoritmos de classificação aos problemas de diagnóstico. No entanto, há uma área de IA que tem sido mais bem-sucedida nos últimos anos, a saber, a área de reconhecimento de imagem e redes neurais convolucionais. Em alguns testes, os algoritmos de IA no reconhecimento de imagens superaram os seres humanos. Aqui estão dois exemplos:
Desafio de reconhecimento visual em larga escala e
referência de reconhecimento de sinais de trânsito na Alemanha .
Por conseguinte, surgiu a ideia de aplicar a IA ao campo do reconhecimento de imagens, onde os médicos estão envolvidos no reconhecimento de imagens, nomeadamente na análise de imagens e, para começar, nos raios X.
A radioscopia é usada para diagnosticar uma ampla gama de doenças e lesões: danos nos pulmões (pneumonia, câncer), fraturas e outras lesões ósseas, parte do diagnóstico do sistema digestivo e muito mais.
É importante que, no diagnóstico de algumas dessas doenças, a imagem radiográfica e sua interpretação sejam a ferramenta predominante no diagnóstico.
A interpretação da imagem, por sua vez, é feita por um radiologista com base na análise visual da imagem. Surge a pergunta: e se aplicarmos o progresso na análise de imagens usando IA à análise e interpretação de raios-x. O que vai acontecer?
Seremos capazes de alcançar uma qualidade comparável aos médicos? Ou talvez a precisão da classificação exceda a precisão dos médicos, como excedeu o reconhecimento de imagens no
Desafio de Reconhecimento Visual em
Grande Escala ?
Existem várias competições de análise de raios X no Kaggle para o diagnóstico de pneumonia. Por exemplo,
um deles.
Aqui 5.863 imagens foram marcadas por médicos, cada uma das imagens foi marcada por dois médicos e, somente se coincidissem no diagnóstico, a imagem foi adicionada ao conjunto de dados. Os pacientes para imagens não foram especialmente selecionados (todas as imagens foram tiradas como parte do trabalho usual com os pacientes). O conjunto de classes é equilibrado na direção da pneumonia, provavelmente próxima da vida real, pois os pacientes já estão tirando fotos com suspeita de pneumonia.
A melhor das soluções atinge precisão = 0,84 e recuperação = 0,96. Então surge a pergunta: é muito ou pouco ... Esta é uma boa pergunta.
Apenas no caso, lembramos que precisão é qual a porcentagem de pacientes que o modelo definido como pacientes com pneumonia está realmente doente de pneumonia (e, consequentemente, qual porcentagem de médicos não trata esta doença por engano). Lembre-se da porcentagem de todos os pacientes com pneumonia que o modelo detectará (o inverso dessa porcentagem é quantos pacientes com pneumonia o modelo marcará como íntegro).
Então é muito ou pouco? Bem, você pode olhar para esta pergunta assim: e os médicos? Eles têm que precisão e recordação.
Para fazer isso, seria necessário plantar um grupo de médicos, fornecer fotos para marcação e, em seguida, comparar a qualidade de suas marcações com a qualidade de marcações usando um algoritmo semelhante ao
Benchmark de reconhecimento de sinais de
trânsito alemão , onde a qualidade do reconhecimento de sinais de trânsito foi comparada. Até onde eu sei, ninguém fez isso com médicos ainda.
Mas suponha que tenhamos feito isso e que a qualidade da marcação usando o algoritmo seja comparável à qualidade da marcação feita pelo médico. Se agora esse ainda não é o caso (o que não é um fato), tenho certeza de que isso acontecerá no futuro próximo. O que vem a seguir?
Substituir radiologistas por inteligência artificial? Esse é um sonho há muito tempo nos Estados Unidos, onde os radiologistas são muito bem pagos e provavelmente merecem a importância de fazer um certo tipo de diagnóstico.
Vamos ver como o processo de usar o algoritmo deve parecer neste caso na prática?
- Em primeiro lugar, seria necessário padronizar o formato e a qualidade da saída das imagens em vários equipamentos de raio-x. Talvez agora esteja padronizado (não sou especialista), mas, por alguma razão, parece-me que não. Se essa padronização não existir, não será possível garantir a estabilidade do modelo durante a transição de uma instalação para outra.
- Em segundo lugar, será necessário adicionar um controle regular da qualidade do modelo. Ou seja, o modelo deve ser alimentado regularmente para a entrada da amostra de teste marcada pelos médicos e a qualidade de seu trabalho deve ser constantemente validada. Em todos os modelos usados em todas as clínicas. Isso significa que deve haver um modelo centralizado (ou um número muito pequeno deles), pois, caso contrário, são necessários muitos recursos para validação de todos os modelos. Logicamente, os fabricantes de equipamentos de raios-x provavelmente chegarão à conclusão de que o modelo será entregue junto com a unidade de raios-x.
- Em terceiro lugar, os limites de confiança devem ser incorporados ao modelo, além do qual a imagem ainda é passada ao médico para classificação.
Como você entende, mesmo que os modelos agora sejam comparáveis ou superiores aos médicos em termos de qualidade de classificação, é necessário um conjunto de etapas do processo para a substituição (dos médicos) ou, mais precisamente, a redução da equipe. Sem mencionar o conjunto de etapas regulatórias e de certificação geralmente necessárias para colocar essa solução em prática.
Em geral, ainda estamos longe do cenário acima, parece-me.
É possível um cenário diferente? Eu acho que sim. Lembre-se do
Teorema do Júri de Condorcet , que diz que a probabilidade de tomar a decisão certa por um grupo de pessoas é maior que cada uma delas individualmente. Assim, a qualidade da classificação do médico e do modelo juntos é superior à qualidade da classificação de qualquer um deles.
Assim, o médico pode usar o modelo como consultor. Porque Porque o próprio médico tem sua própria precisão e recordação. Suponha que os médicos não chamem assim, mas há erros. Alguns erros levam ao fato de que algumas doenças são perdidas. Penso que esses erros são menores, já que os médicos estão apenas tentando minimizar o erro do primeiro tipo. Outros erros levam ao fato de as pessoas serem tratadas por pneumonia, que elas não têm, e alguns lugares nos hospitais são tomados desnecessariamente. Quantos erros totais são desconhecidos, mas são.
Por conseguinte, imagine que estamos usando dois modelos diferentes e a opinião do médico em relação a uma fotografia. A vantagem do teorema de Condorcet é que ele não apenas afirma que duas cabeças são melhores que uma, mas também permite calcular quanto.
Deixe que cada um deles (para cada um dos modelos e o médico) tenha uma precisão de 0,84 (é claro, não sabemos a precisão do médico, mas suponha que não seja menor que a precisão dos modelos). Então, pelo teorema de Condorcet, a precisão total é igual a 0,84 ^ 3 + 3 * 0,84 ^ 2 * (1 - 0,84) = 0,93, o que fornece um aumento claro em comparação com a precisão inicial de 0,84. Assim, aplicando o modelo, o médico se torna claramente mais preciso em suas previsões.
Observe que, nesse paradigma, salvamos o santo dos santos, deixamos a decisão final ao médico, sem transferi-la para a máquina. Parece-me que isso facilitará a introdução de tais soluções e abrirá o caminho para os consultores de IA em medicina.
O que você acha?
Como de costume, se você deseja dominar a aplicação de redes neurais convolucionais e visão computacional na prática - venha ao nosso
curso para analistas , a partir de 28 de janeiro. Há também um
curso introdutório, se você precisar reforçar o básico.