
In letzter Zeit wurde die Verwendung von KI in der Medizin zunehmend diskutiert. Und natürlich ist das Gebiet der Medizin, das direkt um eine solche Anwendung bittet, das Gebiet der Diagnose.
Es scheint, dass es früher möglich war, Expertensysteme und Klassifizierungsalgorithmen auf die Probleme der Diagnose anzuwenden. Es gibt jedoch einen Bereich der KI, der in den letzten Jahren am erfolgreichsten war, nämlich den Bereich der Bilderkennung und der Faltungs-Neuronalen Netze. Bei einigen Tests haben KI-Algorithmen bei der Bilderkennung den Menschen übertroffen. Hier sind zwei Beispiele:
Large Scale Visual Recognition Challenge und
German Traffic Sign Recognition Benchmark .
Dementsprechend entstand die Idee, KI auf den Bereich der Bilderkennung anzuwenden, in dem Ärzte mit der Bilderkennung befasst sind, nämlich auf die Analyse von Bildern und für den Anfang auf Röntgenstrahlen.
Radioskopie wird verwendet, um eine Vielzahl von Krankheiten und Verletzungen zu diagnostizieren: Lungenschäden (Lungenentzündung, Krebs), Frakturen und andere Knochenverletzungen, Teil der Diagnose des Verdauungssystems und vieles mehr.
Es ist wichtig, dass bei der Diagnose einiger dieser Krankheiten das Röntgenbild und seine Interpretation das vorherrschende Instrument bei der Diagnose sind.
Die Interpretation des Bildes erfolgt wiederum durch einen Radiologen auf der Grundlage einer visuellen Bildanalyse. Es stellt sich die Frage: Was ist, wenn wir Fortschritte in der Bildanalyse mit KI auf die Analyse und Interpretation von Röntgenstrahlen anwenden? Was wird passieren?
Werden wir in der Lage sein, eine mit Ärzten vergleichbare Qualität zu erreichen? Oder übersteigt die Klassifizierungsgenauigkeit möglicherweise die Genauigkeit von Ärzten, die bei der Erkennung von Bildern in der
Large Scale Visual Recognition Challenge überschritten wird?
Bei Kaggle gibt es mehrere Röntgenanalyse-Wettbewerbe zur Diagnose einer Lungenentzündung. Zum Beispiel
einer von ihnen.
Hier wurden 5.863 Bilder von Ärzten markiert, jedes der Bilder wurde von zwei Ärzten markiert, und nur wenn sie bei der Diagnose übereinstimmten, wurde das Bild dem Datensatz hinzugefügt. Patienten für Bilder wurden nicht speziell ausgewählt (alle Bilder wurden im Rahmen der üblichen Arbeit mit Patienten aufgenommen). Die Klassen sind in Richtung einer Lungenentzündung ausgewogen, die wahrscheinlich dem realen Leben nahe kommt, da Patienten bereits Bilder mit Verdacht auf Lungenentzündung machen.
Die beste der Lösungen erreicht eine Genauigkeit von 0,84 und einen Rückruf von 0,96. Dann stellt sich die Frage: Ist es viel oder wenig ... Dies ist eine gute Frage.
Nur für den Fall, wir erinnern uns, dass Präzision ist, wie viel Prozent der Patienten, die das Modell als Patienten mit Lungenentzündung definiert, wirklich an Lungenentzündung erkrankt sind (und dementsprechend, wie viel Prozent der Ärzte diese Krankheit nicht versehentlich behandeln). Rückruf ist, wie viel Prozent aller Patienten mit Lungenentzündung das Modell erkennen wird (umgekehrt ist dieser Prozentsatz angegeben, wie viele Patienten mit Lungenentzündung das Modell als gesund markiert).
Also ist es viel oder wenig? Nun, Sie können diese Frage so betrachten: Was ist mit Ärzten? Sie haben welche Präzision und Erinnerung.
Dazu müsste eine Gruppe von Ärzten eingesetzt, ihnen Bilder zur Kennzeichnung gegeben und anschließend die Qualität ihrer Markierungen mit der Qualität der Markierungen verglichen werden. Dabei wird ein Algorithmus verwendet, der dem
deutschen Benchmark zur Erkennung von Verkehrszeichen ähnelt, bei dem die Qualität der Erkennung von Verkehrszeichen verglichen wurde. Soweit ich weiß, hat dies noch niemand mit Ärzten gemacht.
Angenommen, wir haben dies getan und es stellte sich heraus, dass die Qualität des Markups mithilfe des Algorithmus mit der Qualität des Markups durch den Arzt vergleichbar ist. Wenn dies jetzt immer noch nicht der Fall ist (was keine Tatsache ist), dann bin ich sicher, dass dies in naher Zukunft geschehen wird. Was weiter?
Radiologen durch künstliche Intelligenz ersetzen? Dies ist seit langem ein Traum in den Vereinigten Staaten, wo Radiologen aufgrund ihrer Bedeutung für eine bestimmte Art der Diagnose sehr hoch und wahrscheinlich zu Recht bezahlt werden.
Mal sehen, wie der Prozess der Verwendung des Algorithmus in diesem Fall in der Praxis aussehen sollte.
- Erstens wäre es notwendig, das Format und die Qualität der Ausgabe von Bildern auf verschiedenen Röntgengeräten zu standardisieren. Vielleicht ist es jetzt standardisiert (ich bin kein Experte), aber aus irgendeinem Grund scheint es mir nicht so. Wenn diese Standardisierung nicht vorhanden ist, kann die Stabilität des Modells beim Übergang von einer Installation zur anderen nicht garantiert werden.
- Zweitens muss eine regelmäßige Qualitätskontrolle des Modells hinzugefügt werden. Das heißt, das Modell sollte regelmäßig dem von den Ärzten gekennzeichneten Testmuster zugeführt werden, und die Qualität seiner Arbeit sollte ständig validiert werden. Bei allen Modellen, die in allen Kliniken verwendet werden. Dies bedeutet, dass es ein zentrales Modell (oder eine sehr kleine Anzahl davon) geben muss, da ansonsten zu viele Ressourcen erforderlich sind, damit alle Modelle validiert werden können. Logischerweise werden die Hersteller von Röntgengeräten wahrscheinlich zu dem Schluss kommen, dass das Modell zusammen mit dem Röntgengerät geliefert wird.
- Drittens sollten Konfidenzschwellen in das Modell eingebaut werden, ab denen das Bild noch zur Klassifizierung an den Arzt weitergegeben wird.
Wie Sie verstehen, sind auch dann, wenn die Modelle hinsichtlich der Qualität der Klassifizierung den Ärzten vergleichbar oder überlegen sind, eine Reihe von Prozessschritten erforderlich, um sie (Ärzte) zu ersetzen oder genauer gesagt, Personal abzubauen. Ganz zu schweigen von den Regulierungs- und Zertifizierungsschritten, die im Allgemeinen erforderlich sind, um eine solche Lösung in die Praxis umzusetzen.
Im Allgemeinen sind wir noch weit von dem obigen Szenario entfernt, scheint mir.
Ist ein anderes Szenario möglich? Ich denke schon. Erinnern Sie sich an den
Satz der
Condorcet-Jury , der besagt, dass die Wahrscheinlichkeit, dass eine Gruppe von Menschen die richtige Entscheidung trifft, höher ist als jede einzelne von ihnen. Somit ist die Qualität der Klassifizierung des Arztes und des Modells zusammen höher als die Qualität der Klassifizierung eines von ihnen.
Somit kann der Arzt das Modell als Berater verwenden. Warum? Weil der Arzt selbst seine eigene Präzision und Erinnerung hat. Angenommen, Ärzte nennen es nicht so, aber es gibt Fehler. Einige Fehler führen dazu, dass einige Krankheiten übersehen werden. Ich denke, solche Fehler sind weniger, da die Ärzte nur versuchen, den Fehler der ersten Art zu minimieren. Andere Fehler führen dazu, dass Menschen wegen einer Lungenentzündung behandelt werden, die sie nicht haben, und einige Plätze in Krankenhäusern unnötig eingenommen werden. Wie viele Gesamtfehler sind unbekannt, aber sie sind es.
Stellen Sie sich daher vor, wir verwenden zwei verschiedene Modelle und die Meinung des Arztes zu einem Foto. Das Plus von Condorcets Theorem ist, dass es nicht nur behauptet, dass zwei Köpfe besser als einer sind, sondern dass Sie auch berechnen können, wie viel.
Lassen Sie jedes von ihnen (für jedes der Modelle und den Arzt) eine Genauigkeit von 0,84 haben (natürlich kennen wir die Genauigkeit des Arztes nicht, aber nehmen wir an, dass sie nicht niedriger als die Genauigkeit der Modelle ist). Dann ist nach dem Condorcet-Theorem die Gesamtgenauigkeit gleich 0,84 ^ 3 + 3 * 0,84 ^ 2 * (1 - 0,84) = 0,93, was eine deutliche Erhöhung gegenüber der anfänglichen Genauigkeit von 0,84 ergibt. Durch die Anwendung des Modells wird der Arzt in seinen Vorhersagen deutlich genauer.
Beachten Sie, dass wir in diesem Paradigma das Allerheiligste retten und die endgültige Entscheidung dem Arzt überlassen, ohne sie auf die Maschine zu verlagern. Dies scheint mir die Einführung solcher Lösungen zu erleichtern und den Weg für KI-Berater in der Medizin zu ebnen.
Was denkst du?
Wenn Sie die Anwendung von Faltungs-Neuronalen Netzen und Computer Vision in der Praxis beherrschen möchten, besuchen Sie wie gewohnt ab dem 28. Januar unseren
Kurs für Analysten . Es gibt auch einen
Einführungskurs, wenn Sie die Grundlagen vertiefen müssen.