Ein von russischen Wissenschaftlern entwickeltes neuronales Netzwerk hat gelernt, das Alter anhand von Videos mit hoher Genauigkeit zu bestimmen



Eine maßgebliche wissenschaftliche Veröffentlichung Journal of Physics veröffentlichte einen Artikel , der die Ergebnisse der Arbeit zur Schaffung eines neuronalen Netzwerks beschreibt, das das Alter und Geschlecht einer Person bestimmt.

Die betreffenden Entwickler haben ihr Projekt an der Higher School of Economics unter der Leitung von Andrei Savchenko umgesetzt. Das Team schlug eine neue Methode zur Analyse menschlicher Daten aus Videos vor. Diese Methode ist die Grundlage für die Arbeit des neuronalen Netzwerks, das zur Klasse der Faltungsnetzwerke gehört .

Die Methode selbst besteht in der Einzelbildanalyse von Videos mit Schwerpunkt auf einzelnen Einzelbildern einer Person. Die weitere Analyse erfolgt in zwei Richtungen. Mit dem ersten können Sie das Durchschnittsalter einer Person bestimmen, mit dem zweiten das Geschlecht. Wie üblich wurde das neuronale Netzwerk ursprünglich trainiert, die Videobasis, die als Haupttraining diente, enthält 1165 Videos.

Die Autoren geben an, dass ihr neuronales Netzwerk das Alter einer Person mit einer Genauigkeit von etwa 71%, Geschlecht - 88% bestimmen kann. Die Autoren planen, ihre Entwicklung zu nutzen, um eine mobile Anwendung für Android zu erstellen.

Die Entwicklungsinnovation besteht darin, dass dem neuronalen Netzwerk das Arbeiten mit Video beigebracht wurde. Bei Bildern können neuronale Netze seit langem das Alter und Geschlecht einer Person bestimmen - und die Genauigkeit der Systeme ist in diesem Fall recht hoch. Wenn Sie jedoch mit Video arbeiten müssen, ist die Aufgabe kompliziert, da es nicht so einfach ist, einen klaren Rahmen mit einer Person auszuwählen, bei der sein Gesicht klar zu sehen ist.

Das Standardschema verwendet eine Schätzung des Alters einer Person von 0 bis 100 Jahren und analysiert dann die gesamte Altersskala, wobei die Wahrscheinlichkeit angegeben wird, dass eine Person auf dem Bild genau so viele Jahre alt ist. Zum Beispiel beträgt die Wahrscheinlichkeit, dass er zur Altersgruppe von 25 bis 30 Jahren gehört, 10%, 30 bis 35 bis 35% und beispielsweise 50 bis 55 Jahre - 60%.



Der Algorithmus basiert auf der Pycharm-IDE mit Python 3.6. Viele Ressourcen eines solchen neuronalen Netzwerks werden nicht benötigt - die Tests wurden auf einem normalen Desktop-PC mit Intel Core i5-2400-CPU, NVIDIA GeForce GT 440-Grafikkarte und 64-Bit-Windows 7 durchgeführt. Außerdem wurde das System auf einem mobilen Gerät mit Android-Betriebssystem (Android-Version) getestet. und die Eigenschaften des mobilen Geräts sind nicht angegeben).


Beabsichtigte GUI für Android-Anwendungen

Das Hauptelement der mobilen Anwendung ist ein Fenster mit einer Videodemonstration (Aufnahme von der Kamera). Das neuronale Netzwerk analysiert einzelne Frames und versucht, das Alter und Geschlecht der Person anzugeben.

Laut den Entwicklern besteht das Hauptproblem beim Erkennen verschiedener Merkmale einer Person, einschließlich ihres Alters und Geschlechts, darin, dass das Training neuronaler Netze, die sich auf diese Aufgabe spezialisiert haben, zu begrenzt ist. Die Datenbanken mit Videos und Bildern sind relativ klein, und dennoch sind alle Menschen sehr unterschiedlich, einschließlich Vertreter des gleichen Geschlechts und der gleichen Alterskategorie.

Interessanterweise war eine der Datenbanken, auf deren Grundlage das neuronale Netzwerk aus dem Artikel trainiert wurde, dass alle Videos aus indischen Filmen geschnitten wurden. Insgesamt gab es 322 verschiedene Videos mit 34.512 Bildern in der Datenbank. Das Video enthielt Szenen mit Hunderten von indischen Schauspielern. Der Einfachheit halber wurden sie in 4 Alterskategorien unterteilt: "Kinder", "Jugend", "Mittelalter", "Ältere". Die Zeitleiste ist 1-12 Jahre alt, 13-30, 31-50, 50+.

Neuronale Netze können das Geschlecht und das Alter einer Person nicht nur anhand von Fotos oder Videos einer Person oder eines Körpers bestimmen. Beispielsweise hat ein von Google und Verily erstelltes neuronales Netzwerk gelernt, nicht nur die angegebenen Merkmale, sondern auch den durchschnittlichen Blutzucker HbA1c, den BMI, den arteriellen systolischen Druck SBP und den arteriellen diastolischen Druck DBP zu erkennen. Und das System zeigt an, ob eine Person raucht oder nicht. Und das alles - laut Fundus.



Um dieses neuronale Netzwerk zu trainieren, verwendeten die Entwickler die Bilddatenbank, die etwa 300.000 Fotos enthielt. Informationen von EyePACS und UK Biobank. Laut Ärzten kann ein neuer Diagnoseansatz Ärzten helfen, schnell eine Diagnose zu stellen. KI kann nicht nur beschleunigen, sondern auch die Genauigkeit der Diagnose erhöhen. Ärzte brauchen diese Hilfe einfach, da ein menschlicher Arzt nicht immer schnell und effizient arbeiten kann, insbesondere am Ende des Arbeitstages. Infolgedessen leiden die Genauigkeit der Diagnose und die Richtigkeit des vorgeschriebenen Behandlungsverlaufs.

Source: https://habr.com/ru/post/de434082/


All Articles