Aufgrund des langjährigen Traums von Videospielen und des „Hype“ um KI begann ich 2016, Python zu lernen.
Informatik macht Spaß, weil ich erst vor einer Woche das erste Erkennungsmodell trainiert habe, aber ohne Python (es gibt viele Versuchungen in der Informatik). Wie von Andrei Sebrant (Yandex) vorausgesagt, ist eine neue technologische Revolution eingetreten. Warum? Eine Bilderkennungsanwendung einfacher machen als ein Computerspiel. Genug für ein oder zwei Stunden.

Ich bin den "schwierigen" Weg gegangen - ich habe nicht aus vier bereits trainierten Modellen ausgewählt, sondern meine eigenen trainiert. Mit der Core ML-Bibliothek von Apple können Sie dies mit 6 Codezeilen oder über die GUI auf Spielplätzen tun.
import CreateMLUI let builder = MLImageClassifierBuilder() builder.showInLiveView()
Die meiste Zeit wurde damit verbracht, Daten für das Training zu sammeln und zu filtern. 70 Fotos von Hunden, Katzen und Menschen, aber ein schnell geschriebenes Skript machten diesen Prozess halbautomatisch.
Ich habe nur über maschinelles Lernen gelesen. Als ich es selbst ausprobierte, stieß ich auf drei erwartete Probleme / Schlussfolgerungen:
- Daten sind der wichtigste Teil.
- Benutzerfreundliche Oberfläche (CoreML). Alles funktioniert einfach und ich möchte nicht wirklich in den Quellcode gehen, um die Details herauszufinden. Maschinelles Lernen ist für jeden Benutzer zugänglich, aber die Apple-Ingenieure haben versucht, komplexe Details zu verbergen.
- Das Modell ist eine Black Box. Ich kenne die Regeln nicht, nach denen das Modell zwei Prozent der „Katze“ auf dem Foto glaubt.
Das Experiment mit der Erkennung von „menschlichen Katzen“ hat zu der Idee geführt, dass der Klassifizierungsalgorithmus mit dem „Stil“ fertig wird.
Ich habe vier Fotografen und jeweils etwa hundert Fotos ausgewählt. Ich habe nicht versucht, Beispiele sorgfältig auszuwählen, sondern einfach die ersten oder letzten hundert Bilder von
Evgeny Mokhorev und
Oleg Videnin aus meiner Sammlung
kopiert . Es gab nicht genügend Fotos von
Maxim Shumilin , da nicht nur Porträts ausgewählt wurden. Die Fotos von
Jegor Voinov wurden jedoch sorgfältiger ausgewählt, da ich auf seiner Website zwei Abschnitte heruntergeladen habe, die dem Porträt gewidmet sind.
Ich habe mit dem Training des Algorithmus begonnen und im Durchschnitt eine Erkennungsgenauigkeit von 80% erreicht (Testergebnisse während der Erstellung).
Es gab einen seltsamen Moment. Ich habe die Anzahl der Fotos von Oleg Videnin verdoppelt und das System hat nur 30% gelernt, und die Erkennungsgenauigkeit hat sich auf 20% verringert.
Das System musste überprüft werden, um Verzerrungen zu vermeiden. Ich bat Jegor Voinov, Fotos zu senden, die nicht auf der Website sind. Infolgedessen bestätigte der Algorithmus, dass 20 von 26 Fotos der Aufnahme eines Porträts durch Jegor Voinov ähneln.
Dies bestätigte die Erkennungsgenauigkeit von 77%, die beim Erstellen des Klassifikators erhalten wurde.

Und dann beginnt der Spaß.
Erstens kann das System trainiert werden, indem dem Trainingssatz erneut „Fehler“ hinzugefügt werden. Die Ergebnisse ändern sich, aber das System erinnert sich nicht an die Fotos, sondern findet gemeinsame Anzeichen für einen bestimmten Autor. Einige Fotos nach „Arbeiten an Fehlern“ wurden vom System als Fotos von Jegor Voinov erkannt, andere nicht.

Zweitens neigt das System dazu, den Fotografien von Jewgeni Mokhorev den „Akt“ zuzuschreiben, weshalb er unter dem seltenen „Akt“ von Oleg Videnin schreibt, dass es sich um Fotografien von Mokhorev handelt. Und sobald Sie den "gekleideten Mokhorev" zeigen, kann das System "Voinov sehen". Und erkennen Sie das Foto von Jegor Voynov als Foto von Oleg Videnin.

Die Auswahl aus den Fotografien von Maxim Shumilin erwies sich als sehr heterogen. Daher bezieht sich das System bei kleinen Figuren und Porträts mit einer ausgeprägten "Unschärfe" auf die Fotografien von Maxim.

Drittens kann das System einen Blick auf das Foto von Meister Yoda werfen.
Und Sie können einfach ein schnelles Foto machen und herausfinden, in welchem "Stil" das Foto aufgenommen wurde
Und hier ist der Moment der Wahrheit. Ich habe meine Porträts hochgeladen, um herauszufinden, wie viel Mokhorev, Videnin, Voinov und Shumilin in mir sind.

Der Entwurf der
PhotoGuru- App
ist fertig. Bisher scheint es mir, dass dies ein lustiges Spielzeug ist, aber ich werde am Design arbeiten und die Trainingsbeispiele erweitern.
Mit einem Wort, Sie müssen einen Rahmen für das weitere Studium von ML wählen.