Trainingskits aus dem Video - schnell und effizient

Jedes, nicht das trivialste (oder nur seltenste) Objekt kann bei fast jedem Versuch, neuronale Netze zur Lösung realer Probleme zu verwenden, leicht viele Probleme verursachen. Offensichtlich erschwert das Fehlen eines vernünftigen Trainingssatzes die überwältigende Anzahl von Szenarien für die Verwendung des Neurostem-Ansatzes erheblich.

Was ist zum Beispiel mit einer seltenen Heuschreckenart zu tun, deren Anerkennung aus dem einen oder anderen Grund zu einer sehr wichtigen Aufgabe geworden ist?


Alle Ergebnisse / Beispiele wurden unabhängig (und schnell) erhalten.

Benutzerdefinierte Objekte


Die reale Welt ist wie reale Aufgaben überwältigend einzigartig, ungewöhnlich und oft nur sehr spezifisch, wenn es um Farbe, Form, Verhalten usw. geht.


Um die entsprechenden Probleme erfolgreich zu lösen, werden Daten benötigt (in unserem Fall Trainingssätze). Und da nicht jeder versucht, den „korrektesten“ Autopiloten zu bauen oder auf Fotos nach einem Lächeln zu suchen, wird die Erstellung der erforderlichen Sets zum Hauptproblem.

Stimmen Sie zu, die Wahrscheinlichkeit, ein fertiges und qualitativ hochwertiges Set für einen ganz bestimmten Farbstil zu finden, geht gegen Null:


Übrigens scheinen YouTube-Algorithmen etwas falsch zu sein, wenn es um den bemalten Körper geht. Zumindest der zurückgegebene Inhalt sieht etwas kontrovers aus.

Die übliche Art der Kennzeichnung


Angenommen, manuelles Markup sieht nicht sehr beängstigend aus - Sie haben keine Angst vor eintöniger Arbeit oder Crowd Sourcing ist sowohl für die Qualität des Ergebnisses als auch für die Kosten geeignet. Dies gilt jedoch, solange es sich um einen Begrenzungsrahmen handelt (ein abgedroschenes Beispiel dient nur zur Veranschaulichung):


Was tun, wenn für die Besonderheiten der Aufgabe die genaue Kontur ermittelt werden muss? Die Maske RCNN ist eine ziemliche Lösung, erfordert jedoch ein qualitativ hochwertiges und genaues Trainingsset. Und um eine Kontur zu zeichnen, wie Sie wissen, ist dies kein zu markierendes Rechteck, und solche Arbeiten erfordern mehrere andere Anstrengungen.

Automatisierter Ansatz


Die ewige Frage: "Was tun?" Die Antwort ist nicht weniger trivial - zu automatisieren. Klassische Algorithmen der Bildverarbeitung ermöglichen akzeptable Ergebnisse, sofern einige Grundbedingungen erfüllt sind.


Tatsächlich ist es die Auferlegung zusätzlicher Bedingungen, die es nicht zulässt, diesen Ansatz als Hauptlösung zu verwenden. Mit den richtigen Standardalgorithmen erhalten Sie jedoch schnell ein qualitativ hochwertiges, vielfältiges und leicht erweiterbares Set.

So hochwertig, dass selbst der übliche Farbwechsel im ausgewählten Bereich wie eine fast fertige Lösung aussieht:


Mehr über den Ansatz beim nächsten Mal.

Beispiel für ein Trainingsset


Der Ansatz zum Generieren eines Trainingssatzes aus einem Video ist insofern praktisch, als das Endergebnis ausschließlich „live“ und vollständig reale Beispiele enthält, die die Variabilität und Komplexität der realen Welt widerspiegeln. Zum Beispiel Lippen:



Andere Ergebnisse





Verfolgen Sie die Entwicklung des Projekts


YouTube: RobotsCanSee
Telegramm: RobotsCanSeeUs

Source: https://habr.com/ru/post/de472520/


All Articles