Kits de formation de la vidéo - rapidement et efficacement

N'importe quel objet, pas le plus trivial (ou tout simplement rare) peut facilement créer beaucoup de problèmes avec presque chaque tentative d'utiliser des réseaux de neurones pour résoudre de vrais problèmes. De toute évidence, le manque d'un ensemble d'entraînement sain complique considérablement le nombre écrasant de scénarios d'utilisation de l'approche neurostème.

Que faire, par exemple, d'une espèce rare de sauterelle, dont la reconnaissance de représentants, pour une raison ou une autre, est devenue une tâche très importante.


Tous les résultats / exemples ont été obtenus indépendamment (et rapidement).

Objets personnalisés


Le monde réel, comme les tâches réelles, est extrêmement unique, inhabituel et souvent très spécifique en ce qui concerne la couleur, la forme, le comportement, etc.


Pour résoudre avec succès les problèmes correspondants, des données sont nécessaires (ensembles de formation, dans notre cas). Et comme tout le monde n'essaie pas de construire le pilote automatique «le plus correct» ou de chercher des sourires sur les photos, la création des ensembles nécessaires devient le principal problème.

D'accord, la probabilité de trouver un ensemble prêt à l'emploi et de haute qualité pour un style de coloration très spécifique tend à zéro:


Soit dit en passant, les algorithmes youtube semblent un peu faux en ce qui concerne le corps peint. Au moins, le contenu renvoyé semble quelque peu controversé.

La façon habituelle de marquer


Eh bien, supposons que le balisage manuel ne semble pas très effrayant - vous n'avez pas peur du travail monotone ou du sourcing de foule convient à la fois à la qualité du résultat et au coût. Mais cela est vrai tant qu'il s'agit d'une boîte englobante (un exemple hackneyed est utilisé, à des fins d'illustration uniquement):


Que faire si les spécificités de la tâche nécessitent de trouver le contour exact? Le masque RCNN est une bonne solution, mais nécessite un ensemble d'entraînement précis et de haute qualité. Et pour dessiner un contour, comme vous le savez, ce n'est pas un rectangle à marquer et un tel travail nécessitera plusieurs autres efforts.

Approche automatisée


L'éternelle question: "Que faire?". La réponse n'est pas moins triviale - pour automatiser. Les algorithmes classiques de vision par ordinateur permettent d'obtenir des résultats acceptables à condition que certaines conditions de base soient remplies.


En fait, c'est l'imposition de conditions supplémentaires qui ne permet pas d'utiliser cette approche comme solution principale. Néanmoins, les algorithmes standard appropriés vous permettent d'obtenir rapidement un ensemble de haute qualité, diversifié et facilement extensible.

Si haute qualité que même le changement de couleur habituel dans la zone sélectionnée ressemble à une solution presque prête à l'emploi:


En savoir plus sur l'approche la prochaine fois.

Exemple d'ensemble d'entraînement


L'approche pour générer un ensemble d'entraînement à partir d'une vidéo est pratique dans la mesure où le résultat final contient exclusivement des exemples «en direct» et complètement réels qui reflètent la variabilité et la complexité du monde réel. Par exemple, les lèvres:



Autres résultats





Suivez le développement du projet


YouTube: RobotsCanSee
Télégramme: RobotsCanSeeUs

Source: https://habr.com/ru/post/fr472520/


All Articles