Salut L'été est chaud. Les organisateurs des championnats "IT" se sont beaucoup assis au soleil, ont brûlé et ont pris un coup, mais surtout, ils ont rassemblé une nouvelle tâche pour le prochain (déjà neuvième) concours sur la plateforme ML Boot Camp. Le championnat se déroulera en ligne dans un mois.
Aujourd'hui, plus de 10 000 spécialistes sont enregistrés sur la plateforme. Il arrive souvent que les tâches qui y figurent ne soient pas pour les dents de tout le monde (y compris les dieux Kaggle). Pourquoi on fait ça? Il faut par ailleurs développer et essayer, sur des données réelles, et non une balle synthétique. Les victoires viendront avec le temps.
La tâche que nous voulons vous proposer de résoudre dans ce concours est différente de toutes les précédentes. Le thème de la tâche est la détection d'objets dans les images. L'énoncé du problème implique qu'il y aura des images dans l'ensemble de données, mais, assez drôle, elles ne le sont pas. Et ce ne sont pas des pétaoctets de données. Et même pas des gigaoctets.
Le sujet est populaire et, en fait, très important. Dans le réseau social Odnoklassniki, comme dans d'autres produits, il y a une tâche pour filtrer le contenu. Imaginez que votre enfant verra la mauvaise image - son monde changera pour toujours.
Il y a deux ans,
Alexey Sennikov a écrit
un article sur la façon dont Odnoklassniki attirait ses utilisateurs pour résoudre ce problème. En bref, dans un article, Alexey a parlé de l'application de jeu
Odnoklassniki Moderator , dans laquelle les utilisateurs d'un réseau social classent les images comme bonnes et mauvaises, en recevant divers petits pains pour cela, et a également partagé un moyen de résoudre le problème de l'augmentation des applications DAU (Daily Active Users) à l'aide d'algorithmes apprentissage automatique.
Soit dit en passant, DAU compte désormais 40 000 utilisateurs et plus de 1 000 000 décisions par jour. Pas mal, hein?
Le défi du nouveau concours
Le réseau social Odnoklassniki dispose d'une plateforme de balisage des données. Sur celui-ci, les utilisateurs ont été chargés de mettre en évidence un objet donné dans une photographie avec un rectangle. Selon les réponses des gens, il est nécessaire de restaurer la vraie position de l'objet.
À l'entrée, vous recevrez un balisage et des données de crowdsourcing sous la forme de toutes vos étiquettes préférées. En réponse, il vous suffira d'envoyer un fichier avec des prédictions.
L'ensemble de données et la ligne de base seront publiés le jour du début de la compétition au ML Boot Camp.
Pour évaluer la solution, la métrique mIOU (intersection moyenne sur union) sera utilisée. Si vous n'avez pas rencontré cette mesure, nous vous recommandons de lire
un article à ce sujet.
Horaire
Le championnat se déroulera en ligne. Nous commençons le 27 juin à 19h00, clôturons les soumissions le 29 juillet à 12h00. Nous résumons également les résultats le 29 juillet à 13h00.
Tous les utilisateurs enregistrés sur la plateforme recevront un rappel par courrier.
Inscrivez-vous ou abonnez-vous à
la chaîne @mrgchamps. En cours de route, entrez dans la communauté des participants (
chat @mlbootcamp pour 1400 personnes) dans Telegram pour être exactement dans le sujet de tout ce qui se passe.
Cadeaux
Où sans eux. Premièrement, les meilleurs participants recevront:
1ère place: MacBook Pro 13 ', processeur 2 cœurs, SSD 256 Go, 16 RAM.
2e place: iPhone XS Max, 256 Go.
3ème - 6ème place: Apple Watch Series 3 42mm ou Samsung Gear S3 Frontier au choix.
7e - 10e place: Western Digital My Passport 4 TB.
Deuxièmement, les t-shirts sympas obtiendront les 30% supérieurs du nombre total de participants.
Littérature
Pour bien démarrer le championnat, nous vous recommandons de lire les articles:
- Grouper: optimisation des annotations de visage Crowdsourced
- Estimation du maximum de vraisemblance des taux d'erreur des observateurs à l'aide de l'algorithme EM
Venez, participez, apprenez et gagnez!