Crowdsourcing no ML Boot Camp. Consideramos mIOU sem fotos para uma nova tarefa de Odnoklassniki

Oi O verão é quente. Os organizadores do campeonato "IT" sentaram-se muito ao sol, queimaram e deram um golpe, mas o mais importante, eles reuniram uma nova tarefa para o próximo (já nono) concurso na plataforma do ML Boot Camp. O campeonato será realizado on-line dentro de um mês.


Agora, mais de 10 mil especialistas estão registrados na plataforma. Muitas vezes acontece que as tarefas que aparecem nele não são para os dentes de todos (incluindo os deuses Kaggle). Por que estamos fazendo isso? É necessário desenvolver e tentar, além disso, dados reais, e não um marcador sintético. As vitórias virão com o tempo.

A tarefa que queremos oferecer a você para resolver nesta competição é diferente de todas as anteriores. O tema da tarefa é a detecção de objetos nas imagens. A declaração do problema implica que haverá imagens no conjunto de dados, mas, engraçado o suficiente, elas não são. E esses não são petabytes de dados. E nem mesmo gigabytes.

O tópico é popular e, de fato, muito importante. Na rede social Odnoklassniki, como em outros produtos, há uma tarefa para filtrar o conteúdo. Imagine que seu filho verá a imagem errada - o mundo dele mudará para sempre.

Há dois anos, Alexey Sennikov escreveu um artigo sobre como o Odnoklassniki atrai seus usuários para resolver esse problema. Resumidamente, em um artigo, Alexey falou sobre o aplicativo de jogo Odnoklassniki Moderator , no qual os usuários de uma rede social classificam imagens como boas e ruins, recebendo vários pães por ela e também compartilharam uma maneira de resolver o problema de aumentar os aplicativos DAU (Usuários ativos diários) usando algoritmos aprendizado de máquina.

A propósito, a DAU agora tem 40 mil usuários e mais de 1'000'000 decisões por dia. Nada mal, né?

O desafio do novo concurso


A rede social Odnoklassniki possui uma plataforma para marcar dados. Nela, os usuários tiveram a tarefa de destacar um determinado objeto em uma fotografia com um retângulo. De acordo com as respostas das pessoas, é necessário restaurar a verdadeira posição do objeto.


Na entrada, você receberá marcações e dados de crowdsourcing na forma de todas as suas etiquetas favoritas. Em resposta, você apenas precisará enviar um arquivo com previsões.

O conjunto de dados e a linha de base serão publicados no dia em que a competição começar no ML Boot Camp.


Para avaliar a solução, a mIOU (interseção média sobre união) será usada. Se você não encontrou essa métrica, recomendamos que você leia um artigo sobre ela.

Horário


O campeonato ficará online. Começamos em 27 de junho às 19:00, fechamos as inscrições em 29 de julho às 12:00. Também estamos resumindo os resultados em 29 de julho às 13:00.

Todos os usuários registrados na plataforma receberão um lembrete pelo correio. Inscreva-se ou inscreva-se no canal @mrgchamps. Ao longo do caminho, entre na comunidade de participantes ( chat @mlbootcamp para 1400 pessoas) no Telegram para estar exatamente no assunto de tudo o que acontece.

Presentes


Onde sem eles. Em primeiro lugar, os melhores participantes receberão:

1º lugar: MacBook Pro 13 ', processador de 2 núcleos, SSD de 256 GB, 16 RAM.
2º lugar: iPhone XS Max, 256 GB.
3º - 6º lugar: Apple Watch Series 3 42mm ou Samsung Gear S3 Frontier para escolher.
7º - 10º lugar: Western Digital My Passport 4 TB.

Em segundo lugar, as camisetas legais receberão os 30% melhores do número total de participantes.

Literatura


Para começar bem o campeonato, recomendamos a leitura dos artigos:

  1. Garoupa: otimizando anotações de rosto com crowdsourcing
  2. Estimativa de máxima verossimilhança das taxas de erro do observador usando o algoritmo EM

Venha, participe, aprenda e ganhe!

Source: https://habr.com/ru/post/pt456760/


All Articles