Neste outono, estamos novamente organizando o grande concurso de aprendizado de máquina Sberbank Data Science Journey. Todos os anos, abordamos um novo tópico e agora convidamos você a experimentar o AutoML. Mais especificamente, no desenvolvimento de um meta-algoritmo muito qualificado, capaz de criar modelos de aprendizado de máquina de forma independente: com processamento de dados, recursos de construção, modelos de treinamento, selecionando seus parâmetros e prevendo a variável de destino.

Este ano, imediatamente premiaremos 13 equipes para resolver o problema. O restante dos detalhes está mais adiante na postagem.
Termos e Cronograma
A declaração de missão deste ano é detalhada no
GitHub . Em resumo, você precisa criar um algoritmo de aprendizado de máquina que prepare dados automaticamente, selecione uma família de modelos e selecione hiperparâmetros. E, é claro, atende a todas as condições estabelecidas. Para o trabalho, além dessas condições,
é fornecido um
conjunto público de conjuntos de dados .
Cada equipe de participantes receberá uma conta pessoal no site do concurso. Uma equipe pode incluir no máximo quatro pessoas. Durante a competição, de 19 de setembro a 3 de novembro, os participantes poderão fazer upload de
até cinco soluções-algoritmos diariamente em sua conta pessoal. Todas essas decisões se enquadram na classificação geral, onde são verificadas regularmente online, usando um conjunto de dados de teste fechados. A partir dos resultados, uma tabela das classificações gerais é compilada, aberta a todos - você sempre pode estimar seu sucesso. O download das soluções estará disponível até
3 de novembro, 23:59:59 (daqui em diante - horário de Moscou).
Entre todas as decisões ocupadas, cada equipe terá que escolher dois que o representarão na final. Além disso, são dadas 12 horas. Prazo opcional -
4 de novembro às 12:00 .
E finalmente, nas próximas 12 horas, executaremos os dados nas decisões finais e anunciaremos o vencedor no
site da competição até o final deste período.
Prémios
Os desenvolvedores das dez soluções com a classificação final mais alta receberão prêmios em dinheiro: 1 000 000 rublos para o primeiro lugar, 500 000 para o segundo, 300 000 para o terceiro, 200 000 para o terceiro, 200 000 para o quarto e quinto. Todos os outros lugares até o décimo inclusive receberão 100.000 rublos.
Além disso, se a equipe não estiver com preguiça de publicar a solução no GitHub, poderá receber outros 100.000 rublos. Ganharemos três desses prêmios entre as melhores soluções que serão apresentadas para uso público. E, a propósito, esse prêmio adicional não exclui o principal.
O prêmio oficial será realizado no dia 10 de novembro na conferência do Dia da Ciência de Dados Sberbank. Escreveremos sobre o conflito adicionalmente. Cobriremos os custos de transporte de desenvolvedores de outras cidades, mas mesmo que isso não o atraia para a capital, ainda pagaremos o prêmio.
No caso de vários mal-entendidos, todas as informações sobre o evento em uma linguagem legal seca estão disponíveis em um
documento separado. Se você não encontrou a resposta lá ou a pergunta diz respeito à parte técnica, pergunte no
fórum ou nos comentários da postagem. Aguardamos a sua participação!
Links úteis: