Este otoño, una vez más estamos organizando la gran competencia de aprendizaje automático Sberbank Data Science Journey. Cada año cubrimos un nuevo tema y ahora lo invitamos a probar suerte en AutoML. Más específicamente, en el desarrollo de un meta-algoritmo muy habilidoso capaz de crear independientemente modelos de aprendizaje automático: con procesamiento de datos, características de construcción, modelos de entrenamiento, selección de sus parámetros y predicción de la variable objetivo.

Este año premiaremos de inmediato a 13 equipos por resolver el problema. El resto de los detalles se encuentran más adelante en la publicación.
Términos y horario
La declaración de misión de este año se detalla en
GitHub . En resumen, debe crear un algoritmo de aprendizaje automático que prepare automáticamente los datos, seleccione una familia de modelos y seleccione hiperparámetros. Y, por supuesto, cumple con todas las condiciones establecidas. Para el trabajo, además de estas condiciones, se proporciona un
conjunto público de conjuntos de datos .
Cada equipo de participantes recibirá una cuenta personal en el sitio web del concurso. Un equipo puede incluir un máximo de cuatro personas. Durante la competencia, del 19 de septiembre al 3 de noviembre, los participantes podrán cargar
hasta cinco algoritmos de soluciones diariamente en su cuenta personal. Todas estas decisiones caen en la calificación general, donde se verifican regularmente en línea utilizando un conjunto de datos de prueba cerrados. A partir de los resultados, se compila una tabla de la clasificación general, abierta a todos: siempre puede estimar su éxito. La descarga de soluciones estará disponible hasta
el 3 de noviembre a las 23:59:59 (en adelante, hora de Moscú).
Entre todas sus decisiones ocupadas, cada equipo tendrá que elegir dos que lo representarán en la final. Esto se da adicionalmente 12 horas. Fecha límite opcional:
4 de noviembre a las 12:00 .
Y, por último, las próximas 12 horas procesaremos los datos sobre las decisiones finales y anunciaremos el ganador en
el sitio web de la competencia al final de este período.
Premios
Los desarrolladores de las diez soluciones con la calificación final más alta recibirán premios en efectivo: 1 000 000 de rublos por el primer lugar, 500 000 por el segundo, 300 000 por el tercero, 200 000 por el cuarto y quinto. Todos los demás lugares hasta el décimo inclusive recibirán 100,000 rublos.
Además, si el equipo no es demasiado vago para publicar la solución en GitHub, puede recibir otros 100.000 rublos. Ganaremos tres de estos premios entre las mejores soluciones que se presentarán para uso público. Y, por cierto, este premio adicional no excluye el principal.
El premio oficial se llevará a cabo el 10 de noviembre en la conferencia Sberbank Data Science Day. Escribiremos sobre la confe adicionalmente. Cubriremos los costos de transporte de los desarrolladores de otras ciudades, pero incluso si esto no lo atrae a la capital, aún pagaremos el premio.
En caso de varios malentendidos, toda la información sobre el evento en un lenguaje legal seco está disponible en un
documento separado. Si no encontró la respuesta allí o la pregunta se refiere a la parte técnica, pregúntela en el
foro o en los comentarios a la publicación. ¡Esperamos su participación!
Enlaces utiles: