Cet automne, nous organisons une fois de plus le grand concours d'apprentissage automatique Sberbank Data Science Journey. Chaque année, nous couvrons un nouveau sujet et nous vous invitons maintenant à vous essayer à AutoML. Plus précisément, dans le développement d'un méta-algorithme très compétent capable de créer indépendamment des modèles d'apprentissage automatique: avec traitement des données, construction de fonctionnalités, formation de modèles, sélection de leurs paramètres et prédiction de la variable cible.

Cette année, nous récompenserons immédiatement 13 équipes pour la résolution du problème. D'autres détails sont plus tard dans le post.
Termes et calendrier
L'énoncé de mission de cette année est détaillé sur
GitHub . En bref, vous devez créer un algorithme d'apprentissage automatique qui prépare automatiquement les données, sélectionne une famille de modèles et sélectionne les hyperparamètres. Et, bien sûr, il remplit toutes les conditions fixées. Pour le travail, en plus de ces conditions, un
ensemble public de jeux de données est fourni .
Chaque équipe de participants recevra un compte personnel sur le site Web du concours. Une équipe peut comprendre un maximum de quatre personnes. Pendant le concours, du 19 septembre au 3 novembre, les participants pourront télécharger
jusqu'à cinq solutions-algorithmes par jour sur leur compte personnel. Toutes ces décisions relèvent de la notation générale, où elles sont régulièrement vérifiées en ligne à l'aide d'un ensemble de données de test fermées. À partir des résultats, un tableau du classement général est compilé, ouvert à tous - vous pouvez toujours estimer votre succès. Le téléchargement des solutions sera disponible jusqu'au
3 novembre, 23:59:59 (ci-après - heure de Moscou).
Parmi toutes leurs décisions bien remplies, chaque équipe devra en choisir deux qui la représenteront en finale. Ceci est en outre donné 12 heures. Date limite facultative -
4 novembre, 12h00 .
Et enfin, au cours des 12 prochaines heures, nous exécuterons les données sur les décisions finales et annoncerons le gagnant sur
le site Web du concours d'ici la fin de cette période.
Récompenses
Les développeurs des dix solutions ayant obtenu la note finale la plus élevée se verront attribuer des prix en espèces: 1 000 000 roubles pour la première place, 500 000 pour la seconde, 300 000 pour la troisième, 200 000 pour les quatrième et cinquième. Tous les autres endroits jusqu'au dixième inclus recevront 100 000 roubles.
En outre, si l'équipe n'est pas trop paresseuse pour publier la solution sur GitHub, elle peut recevoir 100 000 roubles supplémentaires. Nous remporterons trois de ces prix parmi les meilleures solutions qui seront mises à la disposition du public. Et d'ailleurs, ce prix supplémentaire n'exclut pas le principal.
Le prix officiel aura lieu le 10 novembre lors de la conférence Sberbank Data Science Day. Nous écrirons également sur le confe. Nous couvrirons les frais de transport des développeurs d'autres villes, mais même si cela ne vous attire pas vers la capitale, nous continuerons à payer le prix.
En cas de malentendus divers, toutes les informations sur l'événement dans une langue juridique sèche sont disponibles dans un
document séparé. Si vous n'y avez pas trouvé de réponse ou si la question concerne la partie technique, posez-la sur le
forum ou dans les commentaires du post. Nous nous réjouissons de votre participation!
Liens utiles: