
Amis, nous avons lancé un concours entre développeurs AI / ML -
RAIF Hackathon . Nous vous invitons à participer! L'événement se déroule dans le cadre du forum d'affaires RAIF 2018 (le forum russe de l'intelligence artificielle). Il y a un an, nous avons fait un
hackathon similaire, mais cette fois le format sera différent. Deux étapes vous attendent: les qualifications en ligne et la dernière bataille hors ligne devant les invités de la RAIF. Trois tâches - de Rosreestr, Utkonos et l'usine métallurgique de Novolipetsk (NLMK) - et, en conséquence, trois nominations au choix. Le prix est de plus d'un million de roubles. Et oui, comme l'année dernière, il sera nécessaire de résoudre les tâches à l'aide des technologies d'apprentissage automatique;).
Vous pouvez participer seul ou en équipe de 3 personnes maximum. Vous pouvez choisir une, deux ou même les trois tâches présentées à votre discrétion. Dans les trois cas, vous serez à la disposition des données réelles de nos partenaires (bien sûr, anonymisées). Autrement dit, vous aurez une excellente occasion de regarder dans les coulisses de leur entreprise, ce qui, à notre avis, est beaucoup plus intéressant que les tâches de fiction abstraites qui sont proposées dans la plupart des hackathons.
Une tâche est le résultat absolu:
- Accélérez la production d'acier laminé (NLMK)
Les participants à ce volet pourront voir leurs résultats dans le classement sur le site Web du concours.
Deux autres tâches sont créatives:
- Analyser la demande de biens ("ornithorynque").
- Prédire la valeur cadastrale de l'immobilier (Rosreestr)
Ici, nous ne fournissons que des données de partenaires, et vous devrez vous-même déterminer ce qui peut être fait avec ces données.
Mais tout d'abord.
En ligne et hors ligne
Le RAIF Hackathon se déroulera en deux étapes: en ligne et hors ligne. Jusqu'au 19 octobre inclus, une tournée de qualification en ligne sur une tâche de NLMK a lieu. Pour les tâches d'Utkonos et de Rosreestr, cette étape est de 1 jour de moins - jusqu'au 18 octobre. Après avoir enregistré et rempli un profil dans votre compte, vous pouvez télécharger les données. À la fin des travaux, il sera nécessaire de décharger les modèles mathématiques créés au même endroit, dans votre compte personnel.
Le 11 octobre est la date de la «réconciliation de l'horloge»: ce jour-là, vous pouvez envoyer des solutions intermédiaires (ou déjà définitives) et obtenir le feedback des commissaires du hackathon. Des conseils d'experts en temps opportun augmenteront vos chances d'atteindre la finale. Cette option est particulièrement pertinente pour ceux qui participent aux nominations Utkonos et Rosreestr, chacune impliquant plusieurs solutions.
Le 20 octobre, les résultats de l'étape de qualification seront résumés et le 21 octobre, les résultats seront
envoyés aux participants dans la liste de diffusion et seront publiés sur le site Internet du
RAIF Hackathon .
Dans chaque catégorie, les 10 meilleures équipes qualifiées pour la finale se retrouveront le 23 octobre à Moscou dans le cadre du forum des affaires RAIF lors de la compétition finale. Les finalistes attendent des données supplémentaires et 4 heures de codage pour finaliser leur projet. Tout cela devant des experts reconnus dans le domaine de l'IA / ML et des cadres dirigeants de grandes entreprises russes. En conclusion, un débriefing et une récompense auront lieu.
Dans la nomination de NLMK, les gagnants seront déterminés par le résultat absolu. Dans les nominations d'Utkonos et de Rosreestr, le jury déterminera les meilleures décisions en fonction des résultats de la protection des œuvres soumises. Le prix sera partagé par 3 équipes - chacune recevra 350 000 roubles.
Les tâches, ce sont des nominations
AI pour NLMK
La tâche consiste à prévoir le temps de transit de la bande d'acier sur le site du laminoir à chaud.
Le laminoir à chaud de NLMK produit des produits laminés d'une largeur allant jusqu'à 1850 mm et d'une épaisseur de 1,45 mm à 16 mm. Gamme de nuances - de faible teneur en carbone à haute résistance, y compris les nuances de carbone, ainsi que l'acier électrique. Parmi les principaux consommateurs de bobines et de tôles laminées à chaud figurent l'industrie de la construction, la construction navale, l'automobile, les fabricants de tuyaux, ainsi que leur propre production de produits laminés à froid.
Les produits laminés à chaud sont les suivants. Les dalles chauffées sont déchargées des fours méthodologiques vers la ligne de laminage - les tôles d'acier servant d'ébauche pour le laminage. Au cours du processus de laminage le long de la ligne de laminage, une bande d'acier est comprimée dans les supports des groupes d'ébauche et de finition, devenant plus mince et plus longue, et à la fin elle est enroulée en rouleaux sur des enrouleurs spéciaux. Plus la bande devient mince et longue, plus elle doit se déplacer rapidement dans le camp.
Les données anonymes des bandes (largeur, épaisseur, etc.) et les données dépersonnalisées sur le fonctionnement du broyeur avant le laminage de la bande suivante (vitesse de la table à rouleaux, puissance du support, etc. sans référence au schéma) sont utilisées comme données d'entrée. leur signification physique est indiquée.
Andrzej Arshavsky, directeur de l'analyse des données, NLMK:
Dans le format hackathon, nous voulons essayer de résoudre le problème de prédire le moment de la location d'acier dans l'une de nos unités clés. Le hackathon permet de regarder le processus de production habituel sous différents angles, d'observer comment différentes approches, parfois inattendues, sont utilisées pour l'optimiser. Et pour les participants au RAIF Hackathon, c'est une chance de faire leurs preuves, d'essayer de résoudre un autre problème pratique et de comprendre leur niveau entre collègues.
AI pour Rosreestr
Tâche créative!
Déterminez les paramètres qui affectent la valeur des biens immobiliers et construisez un modèle mathématique qui estime la valeur marchande de ces objets.
Les nouvelles technologies, en particulier l'apprentissage automatique, peuvent augmenter considérablement l'efficacité de l'évaluation immobilière. Les conclusions obtenues analytiquement peuvent être progressivement remplacées par des conclusions «générées» par des algorithmes d'apprentissage automatique basés sur une analyse de la situation sur le marché immobilier et le degré d'influence de divers facteurs sur la valeur de l'immobilier.
Dans ce concours, les participants sont invités à construire un modèle de prévision basé sur le déchargement fourni et toutes autres données provenant de sources ouvertes qui détermineront la valeur marchande de l'objet. Dans le même temps, les données qui serviront de base à la détermination de la valeur marchande et l'échantillon lui-même pour la construction du modèle, les participants doivent les trouver indépendamment dans des sources ouvertes. En tant que résultat estimé du hackathon, un ensemble du modèle mathématique et de la présentation proposés seront considérés.
La présentation doit refléter:
- données externes qui ont été utilisées dans la construction du modèle
- méthodes d'évaluation de l'exactitude du modèle et de leurs résultats
- description du modèle lui-même
- une description des paramètres les plus importants et des conclusions qui peuvent être tirées sur cette base.
Options d'évaluation créative- Applicabilité pratique
- Bon : travail d'analyse effectué. Lors de la construction du modèle, divers facteurs externes affectant la valeur des biens immobiliers ont été pris en compte. Le modèle peut prédire la valeur de l'immobilier, compte tenu du manque d'informations sur un certain nombre de facteurs externes.
- Mauvais : conclusions que tous les facteurs influencent de la même manière, ou le modèle ne fonctionne que pour une petite partie des objets
- Une méthode pour évaluer la précision d'une solution
- Bon : trouver le bon échantillon de test, la capacité de démontrer le fonctionnement du modèle
- Mauvais : calculé la valeur cadastrale selon la formule bien connue
- Utilisation de données externes
- Bon : vous avez analysé et évalué l'influence de divers facteurs externes (proximité des infrastructures clés, accessibilité des transports, état de la maison, présence de parcs / parcs forestiers, plans d'eau, manque de décharges, etc.)
- Mauvais : n'a ajouté aucun paramètre ou ne les a pas utilisés correctement (a permis la fuite de la variable cible)
- Nouveauté
- Bon : les conclusions et les solutions diffèrent de celles connues et accessibles
- Mauvais : utilisé la formule standard pour le calcul
Timofey Alekseev, chef adjoint du département informatique, Rosreestr:
Il sera intéressant pour nous d'évaluer les avantages pratiques des solutions présentées et la possibilité de leur application ultérieure dans le travail du service. Nous attendons des solutions non standard et une attention aux détails des participants.
AI pour The Platypus
Tâche créative!
Analyser la demande de produits de l'hypermarché en ligne en utilisant des données historiques sur le remboursement des marchandises des entrepôts au cours des dernières années.
La solution aidera l'entreprise à fournir la quantité requise de marchandises dans les entrepôts, compte tenu de l'évolution de la demande.
Dans le cadre de cette tâche, les éléments suivants sont intéressants:
- Algorithmes et solutions qui pourraient prendre en compte la manière dont la variation des prix et la disponibilité de certains biens affectent la demande d'autres biens (effet Halo, "cannibalisation").
- Définition des marchandises qui sont des marchandises de substitution et des produits connexes.
- Identification des modèles de comportement des clients, prévision des commandes de marchandises en fonction de ces modèles.
Vladimir Alabin, responsable de l'automatisation des prévisions, Utkonos:
Nous voulons avoir une image plus complète de la demande et des facteurs qui l'influencent afin de satisfaire au maximum les besoins des clients, et d'autre part d'optimiser les opérations de l'entrepôt.
Options d'évaluation créative- Compréhension du domaine
- Bon : La solution est basée sur une compréhension des besoins de l'entreprise.
- Mauvais : selon le participant, tous les paramètres sont également utiles, plus ou moins prédits - il n'y a pas de différence.
- Rentabilité
- Bon : vous avez calculé des indicateurs susceptibles d'intéresser le commerce de détail (par exemple, profiter de la mise en place du système).
- Mauvais : AUC abstraite comptée ou précision. Quelle est l'utilisation du magasin n'est pas claire.
- Utilisation de données externes
- Bon : vous avez apprécié l'impact des vacances, de la météo et d'autres facteurs externes.
- Mauvais : ajout de paramètres farfelus (comme l'effet de la météo sur Mars).
- Nouveauté
- Bon : vous avez apporté votre propre produit et montré en quoi il diffère des solutions toutes faites.
- Mauvais : a ouvert Stackoverflow, a trouvé une question et une réponse similaire, l'a fait par analogie.
>> Devenez membre du RAIF Hackathon <<
Attention! Nous tirons 10 billets pour la section technique
À la fin du RAIF Hackathon, une section technique sera organisée où vous pourrez écouter des experts reconnus de Data Science - des représentants de sociétés russes et étrangères bien connues (y compris des startups). Parmi eux:
Konstantin Vorontsov , professeur, Département des systèmes intelligents, FUPM MIPT;
Dmitry Bugaychenko , ingénieur logiciel à Odnoklassniki;
Emeli Dral , Chief Data Scientist Mechanica.AI;
Nikolay Knyazev , chef de l'équipe Data Science chez Jet Infosystems;
Alexey Dral PDG BigData Team, et autres.
Tous les finalistes du hackathon pourront assister gratuitement à la section technique. Pour ceux qui ne sont pas encore confiants dans leurs capacités ou qui n'ont pas l'intention de participer au hackathon, mais qui souhaitent vraiment assister à cet événement, nous vous annonçons le tirage de 10 billets! Jusqu'au 9 octobre inclus, republiez sur Facebook et / ou Vkontakte et envoyez le lien ici - dans un message personnel. Les gagnants seront déterminés le 10 octobre par un générateur de nombres aléatoires. Nous informerons tout le monde via des médicaments.
UPD: mes amis, pour une interaction opérationnelle avec les participants au RAIF Hackathon, nous avons créé un chat télégramme t.me/RAIFHACK - vous pouvez y poser des questions sur le hackathon.