Formation en entreprise sur la science des données et mitap thématique à Voronej



Le 25 mai, la deuxième réunion Metaconf se tiendra à Voronej, cette fois consacrée à l'apprentissage automatique. Il y a cinq rapports dans le programme mitap, l'inscription gratuite est disponible ici . En particulier, Anton Dolgikh, expert DataArt sur les projets d'IA dans le domaine des soins de santé, parlera du «modèle probabiliste de réseau neuronal du langage naturel». Aujourd'hui, nous avons demandé à Anton de parler de l'expérience de la systématisation des connaissances d'apprentissage automatique au sein de DataArt.

Le champ d'application de ML est en constante expansion (des soins de santé à l'industrie du voyage). Dans DataArt, à un moment donné, le nombre de demandes de développement ML a dépassé une valeur critique. Avant cela, nous avons pu résoudre ces problèmes par les ingénieurs qui travaillaient dans l'entreprise.

Lorsqu'il est devenu difficile de gérer avec nos propres ressources, deux voies de développement sont apparues: embaucher de nouveaux collaborateurs ou former des spécialistes au sein de l'entreprise. Dans le premier cas, nous courons le risque que le développeur ML que nous avons embauché par la suite ne tombe pas immédiatement dans un nouveau projet de notre domaine professionnel. Dans le même temps, les personnes qui sont étroitement impliquées dans le machine learning ne sont généralement pas prêtes à s'engager, par exemple, dans le développement fullstack. Par conséquent, nous nous sommes appuyés sur des ingénieurs DataArt qui souhaitent évoluer vers le ML, mais qui sont en mesure de reprendre leur travail précédent si nécessaire.

Le processus de préparation doit être systématisé. Il peut sembler qu'Internet regorge de tonnes de cours en ligne et vidéo. Mais pour se développer de manière productive, une personne a besoin d'un vecteur de développement - de l'écoute au hasard à n'importe quel cours, il est de peu d'utilité.

Qu'avons-nous fait:

  1. Tout d'abord, ils ont formé le noyau - un groupe d'initiative de collègues ayant le plus d'expérience et d'expertise dans divers domaines de l'apprentissage automatique. Ils ont préparé une série de présentations, fait un aperçu des cours existants et formulé des recommandations: quels cours vous devez suivre afin d'acquérir des compétences pertinentes aux tâches que DataArt résout.
  2. Nous avons organisé des cours de mathématiques. De toute évidence, ML est intrinsèquement des statistiques mathématiques et des méthodes d'optimisation. Pour comprendre et utiliser correctement les méthodes d'apprentissage automatique, certaines connaissances mathématiques sont nécessaires. À première vue, les spécialistes qui ont reçu une formation technique connaissent toujours bien les mathématiques. Mais en pratique, il s'avère que les compétences sont oubliées très rapidement. Cela impose une restriction au cours: une entreprise, contrairement à une université, ne peut pas fournir des connaissances fondamentales, mais les connaissances doivent être adéquates et suffisamment approfondies. Nous avons invité un professeur de l'extérieur à lire le cours (nos collègues étaient trop occupés). Le programme était axé sur des domaines directement liés à l'apprentissage automatique: algèbre linéaire, analyse, théorie des probabilités, méthodes d'optimisation. Le cours est complété par des cours réguliers avec des experts, où sur la base de la théorie, nous considérons les problèmes pratiques des projets d'apprentissage automatique.
  3. Chaque mois, nos spécialistes ML organisent des séminaires pédagogiques sur les dernières réalisations dans ce domaine. L'enregistrement des séminaires est accessible à tous les employés de l'entreprise.
  4. En plus des séminaires, les spécialistes de DataArt ML publient régulièrement un condensé de matériaux intéressants (méthodes, articles, livres) avec de brèves annotations et commentaires.

L'entreprise soutient ces initiatives, un budget est alloué pour l'achat de littérature et la participation de collègues à des conférences, pour des programmes de fer et de mentorat. Le résultat de la formation de mentorat individuel est un prototype prêt à l'emploi qui peut être utilisé lors de conférences ou lors de réunions avec des clients potentiels. À titre d'exemple, nous pouvons citer le résultat du travail de notre expert Andrei Sorokin - un modèle qui détecte et classe les lésions cutanées ( arxiv.org/pdf/1807.05979.pdf ). Pour optimiser le modèle résultant pour une utilisation sur les appareils mobiles, l'employé vient d'aider dans le cadre du programme de mentorat. Le modèle a pris la 12e place du concours international ISIC 2018 , battant non seulement les participants individuels, mais aussi les équipes universitaires.

La systématisation ci-dessus du processus nous a permis de traiter rapidement et de manière experte toutes les demandes du domaine de l'apprentissage automatique qui viennent à DataArt de clients potentiels. Nous avons préparé du matériel marketing et les équipes de vente sont toujours des experts disponibles qui peuvent répondre aux questions des clients. Plusieurs projets ont déjà été menés à bien.

Comme de nombreuses grandes entreprises technologiques, DataArt adapte l'expertise et les programmes éducatifs à un public externe. Le 25 mai, une réunion ouverte de Machine Learning se tient à Voronezh, dont les participants découvriront les tendances des technologies de ML, les problèmes et les tâches qui peuvent être résolus avec leur aide, les projets de la vie réelle qui utilisent des méthodes d'apprentissage automatique et l'intelligence artificielle.

Source: https://habr.com/ru/post/fr452996/


All Articles