Comment trouver rapidement et ne pas perdre des spécialistes de l'IA et de la science des données

En collaboration avec Anna Perova


Présentation


Chaque jour, l'humanité crée, utilise et stocke de grandes quantités de données. Chaque article, blog ou article instagram, tous les éléments de communication similaires et en fait sont des données qui, une fois traitées, deviennent précieuses, font un profit et mettent en garde contre les risques de qui en est propriétaire et sait comment extraire les informations pertinentes.


Compte tenu des capacités croissantes d'analyse des données et de la prise de conscience de l'utilité des archives existantes, le besoin d'experts en science des données, en apprentissage automatique et en intelligence artificielle (IA) est également en mesure de travailler avec les données et de créer des modèles utiles à partir de celles-ci, ainsi que des systèmes de données autotraités et de les forcer. au travail.


Pourquoi ceux qui recrutent des équipes dans ce domaine doivent-ils penser à de nouvelles méthodes de recrutement?


Comme l'écrivait TechCrunch en 2015 , selon Mckinsey , qui, certes, n'était pas loin de la vérité, 490 000 spécialistes seront nécessaires dans ce domaine d'ici 2018.


Si vous vous fiez aux données de LinkedIn - sur 236 millions de profils, environ 11 400 à 19 400 sont des profils de Data Scientists.


Déjà, l' investissement annuel moyen d'Amazon dans le recrutement d'IA est de 227,8 millions de dollars , tandis que l' investissement des principaux concurrents de Google dans le recrutement d'IA est de 130,1 millions de dollars . Les spécialistes dans le domaine de l'intelligence artificielle des grandes entreprises reçoivent de 100 000 $ à 500 000 $ par an. Cela est démontré par une enquête menée par le New York Times, qui, en principe, est vérifiée périodiquement sur dice.com, monster.com ou LinkedIn.


Le quartier est nouveau et tendance. La quantité et la qualité des jeunes spécialistes ne satisfont pas non plus à la demande la plus élevée dans le monde entier et en Russie - ici, la situation ne diffère que par l'ordre des salaires et jusqu'à présent - par le nombre de postes vacants dans le domaine de la science des données et de l'IA.


Selon l'analyse de hh.ru, le nombre de postes vacants dans le domaine du Machine Learning, Deep Learning, Data Science: plus de 1000. Le nombre de spécialistes formés avec l'expérience nécessaire ne dépasse pas 300. Les candidats ayant au moins une expérience minimale dans ce domaine de l'IA, Data Science ne conviennent pas pour ces postes sont environ 3 000. Et cela en soi est un problème de recherche et d'embauche puisque:


  • d'une part, il y a vraiment peu de spĂ©cialistes prĂ©cieux;
  • d'autre part, il y a beaucoup de candidats qui commencent tout juste leur chemin dans le domaine en question, dans la formation (en cas d'embauche) qu'ils devront investir.

Tout cela conduit à un marché du travail extrêmement surchauffé, et lors de l'embauche dans ce domaine, un certain nombre de facteurs doivent être pris en compte:


  • concurrence la plus Ă©levĂ©e pour les talents (salaires et conditions) - il y a plus de postes vacants que de candidats, mais les exigences pour les candidats sont Ă©levĂ©es; statistiques approximatives: 10-15 offres d'emploi pour un candidat avec 3+ annĂ©es d'expĂ©rience en Data Science & AI;
  • les entreprises sont obligĂ©es d'ĂŞtre plus flexibles en termes de salaire, d'horaire, d'opportunitĂ©s supplĂ©mentaires, en gĂ©nĂ©ral, la prĂ©fĂ©rence est aux horaires flexibles, Ă  temps partiel, au besoin de libertĂ© d'ĂŞtre crĂ©atif afin de trouver les meilleures approches et solutions;
  • le candidat s'intĂ©resse aux projets et aux tâches puisque Data Scientist - a souvent un certain type de personnalitĂ©: Ă©tat d'esprit analytique, motivation pour le dĂ©veloppement intellectuel et professionnel, soif de recherche, variĂ©tĂ© de tâches, curiositĂ© et Ă  la place, il y a un certain individualisme et rigueur dans la reconnaissance des rĂ©sultats;
  • l'entreprise a nĂ©anmoins besoin d'une Ă©quipe solide, capable de produire des rĂ©sultats dans les dĂ©lais, dans laquelle il y a quelqu'un Ă  apprendre et avec qui crĂ©er des projets de recherche;
  • des ressources et des capacitĂ©s, un bon Ă©quipement, un GPU sont nĂ©cessaires.

En raison de la forte concurrence pour les talents dans ce domaine, un certain nombre de questions de sélection se posent, dont les principales sont:


  • OĂą trouver des spĂ©cialistes de l'IA et de la science des donnĂ©es?
  • Comment reconnaĂ®tre Comment choisir le meilleur ou le plus prometteur (qui suivra rapidement et de manière rentable la formation) dans un petit cercle de candidats? Quels devraient ĂŞtre les critères de sĂ©lection d'un chasseur de tĂŞtes?
  • Comment ne pas perdre? Comment retenir les professionnels de l'IA et de la science des donnĂ©es?

1. OĂą trouver?


En plus des sources standard et bien connues, je voudrais attirer l'attention sur les spécialistes les plus productifs en termes de mon expérience personnelle dans l'embauche de l'IA et de la science des données.


  • Slack, Open Data Science Channel. Cette ressource n'est pas destinĂ©e aux recruteurs et est principalement destinĂ©e Ă  la communication entre ingĂ©nieurs et spĂ©cialistes du domaine de la Data Science.
    Ce que vous devez faire: publiez votre annonce sur Slack dans la communauté Open Data Science. Il vaut mieux demander à vos collègues, spécialistes DS ou ingénieurs de données, de le faire, sans cacher le niveau des salaires et les opportunités de développement. Soulignez les caractéristiques des tâches et des projets attrayants, les technologies qui peuvent être utilisées.


  • CompĂ©titions Kaggle.
    Ce que vous devez faire: Sélectionnez le top - 50-100 dans les compétitions Kaggle. Les 20 premiers résolvent généralement des problèmes de plaisir, aiment travailler dans de grandes entreprises et ne recherchent pas d'emploi. Après les 20 premiers, vous pouvez sélectionner des candidats potentiels à fort potentiel en DataScience et AI, les contacter, proposer une rencontre et un projet. En cas de refus, il est possible de demander des recommandations en utilisant le programme de parrainage de votre entreprise (vous pouvez poser des questions détaillées sur la chasse avec Kaggle en PM, ou, si vous êtes intéressé, nous préparerons du matériel séparé).


  • Indice H. Index Hirsch, mais plutĂ´t une mĂ©thode d'Ă©valuation / recherche de candidats, qui est prĂ©fĂ©rable d'utiliser lors de la recherche d' experts en IA, ML / DL, Vision par ordinateur, Data Science. Ce critère permet d'Ă©valuer lequel des scientifiques et des professeurs est le mieux citĂ© et lequel est le pire et de trouver ceux qui se spĂ©cialisent dans le domaine professionnel souhaitĂ© et peuvent devenir un gourou des jeunes spĂ©cialistes. Ce que vous devez faire: recherchez des spĂ©cialistes de la science des donnĂ©es et de l'IA utilisant des donnĂ©es ouvertes sur l'indice Hirsch. IntĂ©ressez-vous aux sujets qui correspondent Ă  vos besoins. Indice moyen pour les scientifiques de diffĂ©rents niveaux:
    1. jeune scientifique, étudiant diplômé - 0-2;
    2. Candidat en sciences - 3-6;
    3. Docteur en sciences - 7-10;
    4. Membre du Dissertation Council - 10-15;
    5. scientifique de renommée mondiale, président du Dissertation Council - 16 ans et plus.

Site utile pour rechercher des candidats par index de citation: eLIBRARY.ru.
Ce site contient des publications de scientifiques russes. Il y a plus de 24 millions d'articles publiés, la base de données est constamment mise à jour.
L'une des principales lacunes est de s'inscrire sur le site, puis de trouver un professeur avec un grand nombre de publications avec un haut niveau de citation, de trouver un moyen de le contacter et de demander des recommandations aux co-auteurs et aux étudiants. En option, ouvrez les publications et contactez les co-auteurs via des réseaux sociaux accessibles.
Lors de l'embauche de scientifiques, il est important de considérer qu'ils peuvent manquer de compétences pratiques et de compréhension de l'entreprise, mais leur carrière scientifique peut être utile pour le développement de projets à forte intensité scientifique, y compris dans le domaine de l'IA.


  • Organisez votre propre concours Data Science: hackathon, un concours de programmation. De tels Ă©vĂ©nements sont organisĂ©s par AI Community, Open Data Science, etc. Vous pouvez essayer de l'organiser vous-mĂŞme, mais la qualitĂ© risque d'en souffrir.
    Un exemple de bonne compétition: le concours Sberbank .


  • Commencez un cours de formation ML / Deep Learning gratuit - le format n'est pas important. L'essentiel est de dĂ©cider du sujet et des tâches, en surveillant les spĂ©cialistes les plus appropriĂ©s en fonction des rĂ©sultats de la rĂ©solution des "devoirs". Pour un bon entonnoir, invitez plus de 50 des plus prometteurs. En consĂ©quence, il en restera environ 10 Ă  15 et vous n'en embaucherez pas plus de 5, mais cette mĂ©thode vous fera gagner beaucoup de temps et d'efforts.
  • Le système de recommandations internes. Attribuez une prime de recommandation dĂ©cente aux employĂ©s internes. Stimulez leurs recommandations.
  • DĂ©veloppez votre rĂ©seau d'IA. La communautĂ© de l'IA et de la science des donnĂ©es en Russie et dans le monde est encore très petite et communique activement lors de confĂ©rences, il est facile d'obtenir des recommandations de gourous et de confĂ©renciers, il est souvent mĂŞme possible de le faire gratuitement (OpenAITalks, Skolkovo Robotics, NIPS, ICLR etc.)

2. Comment sélectionner de très bons spécialistes en science des données et en IA


Il n’est pas facile pour les RH de comprendre tous les concepts à la fois, donc le plus important est de bien comprendre les principales rubriques pour au moins s’orienter. Et agissez conformément aux instructions (chapitre "LISTE FINALE, ou Principes de sélection du personnel") - c'est-à-dire équilibrer très clairement la complexité du travail et tester la motivation financière et non financière.


Donc, pour commencer, il est important de décider ce qui est maintenant compris comme un Data Scientist


Les scientifiques des données utilisent des données statistiques, l'apprentissage automatique et des approches analytiques pour résoudre des problèmes commerciaux critiques. Leur fonction principale est d'aider les organisations à transformer leurs volumes de Big Data en modèles précieux et exploitables.


Ils doivent avoir une bonne connaissance des mathématiques, programmer, développer des algorithmes d'apprentissage automatique pour automatiser les algorithmes. Ils sont également censés avoir une grande capacité à interpréter les données, la capacité de les visualiser est importante, les compétences en résolution de problèmes sont importantes, même si les problèmes ne sont pas formulés à la fin.


Il est important qu'ils puissent travailler avec différents types de données et des données de différents niveaux de préparation.


Une bonne formation en mathématiques (connaissance de l'algèbre linéaire, de la géométrie analytique, de la théorie des probabilités et des statistiques mathématiques) est indispensable. Et cela est encore plus important pour l'analyse des données que les connaissances en ingénierie. La formation des modèles ML nécessite de comprendre exactement quels modèles utiliser, comment interpréter et comment améliorer les résultats.


Connaissance des langages de programmation : Python ou R (mais naviguez dans la pile technologique que vous utilisez); C / C ++; Java
Compétences : Scala, Apache Spark, Hadoop, machine learning, deep learning et statistiques.
De plus : Tensorflow, PyTorch, Keras, Caffe, Pandas etc., Jupyter et RStudio., Expérience avec des systèmes très chargés, Cuda.


La différence entre Data Scientists et Data Engineer est la capacité non seulement d'analyser les données, mais aussi de les intégrer dans les systèmes existants. À cet égard, une connaissance approfondie des langages de programmation, ainsi que l'expérience de la création ou de la participation à la création de systèmes multithread hautement chargés, etc., sont particulièrement importantes.


Les concepts clés qu'un recruteur doit connaître sont le Machine Learning, le Deep Learning, la Data Science, le Data Mining, le Big Data, la Vision par Ordinateur, le Traitement d'Image, la reconnaissance de voiture, la reconnaissance faciale, les systèmes de Recommandation, le Traitement du Langage Naturel, les concours de kaggle.


Filtrage des candidats sur la base d'un entretien RH téléphonique:


  1. Il est important de comprendre la profondeur des connaissances du candidat en mathématiques (algèbre linéaire, théorie des probabilités)
  2. Quels cadres utilise-t-il? Une expérience variée est la bienvenue.
  3. Quels sont les projets les plus complexes que les projets ont dû créer? Quels ont été le rôle et le résultat personnels?
  4. À quelles compétitions a-t-il participé?
  5. Y a-t-il des articles dans des revues scientifiques et ici sur habr.com?

Algorithme de recrutement et de sélection:


  1. L'entretien technique se compose de 3 parties:
    • Test en ligne pendant 20 minutes. Un exemple de site pour publier un test en ligne. ;
    • Test - 1 heure. Entretien technique au bureau. Tâche de test 20 min-1 heure. Vous pouvez crĂ©er un test de 10 Ă  15 tâches (tâches en thĂ©orie des probabilitĂ©s, statistiques mathĂ©matiques, vision par ordinateur, apprentissage automatique). Le test est effectuĂ© par le candidat seul dans la salle de rĂ©union. Il n'a pas Ă  rĂ©soudre tous les problèmes, mais il est important d'en rĂ©soudre au moins 50%. Lors des tests, il est utile de fixer des points pour une Ă©valuation objective et la capacitĂ© de comparer les candidats;
    • La partie orale de l'entretien technique dure 1 heure (discussion des rĂ©sultats de problèmes en thĂ©orie des probabilitĂ©s, statistiques mathĂ©matiques et analyse de la façon dont le candidat aborde la rĂ©solution de problèmes en vision par ordinateur, apprentissage automatique).

Il faut comprendre que les conditions de travail et autres «goodies» sont connus du candidat et honnêtement exprimés à l'avance, sinon la motivation ne sera pas uniquement pour tout le monde .


  1. Entretien RH & personnalité avec Timlider
    Les traits de personnalité nécessaires à un DataScientist sont:
    • CapacitĂ© d'apprentissage Ă©levĂ©e Il doit ĂŞtre intelligent, acquĂ©rir rapidement de nouvelles compĂ©tences, ĂŞtre prĂ©parĂ© et se dĂ©velopper constamment dans son domaine et de prĂ©fĂ©rence dans le domaine de l'entreprise.
    • CuriositĂ©, intĂ©rĂŞt pour les nouvelles technologies, expĂ©rience pratique de leur utilisation, intĂ©rĂŞt pour les domaines connexes.
    • PersĂ©vĂ©rance et persĂ©vĂ©rance - la capacitĂ© de travailler sur un problème pendant longtemps
    • CrĂ©ativitĂ© - intĂ©rĂŞt pour de nouvelles opportunitĂ©s, motivation et capacitĂ© Ă  trouver de nouvelles solutions.

Comment retenir les spécialistes de l'IA et de la science des données dans une entreprise:


Ici, les outils de rétention standard ont leurs propres caractéristiques.


  • La capacitĂ© de travailler avec un gourou, un expert du marchĂ© de l'IA en Russie ou dans d'autres pays, la capacitĂ© de rĂ©diger un doctorat, de faire des recherches conjointes;
  • Une Ă©quipe de professionnels forts, auprès desquels il est possible d'apprendre et avec qui il est intĂ©ressant de crĂ©er des projets d'IA (Top 10 des universitĂ©s, employĂ©s de grandes entreprises des leaders du marchĂ© de l'IA en Russie);
  • La possibilitĂ© d'Ă©crire un article. Faire de la recherche et des publications pour des confĂ©rences internationales (NIPS, ICLR etc.);
  • Assistance pour l'obtention d'un diplĂ´me scientifique, y compris international;
  • Accès aux sources primaires.

Et des valeurs universelles:


  • Tâches intĂ©ressantes, capacitĂ© de faire des publications;
  • Salaire Ă©levĂ©, sa croissance rĂ©gulière conformĂ©ment au niveau du marchĂ©;
  • Le respect Y compris la confiance dans l'expertise, la reconnaissance des rĂ©alisations dans l'entreprise et la communautĂ© scientifique (bonus, bonus pour l'obtention de rĂ©sultats);
  • Bon Ă©quipement, accès aux donnĂ©es;
  • Informations sur les changements - les employĂ©s doivent ĂŞtre conscients des plans futurs de l'entreprise. MĂŞme dans une grande entreprise, il est important de veiller Ă  ne pas les garder dans le noir;
  • Prendre soin des employĂ©s - des sondages rĂ©guliers avec la possibilitĂ© de recevoir des rĂ©ponses honnĂŞtes. Comment amĂ©liorer la vie des employĂ©s, les aider Ă  ĂŞtre plus efficaces (fruits au bureau, instruments de musique, salle de dĂ©tente, fĂ©licitations non seulement pour votre anniversaire, mais aussi pour d'autres vacances, etc.).

En conclusion, il convient de noter qu'il est important de savoir que la différence entre ces postes vacants et les autres - les méthodes de recrutement précédentes pour ces candidats ne fonctionnent pas aussi efficacement. Il est important de trouver un équilibre entre l'extrême pénurie de spécialistes, la volonté d'être plus flexible dans les conditions et la nécessité de filtrer et de sélectionner des professionnels solides qui peuvent apporter une contribution positive aux changements commerciaux.

Source: https://habr.com/ru/post/fr412625/


All Articles