En collaboration avec Anna Perova
Présentation
Chaque jour, l'humanité crée, utilise et stocke de grandes quantités de données. Chaque article, blog ou article instagram, tous les éléments de communication similaires et en fait sont des données qui, une fois traitées, deviennent précieuses, font un profit et mettent en garde contre les risques de qui en est propriétaire et sait comment extraire les informations pertinentes.
Compte tenu des capacités croissantes d'analyse des données et de la prise de conscience de l'utilité des archives existantes, le besoin d'experts en science des données, en apprentissage automatique et en intelligence artificielle (IA) est également en mesure de travailler avec les données et de créer des modèles utiles à partir de celles-ci, ainsi que des systèmes de données autotraités et de les forcer. au travail.
Pourquoi ceux qui recrutent des équipes dans ce domaine doivent-ils penser à de nouvelles méthodes de recrutement?
Comme l'écrivait TechCrunch en 2015 , selon Mckinsey , qui, certes, n'était pas loin de la vérité, 490 000 spécialistes seront nécessaires dans ce domaine d'ici 2018.
Si vous vous fiez aux données de LinkedIn - sur 236 millions de profils, environ 11 400 à 19 400 sont des profils de Data Scientists.
Déjà , l' investissement annuel moyen d'Amazon dans le recrutement d'IA est de 227,8 millions de dollars , tandis que l' investissement des principaux concurrents de Google dans le recrutement d'IA est de 130,1 millions de dollars . Les spécialistes dans le domaine de l'intelligence artificielle des grandes entreprises reçoivent de 100 000 $ à 500 000 $ par an. Cela est démontré par une enquête menée par le New York Times, qui, en principe, est vérifiée périodiquement sur dice.com, monster.com ou LinkedIn.
Le quartier est nouveau et tendance. La quantité et la qualité des jeunes spécialistes ne satisfont pas non plus à la demande la plus élevée dans le monde entier et en Russie - ici, la situation ne diffère que par l'ordre des salaires et jusqu'à présent - par le nombre de postes vacants dans le domaine de la science des données et de l'IA.
Selon l'analyse de hh.ru, le nombre de postes vacants dans le domaine du Machine Learning, Deep Learning, Data Science: plus de 1000. Le nombre de spécialistes formés avec l'expérience nécessaire ne dépasse pas 300. Les candidats ayant au moins une expérience minimale dans ce domaine de l'IA, Data Science ne conviennent pas pour ces postes sont environ 3 000. Et cela en soi est un problème de recherche et d'embauche puisque:
- d'une part, il y a vraiment peu de spécialistes précieux;
- d'autre part, il y a beaucoup de candidats qui commencent tout juste leur chemin dans le domaine en question, dans la formation (en cas d'embauche) qu'ils devront investir.
Tout cela conduit à un marché du travail extrêmement surchauffé, et lors de l'embauche dans ce domaine, un certain nombre de facteurs doivent être pris en compte:
- concurrence la plus élevée pour les talents (salaires et conditions) - il y a plus de postes vacants que de candidats, mais les exigences pour les candidats sont élevées; statistiques approximatives: 10-15 offres d'emploi pour un candidat avec 3+ années d'expérience en Data Science & AI;
- les entreprises sont obligées d'être plus flexibles en termes de salaire, d'horaire, d'opportunités supplémentaires, en général, la préférence est aux horaires flexibles, à temps partiel, au besoin de liberté d'être créatif afin de trouver les meilleures approches et solutions;
- le candidat s'intéresse aux projets et aux tâches puisque Data Scientist - a souvent un certain type de personnalité: état d'esprit analytique, motivation pour le développement intellectuel et professionnel, soif de recherche, variété de tâches, curiosité et à la place, il y a un certain individualisme et rigueur dans la reconnaissance des résultats;
- l'entreprise a néanmoins besoin d'une équipe solide, capable de produire des résultats dans les délais, dans laquelle il y a quelqu'un à apprendre et avec qui créer des projets de recherche;
- des ressources et des capacités, un bon équipement, un GPU sont nécessaires.
En raison de la forte concurrence pour les talents dans ce domaine, un certain nombre de questions de sélection se posent, dont les principales sont:
- Où trouver des spécialistes de l'IA et de la science des données?
- Comment reconnaître Comment choisir le meilleur ou le plus prometteur (qui suivra rapidement et de manière rentable la formation) dans un petit cercle de candidats? Quels devraient être les critères de sélection d'un chasseur de têtes?
- Comment ne pas perdre? Comment retenir les professionnels de l'IA et de la science des données?
1. OĂą trouver?
En plus des sources standard et bien connues, je voudrais attirer l'attention sur les spécialistes les plus productifs en termes de mon expérience personnelle dans l'embauche de l'IA et de la science des données.
Slack, Open Data Science Channel. Cette ressource n'est pas destinée aux recruteurs et est principalement destinée à la communication entre ingénieurs et spécialistes du domaine de la Data Science.
Ce que vous devez faire: publiez votre annonce sur Slack dans la communauté Open Data Science. Il vaut mieux demander à vos collègues, spécialistes DS ou ingénieurs de données, de le faire, sans cacher le niveau des salaires et les opportunités de développement. Soulignez les caractéristiques des tâches et des projets attrayants, les technologies qui peuvent être utilisées.
Compétitions Kaggle.
Ce que vous devez faire: Sélectionnez le top - 50-100 dans les compétitions Kaggle. Les 20 premiers résolvent généralement des problèmes de plaisir, aiment travailler dans de grandes entreprises et ne recherchent pas d'emploi. Après les 20 premiers, vous pouvez sélectionner des candidats potentiels à fort potentiel en DataScience et AI, les contacter, proposer une rencontre et un projet. En cas de refus, il est possible de demander des recommandations en utilisant le programme de parrainage de votre entreprise (vous pouvez poser des questions détaillées sur la chasse avec Kaggle en PM, ou, si vous êtes intéressé, nous préparerons du matériel séparé).
- Indice H. Index Hirsch, mais plutôt une méthode d'évaluation / recherche de candidats, qui est préférable d'utiliser lors de la recherche d' experts en IA, ML / DL, Vision par ordinateur, Data Science. Ce critère permet d'évaluer lequel des scientifiques et des professeurs est le mieux cité et lequel est le pire et de trouver ceux qui se spécialisent dans le domaine professionnel souhaité et peuvent devenir un gourou des jeunes spécialistes. Ce que vous devez faire: recherchez des spécialistes de la science des données et de l'IA utilisant des données ouvertes sur l'indice Hirsch. Intéressez-vous aux sujets qui correspondent à vos besoins. Indice moyen pour les scientifiques de différents niveaux:
- jeune scientifique, étudiant diplômé - 0-2;
- Candidat en sciences - 3-6;
- Docteur en sciences - 7-10;
- Membre du Dissertation Council - 10-15;
- scientifique de renommée mondiale, président du Dissertation Council - 16 ans et plus.
Site utile pour rechercher des candidats par index de citation: eLIBRARY.ru.
Ce site contient des publications de scientifiques russes. Il y a plus de 24 millions d'articles publiés, la base de données est constamment mise à jour.
L'une des principales lacunes est de s'inscrire sur le site, puis de trouver un professeur avec un grand nombre de publications avec un haut niveau de citation, de trouver un moyen de le contacter et de demander des recommandations aux co-auteurs et aux étudiants. En option, ouvrez les publications et contactez les co-auteurs via des réseaux sociaux accessibles.
Lors de l'embauche de scientifiques, il est important de considérer qu'ils peuvent manquer de compétences pratiques et de compréhension de l'entreprise, mais leur carrière scientifique peut être utile pour le développement de projets à forte intensité scientifique, y compris dans le domaine de l'IA.
Organisez votre propre concours Data Science: hackathon, un concours de programmation. De tels événements sont organisés par AI Community, Open Data Science, etc. Vous pouvez essayer de l'organiser vous-même, mais la qualité risque d'en souffrir.
Un exemple de bonne compétition: le concours Sberbank .
- Commencez un cours de formation ML / Deep Learning gratuit - le format n'est pas important. L'essentiel est de décider du sujet et des tâches, en surveillant les spécialistes les plus appropriés en fonction des résultats de la résolution des "devoirs". Pour un bon entonnoir, invitez plus de 50 des plus prometteurs. En conséquence, il en restera environ 10 à 15 et vous n'en embaucherez pas plus de 5, mais cette méthode vous fera gagner beaucoup de temps et d'efforts.
- Le système de recommandations internes. Attribuez une prime de recommandation décente aux employés internes. Stimulez leurs recommandations.
- Développez votre réseau d'IA. La communauté de l'IA et de la science des données en Russie et dans le monde est encore très petite et communique activement lors de conférences, il est facile d'obtenir des recommandations de gourous et de conférenciers, il est souvent même possible de le faire gratuitement (OpenAITalks, Skolkovo Robotics, NIPS, ICLR etc.)
2. Comment sélectionner de très bons spécialistes en science des données et en IA
Il n’est pas facile pour les RH de comprendre tous les concepts à la fois, donc le plus important est de bien comprendre les principales rubriques pour au moins s’orienter. Et agissez conformément aux instructions (chapitre "LISTE FINALE, ou Principes de sélection du personnel") - c'est-à -dire équilibrer très clairement la complexité du travail et tester la motivation financière et non financière.
Donc, pour commencer, il est important de décider ce qui est maintenant compris comme un Data Scientist
Les scientifiques des données utilisent des données statistiques, l'apprentissage automatique et des approches analytiques pour résoudre des problèmes commerciaux critiques. Leur fonction principale est d'aider les organisations à transformer leurs volumes de Big Data en modèles précieux et exploitables.
Ils doivent avoir une bonne connaissance des mathématiques, programmer, développer des algorithmes d'apprentissage automatique pour automatiser les algorithmes. Ils sont également censés avoir une grande capacité à interpréter les données, la capacité de les visualiser est importante, les compétences en résolution de problèmes sont importantes, même si les problèmes ne sont pas formulés à la fin.
Il est important qu'ils puissent travailler avec différents types de données et des données de différents niveaux de préparation.
Une bonne formation en mathématiques (connaissance de l'algèbre linéaire, de la géométrie analytique, de la théorie des probabilités et des statistiques mathématiques) est indispensable. Et cela est encore plus important pour l'analyse des données que les connaissances en ingénierie. La formation des modèles ML nécessite de comprendre exactement quels modèles utiliser, comment interpréter et comment améliorer les résultats.
Connaissance des langages de programmation : Python ou R (mais naviguez dans la pile technologique que vous utilisez); C / C ++; Java
Compétences : Scala, Apache Spark, Hadoop, machine learning, deep learning et statistiques.
De plus : Tensorflow, PyTorch, Keras, Caffe, Pandas etc., Jupyter et RStudio., Expérience avec des systèmes très chargés, Cuda.
La différence entre Data Scientists et Data Engineer est la capacité non seulement d'analyser les données, mais aussi de les intégrer dans les systèmes existants. À cet égard, une connaissance approfondie des langages de programmation, ainsi que l'expérience de la création ou de la participation à la création de systèmes multithread hautement chargés, etc., sont particulièrement importantes.
Les concepts clés qu'un recruteur doit connaître sont le Machine Learning, le Deep Learning, la Data Science, le Data Mining, le Big Data, la Vision par Ordinateur, le Traitement d'Image, la reconnaissance de voiture, la reconnaissance faciale, les systèmes de Recommandation, le Traitement du Langage Naturel, les concours de kaggle.
Filtrage des candidats sur la base d'un entretien RH téléphonique:
- Il est important de comprendre la profondeur des connaissances du candidat en mathématiques (algèbre linéaire, théorie des probabilités)
- Quels cadres utilise-t-il? Une expérience variée est la bienvenue.
- Quels sont les projets les plus complexes que les projets ont dû créer? Quels ont été le rôle et le résultat personnels?
- À quelles compétitions a-t-il participé?
- Y a-t-il des articles dans des revues scientifiques et ici sur habr.com?
Algorithme de recrutement et de sélection:
- L'entretien technique se compose de 3 parties:
- Test en ligne pendant 20 minutes. Un exemple de site pour publier un test en ligne. ;
- Test - 1 heure. Entretien technique au bureau. Tâche de test 20 min-1 heure. Vous pouvez créer un test de 10 à 15 tâches (tâches en théorie des probabilités, statistiques mathématiques, vision par ordinateur, apprentissage automatique). Le test est effectué par le candidat seul dans la salle de réunion. Il n'a pas à résoudre tous les problèmes, mais il est important d'en résoudre au moins 50%. Lors des tests, il est utile de fixer des points pour une évaluation objective et la capacité de comparer les candidats;
- La partie orale de l'entretien technique dure 1 heure (discussion des résultats de problèmes en théorie des probabilités, statistiques mathématiques et analyse de la façon dont le candidat aborde la résolution de problèmes en vision par ordinateur, apprentissage automatique).
Il faut comprendre que les conditions de travail et autres «goodies» sont connus du candidat et honnêtement exprimés à l'avance, sinon la motivation ne sera pas uniquement pour tout le monde .
- Entretien RH & personnalité avec Timlider
Les traits de personnalité nécessaires à un DataScientist sont:
- Capacité d'apprentissage élevée Il doit être intelligent, acquérir rapidement de nouvelles compétences, être préparé et se développer constamment dans son domaine et de préférence dans le domaine de l'entreprise.
- Curiosité, intérêt pour les nouvelles technologies, expérience pratique de leur utilisation, intérêt pour les domaines connexes.
- Persévérance et persévérance - la capacité de travailler sur un problème pendant longtemps
- Créativité - intérêt pour de nouvelles opportunités, motivation et capacité à trouver de nouvelles solutions.
Comment retenir les spécialistes de l'IA et de la science des données dans une entreprise:
Ici, les outils de rétention standard ont leurs propres caractéristiques.
- La capacité de travailler avec un gourou, un expert du marché de l'IA en Russie ou dans d'autres pays, la capacité de rédiger un doctorat, de faire des recherches conjointes;
- Une équipe de professionnels forts, auprès desquels il est possible d'apprendre et avec qui il est intéressant de créer des projets d'IA (Top 10 des universités, employés de grandes entreprises des leaders du marché de l'IA en Russie);
- La possibilité d'écrire un article. Faire de la recherche et des publications pour des conférences internationales (NIPS, ICLR etc.);
- Assistance pour l'obtention d'un diplĂ´me scientifique, y compris international;
- Accès aux sources primaires.
Et des valeurs universelles:
- Tâches intéressantes, capacité de faire des publications;
- Salaire élevé, sa croissance régulière conformément au niveau du marché;
- Le respect Y compris la confiance dans l'expertise, la reconnaissance des réalisations dans l'entreprise et la communauté scientifique (bonus, bonus pour l'obtention de résultats);
- Bon équipement, accès aux données;
- Informations sur les changements - les employés doivent être conscients des plans futurs de l'entreprise. Même dans une grande entreprise, il est important de veiller à ne pas les garder dans le noir;
- Prendre soin des employés - des sondages réguliers avec la possibilité de recevoir des réponses honnêtes. Comment améliorer la vie des employés, les aider à être plus efficaces (fruits au bureau, instruments de musique, salle de détente, félicitations non seulement pour votre anniversaire, mais aussi pour d'autres vacances, etc.).
En conclusion, il convient de noter qu'il est important de savoir que la différence entre ces postes vacants et les autres - les méthodes de recrutement précédentes pour ces candidats ne fonctionnent pas aussi efficacement. Il est important de trouver un équilibre entre l'extrême pénurie de spécialistes, la volonté d'être plus flexible dans les conditions et la nécessité de filtrer et de sélectionner des professionnels solides qui peuvent apporter une contribution positive aux changements commerciaux.