In Zusammenarbeit mit Anna Perova
Einführung
Jeden Tag erstellt, nutzt und speichert die Menschheit riesige Datenmengen. Jeder Artikel, Blog oder Instagram-Beitrag, jedes Like und jede Tatsache der Kommunikation sind Daten, die bei ihrer Verarbeitung wertvoll werden, Gewinn bringen und vor den Risiken warnen, wem sie gehören und wie sie relevante Informationen extrahieren können.
Mit den wachsenden Möglichkeiten der Datenanalyse und dem Bewusstsein für die Nützlichkeit bestehender Archive ist der Bedarf an Experten für Datenwissenschaft, maschinelles Lernen und künstliche Intelligenz (KI) auch in der Lage, mit Daten zu arbeiten und darauf basierende nützliche Modelle zu erstellen sowie Datensysteme selbst zu verarbeiten und zu erzwingen arbeiten.
Warum müssen diejenigen, die Teams in diesem Bereich rekrutieren, über neue Rekrutierungsmethoden nachdenken?
Wie TechCrunch bereits 2015 schrieb , werden laut Mckinsey , der zugegebenermaßen nicht weit von der Wahrheit entfernt war, bis 2018 490.000 Spezialisten in diesem Bereich benötigt.
Wenn Sie sich auf LinkedIn- Daten verlassen - von 236 Millionen Profilen sind etwa 11.400 bis 19.400 Profile von Data Scientists.
Die durchschnittliche jährliche Investition von Amazon in AI Hiring beträgt bereits 227,8 Millionen US-Dollar , während die Hauptinvestition von Google in AI Hiring 130,1 Millionen US-Dollar beträgt . Spezialisten auf dem Gebiet der künstlichen Intelligenz führender Unternehmen erhalten zwischen 100.000 und 500.000 US-Dollar pro Jahr. Dies geht aus einer Umfrage der New York Times hervor, die im Prinzip regelmäßig von dice.com, monster.com oder LinkedIn überprüft wird.
Das Gebiet ist neu und im Trend. Die Quantität und Qualität junger Fachkräfte befriedigt nicht die höchste Nachfrage nach ihnen sowohl auf der ganzen Welt als auch in Russland - hier unterscheidet sich die Situation nur in der Reihenfolge der Gehälter und bisher in der Anzahl der offenen Stellen im Bereich Data Science & AI.
Nach der Analyse von hh.ru beträgt die Anzahl der offenen Stellen im Bereich Maschinelles Lernen, Deep Learning, Data Science mehr als 1000. Die Anzahl der ausgebildeten Fachkräfte mit der erforderlichen Erfahrung beträgt nicht mehr als 300. Kandidaten mit mindestens minimaler Erfahrung in diesem Bereich der KI, Data Science sind nicht geeignet Diese Positionen sind ungefähr dreitausend. Und dies an sich ist ein Problem für die Suche und Einstellung seit:
- Einerseits gibt es wirklich wenige wertvolle Spezialisten;
- Auf der anderen Seite gibt es viele Kandidaten, die gerade erst ihren Weg in das betreffende Gebiet finden und in deren Ausbildung (im Falle einer Einstellung) sie investieren müssen.
All dies führt zu einem extrem überhitzten Arbeitsmarkt, und bei der Einstellung in diesem Bereich müssen eine Reihe von Faktoren berücksichtigt werden:
- höchster Wettbewerb um Talente (Gehälter und Bedingungen) - es gibt mehr offene Stellen als Kandidaten, aber die Anforderungen an Kandidaten sind hoch; ungefähre Statistik: 10-15 Stellenangebote für einen Kandidaten mit mehr als 3 Jahren Erfahrung in Data Science & AI;
- Unternehmen sind gezwungen, flexibler in Bezug auf Gehalt, Zeitplan und zusätzliche Möglichkeiten zu sein. Im Allgemeinen werden flexible Arbeitszeiten, Teilzeit und die Notwendigkeit der Freiheit, kreativ zu sein, bevorzugt, um die besten Ansätze und Lösungen zu finden.
- Der Kandidat interessiert sich seitdem für Projekte und Aufgaben Data Scientist - hat oft einen bestimmten Persönlichkeitstyp: analytische Denkweise, Motivation für intellektuelle und berufliche Entwicklung, Verlangen nach Forschung, eine Vielzahl von Aufgaben, Neugierde und an der Stelle gibt es einen gewissen Individualismus und Genauigkeit bei der Erkennung der Ergebnisse;
- Das Unternehmen braucht dennoch ein starkes Team, das in der Lage ist, pünktlich Ergebnisse zu liefern, in dem es jemanden gibt, von dem man lernen kann und mit dem man Forschungsprojekte erstellt.
- Ressourcen und Kapazitäten, gute Ausrüstung, GPU werden benötigt.
Aufgrund des starken Wettbewerbs um Talente in diesem Bereich stellen sich eine Reihe von Auswahlfragen, von denen die folgenden folgende sind:
- Wo finden Sie AI & Data Science-Spezialisten?
- Wie man erkennt Wie kann man aus einem kleinen Kreis von Kandidaten die besten oder vielversprechendsten auswählen (die schnell und profitabel trainieren werden)? Was sollten die Auswahlkriterien für einen Headhunter sein?
- Wie nicht zu verlieren? Wie kann man AI & Data Science-Experten binden?
1. Wo zu finden?
Neben Standard- und bekannten Quellen möchte ich auf die produktivsten Spezialisten hinsichtlich meiner persönlichen Erfahrung bei der Einstellung von AI & Data Science aufmerksam machen.
Lockerer, offener Data Science Channel. Diese Ressource ist nicht für Personalvermittler gedacht und dient hauptsächlich der Kommunikation zwischen Ingenieuren und Spezialisten auf dem Gebiet der Datenwissenschaft.
Was Sie tun müssen: Veröffentlichen Sie Ihre Anzeige auf Slack in der Open Data Science-Community. Bitten Sie besser Ihre Kollegen, DS-Spezialisten oder Dateningenieure, dies zu tun, ohne die Höhe der Gehälter und Entwicklungsmöglichkeiten zu verbergen. Betonen Sie die Merkmale attraktiver Aufgaben und Projekte, Technologien, die verwendet werden können.
Kaggle-Wettbewerbe.
Was Sie tun müssen: Wählen Sie die Top - 50-100 in Kaggle-Wettbewerben. Die ersten 20 lösen normalerweise Probleme zum Vergnügen, arbeiten gerne in großen Unternehmen und suchen nicht nach Jobs. Nach den ersten 20 können Sie potenzielle Kandidaten mit hohem Potenzial in DataScience und AI auswählen, sie kontaktieren, ein Meeting und ein Projekt anbieten. Im Falle einer Ablehnung können Sie Empfehlungen über das Empfehlungsprogramm Ihres Unternehmens anfordern (Sie können detaillierte Fragen zur Jagd mit Kaggle in PM stellen oder, wenn Sie interessiert sind, separates Material vorbereiten).
- H-Index. Hirsch-Index, sondern eine Methode zur Bewertung / Suche von Kandidaten, die besser bei der Suche nach Experten für KI, ML / DL, Computer Vision und Data Science zu verwenden ist. Dieses Kriterium ermöglicht es, zu bewerten, welcher der Wissenschaftler und Professoren besser und welcher schlechter zitiert wird, und diejenigen zu finden, die sich auf das gewünschte Berufsfeld spezialisiert haben und ein Guru für junge Spezialisten werden können. Was Sie tun müssen: Suchen Sie nach Data Science- und AI-Spezialisten, die offene Daten im Hirsch-Index verwenden. Interessieren Sie sich für Themen, die Ihren Anforderungen entsprechen. Durchschnittlicher Index für Wissenschaftler verschiedener Niveaus:
- junger Wissenschaftler, Doktorand - 0-2;
- Kandidat der Wissenschaft - 3-6;
- Doktor der Wissenschaften - 7-10;
- Mitglied des Dissertationsrates - 10-15;
- weltberühmter Wissenschaftler, Vorsitzender des Dissertationsrates - 16 Jahre und älter.
Nützliche Seite für die Suche nach Kandidaten nach Zitierindex: eLIBRARY.ru.
Diese Seite enthält Veröffentlichungen russischer Wissenschaftler. Es wurden mehr als 24 Millionen Artikel veröffentlicht, die Datenbank wird ständig aktualisiert.
Eine der Hauptlücken besteht darin, sich auf der Website zu registrieren, dann einen Professor mit einer großen Anzahl von Veröffentlichungen mit einem hohen Zitiergrad zu finden, einen Weg zu finden, ihn zu kontaktieren und Empfehlungen von Mitautoren und Studenten einzuholen. Öffnen Sie optional Veröffentlichungen und kontaktieren Sie Co-Autoren über zugängliche soziale Netzwerke.
Bei der Einstellung von Wissenschaftlern ist es wichtig zu berücksichtigen, dass ihnen möglicherweise praktische Fähigkeiten und ein Verständnis für das Geschäft fehlen, ihre wissenschaftliche Karriere jedoch für die Entwicklung wissenschaftsintensiver Projekte, auch im Bereich der KI, nützlich sein kann.
Organisieren Sie Ihren eigenen Data Science-Wettbewerb: Hackathon, einen Programmierwettbewerb. Solche Veranstaltungen werden von AI Community, Open Data Science usw. durchgeführt. Sie können versuchen, sie selbst zu organisieren, aber die Qualität wird wahrscheinlich darunter leiden.
Ein Beispiel für einen guten Wettbewerb: Sberbank Contest .
- Starten Sie einen kostenlosen ML / Deep Learning-Schulungskurs - das Format ist nicht wichtig. Die Hauptsache ist, über das Thema und die Aufgaben zu entscheiden und die am besten geeigneten Spezialisten anhand der Ergebnisse der Lösung von "Hausaufgaben" zu überwachen. Laden Sie für einen guten Trichter über 50 der vielversprechendsten ein. Infolgedessen bleiben etwa 10 bis 15 übrig, und Sie stellen nicht mehr als 5 ein. Diese Methode spart jedoch viel Zeit und Mühe.
- Das System der internen Empfehlungen. Weisen Sie internen Mitarbeitern einen angemessenen Empfehlungsbonus zu. Stimulieren Sie ihre Empfehlungen.
- Entwickeln Sie Ihr KI-Netzwerk. Die KI- und Data Science-Community in Russland und der Welt ist immer noch sehr klein und kommuniziert aktiv auf Konferenzen. Es ist einfach, Empfehlungen von Gurus und Rednern zu erhalten. Oft ist es sogar möglich, dies kostenlos zu tun (OpenAITalks, Skolkovo Robotics, NIPS, ICLR usw.).
2. Wie man wirklich gute Data Science & AI-Spezialisten auswählt
Für die Personalabteilung ist es nicht einfach, alle Konzepte auf einmal zu verstehen. Das Wichtigste ist daher, die Hauptüberschriften gut zu verstehen, um sich zumindest irgendwie zu orientieren. Und handeln Sie gemäß den Anweisungen (Kapitel "SCHLUSSLISTE oder Grundsätze der Personalauswahl") - d. H. Die Komplexität der Arbeit sehr klar ausbalancieren und die finanzielle und nicht finanzielle Motivation testen.
Für den Anfang ist es daher wichtig zu entscheiden, was jetzt als Data Scientist verstanden wird
Datenwissenschaftler verwenden statistische Daten, maschinelles Lernen und analytische Ansätze zur Lösung kritischer Geschäftsprobleme. Ihre Hauptfunktion besteht darin, Unternehmen dabei zu helfen, ihr Big-Data-Volumen in wertvolle und umsetzbare Modelle umzuwandeln.
Sie sollten über gute Kenntnisse in Mathematik verfügen, programmieren und Algorithmen für maschinelles Lernen entwickeln, um Algorithmen zu automatisieren. Von ihnen wird auch eine hohe Fähigkeit zur Interpretation von Daten erwartet, die Fähigkeit zur Visualisierung ist wichtig, Fähigkeiten zur Problemlösung sind wichtig, auch wenn die Probleme nicht bis zum Ende formuliert sind.
Es ist wichtig, dass sie mit verschiedenen Datentypen und Daten mit unterschiedlichen Bereitschaftsgraden arbeiten können.
Ein guter mathematischer Hintergrund (Kenntnisse der linearen Algebra, der analytischen Geometrie, der Wahrscheinlichkeitstheorie und der mathematischen Statistik) ist ein Muss. Und das ist für die Datenanalyse noch wichtiger als technisches Wissen. Das Training von ML-Modellen erfordert ein genaues Verständnis der zu verwendenden Modelle, der Interpretation und der Verbesserung der Ergebnisse.
Kenntnisse in Programmiersprachen : Python oder R (aber navigieren Sie durch den von Ihnen verwendeten Technologie-Stack); C / C ++; Java
Fähigkeiten : Scala, Apache Spark, Hadoop, maschinelles Lernen, tiefes Lernen und Statistik.
Zusätzlich : Tensorflow, PyTorch, Keras, Caffe, Pandas usw., Jupyter und RStudio., Erfahrung mit hoch belasteten Systemen, Cuda.
Der Unterschied zwischen Data Scientists und Data Engineer besteht in der Fähigkeit, Daten nicht nur zu analysieren, sondern auch in vorhandene Systeme zu integrieren. In diesem Zusammenhang sind besondere Kenntnisse der Programmiersprachen sowie die Erfahrung mit der Erstellung oder Teilnahme an der Erstellung hoch geladener Multithread-Systeme usw. besonders wichtig.
Schlüsselkonzepte, mit denen ein Personalvermittler vertraut sein sollte, sind maschinelles Lernen, Deep Learning, Data Science, Data Mining, Big Data, Computer Vision, Bildverarbeitung, Fahrzeugerkennung, Gesichtserkennung, Empfehlungssysteme, Verarbeitung natürlicher Sprache und Kaggle-Wettbewerbe.
Filtern von Kandidaten anhand eines telefonischen HR-Interviews:
- Es ist wichtig zu verstehen, wie tief die mathematischen Kenntnisse des Kandidaten sind (lineare Algebra, Wahrscheinlichkeitstheorie).
- Welche Frameworks werden verwendet? Eine abwechslungsreiche Erfahrung ist willkommen.
- Was waren die komplexesten Projekte, die Projekte erstellen mussten? Was war die persönliche Rolle und das Ergebnis?
- An welchen Wettbewerben hat er teilgenommen?
- Gibt es Artikel in wissenschaftlichen Fachzeitschriften und hier auf habr.com?
Rekrutierungs- und Auswahlalgorithmus:
- Das technische Interview besteht aus 3 Teilen:
- Online-Test für 20 Minuten. Eine Beispielseite zum Posten eines Online-Tests. ;;
- Testen - 1 Stunde. Technisches Interview im Büro. Testaufgabe 20 min-1 Stunde. Sie können einen Test mit 10-15 Aufgaben erstellen (Aufgaben in Wahrscheinlichkeitstheorie, mathematischer Statistik, Computer Vision, maschinelles Lernen). Der Test wird vom Kandidaten alleine im Besprechungsraum durchgeführt. Er muss nicht alle Probleme lösen, aber es ist wichtig, mindestens 50% zu lösen. Beim Testen ist es nützlich, Punkte für eine objektive Bewertung und die Fähigkeit zum Vergleichen von Kandidaten festzulegen.
- Der mündliche Teil des technischen Interviews dauert 1 Stunde (Diskussion der Ergebnisse von Problemen in der Wahrscheinlichkeitstheorie, mathematische Statistik und Analyse, wie der Kandidat Probleme in der Bildverarbeitung und beim maschinellen Lernen löst).
Es versteht sich, dass die Arbeitsbedingungen und andere „Goodies“ dem Kandidaten bekannt sind und im Voraus ehrlich geäußert werden, andernfalls ist die Motivation nicht nur für alle .
- HR & Persönlichkeitsinterview mit Timlider
Die für einen DataScientist erforderlichen Persönlichkeitsmerkmale sind:
- Hohe Lernfähigkeit. Er muss klug sein, schnell neue Fähigkeiten erwerben, auf seinem Gebiet und vorzugsweise im Fachbereich des Unternehmens vorbereitet und ständig weiterentwickelt werden.
- Neugier, Interesse an neuen Technologien, praktische Erfahrung in deren Einsatz, Interesse an verwandten Bereichen.
- Ausdauer und Ausdauer - die Fähigkeit, lange an einem Problem zu arbeiten
- Kreativität - Interesse an neuen Möglichkeiten, Motivation und der Fähigkeit, neue Lösungen zu finden.
So halten Sie AI & Data Science-Spezialisten in einem Unternehmen:
Hier haben Standard-Retentionswerkzeuge ihre eigenen Eigenschaften.
- Die Fähigkeit, mit einem Guru zusammenzuarbeiten, einem Experten auf dem KI-Markt in Russland oder anderen Ländern, die Fähigkeit, Doktorarbeiten zu schreiben, gemeinsame Forschung zu betreiben;
- Ein Team von starken Fachleuten, von denen man lernen kann und mit denen es interessant ist, KI-Projekte zu erstellen (Top-10-Universitäten, Mitarbeiter von Großunternehmen der KI-Marktführer in Russland);
- Die Fähigkeit, einen Artikel zu schreiben. Forschung und Veröffentlichungen für internationale Konferenzen (NIPS, ICLR usw.) durchzuführen;
- Unterstützung bei der Erlangung eines wissenschaftlichen Abschlusses, einschließlich internationaler;
- Zugang zu Primärquellen.
Und universelle Werte:
- Interessante Aufgaben, die Fähigkeit, Veröffentlichungen zu machen;
- Hohes Gehalt, regelmäßiges Wachstum entsprechend dem Marktniveau;
- Respekt Einschließlich des Vertrauens in Fachwissen, der Anerkennung von Leistungen im Unternehmen und in der wissenschaftlichen Gemeinschaft (Prämien, Prämien für das Erreichen von Ergebnissen);
- Gute Ausstattung, Zugang zu Daten;
- Informationen zu Änderungen - Mitarbeiter sollten über die zukünftigen Pläne des Unternehmens informiert sein. Selbst in einem großen Unternehmen ist es wichtig, darauf zu achten, dass sie nicht im Dunkeln bleiben.
- Pflege der Mitarbeiter - regelmäßige Umfragen mit der Möglichkeit, ehrliche Antworten zu erhalten. Wie Sie das Leben der Mitarbeiter verbessern und ihnen helfen können, effizienter zu arbeiten (Früchte im Büro, Musikinstrumente, ein Raum zum Entspannen, Glückwünsche nicht nur zu Ihrem Geburtstag, sondern auch zu anderen Feiertagen usw.).
Zusammenfassend ist anzumerken, dass es wichtig ist zu wissen, dass der Unterschied zwischen diesen offenen Stellen und den anderen - die bisherigen Rekrutierungsmethoden für diese Kandidaten funktionieren nicht so effektiv. Es ist wichtig, ein Gleichgewicht zwischen dem extremen Fachkräftemangel, der Bereitschaft zu flexibleren Bedingungen und der Notwendigkeit zu finden, starke Fachkräfte zu filtern und auszuwählen, die einen positiven Beitrag zu geschäftlichen Veränderungen leisten können.