En colaboración con Anna Perova
Introduccion
Todos los días, la humanidad crea, usa y almacena grandes cantidades de datos. Cada artículo, blog o publicación de Instagram, cada me gusta y, de hecho, cada hecho de comunicación son datos que, cuando se procesan, se vuelven valiosos, obtienen ganancias y advierten contra los riesgos de quién es el propietario y sabe cómo extraer información relevante.
Con las crecientes capacidades de análisis de datos y la conciencia de la utilidad de los archivos existentes, la necesidad de expertos en ciencia de datos, aprendizaje automático e inteligencia artificial (IA) también puede trabajar con datos y crear modelos útiles basados en ellos, así como sistemas de datos de autoprocesamiento y forzarlos a trabajar
¿Por qué los que están reclutando equipos en esta área necesitan pensar en nuevos métodos de reclutamiento?
Como TechCrunch escribió en 2015 , según Mckinsey , quien, sin duda, no estaba lejos de la verdad, se necesitarán 490,000 especialistas en esta área para 2018.
Si confía en los datos de LinkedIn , de 236 millones de perfiles, aproximadamente 11,400-19,400 son perfiles de Data Scientists.
La inversión anual promedio de Amazon en la contratación de AI es de $ 227.8 millones , mientras que la inversión de la competencia clave de Google en la contratación de AI es de $ 130.1 millones . Los especialistas en el campo de la inteligencia artificial de las empresas líderes reciben de $ 100,000 a $ 500,000 por año. Esto se evidencia en una encuesta realizada por The New York Times, que, en principio, se revisa periódicamente desde dice.com, monster.com o LinkedIn.
El área es nueva y en tendencia. La cantidad y la calidad de los especialistas jóvenes no satisface la mayor demanda para ellos tanto en todo el mundo como en Rusia, aquí la situación difiere solo en el orden de los salarios y hasta ahora, en el número de vacantes abiertas en el campo de la Ciencia de los Datos y la IA.
Según el análisis de hh.ru, el número de vacantes abiertas en el campo de Aprendizaje automático, Aprendizaje profundo, Ciencia de datos: más de 1000. El número de especialistas capacitados con la experiencia necesaria no es más de 300. Los candidatos con al menos una experiencia mínima en este campo de IA, Ciencia de datos no son adecuados para Estas posiciones son alrededor de 3 mil. Y esto en sí mismo es un problema de búsqueda y contratación, ya que:
- por un lado, hay realmente pocos especialistas valiosos;
- Por otro lado, hay muchos candidatos que recién están comenzando su camino en el campo en cuestión, en cuya capacitación (en el caso de la contratación) tendrán que invertir.
Todo esto conduce a un mercado laboral extremadamente sobrecalentado, y al contratar en esta área, se deben tener en cuenta una serie de factores:
- mayor competencia por talentos (salarios y condiciones): hay más vacantes que candidatos, pero los requisitos para los candidatos son altos; estadísticas aproximadas: 10-15 ofertas de trabajo para un candidato con más de 3 años de experiencia en Data Science & AI;
- las empresas se ven obligadas a ser más flexibles en términos de salario, horario, oportunidades adicionales, en general, la preferencia es por horarios flexibles, a tiempo parcial, la necesidad de libertad para ser creativos a fin de encontrar los mejores enfoques y soluciones;
- el candidato está interesado en proyectos y tareas desde Científico de datos: a menudo tiene un cierto tipo de personalidad: mentalidad analítica, motivación para el desarrollo intelectual y profesional, ansias de investigación, una variedad de tareas, curiosidad y en el lugar hay un cierto individualismo y exigencia para reconocer los resultados;
- Sin embargo, la compañía necesita un equipo fuerte, capaz de entregar resultados a tiempo, en el que haya alguien de quien aprender y con quien crear proyectos de investigación;
- Se necesitan recursos y capacidades, buenos equipos, GPU.
Debido a la alta competencia por el talento en esta área, surgen una serie de preguntas de selección, las principales de las cuales son:
- ¿Dónde encontrar especialistas en IA y ciencia de datos?
- Cómo reconocer ¿Cómo elegir el mejor o el más prometedor (quién se capacitará de manera rápida y rentable) de un pequeño círculo de candidatos? ¿Cuáles deberían ser los criterios de selección para un Headhunter?
- ¿Cómo no perder? ¿Cómo retener a los profesionales de IA y ciencia de datos?
1. ¿Dónde encontrar?
Además de las fuentes estándar y conocidas, me gustaría llamar la atención sobre los especialistas más productivos en términos de mi experiencia personal en la contratación de inteligencia artificial y ciencia de datos.
Slack, Open Data Science Channel. Este recurso no es para reclutadores y está destinado principalmente a la comunicación entre ingenieros y especialistas en el campo de la ciencia de datos.
Lo que debe hacer: Publique su anuncio en Slack en la comunidad de Open Data Science. Es mejor pedirles a sus colegas, especialistas en DS o ingenieros de datos que hagan esto, sin ocultar el nivel de los salarios y las oportunidades de desarrollo. Enfatice las características de tareas y proyectos atractivos, tecnologías que se pueden utilizar.
Kaggle Competiciones.
Lo que debes hacer: selecciona el mejor - 50-100 en las competiciones de Kaggle. Los primeros 20 generalmente resuelven problemas por placer, disfrutan trabajar en grandes empresas y no buscan trabajo. Después de los primeros 20, puede seleccionar candidatos potenciales con alto potencial en DataScience y AI, contactarlos, ofrecer una reunión y un proyecto. En caso de rechazo, es posible solicitar recomendaciones utilizando el programa de referencias de su empresa (puede hacer preguntas en detalle sobre la caza con Kaggle en PM o, si está interesado, prepararemos material por separado).
- Índice H. Índice de Hirsch, sino más bien un método para evaluar / buscar candidatos, que es mejor usar cuando se buscan expertos en IA, ML / DL, visión por computadora, ciencia de datos. Este criterio permite evaluar cuál de los científicos y profesores es mejor citado y cuál es peor, y encontrar a aquellos que se especializan en el campo profesional deseado y pueden convertirse en gurús para jóvenes especialistas. Lo que debe hacer: busque especialistas en ciencia de datos e inteligencia artificial que utilicen datos abiertos en el índice de Hirsch. Interesarse en temas que se ajusten a sus necesidades. Índice promedio para científicos de diferentes niveles:
- joven científico, estudiante graduado - 0-2;
- Candidato de Ciencia - 3-6;
- Doctor en Ciencias - 7-10;
- Miembro del Consejo de Disertación - 10-15;
- científico de fama mundial, presidente del Consejo de Disertación - 16 y más.
Sitio útil para buscar candidatos por índice de citas: eLIBRARY.ru.
Este sitio contiene publicaciones de científicos rusos. Hay más de 24 millones de artículos publicados, la base de datos se actualiza constantemente.
Una de las lagunas principales es registrarse en el sitio, luego encontrar un profesor con una gran cantidad de publicaciones con un alto nivel de citas, encontrar una manera de contactarlo y pedir recomendaciones a los coautores y estudiantes. Como opción, abrir publicaciones y contactar coautores a través de redes sociales accesibles.
Al contratar científicos, es importante tener en cuenta que pueden carecer de habilidades prácticas y comprensión del negocio, pero su carrera científica puede ser útil para el desarrollo de proyectos intensivos en ciencia, incluso en el campo de la IA.
Organice su propia competencia de ciencia de datos: hackathon, una competencia de programación. Tales eventos son realizados por AI Community, Open Data Science, etc. Puede intentar organizarlo usted mismo, pero es probable que la calidad se vea afectada.
Un ejemplo de una buena competencia: Sberbank Contest .
- Comience un curso de capacitación gratuito ML / Deep Learning: el formato no es importante. Lo principal es decidir sobre el tema y las tareas, monitoreando a los especialistas más adecuados de acuerdo con los resultados de la resolución de "tarea". Para un buen embudo, invite a más de 50 de los más prometedores. Como resultado, quedará aproximadamente 10-15, y contratará no más de 5, pero este método le ahorrará mucho tiempo y esfuerzo.
- El sistema de recomendaciones internas. Asigne un bono de referencia decente para los empleados internos. Estimular sus recomendaciones.
- Desarrolle su red de IA. La comunidad de AI y ciencia de datos en Rusia y en el mundo todavía es muy pequeña y se comunica activamente en las conferencias, es fácil obtener recomendaciones de gurús y oradores, a menudo incluso es posible hacerlo de forma gratuita (OpenAITalks, Skolkovo Robotics, NIPS, ICLR, etc.)
2. Cómo seleccionar realmente buenos especialistas en ciencia de datos e inteligencia artificial
No es fácil para RR.HH. comprender todos los conceptos a la vez, por lo que lo más importante es comprender bien los encabezados principales para al menos orientarse de alguna manera. Y actúe de acuerdo con las instrucciones (capítulo "LISTA FINAL o Principios de selección de personal"), es decir equilibra muy claramente la complejidad del trabajo y prueba la motivación financiera y no financiera.
Entonces, para empezar, es importante decidir qué se entiende ahora como Data Scientist
Los científicos de datos utilizan datos estadísticos, aprendizaje automático y enfoques analíticos para resolver problemas comerciales críticos. Su función principal es ayudar a las organizaciones a convertir sus grandes volúmenes de datos en modelos valiosos y procesables.
Deben tener un buen conocimiento de las matemáticas, programar, desarrollar algoritmos de aprendizaje automático para automatizar algoritmos. También se espera que tengan una alta capacidad para interpretar datos, la capacidad de visualizarlos es importante, las habilidades para resolver problemas son importantes, incluso si los problemas no se formulan hasta el final.
Es importante que puedan trabajar con diferentes tipos de datos y datos de diferentes niveles de preparación.
Una buena base matemática (conocimiento de álgebra lineal, geometría analítica, teoría de probabilidad y estadística matemática) es imprescindible. Y esto es aún más importante para el análisis de datos que el conocimiento de ingeniería. La capacitación de modelos de ML requiere una comprensión de exactamente qué modelos usar, cómo interpretar y cómo mejorar los resultados.
Conocimiento de lenguajes de programación : Python o R (pero navegue por la pila de tecnología que usa); C / C ++; Java
Habilidades : Scala, Apache Spark, Hadoop, aprendizaje automático, aprendizaje profundo y estadísticas.
Además : Tensorflow, PyTorch, Keras, Caffe, Pandas, etc., Jupyter y RStudio., Experiencia con sistemas altamente cargados, Cuda.
La diferencia entre los científicos de datos y el ingeniero de datos es la capacidad no solo de analizar datos, sino también de integrarlos en los sistemas existentes. En este sentido, es especialmente importante un profundo conocimiento de los lenguajes de programación, así como la experiencia de crear o participar en la creación de sistemas de múltiples subprocesos altamente cargados, etc.
Los conceptos clave con los que un reclutador debería estar familiarizado son: Aprendizaje automático, Aprendizaje profundo, Ciencia de datos, Minería de datos, Big Data, Visión por computadora, Procesamiento de imágenes, reconocimiento de automóviles, reconocimiento facial, Sistemas de recomendación, Procesamiento de lenguaje natural, concursos de kaggle.
Filtrado de candidatos basado en una entrevista telefónica de recursos humanos:
- Es importante comprender cuán profundo es el conocimiento del candidato en matemáticas (álgebra lineal, teoría de la probabilidad)
- ¿Qué marcos utiliza? Una experiencia variada es bienvenida.
- ¿Cuáles son los proyectos más complejos que los proyectos tuvieron que crear? ¿Cuál fue el papel personal y el resultado?
- ¿En qué competiciones participó?
- ¿Hay artículos en revistas científicas y aquí en habr.com?
Algoritmo de reclutamiento y selección:
- La entrevista técnica consta de 3 partes:
- Pruebas en línea durante 20 minutos. Un sitio de ejemplo para publicar una prueba en línea. ;
- Prueba - 1 hora. Entrevista técnica en la oficina. Tarea de prueba 20 min-1 hora. Puede crear una prueba de 10-15 tareas (tareas en teoría de probabilidad, estadística matemática, visión por computadora, aprendizaje automático). La prueba la realiza el candidato solo en la sala de reuniones. No tiene que resolver todos los problemas, pero es importante resolver al menos el 50%. En las pruebas, es útil establecer puntos para una evaluación objetiva y la capacidad de comparar candidatos;
- La parte oral de la entrevista técnica es de 1 hora (discusión de los resultados de problemas en teoría de probabilidad, estadística matemática y análisis de cómo el candidato aborda la resolución de problemas en visión por computadora, aprendizaje automático).
Debe entenderse que las condiciones de trabajo y otros "beneficios" son conocidos por el candidato y sinceramente expresados de antemano, de lo contrario, la motivación no será solo para todos .
- Entrevista de Recursos Humanos y Personalidad con Timlider
Los rasgos de personalidad necesarios para un DataScientist son:
- Alta capacidad de aprendizaje: debe ser inteligente, adquirir rápidamente nuevas habilidades, estar preparado y desarrollarse constantemente en su campo y preferiblemente en el área temática de la empresa.
- Curiosidad, interés en nuevas tecnologías, experiencia práctica en su uso, interés en campos relacionados.
- Perseverancia y perseverancia: la capacidad de trabajar en un problema durante mucho tiempo
- Creatividad: interés en nuevas oportunidades, motivación y la capacidad de encontrar nuevas soluciones.
Cómo retener especialistas en inteligencia artificial y ciencia de datos en una empresa:
Aquí, las herramientas de retención estándar tienen sus propias características.
- La capacidad de trabajar con un gurú, un experto en el mercado de IA en Rusia u otros países, la capacidad de escribir PHD, hacer investigación conjunta;
- Un equipo de profesionales fuertes, de quienes es posible aprender y con quienes es interesante crear proyectos de IA (universidades Top-10, empleados de compañías a gran escala de los líderes del mercado de IA en Rusia);
- La capacidad de escribir un artículo. Para realizar investigaciones y publicaciones para conferencias internacionales (NIPS, ICLR, etc.);
- Asistencia en la obtención de un título científico, incluso internacional;
- Acceso a fuentes primarias.
Y valores universales:
- Tareas interesantes, la capacidad de hacer publicaciones;
- Alto salario, su crecimiento regular de acuerdo con el nivel del mercado;
- Respeto Incluyendo la confianza en la experiencia, el reconocimiento de los logros en la empresa y la comunidad científica (bonificaciones, bonificaciones por lograr resultados);
- Buen equipo, acceso a datos;
- Información sobre cambios: los empleados deben conocer los planes futuros de la empresa. Incluso en una gran empresa, es importante tener cuidado de no mantenerlos en la oscuridad;
- Cuidar a los empleados: encuestas periódicas con la posibilidad de recibir respuestas honestas. Cómo mejorar la vida de los empleados, ayudarlos a ser más eficientes (frutas en la oficina, instrumentos musicales, un lugar para relajarse, felicitaciones no solo por su cumpleaños, sino también por otras vacaciones, etc.).
En conclusión, vale la pena señalar que es importante saber que la diferencia entre estas vacantes del resto - los métodos de reclutamiento anteriores para estos candidatos no funcionan de manera tan efectiva. Es importante lograr un equilibrio entre la extrema escasez de especialistas, la voluntad de ser más flexibles en las condiciones y la necesidad de filtrar y seleccionar profesionales fuertes que puedan hacer una contribución positiva a los cambios comerciales.