Em colaboração com Anna Perova
1. Introdução
Todos os dias, a humanidade cria, usa e armazena grandes quantidades de dados. Todo artigo, blog ou postagem no instagram, todo e qualquer fato de comunicação são dados que, quando processados, se tornam valiosos, geram lucro e alertam contra os riscos de quem o possui e sabe como extrair informações relevantes.
Com os crescentes recursos de análise de dados e a conscientização da utilidade dos arquivos existentes, a necessidade de especialistas em Ciência de Dados, aprendizado de máquina e inteligência artificial (IA) também é capaz de trabalhar com dados e criar modelos úteis baseados neles, além de auto-processar sistemas de dados e forçá-los trabalhar.
Por que aqueles que estão recrutando equipes nesta área precisam pensar em novos métodos de recrutamento?
Como o TechCrunch escreveu em 2015 , de acordo com Mckinsey , que, reconhecidamente, não estava longe da verdade, 490.000 especialistas serão necessários nessa área até 2018.
Se você confia nos dados do LinkedIn - dos 236 milhões de perfis, cerca de 11.400-19.400 são perfis da Data Scientists.
O investimento médio anual da Amazon em AI Hiring já é de US $ 227,8 milhões , enquanto o principal investimento do Google na IA Hiring é de US $ 130,1 milhões . Os especialistas no campo da inteligência artificial das principais empresas recebem de US $ 100.000 a US $ 500.000 por ano. Isso é evidenciado por uma pesquisa realizada pelo The New York Times, que, em princípio, é verificada periodicamente no site dice.com, monster.com ou LinkedIn.
A área é nova e em tendência. A quantidade e a qualidade dos jovens especialistas não satisfazem a maior demanda por eles no mundo todo e também na Rússia - aqui a situação difere apenas na ordem dos salários e até agora - no número de vagas abertas no campo de Ciência de Dados e IA.
De acordo com a análise de hh.ru, o número de vagas abertas no campo de Machine Learning, Deep Learning, Data Science: mais de 1000. O número de especialistas treinados com a experiência necessária não é superior a 300. Candidatos com pelo menos experiência mínima neste campo da IA, Data Science não são adequados para essas posições são de cerca de 3 mil. E isso por si só é um problema para pesquisa e contratação, uma vez que:
- por um lado, existem realmente poucos especialistas valiosos;
- por outro lado, há muitos candidatos que estão apenas começando no campo em questão, em cujo treinamento (no caso de contratação) eles terão que investir.
Tudo isso leva a um mercado de trabalho extremamente superaquecido e, ao contratar nesta área, vários fatores devem ser levados em consideração:
- maior competição por talentos (salários e condições) - há mais vagas que candidatos, mas os requisitos para os candidatos são altos; estatísticas aproximadas: 10 a 15 ofertas de emprego para um candidato com mais de 3 anos de experiência em Data Science & AI;
- as empresas são forçadas a serem mais flexíveis em termos de salário, cronograma, oportunidades adicionais; em geral, a preferência é por horários flexíveis, meio período, a necessidade de liberdade para ser criativo, a fim de encontrar as melhores abordagens e soluções;
- o candidato está interessado em projetos e tarefas desde Data Scientist - geralmente tem um certo tipo de personalidade: mentalidade analítica, motivação para o desenvolvimento intelectual e profissional, desejo de pesquisa, uma variedade de tarefas, curiosidade e, no local, existe um certo individualismo e exatidão no reconhecimento dos resultados;
- a empresa, no entanto, precisa de uma equipe forte, capaz de fornecer resultados dentro do prazo, nos quais haja alguém para aprender e com quem criar projetos de pesquisa;
- recursos e capacidades, bons equipamentos, GPU são necessários.
Devido à alta competição por talentos nessa área, surgem várias questões de seleção, sendo as principais:
- Onde encontrar especialistas em IA e ciência de dados?
- Como reconhecer Como escolher o melhor ou o mais promissor (quem passará pelo treinamento de maneira rápida e lucrativa) em um pequeno círculo de candidatos? Quais devem ser os critérios de seleção para um Headhunter?
- Como não perder? Como manter profissionais de IA e ciência de dados?
1. Onde encontrar?
Além de fontes padrão e conhecidas, gostaria de chamar a atenção para os especialistas mais produtivos em termos de minha experiência pessoal na contratação de IA e ciência de dados.
Slack, Open Data Science Channel. Este recurso não é para recrutadores e destina-se principalmente à comunicação entre engenheiros e especialistas no campo da ciência de dados.
O que você precisa fazer: publique seu anúncio no Slack na comunidade Open Data Science. É melhor pedir a seus colegas, especialistas em DS ou engenheiros de dados para fazer isso, sem ocultar o nível de salários e oportunidades de desenvolvimento. Enfatize os recursos de tarefas e projetos atraentes, tecnologias que podem ser usadas.
Competições Kaggle.
O que você precisa fazer: Selecione o top - 50-100 nas competições Kaggle. Os primeiros 20 geralmente resolvem problemas por prazer, gostam de trabalhar em grandes empresas e não buscam emprego. Após os 20 primeiros, você pode selecionar candidatos em potencial com alto potencial em DataScience e AI, contatá-los, oferecer uma reunião e um projeto. Em caso de recusa, é possível solicitar recomendações usando o programa de referência da sua empresa (você pode fazer perguntas detalhadas sobre a caça ao Kaggle no PM, ou, se estiver interessado, prepararemos material separado).
- Índice H. Índice de Hirsch, mas um método para avaliar / pesquisar candidatos, que é melhor usar ao pesquisar especialistas em AI, ML / DL, Visão Computacional, Ciência de Dados. Esse critério permite avaliar qual dos cientistas e professores é melhor citado e qual é o pior e encontrar aqueles que se especializam no campo profissional desejado e podem se tornar um guru para jovens especialistas. O que você precisa fazer: procure especialistas em Data Science e AI usando dados abertos no índice Hirsch. Interesse-se por tópicos que atendam às suas necessidades. Índice médio para cientistas de diferentes níveis:
- jovem cientista, estudante de graduação - 0-2;
- Candidato da ciência - 3-6;
- Doutor em Ciências - 7-10;
- Membro do Conselho de Dissertação - 10-15;
- cientista mundialmente famoso, presidente do Conselho de Dissertação - 16 e acima.
Site útil para procurar candidatos pelo índice de referência: eLIBRARY.ru.
Este site contém publicações de cientistas russos. Existem mais de 24 milhões de artigos publicados, o banco de dados é atualizado constantemente.
Uma das principais brechas é se registrar no site, encontrar um professor com um grande número de publicações com um alto nível de citação, encontrar uma maneira de contatá-lo e pedir recomendações de coautores e estudantes. Como opção, abra publicações e entre em contato com os coautores através de redes sociais acessíveis.
Ao contratar cientistas, é importante considerar que eles podem não ter habilidades práticas e compreensão do negócio, mas sua carreira científica pode ser útil para o desenvolvimento de projetos de ciência intensiva, inclusive no campo da IA.
Organize seu próprio concurso de Ciência de Dados: hackathon, um concurso de programação. Esses eventos são realizados pela Comunidade da AI, Open Data Science, etc. Você pode tentar organizá-lo sozinho, mas é provável que a qualidade sofra.
Um exemplo de uma boa competição: Sberbank Contest .
- Inicie um curso de treinamento gratuito de ML / Deep Learning - o formato não é importante. O principal é decidir sobre o tópico e as tarefas, monitorando os especialistas mais adequados de acordo com os resultados da resolução de "trabalhos de casa". Para um bom funil, convide mais de 50 dos mais promissores. Como resultado, permanecerão entre 10 e 15 e você não contratará mais que 5, mas esse método economizará muito tempo e esforço.
- O sistema de recomendações internas. Atribua um bônus de referência decente para funcionários internos. Estimule suas recomendações.
- Desenvolva sua rede de IA. A comunidade de IA e ciência de dados na Rússia e no mundo ainda é muito pequena e se comunica ativamente em conferências, é fácil obter recomendações de gurus e palestrantes; muitas vezes é possível fazê-lo gratuitamente (OpenAITalks, Skolkovo Robotics, NIPS, ICLR etc.)
2. Como selecionar realmente bons especialistas em Ciência de Dados e IA
Não é fácil para o RH entender todos os conceitos de uma só vez; portanto, o mais importante é entender bem os principais títulos para, pelo menos, de alguma forma, se orientar. E aja de acordo com as instruções (capítulo "LISTA FINAL ou Princípios de seleção de pessoal") - ou seja, equilibrar muito claramente a complexidade do trabalho e testar a motivação financeira e não financeira.
Portanto, para começar, é importante decidir o que agora é entendido como cientista de dados
Os cientistas de dados usam dados estatísticos, aprendizado de máquina e abordagens analíticas para resolver problemas críticos de negócios. Sua principal função é ajudar as organizações a transformar seus volumes de big data em modelos valiosos e acionáveis.
Eles devem ter um bom conhecimento de matemática, programar, desenvolver algoritmos de aprendizado de máquina para automatizar algoritmos. Também é esperado que eles tenham uma alta capacidade de interpretar dados, a capacidade de visualizá-los é importante, as habilidades de resolução de problemas são importantes, mesmo que os problemas não sejam formulados até o fim.
É importante que eles possam trabalhar com diferentes tipos de dados e dados de diferentes níveis de prontidão.
Um bom conhecimento matemático (conhecimento de álgebra linear, geometria analítica, teoria das probabilidades e estatística matemática) é obrigatório. E isso é ainda mais importante para a análise de dados do que o conhecimento em engenharia. O treinamento de modelos de ML requer uma compreensão exata de quais modelos usar, como interpretar e como melhorar os resultados.
Conhecimento de linguagens de programação : Python ou R (mas navegue na pilha de tecnologia que você usa); C / C ++; Java
Habilidades : Scala, Apache Spark, Hadoop, aprendizado de máquina, aprendizado profundo e estatística.
Além disso : Tensorflow, PyTorch, Keras, Caffe, Pandas etc., Jupyter e RStudio., Experiência com sistemas altamente carregados, Cuda.
A diferença entre cientistas de dados e engenheiro de dados é a capacidade de analisar não apenas os dados, mas também de integrá-los aos sistemas existentes. Nesse sentido, é especialmente importante um profundo conhecimento de linguagens de programação, bem como a experiência de criar ou participar da criação de sistemas multithread altamente carregados, etc.
Os principais conceitos com os quais um recrutador deve estar familiarizado são: Aprendizado de Máquina, Aprendizado Profundo, Ciência de Dados, Mineração de Dados, Big Data, Visão Computacional, Processamento de Imagem, reconhecimento de automóveis, reconhecimento de rosto, sistemas de Recomendação, sistemas de Recomendação, processamento de Linguagem Natural, concursos de kaggle.
Filtragem de candidatos com base em uma entrevista por telefone do RH:
- É importante entender a profundidade do conhecimento do candidato em matemática (álgebra linear, teoria das probabilidades)
- Quais estruturas ele usa? Uma experiência variada é bem-vinda.
- Quais são os projetos mais complexos que os projetos tiveram que criar? Qual foi o papel e o resultado pessoal?
- Em que competições ele participou?
- Existem artigos em revistas científicas e aqui no habr.com?
Algoritmo de recrutamento e seleção:
- A entrevista técnica consiste em 3 partes:
- Teste online por 20 minutos. Um site de exemplo para postar um teste online. ;
- Teste - 1 hora. Entrevista técnica no escritório. Teste a tarefa 20 min-1 hora. Você pode criar um teste de 10 a 15 tarefas (tarefas em teoria das probabilidades, estatística matemática, visão computacional, aprendizado de máquina). O teste é realizado pelo candidato sozinho na sala de reuniões. Ele não precisa resolver todos os problemas, mas é importante resolver pelo menos 50%. Nos testes, é útil definir pontos para uma avaliação objetiva e a capacidade de comparar candidatos;
- A parte oral da entrevista técnica é de 1 hora (discussão dos resultados de problemas na teoria das probabilidades, estatística matemática e análise de como o candidato aborda a solução de problemas em visão computacional, aprendizado de máquina).
Deve-se entender que as condições de trabalho e outras “guloseimas” são conhecidas do candidato e expressadas com sinceridade antecipadamente; caso contrário, a motivação não será apenas para todos .
- Entrevista de RH e Personalidade com Timlider
Os traços de personalidade necessários para um DataScientist são:
- Alta capacidade de aprendizado: deve ser inteligente, adquirir rapidamente novas habilidades, estar preparado e desenvolver-se constantemente em seu campo e, de preferência, na área de atuação da empresa.
- Curiosidade, interesse em novas tecnologias, experiência prática em seu uso, interesse em áreas afins.
- Perseverança e perseverança - a capacidade de trabalhar em um problema por um longo tempo
- Criatividade - interesse em novas oportunidades, motivação e capacidade de apresentar novas soluções.
Como manter especialistas em IA e ciência de dados em uma empresa:
Aqui, as ferramentas de retenção padrão têm suas próprias características.
- A capacidade de trabalhar com um guru, um especialista no mercado de IA na Rússia ou em outros países, a capacidade de escrever PHD, faz pesquisas conjuntas;
- Uma equipe de profissionais fortes, com quem é possível aprender e com quem é interessante criar projetos de IA (as 10 melhores universidades, funcionários de grandes empresas dos líderes de mercado de IA na Rússia);
- A capacidade de escrever um artigo. Fazer pesquisas e publicações para conferências internacionais (NIPS, ICLR etc.);
- Assistência na obtenção de um diploma científico, inclusive internacional;
- Acesso a fontes primárias.
E valores universais:
- Tarefas interessantes, a capacidade de fazer publicações;
- Salário alto, seu crescimento regular de acordo com o nível de mercado;
- Respeito Incluindo confiança na experiência, reconhecimento de realizações na empresa e na comunidade científica (bônus, bônus por alcançar resultados);
- Bom equipamento, acesso a dados;
- Informações sobre mudanças - os funcionários devem estar cientes dos planos futuros da empresa. Mesmo em uma grande empresa, é importante tomar cuidado para não mantê-los no escuro;
- Cuidar dos funcionários - pesquisas regulares com a possibilidade de receber respostas honestas. Como melhorar a vida dos funcionários, ajudá-los a serem mais eficientes (frutas no escritório, instrumentos musicais, sala de relaxamento, parabéns não apenas pelo seu aniversário, mas também por outros feriados, etc.).
Concluindo, vale ressaltar que é importante saber que a diferença entre essas vagas e as demais - os métodos de recrutamento anteriores para esses candidatos não funcionam tão efetivamente. É importante encontrar um equilíbrio entre a extrema escassez de especialistas, a disposição de ser mais flexível em condições e a necessidade de filtrar e selecionar profissionais fortes que possam dar uma contribuição positiva às mudanças nos negócios.