如何快速找到并不会失去AI和数据科学专家

与Anna Perova合作


引言


人类每天都在创建,使用和存储大量数据。 每一篇文章,博客或instagram帖子,每一个相似的话题以及实际上的每一个交流事实,都是数据,这些数据经过处理后会变得很有价值,可以获利,并警告谁拥有它并知道如何提取相关信息的风险。


随着数据分析能力的增强以及对现有档案的实用性的认识,对数据科学,机器学习和人工智能(AI)的专家的需求也能够处理数据并基于数据创建有用的模型,以及自我处理数据系统并强制使用它们工作。


为什么这方面的招聘团队需要考虑新的招聘方法?


正如TechCrunch在2015年写的那样,据麦肯锡说 ,他承认事实并非遥不可及,到2018年,该领域将需要490,000名专家。


如果您依靠LinkedIn数据-在2.36亿个个人资料中,大约有11,400-19,400是数据科学家的个人资料。


亚马逊在AI招聘方面的年均投资已达2.278亿美元 ,而Google 在AI招聘方面 主要竞争对手投资已达1.301亿 美元 。 领先公司的人工智能领域的专家每年可获得100,000美元到500,000美元。 《纽约时报》进行的一项调查证明了这一点,原则上,该调查会定期从dice.com,monster.com或LinkedIn进行检查。


该地区是新的趋势。 在全球乃至整个俄罗斯,年轻专家的数量和素质都无法满足他们的最高需求-这里的情况仅在薪水顺序方面和迄今为止-在数据科学和AI领域的空缺职位数量上有所不同。


根据hh.ru的分析,机器学习,深度学习,数据科学领域的空缺职位数量:超过1000。具有必要经验的受过培训的专家人数不超过300。这些职位大约有三千。 由于以下原因,这本身就是搜索和招聘的问题:


  • 一方面,真正有价值的专家很少。
  • 另一方面,有许多候选人刚刚开始涉足这一领域,他们将必须向他们的培训(在招聘方面)进行投资。

所有这些都导致劳动力市场极度过热,在该地区招聘时,必须考虑以下因素:


  • 最高的人才竞争(薪水和条件)-空缺职位比候选人更多,但对候选人的要求很高; 大约的统计数据:一位具有3年以上数据科学和AI经验的候选人的10-15个工作机会;
  • 公司被迫在薪水,日程安排,更多机会方面更加灵活,总的来说,他们偏向于弹性工作时间,兼职时间,需要自由创新的能力,以便找到最佳方法和解决方案;
  • 自此以来,候选人对项目和任务感兴趣 数据科学家-通常具有某种个性类型:分析型思维,对智力和专业发展的动力,对研究的渴望,各种任务,好奇心,并且在识别结果时具有一定的个人主义和严谨性;
  • 尽管如此,公司仍需要一支强大的团队,能够按时交付成果,并需要有人向他们学习,并与他们一起创建研究项目。
  • 资源和容量,良好的设备和GPU是必需的。

由于该领域人才的竞争激烈,因此出现了很多选择问题,其中主要是:


  • 在哪里可以找到AI和数据科学专家?
  • 如何识别 如何从一小部分候选人中选择最佳或最有前途的人(他们将快速而有利润地接受培训)? 猎头公司的选择标准应该是什么?
  • 怎么不输? 如何留住AI和数据科学专业人才?

1.在哪里找到?


除了标准和知名的资料来源,我还想以我在雇用AI和数据科学方面的个人经验来吸引最有生产力的专家。


  • 松弛,开放数据科学频道。 该资源不适用于招聘人员,主要用于数据科学领域的工程师和专家之间的通信。
    您需要做的是:在开放数据科学社区的Slack上发布您的广告。 最好请您的同事,DS专家或数据工程师来执行此操作,而又不要掩盖薪水水平和发展机会。 强调有吸引力的任务和项目的特征,可以使用的技术。


  • Kaggle比赛。
    您需要做的是:在Kaggle比赛中选择最高的50-100。 前20名通常会为娱乐而解决问题,喜欢在大公司工作,而不是寻找工作。 在前20名之后,您可以选择在DataScience和AI中具有高潜力的潜在候选人,与他们联系,提供会议和项目。 如果被拒绝,可以使用贵公司的推荐程序来请求推荐(您可以在PM中与Kaggle一起打猎的详细问题,或者,如果您有兴趣,我们将准备单独的材料)。


  • H索引。 Hirsch索引,而是一种评估/搜索候选人的方法,在搜索AI,ML / DL,计算机视觉,数据科学专家时更适合使用。 该标准可以评估哪些科学家和教授被引用得更好,哪些被引用更差,并找到专门从事所需专业领域并可以成为年轻专家的专家的人。 您需要做的是:使用Hirsch索引上的开放数据寻找数据科学和AI专家。 对符合您需求的主题感兴趣。 不同级别科学家的平均指数:
    1. 年轻科学家,研究生-0-2;
    2. 科学候选人-3-6;
    3. 理学博士-7-10;
    4. 论文委员会成员-10-15;
    5. 世界著名科学家,学位论文委员会主席-16岁及以上。

通过引文索引搜索候选人的有用站点:eLIBRARY.ru。
该站点包含俄罗斯科学家的出版物。 张贴的文章超过2400万,数据库不断更新。
主要漏洞之一是在该网站上注册,然后找到一位被引用次数很多的出版物众多的教授,找到与他联系的方法,并向合著者和学生寻求建议。 作为选择,可以打开出版物并通过可访问的社交网络联系合著者。
在招聘科学家时,重要的是要考虑到他们可能缺乏实践技能和对业务的了解,但是他们的科学职业可能对开发包括人工智能领域在内的科学密集型项目很有用。


  • 组织您自己的数据科学竞赛:hackathon,编程竞赛。 此类事件由AI社区,开放数据科学等机构完成。您可以尝试自己组织它,但是质量可能会受到影响。
    良好竞争的一个例子: Sberbank竞赛


  • 开始免费的ML /深度学习培训课程-格式并不重要。 最主要的是确定主题和任务,根据解决“作业”的结果监视最合适的专家。 要获得一个好的渠道,请邀请50多个最有希望的渠道。 结果,将保留大约10-15,而您雇用的人数不超过5,但是此方法将节省大量时间和精力。
  • 内部建议系统。 为内部员工分配体面的推荐奖金。 刺激他们的建议。
  • 开发您的AI网络。 俄罗斯和世界各地的AI和数据科学界仍然很小,并且在会议上积极交流,很容易从专家和演讲者那里获得建议,甚至有可能免费提供(OpenAITalks,Skolkovo Robotics,NIPS,ICLR等)。

2.如何选择真正优秀的数据科学和人工智能专家


人力资源部很难一次理解所有概念,因此最重要的是要充分理解主要标题,以便至少以某种方式定位自己。 并按照说明进行操作 (“最终列表或人员选择原则”)-即 非常清楚地平衡工作的复杂性和测试财务和非财务动机。


因此,对于初学者来说,重要的是要决定现在被理解为数据科学家的东西


数据科学家使用统计数据,机器学习和分析方法来解决关键业务问题。 它们的主要功能是帮助组织将大数据量转换为有价值的可行模型。


他们应该具有良好的数学知识,程序设计,开发机器学习算法以使算法自动化。 即使没有将问题解决到最后,也希望它们具有很高的数据解释能力,可视化它们的能力很重要,解决问题的技能也很重要。


重要的是,它们可以使用不同类型的数据以及不同级别的就绪性数据。


必须具有良好的数学背景(了解线性代数,解析几何,概率论和数学统计)。 对于数据分析而言,这比工程知识更为重要。 训练ML模型需要准确了解要使用的模型,如何解释以及如何改善结果。


编程语言知识 :Python或R(但请浏览您使用的技术堆栈); C / C ++; 爪哇
技能 :Scala,Apache Spark,Hadoop,机器学习,深度学习和统计。
另外 :Tensorflow,PyTorch,Keras,Caffe,Pandas等,Jupyter和RStudio。高负载系统的使用经验,Cuda。


数据科学家和数据工程师之间的区别在于,不仅可以分析数据,还可以将其集成到现有系统中。 在这方面,对编程语言的深入了解以及创建或参与创建高负载的多线程系统等的经验尤其重要。


招聘人员应该熟悉的关键概念是机器学习,深度学习,数据科学,数据挖掘,大数据,计算机视觉,图像处理,汽车识别,面部识别,推荐系统,自然语言处理,kaggle竞赛。


根据电话人力资源面试筛选候选人:


  1. 重要的是要了解候选人的数学知识有多深(线性代数,概率论)
  2. 它使用什么框架? 欢迎有各种各样的经验。
  3. 项目必须创建的最复杂的项目是什么? 个人角色和结果是什么?
  4. 他参加了哪些比赛?
  5. 在habr.com上的科学期刊上是否有文章?

招聘与选拔算法:


  1. 技术面试包括三个部分:
    • 在线测试20分钟。 用于发布在线测试的示例站点。 ;
    • 测试-1小时。 在办公室进行技术面试。 测试任务20分1小时。 您可以测试10-15个任务(概率论,数学统计,计算机视觉,机器学习中的任务)。 该测试仅由应聘者在会议室中执行。 他不必解决所有问题,但解决至少50%的问题很重要。 在测试中,设定客观评估点和比较候选者的能力非常有用;
    • 技术面试的口试时间为1小时(讨论概率论,数学统计问题的结果以及对候选人如何解决计算机视觉,机器学习中的问题的分析)。

应该理解的是,工作条件和其他“好东西”是应聘者事先知道并诚实地表达出来的;否则,动机将不仅适用于每个人


  1. 蒂姆利德的人力资源和人格采访
    DataScientist必需的人格特质是:
    • 高学习能力:他必须很聪明,能迅速掌握新技能,有准备并在自己的领域内,尤其是公司的学科领域不断发展。
    • 好奇心,对新技术的兴趣,使用新技术的实际经验,对相关领域的兴趣。
    • 毅力和毅力-长期解决一个问题的能力
    • 创造力-对新机会,动机和提出新解决方案的能力的兴趣。

如何在公司中保留AI和数据科学专家:


在这里,标准的固定工具具有自己的特点。


  • 具有与大师合作的能力,俄罗斯或其他国家的AI市场专家的能力,编写PHD的能力,进行联合研究的能力;
  • 一支强大的专业人员团队,可以从中学习并与他们合作创建AI项目(前十名大学,来自俄罗斯AI市场领导者的大型公司的员工);
  • 撰写文章的能力。 为国际会议(NIPS,ICLR等)进行研究和出版;
  • 协助获得包括国际在内的科学学位;
  • 访问主要资源。

和普遍的价值观:


  • 有趣的任务,具有发表出版物的能力;
  • 高薪,其根据市场水平有规律地增长;
  • 尊重 包括对专业知识的信任,对公司和科学界的成就的认可(奖金,实现成果的奖金);
  • 好的设备,获取数据;
  • 变更信息-员工应了解公司的未来计划。 即使在大型公司中,也要注意不要让它们处于黑暗中。
  • 关爱员工-定期进行民意调查,可能会得到诚实的答案。 如何改善员工的生活,帮助他们提高工作效率(办公室里的水果,乐器,休闲室,不仅在您的生日,还有其他假期等恭喜您)。

总之,值得注意的是,重要的是要知道这些职位空缺与其他职位之间的区别-以前针对这些候选人的招聘方法并不那么有效。 必须在专家的极端短缺,在条件上更灵活的意愿与筛选和选择可以为业务变化做出积极贡献的强大专家之间取得平衡。

Source: https://habr.com/ru/post/zh-CN412625/


All Articles