2017年12月,我们对俄罗斯各类用户进行了一项调查,一种或多种与数据分析有关的方式。 我们想知道该领域的专家使用了哪种编程语言,技术和工具。 这对于
PyCharm的开发也很重要,而
PyCharm在分析人员中已经非常流行。 更好地了解数据分析专家的需求将使我们的产品更加方便。
后来,我们在其他国家进行了类似的研究,并且有机会将俄罗斯与世界的情况进行了比较。 在这里,我们将分享最有趣的观察结果,有关俄罗斯的更完整数据和信息图表已发布
在我们的网站上 。 可
在此处获得源数据(为了确保机密性,已删除所有未解决问题的答案)。 不久,我们还将发布一项全球研究的结果。
数据科学专家简介该研究分析了来自世界各地的373位俄罗斯人和1965位受访者的回答。 按年龄划分,俄罗斯在数据科学领域的专家与外国同事几乎没有区别,但是外国专家的正规教育水平较高。 在接受调查的俄罗斯人中,有59%拥有学士学位,只有20%拥有硕士学位,而世界上有45%的受访者拥有学士学位,有36%拥有硕士学位。
数据科学领域相对年轻,大约一半的受访者(46%)已经从事了1-3年。 只有18%的人有3-6年的经验。 值得注意的是,对于绝大多数受访者(具有0至6年经验的受访者,例如> 90%),平均年龄与经验无关。 这可能是由于该领域的年轻化以及来自相关领域的人们正在积极进入这一领域。
许多人会解决数据分析任务以及编程和其他工作职责。 只有50%的受访者(根据我们的调查,全球为36%)表示将数据分析作为他们的主要专业活动,而33%的受访者将数据分析与他们的主要专业职责相结合。
程式语言Python是俄罗斯乃至全世界的主要数据分析语言。 在国外,在数据分析领域使用Python和R的比例分别为73%和40%,在俄罗斯,Python比R更为流行-84%和25%。
技术与工具超过60%的受访者以一种或另一种方式使用深度学习工具。 TensorFlowTM是最受欢迎的框架-49%,Keras以39%位居第二。
40%的受访者使用Apache Spark,其中92%的人使用Scala进行编程。 Scala是主要语言的每个人都使用Apache Spark。 仅使用Python编程并使用Spark的人的比例约为14%(如果不考虑使用Lua和Julia的Spark的能力,则该比例将增加到20%)。
薪水大数据技术知识是高工资的关键。 大数据技术领域以外的专家的平均工资为12.7万卢布。 专家的薪水根据资格和经验的不同而有很大差异,但平均而言,它们在大数据分析领域要高得多。 有趣的是,尽管Apache Spark受到欢迎,但了解这项技术的受访者的薪水却比拥有Apache Pig和Apache Hive的专家低-分别为157千卢布和177千卢布。 了解Apache Hadoop / MapReduce可以平均赚取15万卢布。
关于薪水对编程语言的依赖性,我们与全世界没有什么不同:Scala的专家的收入比其他人多-平均为17.3万卢布。 紧随其后的是拥有Java知识的受访者(15.8万和Python)14.3万。此外,使用Python的专家的薪水比使用R的专家(13.6万)高4-5%,这与世界上的情况相当一致。
有关俄罗斯数据科学领域状况的更多详细信息,请参阅
带有图表的
完整报告版本 。 我们的研究并没有声称自己具有绝对代表性,因为我们通过显示数据科学界相当活跃的一部分的渠道来分发与调查的链接:
- 在Slack开放数据科学(ODS)社区中,
- 直接发送给拥有数据分析部门的公司,
- 分发给SmartData会议参与者,分发给主题用户组等。
但是,我们的评论对俄罗斯的行业有了一定的了解。
对于那些想要进行独立分析并得出自己结论的人,可以使用
初始数据 。 为了维护机密性,所有未解决问题的答案均已删除。
我们计划继续监视数据科学领域的趋势,并进行类似的调查。 如果您想参与我们的未来研究,请订阅
我们报告的最后一页。 我们很高兴在受访者中见到您。