Im Dezember 2017 haben wir eine Umfrage unter verschiedenen Gruppen russischer Benutzer durchgeführt, die sich auf die eine oder andere Weise auf die Datenanalyse bezogen. Wir möchten wissen, welche Programmiersprachen, Technologien und Tools von Spezialisten auf diesem Gebiet verwendet werden. Dies ist auch wichtig für die Entwicklung von
PyCharm , das bei Analysten bereits sehr beliebt ist. Ein besseres Verständnis der Bedürfnisse von Datenanalysespezialisten macht unser Produkt noch komfortabler.
Später führten wir eine ähnliche Studie in anderen Ländern durch und hatten die Gelegenheit, die Situation in Russland mit der Welt zu vergleichen. Hier werden wir die interessantesten Beobachtungen teilen, vollständigere Daten zu Russland und Infografiken werden
auf unserer Website veröffentlicht . Die Quelldaten finden Sie
hier (alle Antworten auf offene Fragen wurden aus Gründen der Vertraulichkeit gelöscht). In Kürze werden wir auch die Ergebnisse einer weltweiten Studie veröffentlichen.
Profil eines Data Science-SpezialistenDie Studie analysierte die Antworten von 373 Russen und 1965 Befragten aus der ganzen Welt. Nach Alter unterscheiden sich russische Spezialisten auf dem Gebiet der Datenwissenschaft praktisch nicht von ihren ausländischen Kollegen, aber ausländische Spezialisten verfügen über ein höheres formales Bildungsniveau. Unter den befragten Russen haben 59% einen Bachelor-Abschluss und nur 20% einen Master-Abschluss, während weltweit 45% der Befragten einen Bachelor-Abschluss und 36% einen Master-Abschluss haben.
Das Gebiet der Datenwissenschaft ist relativ jung, etwa die Hälfte der Befragten (46%) arbeitet seit 1 bis 3 Jahren darin. Und nur 18% haben 3-6 Jahre Erfahrung. Es ist bezeichnend, dass für die überwiegende Mehrheit der Befragten (mit einer Erfahrung von 0 bis 6 Jahren und solchen> 90%) das Durchschnittsalter nichts mit Erfahrung zu tun hat. Dies ist wahrscheinlich auf die Jugend der Sphäre und die Tatsache zurückzuführen, dass Menschen aus verwandten Bereichen aktiv in diese Sphäre ziehen.
Viele Menschen lösen Datenanalyseaufgaben zusammen mit Programmier- und anderen Aufgaben. Nur 50% der Befragten (laut unserer Umfrage 36% weltweit) gaben die Datenanalyse als ihre berufliche Haupttätigkeit an. 33% der Befragten kombinieren die Datenanalyse mit ihrer beruflichen Hauptverantwortung.
ProgrammiersprachenPython ist die dominierende Datenanalysesprache in Russland und der Welt. Im Ausland beträgt der Anteil der Verwendung von Python und R im Bereich der Datenanalyse 73% bzw. 40%. In Russland ist Python viel beliebter als R - 84% gegenüber 25%.
Technologie und WerkzeugeMehr als 60% der Befragten verwenden auf die eine oder andere Weise Deep-Learning-Tools. TensorFlowTM ist das beliebteste Framework - 49%, Keras mit 39% auf dem zweiten Platz.
Apache Spark wird von 40% der Befragten verwendet, darunter 92% derjenigen, die auf Scala programmieren. Jeder, für den Scala die Hauptsprache ist, verwendet Apache Spark. Der Anteil derer, die nur in Python programmieren und Spark verwenden, liegt bei etwa 14% (wenn Sie die Fähigkeit zur Verwendung von Spark von Lua und Julia nicht berücksichtigen, erhöht sich dieser Prozentsatz auf 20%).
GehaltDas Wissen über Big-Data-Technologien ist der Schlüssel zu hohen Löhnen. Das durchschnittliche Gehalt eines Spezialisten außerhalb des Big-Data-Technologie-Stacks beträgt 127.000 Rubel. Die Gehälter von Spezialisten variieren je nach Qualifikation und Erfahrung erheblich, sind jedoch im Bereich der Big-Data-Analyse im Durchschnitt viel höher. Interessanterweise sind die Gehälter von Befragten mit Kenntnissen dieser Technologie trotz der Popularität von Apache Spark schlechter als die von Spezialisten, die Apache Pig und Apache Hive besitzen - 157.000 Rubel gegenüber 177 bzw. 166.000. Das Wissen über Apache Hadoop / MapReduce ermöglicht es, durchschnittlich 150.000 Rubel zu verdienen.
In Bezug auf die Abhängigkeit der Gehälter von der Programmiersprache unterscheiden wir uns nicht von der ganzen Welt: Die Spezialisten der Scala verdienen mehr als die anderen - durchschnittlich 173.000 Rubel. Ihnen folgen Befragte mit Java-Kenntnissen - 158.000 und Python - 143.000. Darüber hinaus sind die Gehälter von Spezialisten, die Python verwenden, um 4-5% höher als die von R (136.000), was mit der Situation in der Welt durchaus übereinstimmt .
Weitere Einzelheiten zum Stand der Data Science-Sphäre in Russland finden Sie in der
Vollversion des Berichts mit Infografiken . Unsere Studie erhebt keinen Anspruch auf absolute Repräsentativität, da wir den Link zur Umfrage in Kanälen verteilt haben, in denen ein ziemlich aktiver Teil der Data Science-Community präsentiert wird:
- in den Slack Open Data Science (ODS) Communities,
- direkt an Unternehmen mit Datenanalyseeinheiten gesendet,
- verteilt an SmartData-Konferenzteilnehmer, verteilt in thematische Benutzergruppen usw.
Unsere Überprüfung gibt jedoch einen bestimmten Eindruck von der Branche in Russland.
Für diejenigen, die eine unabhängige Analyse durchführen und ihre eigenen Schlussfolgerungen ziehen möchten, stehen die
ersten Daten zur Verfügung. Alle Antworten auf offene Fragen wurden aus Gründen der Vertraulichkeit gelöscht.
Wir planen, weiterhin Trends im Bereich Data Science zu überwachen und ähnliche Umfragen durchzuführen. Wenn Sie an unserer zukünftigen Forschung teilnehmen möchten, abonnieren Sie die letzte Seite
unseres Berichts . Wir würden uns freuen, Sie unter unseren Befragten zu sehen.