علوم البيانات في روسيا: اللغات والتقنيات والمزيد

في ديسمبر 2017 ، أجرينا مسحًا بين مجموعات مختلفة من المستخدمين الروس ، بطريقة أو بأخرى تتعلق بتحليل البيانات. نود معرفة لغات البرمجة والتقنيات والأدوات التي يستخدمها المتخصصون في هذا المجال. هذا مهم أيضًا لتطوير PyCharm ، الذي يحظى بشعبية كبيرة بين المحللين. إن الفهم الأفضل لاحتياجات متخصصي تحليل البيانات سيجعل منتجاتنا أكثر راحة.

في وقت لاحق أجرينا دراسة مماثلة في بلدان أخرى ، وأتيحت لنا الفرصة لمقارنة الوضع في روسيا مع العالم. هنا سوف نشارك الملاحظات الأكثر إثارة للاهتمام ، يتم نشر بيانات أكثر اكتمالاً عن روسيا والرسوم البيانية على موقعنا . بيانات المصدر متاحة هنا (تم حذف جميع إجابات الأسئلة المفتوحة من أجل الحفاظ على السرية). قريباً سننشر نتائج دراسة عالمية.

الصورة

الملف الشخصي المتخصص في علوم البيانات

حللت الدراسة ردود 373 روسيًا و 1965 مستجيبًا من جميع أنحاء العالم. حسب العمر ، لا يختلف المتخصصون الروس في مجال علوم البيانات عمليا عن زملائهم الأجانب ، ولكن المتخصصين الأجانب لديهم مستوى أعلى من التعليم الرسمي. من بين الروس الذين شملهم الاستطلاع ، 59٪ حصلوا على درجة البكالوريوس ، و 20٪ فقط حصلوا على درجة الماجستير ، بينما 45٪ من المستطلعين في العالم حصلوا على درجة البكالوريوس ، و 36٪ حصلوا على درجة الماجستير.

مجال علم البيانات حديث العهد نسبيًا ، حيث يعمل فيه حوالي نصف المشاركين (46٪) لمدة تتراوح من عام إلى 3 أعوام. و 18٪ فقط لديهم خبرة 3-6 سنوات. من المهم أنه بالنسبة للغالبية العظمى من المستجيبين (أولئك الذين لديهم خبرة من 0 إلى 6 سنوات ، وأكثر من 90 ٪) ، فإن متوسط ​​العمر ليس له علاقة بالتجربة. ربما يرجع ذلك إلى شباب المجال وحقيقة أن الأشخاص من المناطق ذات الصلة ينتقلون بنشاط إليها.

يحل الكثير من الأشخاص مهام تحليل البيانات إلى جانب البرمجة ومسؤوليات العمل الأخرى. أشار 50٪ فقط من المجيبين (36٪ في العالم ، وفقًا لمسحنا) إلى تحليل البيانات باعتباره نشاطهم المهني الرئيسي ، و 33٪ من المجيبين يجمعون بين تحليل البيانات ومسؤولياتهم المهنية الرئيسية.

لغات البرمجة

بايثون هي لغة تحليل البيانات السائدة في روسيا والعالم. في الخارج ، تبلغ نسبة استخدام Python و R في مجال تحليل البيانات 73٪ و 40٪ ، على التوالي ، في روسيا Python أكثر شعبية من R - 84٪ مقابل 25٪.

التكنولوجيا والأدوات

يستخدم أكثر من 60٪ من المجيبين بطريقة أو بأخرى أدوات التعلم العميق. TensorFlowTM هو الإطار الأكثر شعبية - 49٪ ، Keras في المركز الثاني بنسبة 39٪.

يستخدم Apache Spark من قبل 40٪ من المستجيبين ، بما في ذلك 92٪ من الذين يبرمجون على Scala كل شخص تكون لغة سكالا هي اللغة الرئيسية يستخدم Apache Spark. تبلغ نسبة أولئك الذين يبرمجون في Python فقط ويستخدمون Spark حوالي 14٪ (إذا لم تأخذ في الاعتبار القدرة على استخدام Spark من Lua و Julia ، فستزداد هذه النسبة إلى 20٪).

الراتب

المعرفة بتقنيات البيانات الضخمة هي مفتاح ارتفاع الأجور. متوسط ​​راتب أخصائي خارج حزمة تكنولوجيا البيانات الضخمة هو 127 ألف روبل. تختلف رواتب المتخصصين اختلافًا كبيرًا اعتمادًا على المؤهلات والخبرة ، ولكن في المتوسط ​​هم أعلى بكثير في مجال تحليل البيانات الضخمة. ومن المثير للاهتمام ، على الرغم من شعبية Apache Spark ، فإن المستجيبين الذين لديهم معرفة بهذه التكنولوجيا أقل شأنا في الرواتب للمتخصصين الذين يمتلكون Apache Pig و Apache Hive - 157 ألف روبل مقابل 177 و 166 ألف على التوالي. إن معرفة Apache Hadoop / MapReduce تجعل من الممكن كسب متوسط ​​150 ألف روبل.

من حيث اعتماد الرواتب على لغة البرمجة ، نحن لا نختلف عن العالم كله: المتخصصون في Scala يكسبون أكثر من البقية - بمتوسط ​​173 ألف روبل. ويتبعهم مستجيبون لديهم معرفة بـ Java - 158 ألفًا ، و Python - 143 ألفًا. وفي الوقت نفسه ، فإن رواتب المتخصصين الذين يستخدمون Python أعلى بنسبة 4-5 ٪ من المتخصصين الذين يستخدمون R (136 ألفًا) ، وهو ما يتوافق تمامًا مع الوضع في العالم .

يمكن العثور على مزيد من التفاصيل حول حالة مجال علوم البيانات في روسيا في النسخة الكاملة من التقرير مع الرسوم البيانية . لا تدعي دراستنا أنها تمثيلية تمامًا ، نظرًا لأننا وزعنا الرابط إلى الاستبيان في القنوات حيث يتم تقديم جزء نشط إلى حد ما من مجتمع علوم البيانات:

  • في مجتمعات Slack Open Data Science (ODS) ،
  • يتم إرسالها مباشرة إلى الشركات التي لديها وحدات تحليل البيانات ،
  • يتم توزيعها على المشاركين في مؤتمر SmartData وتوزيعها في مجموعات المستخدمين المواضيعية ، إلخ

ومع ذلك ، تقدم مراجعتنا فكرة معينة عن الصناعة في روسيا.

بالنسبة لأولئك الذين يرغبون في إجراء تحليل مستقل واستخلاص استنتاجاتهم الخاصة ، تتوفر البيانات الأولية . تم حذف جميع إجابات الأسئلة المفتوحة من أجل الحفاظ على السرية.

نخطط لمواصلة مراقبة الاتجاهات في مجال علوم البيانات وإجراء استبيانات مماثلة. إذا كنت ترغب في المشاركة في بحثنا المستقبلي ، فاشترك في الصفحة الأخيرة من تقريرنا . سنكون سعداء لرؤيتك بين المشاركين.

Source: https://habr.com/ru/post/ar418113/


All Articles