Ilmu Data di Rusia: Bahasa, Teknologi, dan Lainnya

Pada bulan Desember 2017, kami melakukan survei di antara berbagai kelompok pengguna Rusia, satu atau lain cara terkait dengan analisis data. Kami ingin tahu bahasa pemrograman, teknologi, dan alat apa yang digunakan oleh spesialis di bidang ini. Ini juga penting untuk pengembangan PyCharm , yang sudah cukup populer di kalangan analis. Pemahaman yang lebih baik tentang kebutuhan spesialis analisis data akan membuat produk kami semakin nyaman.

Kemudian kami melakukan penelitian serupa di negara-negara lain, dan kami berkesempatan untuk membandingkan situasi di Rusia dengan dunia. Di sini kami akan membagikan pengamatan yang paling menarik, data yang lebih lengkap tentang Rusia dan infografis dipublikasikan di situs web kami . Sumber data tersedia di sini (semua jawaban untuk pertanyaan terbuka telah dihapus untuk menjaga kerahasiaan). Segera kami juga akan mempublikasikan hasil studi di seluruh dunia.

gambar

Profil Spesialis Ilmu Data

Studi ini menganalisis tanggapan 373 Rusia dan 1965 responden dari seluruh dunia. Pada usia, spesialis Rusia di bidang Ilmu Data praktis tidak berbeda dari rekan asing mereka, tetapi spesialis asing memiliki tingkat pendidikan formal yang lebih tinggi. Di antara Rusia yang disurvei, 59% memiliki gelar sarjana, dan hanya 20% memiliki gelar master, sedangkan di dunia 45% responden memiliki gelar sarjana, dan 36% memiliki gelar master.

Bidang Ilmu Data relatif muda, sekitar setengah dari responden (46%) telah bekerja di dalamnya selama 1 hingga 3 tahun. Dan hanya 18% yang memiliki pengalaman 3-6 tahun. Penting bagi sebagian besar responden (mereka yang memiliki pengalaman dari 0 hingga 6 tahun, dan lebih dari 90%), usia rata-rata tidak ada hubungannya dengan pengalaman. Ini mungkin karena pemuda bola dan fakta bahwa orang-orang dari daerah terkait secara aktif pindah ke dalamnya.

Banyak orang menyelesaikan tugas analisis data bersamaan dengan pemrograman dan tanggung jawab pekerjaan lainnya. Hanya 50% responden (36% di dunia, menurut survei kami) menunjukkan analisis data sebagai kegiatan profesional utama mereka, 33% responden menggabungkan analisis data dengan tanggung jawab profesional utama mereka.

Bahasa pemrograman

Python adalah bahasa analisis data yang dominan di Rusia dan di dunia. Di luar negeri, pangsa menggunakan Python dan R di bidang analisis data adalah masing-masing 73% dan 40%, di Rusia Python jauh lebih populer daripada R - 84% dibandingkan 25%.

Teknologi dan Alat

Lebih dari 60% responden dalam satu atau lain cara menggunakan alat belajar yang mendalam. TensorFlowTM adalah kerangka kerja paling populer - 49%, Keras di tempat kedua dengan 39%.

Apache Spark digunakan oleh 40% responden, termasuk 92% dari mereka yang memprogram Scala. Semua orang untuk siapa Scala adalah bahasa utama menggunakan Apache Spark. Proporsi mereka yang hanya memprogram dalam Python dan menggunakan Spark adalah sekitar 14% (jika Anda tidak memperhitungkan kemampuan untuk menggunakan Spark dari Lua dan Julia, maka persentase ini akan meningkat menjadi 20%).

Gaji

Pengetahuan tentang teknologi data besar adalah kunci upah tinggi. Gaji rata-rata seorang spesialis di luar tumpukan teknologi data besar adalah 127 ribu rubel. Gaji spesialis bervariasi tergantung pada kualifikasi dan pengalaman, tetapi rata-rata mereka jauh lebih tinggi di bidang analisis data besar. Menariknya, terlepas dari popularitas Apache Spark, responden dengan pengetahuan teknologi ini lebih rendah dalam hal gaji dibandingkan spesialis yang memiliki Apache Pig dan Apache Hive - masing-masing 157 ribu rubel melawan 177 dan 166 ribu. Pengetahuan tentang Apache Hadoop / MapReduce memungkinkan untuk mendapatkan rata-rata 150 ribu rubel.

Dalam hal ketergantungan gaji pada bahasa pemrograman, kami tidak berbeda dari seluruh dunia: spesialis di Scala menghasilkan lebih dari yang lain - rata-rata 173 ribu rubel. Mereka diikuti oleh responden dengan pengetahuan Jawa - 158 ribu, dan Python - 143 ribu. Selain itu, gaji spesialis menggunakan Python adalah 4-5% lebih tinggi daripada yang menggunakan R (136 ribu), yang cukup konsisten dengan situasi di dunia .

Rincian lebih lanjut tentang keadaan lingkup Ilmu Data di Rusia dapat ditemukan dalam versi lengkap dari laporan dengan infografis . Studi kami tidak berpura-pura benar-benar representatif, karena kami mendistribusikan tautan ke survei di saluran di mana bagian yang cukup aktif dari komunitas Ilmu Data diwakili:

  • dalam komunitas Slack Open Data Science (ODS),
  • dikirim langsung ke perusahaan yang memiliki unit analisis data,
  • didistribusikan ke peserta konferensi SmartData, didistribusikan dalam kelompok pengguna tematik, dll.

Namun, tinjauan kami memberikan gagasan tertentu tentang industri di Rusia.

Bagi mereka yang ingin melakukan analisis independen dan menarik kesimpulan sendiri, data awal tersedia. Semua jawaban untuk pertanyaan terbuka telah dihapus untuk menjaga kerahasiaan.

Kami berencana untuk terus memantau tren di bidang Ilmu Data dan melakukan survei serupa. Jika Anda ingin berpartisipasi dalam penelitian masa depan kami, berlangganan halaman terakhir dari laporan kami . Kami akan senang melihat Anda di antara responden kami.

Source: https://habr.com/ru/post/id418113/


All Articles