Ciencia de datos en Rusia: idiomas, tecnologías y más

En diciembre de 2017, realizamos una encuesta entre varios grupos de usuarios rusos, de una forma u otra relacionada con el análisis de datos. Nos gustaría saber qué lenguajes de programación, tecnologías y herramientas utilizan los especialistas en este campo. Esto también es importante para el desarrollo de PyCharm , que ya es bastante popular entre los analistas. Una mejor comprensión de las necesidades de los especialistas en análisis de datos hará que nuestro producto sea aún más conveniente.

Más tarde realizamos un estudio similar en otros países, y tuvimos la oportunidad de comparar la situación en Rusia con el mundo. Aquí compartiremos las observaciones más interesantes, los datos más completos sobre Rusia y las infografías se publican en nuestro sitio web . Los datos de origen están disponibles aquí (todas las respuestas a las preguntas abiertas se han eliminado para mantener la confidencialidad). Pronto también publicaremos los resultados de un estudio mundial.

imagen

Perfil de especialista en ciencia de datos

El estudio analizó las respuestas de 373 rusos y 1965 encuestados de todo el mundo. Por edad, los especialistas rusos en el campo de la ciencia de datos prácticamente no difieren de sus colegas extranjeros, pero los especialistas extranjeros tienen un mayor nivel de educación formal. Entre los rusos encuestados, el 59% tiene una licenciatura, y solo el 20% tiene una maestría, mientras que en el mundo el 45% de los encuestados tiene una licenciatura, y el 36% tiene una maestría.

El campo de la ciencia de datos es relativamente joven, aproximadamente la mitad de los encuestados (46%) han estado trabajando en él durante 1 a 3 años. Y solo el 18% tiene experiencia de 3 a 6 años. Es significativo que para la gran mayoría de los encuestados (aquellos con experiencia de 0 a 6 años y> 90%), la edad promedio no tiene nada que ver con la experiencia. Esto probablemente se deba a la juventud de la esfera y al hecho de que personas de áreas relacionadas se están moviendo activamente hacia ella.

Muchas personas resuelven tareas de análisis de datos junto con la programación y otras responsabilidades laborales. Solo el 50% de los encuestados (36% en el mundo, según nuestra encuesta) indicó el análisis de datos como su principal actividad profesional, el 33% de los encuestados combina el análisis de datos con sus principales responsabilidades profesionales.

Lenguajes de programación

Python es el lenguaje de análisis de datos dominante en Rusia y en el mundo. En el extranjero, la proporción de usar Python y R en el campo del análisis de datos es del 73% y 40%, respectivamente, en Rusia Python es mucho más popular que R - 84% frente al 25%.

Tecnologia y Herramientas

Más del 60% de los encuestados de una forma u otra usan herramientas de aprendizaje profundo. TensorFlowTM es el marco más popular: 49%, Keras en segundo lugar con 39%.

Apache Spark es utilizado por el 40% de los encuestados, incluido el 92% de los que programan en Scala. Todos aquellos para quienes Scala es el idioma principal usan Apache Spark. La proporción de aquellos que solo programan en Python y usan Spark es aproximadamente del 14% (si no tiene en cuenta la capacidad de usar Spark de Lua y Julia, entonces este porcentaje aumentará al 20%).

Salario

El conocimiento de las tecnologías de big data es la clave de los altos salarios. El salario promedio de un especialista fuera de la pila de tecnología de big data es de 127 mil rublos. Los salarios de los especialistas varían significativamente según las calificaciones y la experiencia, pero en promedio son mucho más altos en el campo del análisis de big data. Curiosamente, a pesar de la popularidad de Apache Spark, los encuestados con conocimiento de esta tecnología son inferiores en salarios a los especialistas que poseen Apache Pig y Apache Hive: 157 mil rublos contra 177 y 166 mil, respectivamente. El conocimiento de Apache Hadoop / MapReduce hace posible obtener un promedio de 150 mil rublos.

En cuanto a la dependencia de los salarios del lenguaje de programación, no diferimos del mundo entero: los especialistas en Scala ganan más que el resto, un promedio de 173 mil rublos. Les siguen los encuestados con conocimientos de Java: 158 mil y Python: 143 mil. Además, los salarios de los especialistas que usan Python son entre un 4 y un 5% más altos que los que usan R (136 mil), lo cual es bastante consistente con la situación en el mundo .

Se pueden encontrar más detalles sobre el estado de la esfera de la ciencia de datos en Rusia en la versión completa del informe con infografías . Nuestro estudio no pretende ser absolutamente representativo, ya que distribuimos el enlace a la encuesta en canales donde se presenta una parte bastante activa de la comunidad de Data Science:

  • en las comunidades de Slack Open Data Science (ODS),
  • enviado directamente a empresas que tienen unidades de análisis de datos,
  • distribuido a los participantes de la conferencia SmartData, distribuido en grupos de usuarios temáticos, etc.

Sin embargo, nuestra revisión da una cierta idea de la industria en Rusia.

Para aquellos que desean realizar un análisis independiente y sacar sus propias conclusiones, los datos iniciales están disponibles. Todas las respuestas a las preguntas abiertas se han eliminado para mantener la confidencialidad.

Planeamos continuar monitoreando las tendencias en el campo de la ciencia de datos y realizar encuestas similares. Si desea participar en nuestra investigación futura, suscríbase a la última página de nuestro informe . Estaremos encantados de verte entre nuestros encuestados.

Source: https://habr.com/ru/post/es418113/


All Articles