
Seule une personne qui n'a pas de connexions externes avec le monde extĂ©rieur n'a pas entendu parler des mĂ©gadonnĂ©es aujourd'hui. Sur HabrĂ©, le sujet d'analyse Big Data et les sujets connexes sont populaires. Mais les non-spĂ©cialistes qui voudraient se consacrer Ă l'Ă©tude du Big Data, il n'est pas toujours clair quelles perspectives ce domaine a, oĂč l'analyse du Big Data peut ĂȘtre appliquĂ©e et sur quoi un bon analyste peut compter. Essayons de le comprendre.
Chaque annĂ©e, le volume d'informations gĂ©nĂ©rĂ©es par une personne augmente. D'ici 2020, le volume de donnĂ©es stockĂ©es passera Ă 40-44 zettaoctets (1 ST ~ 1 milliard de Go). D'ici 2025, jusqu'Ă environ 400 zettaoctets. En consĂ©quence, la gestion des donnĂ©es structurĂ©es et non structurĂ©es Ă l'aide de la technologie moderne est un domaine qui prend de plus en plus d'importance. IntĂ©ressĂ© par les mĂ©gadonnĂ©es, tant les entreprises individuelles que les Ătats entiers
Soit dit en passant, c'est en train de discuter du boom de l'information et des méthodes de traitement des données générées par l'homme que le terme Big Data est apparu. On pense que le rédacteur en chef du magazine Nature, Clifford Lynch, l'a proposé pour la premiÚre fois en 2008.
Depuis lors, le marché du Big Data a augmenté de plusieurs dizaines de pour cent par an. Et cette tendance, selon les experts, se poursuivra. Ainsi, selon
Frost & Sullivan, le marché mondial total de l'analyse des mégadonnées devrait atteindre 20,2 milliards de dollars en 2021. La croissance annuelle sera d'environ 35,9%.
Pourquoi Big Data Analytics?
Il vous permet d'identifier des informations extrĂȘmement prĂ©cieuses Ă partir d'ensembles de donnĂ©es structurĂ©es ou non structurĂ©es. GrĂące Ă cela, une entreprise, par exemple, peut dĂ©terminer les tendances, prĂ©voir les indicateurs de production et optimiser ses propres dĂ©penses. Il est clair que pour rĂ©duire les coĂ»ts, les entreprises sont prĂȘtes Ă introduire les derniĂšres solutions.
Technologies et méthodes d'analyse utilisées pour analyser le Big Data:
- Exploration de données;
- crowdsourcing;
- mélange et intégration des données;
- apprentissage automatique;
- réseaux de neurones artificiels;
- reconnaissance de formes;
- analyse prédictive;
- modélisation par simulation;
- analyse spatiale;
- analyse statistique;
- visualisation des données analytiques.
L'analyse des Big Data dans le monde
L'analyse du Big Data est désormais utilisée par plus de 50% des entreprises dans le monde. Malgré le fait qu'en 2015, ce chiffre n'était que de 17%. Le Big Data est le plus activement utilisé par les entreprises qui travaillent dans le domaine des télécommunications et des services financiers. Viennent ensuite les entreprises spécialisées dans les technologies de la santé. Utilisation minimale de l'analyse du Big Data dans les entreprises éducatives: dans la plupart des cas, les représentants de ce domaine ont annoncé leur intention d'utiliser la technologie dans un avenir proche.
Aux Ătats-Unis, l'analyse du Big Data est la plus utilisĂ©e: plus de 55% des entreprises de divers domaines utilisent cette technologie. En Europe et en Asie, la demande pour l'analyse des mĂ©gadonnĂ©es n'est pas beaucoup plus faible - environ 53%.
Et qu'en est-il de la Russie?
Selon les analystes d'IDC, la
Russie est le plus grand marché régional d'analyse de Big Data . La croissance du marché de ces solutions en Europe centrale et orientale est assez active, chaque année cet indicateur augmente de 11%. D'ici 2022, il atteindra quantitativement 5,4 milliards de dollars.
à bien des égards, un développement aussi rapide du marché est causé par la croissance de cette sphÚre en Russie. En 2018, les revenus de la vente de solutions pertinentes en Fédération de Russie ont représenté 40% de l'investissement total dans les technologies de traitement des Big Data dans toute la région.
En Fédération de Russie, les entreprises des secteurs bancaire et public, l'industrie des télécommunications et l'industrie dépensent le plus pour le traitement des mégadonnées.
Que fait Big Data Analyst et combien reçoit-il en Russie?
L'analyste Big Data est chargé d'explorer de grandes quantités d'informations, à la fois partiellement structurées et non structurées. Pour les organisations bancaires, ce sont les transactions, pour les opérateurs, les appels et le trafic, et dans le commerce de détail, les visites et achats clients. Comme mentionné ci-dessus, l'analyse du Big Data révÚle les liens entre divers facteurs d'une «histoire d'informations brutes», par exemple, un processus de production ou une réaction chimique. Sur la base des données d'analyse, de nouvelles approches et solutions sont développées dans divers domaines - de la production à la médecine.
Compétences nécessaires à l'analyse du Big Data:
- La capacitĂ© de comprendre rapidement les caractĂ©ristiques de la zone pour laquelle l'analyse est effectuĂ©e, de vous immerger dans les aspects de la sphĂšre souhaitĂ©e. Cela peut ĂȘtre la vente au dĂ©tail, l'industrie pĂ©troliĂšre et gaziĂšre, la mĂ©decine, etc.
- Connaissance des méthodes d'analyse statistique des données, construction de modÚles mathématiques (réseaux de neurones, réseaux bayésiens, clustering, régression, factorielle, analyses de variance et corrélation, etc.).
- Pour pouvoir extraire des données de différentes sources, les convertir pour analyse, télécharger vers la base de données analytique.
- MaĂźtrise SQL.
- Connaissance de l'anglais Ă un niveau suffisant pour lire en toute transparence la documentation technique.
- Connaissance de Python (au moins les bases), de Bash (il est trÚs difficile de s'en passer dans le processus de travail), et il est souhaitable de connaßtre les bases de Java et Scala (nécessaires pour l'utilisation active de Spark, l'un des cadres les plus populaires pour travailler avec les mégadonnées).
- Capacité à travailler avec Hadoop.
Eh bien, combien gagne un analyste Big Data?
Les spécialistes du Big Data sont en pénurie, la demande dépasse l'offre. En effet, les entreprises s'entendent: pour le développement, de nouvelles technologies sont nécessaires, et pour le développement des technologies, des spécialistes sont nécessaires.
Ainsi, Data Scientist et Data Analyst aux Ătats-Unis sont
entrés dans le top 3 des meilleures professions de 2017 selon l'agence de recrutement Glassdoor. Le salaire moyen de ces professionnels en Amérique commence à 100 000 $ par an.
En Russie, les spécialistes de l'apprentissage automatique obtiennent de 130 à 300 000 roubles par mois, les analystes du big data de 73 à 200 000 roubles par mois. Tout dépend de l'expérience et des qualifications. Bien sûr, il y a des postes vacants avec un salaire inférieur et il y a plus de postes vacants. Demande maximale d'analystes Big Data à Moscou et Saint-Pétersbourg. Sans surprise, Moscou représente environ 50% des postes vacants actifs (selon hh.ru). La demande est beaucoup moins importante à Minsk et à Kiev. Il convient de noter que certains postes vacants offrent un horaire flexible et un travail à distance. Mais en général, les entreprises ont besoin de spécialistes qui travaillent au bureau.
Au fil du temps, nous pouvons nous attendre à une augmentation de la demande d'analystes Big Data et de représentants de spécialités connexes. Comme mentionné ci-dessus, personne n'a annulé la pénurie de personnel dans le domaine de la technologie. Mais, bien sûr, pour devenir analyste Big Data, vous devez apprendre et travailler, en améliorant à la fois les compétences mentionnées ci-dessus et les compétences supplémentaires. L'une des opportunités pour commencer le chemin de l'analyse du Big Data est
de vous inscrire Ă un cours de Geekbrains et de vous essayer Ă travailler avec le Big Data.