Le jeudi 4 octobre, j'ai assisté à la conférence DataVizDay à Minsk en tant que conférencier. Je partagerai les idées et les impressions les plus intéressantes de Misnka.
Idées clés:
- 80% de vos efforts se feront avant la BI et la visualisation, car les données sont soit mauvaises, soit très mauvaises, et vous passerez essentiellement du temps à préparer et à collecter des données.
2. Néanmoins, la visualisation crée la valeur de la date de votre produit. Sans visualisation, il s'avère que tout un tas de chiffres. - Malheureusement, très souvent, la visualisation est mauvaise, ils utilisent de mauvaises approches, des types de graphiques et d'histogrammes, des représentations de surcharge avec des détails. En conséquence, nous voyons souvent Kill par powerpoint et l'abondance de données n'ajoute pas de transparence à l'analyse.
- Excel continue de jouer un rôle important dans les processus. Et souvent, les entreprises ne sont pas prêtes à passer à quelque chose de avancé. Mais même sur Excel, vous pouvez créer beaucoup de choses intéressantes, car une bonne analyse commence très probablement par la propreté et la préparation des données, et non par de beaux tableaux de bord.
- Des analyses de rentabilisation - l'utilisation des données sur les réseaux sociaux pour construire une carte des «pensées» sur certaines parties de la ville. Par exemple, à Moscou, tous les tweets sur le centre, mais personne n'écrit sur la vie autour du centre. Il semble ne pas être dans l'espace social, bien que la plupart des habitants de Moscou y vivent.
- Les cas plus traditionnels sont des analyses transversales du contact à la vente. Certes, jusqu'à présent, personne n'est venu avec un cas non seulement d'analyse de bout en bout du contact, mais étant donné que le client peut avoir de nombreux contacts et le dernier contact qui a conduit à l'achat n'est pas le pointeur le plus fiable vers le canal d'attraction. Donc pour l'instant, toutes nos analyses de bout en bout sont quelque peu faussées par l'importance excessive des canaux et la sous-estimation du fait que les gens peuvent avoir de nombreux contacts avec la marque.
- Il y a eu de nombreuses discussions sur les mauvaises visualisations et sur la façon de les corriger. J'ai appris que les gens abusent d'un graphique à secteurs et pour surmonter ce problème, un bloc entier d'une des présentations a été attribué. Les camemberts suggèrent de passer aux barres, aux graphiques sankey ou de remplacer généralement les lignes.
- Deux paradigmes sont en difficulté - l'analyste de données ne devrait que pousser sur les boutons et l'analyste de données devrait être capable d'écrire du code (R / python, SQL) pour ses visualisations et le traitement des données du pipeline. Personnellement, je suis partisan de la deuxième approche, quelque chose comme le paradigme DevOps, uniquement en analytique, lorsque le problème technique ne devrait pas être un obstacle à la livraison de produits analytiques.
- Beaucoup de gens avec qui j'ai parlé se plaignent souvent de ne pas avoir construit un entrepôt de données pratique et doivent terminer beaucoup de choses dans Excel. Et ce malgré le fait qu'ils ont de nombreux Itshniks barbus qui scient ce magasin depuis des années.
- Un autre problème est la forte séparation entre informatique et non informatique. Les gens ne savent pas parler la même langue et ne résolvent pas le problème, mais ne résolvent que les problèmes dans «leur domaine de responsabilité». C'est là que se trouvent les installations de stockage inutiles, et à côté d'eux, les gens scient leur pipeline sur Excel.
- Nous avons discuté avec un collègue d'un autre problème urgent: comment améliorer la maîtrise des données dans l'entreprise. Quels que soient les données et le stockage, leur extraction, interprétation et traitement incorrects signifient de fausses analyses. Et comme les données deviennent de plus en plus démocratiques, chaque utilisateur doit en quelque sorte recevoir une formation minimale pour pouvoir utiliser ces données. Mais souvent dans les entreprises, tout ne va pas si bien avec cette préparation, cette formation et cette documentation sur l'utilisation du référentiel. Si quelqu'un a pu organiser une bonne formation à la maîtrise des données, alors vous pouvez parler - un sujet brûlant et je serai au premier plan.
- Certains sujets ont couvert le travail avec des cartes. Malheureusement, j'ai raté ces discours. Je peux seulement dire que travailler avec des cartes et leur visualisation est un outil vraiment intéressant et important pour gérer une entreprise. Le tableau de bord et Power BI peuvent dessiner diverses cartes, points, polygones et lignes sur les cartes, le cercle regorge de sources de géodonnées que vous pouvez combiner avec les données de votre entreprise et obtenir des informations intéressantes: nouveaux points pour l'entreprise, concentration des concurrents, informations sur la distance jusqu'à vos clients, la relation entre le logement et la consommation et plus encore. Bientôt, j'écrirai mon expérience avec les cartes et les outils que nous avons essayés.
- Mon sujet de rapport a été consacré à l'expérience de l'organisation du travail du département d'analyse scrum. À ce sujet, je ferai un article séparé.
Dois-je aller à la conférence? Oui, ça l'est. Mais attendez-vous simplement à ce qu'une partie comparable des informations utiles que vous devriez obtenir ne provienne pas des rapports, mais de la communication avec des personnes qui ont rencontré des problèmes similaires aux vôtres. Ne vous ennuyez pas lors des pauses café et communiquez avec le plus de monde possible!
Minsk elle-même est une belle ville. Pour une raison quelconque, je m'attendais à une «cuillère gelée». En tout cas, une telle impression reste de la partie internationale de l'aéroport de Minsk. Mais la ville elle-même ressemble à un mélange de Saint-Pétersbourg, de Moscou stalinien et de peu de «Sovka». Dans le même temps, tout est soigné, pas surchargé de bâtiments scellés, beaucoup d'espace et même les maisons «pelles» ont l'air décentes.


Les organisateurs ont promis l'année prochaine de tenir une conférence sur deux sites à Moscou et à Minsk, donc si vous ne venez pas à Minsk, essayez de venir à Moscou.
J'ai également eu un rapport et pas du tout sur la visualisation, mais sur la façon dont nous avons fait la mêlée dans l'équipe d'analyse. Je partagerai des rapports dans le prochain article.