
J'ai souvent entendu l'opinion que la tâche des analystes est de montrer des chiffres franchement «tristes» de manière à ce que tout se passe comme prévu. Peut-être que cela se produit quelque part, mais dans gamedev, le contraire est vrai. Nous devons fournir les données les plus objectives pour que les bonnes décisions soient prises dans le projet. Et rendez ces données compréhensibles.
C'est souvent plus difficile que d'attirer avec de beaux graphismes.Par conséquent, j'ai compilé plusieurs principes de base de la visualisation que j'applique dans mon travail (une liste de sources à la fin). Il est utile si vous rédigez des rapports, préparez une présentation ou si vous souhaitez simplement transmettre la signification de certains chiffres. L'essentiel: pour faire un bon emploi du temps, vous n'avez pas besoin d'être un artiste talentueux ou de posséder magistralement matplotlib / ggplot2. Allons-y.
Pourquoi le simple Excel (et parfois le crayon et le papier) est-il suffisant pour un bon graphique?
Cela découle du seul but de la visualisation - transmettre votre idée. Par conséquent, tout de suite: il n'y a pas de «beaux» ou de «bons» horaires - qu'ils aident à transmettre une idée ou non. Et sinon, peu importe à quel point le calendrier est beau, il n'est pas nécessaire.
Le processus de création d'un calendrier qui atteindra son objectif peut être divisé en 4 étapes [1]:

Tout commence par une idée. Que voulez-vous que les lecteurs ou les téléspectateurs comprennent? Sur cette base, le type de diagrammes est sélectionné, puis l'attention est attirée sur les endroits importants et tout ce qui interfère avec la transmission de la pensée est supprimé.
Maintenant, plus sur chaque article.
Idée
Commençons par formuler l'idée et comment elle affecte les graphiques. Prenons un exemple canonique: un signe «Ventes par région» avec un ensemble de données très simple (8 chiffres, 2 entreprises) [2].
Sous cette forme, elle est difficile à percevoir et aucune idée n'en découle directement:

Pour montrer les connexions importantes plus facilement et plus clairement - nous avons besoin d'un diagramme. Et selon le type de graphique choisi, une pensée complètement différente apparaîtra au premier plan.

Par exemple, la seule chose que nous pouvons considérer à première vue dans le tableau ci-dessus est que la structure des ventes des deux sociétés est différente. Pour lire toute autre information, vous devez comprendre plus profondément, et cela n'aide pas à transmettre l'idée.
Un autre graphique, les mêmes données:

Ici, en plus de la différence de structure, nous montrons déjà comment les entreprises se partagent les parts de ventes dans différentes régions. Si vous le lisez de gauche à droite (comme la plupart des gens le feront), l'idée sera la suivante: l'entreprise B (à gauche) a la plus petite part des ventes dans le sud, et l'entreprise A (à droite) a la plus grande part. Et vice versa dans le nord.
Un autre graphique:

Si nous utilisons un histogramme de ce type, alors l'attention sera principalement attirée sur la comparaison des entreprises: en termes de revenus au nord, l'entreprise B devance l'entreprise A, à l'est et à l'ouest elles concurrencent, et au sud, l'entreprise B est derrière l'entreprise A.
Les mêmes données, seulement 8 chiffres, mais selon la présentation, elles expriment des idées différentes.
Par conséquent, nous formulons d'abord une pensée, puis choisissons le type de diagramme approprié.
Types de graphiques
Passons en revue les types de diagrammes les plus courants (que vous pouvez trouver dans Excel, tout BI ou d'autres outils analytiques) et voyons quel type de comparaisons (et quelles idées) sont les mieux utilisées pour eux [2].
Graphique circulaireCommençons par le graphique à secteurs et les variations «préférés» (graphiques en anneau). Dans l'interprétation classique, son objectif principal est de comparer les parts lors de l'affichage d'une structure statique.
Composantes d'un bon jeuMais il y a aussi une opinion que le but principal de ce diagramme est la publicité et de belles images.
À bien des égards, ce sont les graphiques à secteurs qui permettent aux consultants commerciaux de vendre des présentations de 30 pages il y a plusieurs millions d'années. Non? Voici les premières images à la demande de "consulting", "analytics", "BI":
Des camemberts, ils sont partoutPresque aucune image publicitaire ne peut se passer de camemberts (ou de leurs variétés). Ce n'est pas tant un outil qu'un symbole.
Et pour la visualisation de données réelles, cela ne convient pas.
Premièrement, la portée de ce diagramme est très étroite. Une structure statique doit être montrée pas si souvent - un petit nombre de cas. Et deuxièmement, beaucoup de gens ne lisent pas bien les parts dans les camemberts, surtout si quelqu'un les rend volumineux (folie). Et troisièmement, le même type de comparaison peut être exprimé dans d'autres diagrammes et il ne fera que s'améliorer.
Par conséquent, il vaut mieux oublier les graphiques circulaires. Eh bien, si vous faites de la publicité ou souhaitez ajouter de la solidité à votre présentation, l'option n'est pas si mauvaise.
Graphique à barres (horizontal)Elle est un graphique à barres et sert de comparaison de position. Il montre clairement laquelle des alternatives est la meilleure, qui prend quelle place et comment elles se situent dans le rang.
Comparaison de positionUn graphique à barres est idéal pour les évaluations. Et ce qui est très pratique - les noms longs s'intègrent facilement dans la légende. Dans d'autres types de graphiques, cela peut interférer.
Graphique linéaireLe type suivant est un classique. Le graphique linéaire en russe est souvent appelé simplement un "graphique".
Il est utilisé pour une comparaison temporaire, lorsque vous devez afficher la façon dont l'indicateur a changé au fil du temps, si la dynamique était différente pour différents indicateurs, etc.
Comparaison des indicateurs de performanceQue rechercher lors de la création d'un graphique en courbes:
- L'adéquation de la période. Sinon, le graphique se transformera en un gâchis illisible.
- Le nombre de lignes. Plus de cinq ou sept lignes - un tabou, personne ne les comprendra.

À gauche, la période est trop longue, à droite, une «nouille» de lignes - Échelle. Attention, Line Chart est apprécié de ceux qui vont tromper à l'aide des données [3].

Classic Lies - Jeux d'échelle
Par exemple, si vous montrez le calendrier à gauche lors de la présentation du conseil d'administration et l'appelez rétention, le projet sera probablement fermé. En fait, tout n'est pas si mal: à droite est le même graphique, mais avec une échelle raisonnable, il devient clair que la «baisse» de l'indicateur n'est qu'une fluctuation. En sens inverse, cela fonctionne également, en augmentant l'échelle, vous pouvez masquer la détérioration évidente de l'indicateur.
En résumé, le graphique linéaire est un type de graphique très utile. Surtout dans le développement de jeux, où il est nécessaire de surveiller en permanence les indicateurs, de montrer les changements de dynamique et de suivre le développement des projets.
Graphique de zoneLe type suivant, Area Chart, sert à montrer la structure en dynamique. À quoi faut-il faire attention? Encore une fois - si nous faisons une abondance de couches, le graphique devient illisible. Supprimez les couches supplémentaires et ne laissez que les plus importantes (comment faire, nous parlerons un peu plus loin):
HistogrammeLes histogrammes sont un «marteau universel». Ce type de graphique présente de nombreuses variantes qui peuvent être utilisées dans diverses situations:
- comparaison temporaire;
- distribution de fréquences;
- comparaison des actions (bonjour aux camemberts);
- contribution à la dynamique globale;
- comparaison des alternatives et plus encore.

Pour cette polyvalence, l'histogramme paie une limitation - seul un petit nombre de périodes ou de comparaisons peuvent y être affichées. Sinon, le calendrier devient illisible et cesse de remplir sa tâche.
Conclusion: les graphiques à barres, les graphiques en aires et les graphiques en courbes peuvent couvrir 90% des besoins de visualisation des données. Il suffit d'étudier ces trois outils et de suivre les mêmes 4 étapes pour faire d'excellents diagrammes qui aideront à transmettre vos pensées au public.
Graphique à nuage de pointsPour le dessert, pensez aux tableaux de dispersion ou à une «carte». L'avantage de ce type est qu'il contient beaucoup d'indicateurs. Il a deux axes, la taille du point, la couleur et le symbole - qui peuvent tous potentiellement afficher une dimension supplémentaire. Mais plus les mesures sont entassées, plus il sera difficile à lire. Dans les documents imprimés, lorsque les gens peuvent s'asseoir et comprendre, cela est permis, mais en parlant, il est préférable de ne pas utiliser plus de 2-3 mesures.
Options disponibles: position du point, couleur, taille et symboleGestion de l'emphase et de l'attention
L'idée formulée et le bon type de graphique représentent la moitié du succès. Mais en plus de cela, nous voulons que le lecteur ou le téléspectateur regarde immédiatement au bon endroit. Comment souligner?
FlècheLa manière la plus simple qui est souvent négligée est la flèche. Bon marché et joyeux, mais remplit pleinement sa tâche. Presque n'importe quel outil de capture d'écran peut définir une flèche. Avec lui, vous pouvez toujours attirer l'attention du spectateur sur l'élément graphique souhaité.
CadreUne autre option de la "bon marché" - mettant en évidence le cadre. Il est utilisé quand ils parlent d'une certaine période de temps et veulent mettre en évidence la dynamique de l'indicateur.

Un bon exemple est le graphique du début de l'article lorsque j'ai parlé de jeux avec échelle - vous pouvez parler à la fois de petits changements et de la vue d'ensemble.
DélimiteursEssentiellement, les lignes de séparation sont une variante de la bordure. Ils sont utiles lorsque nous voulons mettre en évidence des périodes «avant / après» lors de l'affichage de la dynamique. Ou, par exemple, un «couloir» de valeurs intéressantes dans un nuage de points.
La couleurUn peu plus d'effort nécessite une mise en évidence des couleurs. Mais ça a l'air "bien rangé".
Dynamique des indicateurs sur une période spécifiqueUne autre variation dans la mise en évidence des couleurs est lorsque nous mettons en évidence les parties du graphique qui nous intéressent avec une teinte plus lumineuse:

Retirer l'excédent
La dernière étape consiste à retirer les éléments en excès. Tout ce qui distraira et gênera la transmission de l'idée principale.
Retour à l'exemple de graphique en aires. Dans ce type, nous supprimons les calques inutiles. Si vous souhaitez souligner que le revenu affiche une augmentation dans une seule catégorie, toutes les autres couches peuvent être masquées.
Réduire les calquesDe nombreux outils d'analyse par défaut créent des graphiques avec des lignes et une échelle. Au lieu de forcer le visualiseur à corréler la hauteur des colonnes et l'échelle, nous pouvons spécifier les nombres sur chaque colonne séparément et supprimer les lignes qui ne sont plus nécessaires. Sera plus propre.

Toujours réduire les unités et arrondir aux chiffres significatifs. Si nous parlons de millions, alors des centaines et des dizaines ne sont certainement pas nécessaires. Premièrement, ce sera moins gênant pour le spectateur, et deuxièmement, il sera plus facile d'ajuster les chiffres sur le graphique.
Et enfin, si soudainement le calendrier résultant ne vous aide toujours pas à faire passer le message, supprimez-le complètement. Pourquoi surcharger une présentation ou un rapport avec un ballast inutile?
Les sources
Jusqu'à présent, il a été possible de parcourir brièvement les principes les plus élémentaires, mais le sujet de la visualisation des données est beaucoup plus large. Si elle est intéressée, je vous recommande de vous familiariser avec les sources sans lesquelles cet article ne serait pas:
[1] Alexander Bogachev,
«Des graphiques qui convainquent tout le monde .
» Le livre est toujours en cours, les chapitres sont progressivement disposés par l'auteur sur le site, mais ce qui s'y trouve est déjà très utile.
[2] Gene Zhelyazny,
"Parlez dans le langage des diagrammes .
" Le classique de la visualisation des données, qui a écrit ce livre alors que les graphiques étaient encore dessinés à la main et il fallait immédiatement réfléchir à comment le corriger.
[3] Darrell Huff,
«Comment mentir à l'aide de statistiques» . Pas moins de travail classique sur la manipulation des données.