Nós do
The Economist levamos a visualização de dados muito a sério. Todas as semanas, publicamos cerca de 40 gráficos nas versões impressa e online, além de aplicativos. Em todos os lugares, nos esforçamos para representar com precisão os números, para que melhor ilustrem o tópico. Mas às vezes cometemos erros. É importante aprender essas lições para que você não cometa erros no futuro. Certamente nossa experiência será útil para você.
Mergulhando nos arquivos, encontrei alguns exemplos instrutivos. Os crimes contra a visualização de dados são agrupados em três categorias. Estes são gráficos que:
- enganar;
- confuso;
- não pode fazer sentido.
Para cada uma delas, é mostrada uma versão revisada, que ocupa a mesma quantidade de espaço - um fator importante para a publicação impressa.
(Nota: a maioria dos gráficos "originais" é publicada antes do reprojeto. Os gráficos aprimorados são compilados de acordo com as novas especificações. Os dados são os mesmos).
Gráficos enganosos
Vamos começar com o pior dos crimes: apresentar dados de maneira enganosa. Nós nunca fazemos isso de propósito! Mas às vezes isso acontece. Vamos considerar três exemplos do nosso arquivo.
Erro: truncamento
( dados em csv )Este gráfico mostra o número médio de curtidas no Facebook nas páginas à esquerda. O objetivo do gráfico era mostrar a diferença nos gostos dos cargos de Corbin e outros.
A programação original não apenas subestima o número de curtidas de Corbin, mas também exagera o desempenho de outros participantes (aqui
está outro exemplo de um erro desse tipo). Na versão revisada, a coluna do Sr. Corbin está totalmente especificada. Todas as outras colunas ainda estão visíveis.
Outra singularidade é a escolha da cor. Na tentativa de imitar o esquema de cores Labor, usamos três tons de laranja / vermelho atribuídos a 1) Corbin, 2) a outros deputados e 3) a partidos / grupos. Isso não é explicado em nenhum lugar. Embora a lógica possa ser óbvia para muitos, faz pouco sentido para aqueles que não estão muito familiarizados com a política britânica.
Erro: o efeito do relacionamento devido ao ajuste das escalas
Um exemplo raro de correlação perfeita? Na verdade não ( dados em csv )O gráfico acima é de um artigo para perda de peso de cães. À primeira vista, parece que o peso e a circunferência do pescoço do cão estão perfeitamente correlacionados. Mas isso é verdade? Apenas até certo ponto.
No gráfico, as duas escalas são reduzidas em três unidades (de 21 para 18 à esquerda; de 45 para 42 à direita). Mas em termos percentuais, a escala esquerda é reduzida em 14% e a direita - em 7%. No gráfico revisado, mantive a escala dupla, mas ajustei os intervalos para refletir uma mudança proporcional comparável.
Dado o tema divertido deste diagrama, o erro pode parecer relativamente pequeno. No final, o significado é o mesmo nas duas versões. Mas a conclusão é importante: se os dois gráficos estiverem muito próximos um do outro, você provavelmente precisará examinar mais de perto as escalas.
Erro: método de visualização incorreto
As opiniões sobre o Brexit são quase tão instáveis quanto as negociações sobre ele ( dados em csv )Publicamos este gráfico de pesquisa em nosso aplicativo de notícias Espresso. Mostra a relação com os resultados do referendo da UE na forma de um gráfico de linhas. A julgar pelos dados, os entrevistados flutuam bastante em suas opiniões: os resultados saltam alguns pontos percentuais.
Em vez de uma curva suave para exibição de tendências, indicamos os valores reais de cada pesquisa. Isso aconteceu principalmente porque nossa ferramenta de gráficos não sabia como criar linhas suaves. Somente recentemente dominamos programas mais avançados para processar dados estatísticos (por exemplo, R) com métodos de visualização mais sofisticados. Hoje, qualquer pessoa pode criar uma curva suave para pesquisas, como uma opção melhorada no topo.
Ainda há uma violação da escala. O gráfico de origem dispersa os dados mais amplamente do que deveria. Na versão revisada, adicionei um pouco de espaço entre o início da escala e o ponto de dados mínimo. Francis Gagnon oferece uma
boa fórmula para tais situações: deixe livre pelo menos 33% da área abaixo do gráfico de linhas, que não começa do zero.
Gráficos confusos
Não é um crime tão sério como enganoso, mas se o cronograma for difícil de entender, isso é um sinal de um trabalho de visualização mal feito.
Erro: gráficos muito obscuros
... o que? ( dados em csv )Jornalistas do
The Economist procuram, de uma maneira boa, confundir o leitor. Mas às vezes vamos longe demais. O
gráfico acima mostra o déficit comercial dos EUA em bens e o número de pessoas empregadas na fabricação.
Este gráfico é incrivelmente difícil de entender. Ela tem dois problemas principais. Primeiro, os valores de uma série (déficit comercial) são completamente negativos, enquanto outros (emprego na indústria) são positivos. É difícil combinar dados tão diferentes em um diagrama. A “solução” óbvia leva a um segundo problema: duas linhas de dados não têm uma linha de base comum. A linha de base do déficit comercial está no topo do gráfico (destacada em vermelho, passa pela metade do gráfico). A linha de base da escala correta está na parte inferior.
O gráfico revisado mostra que não havia necessidade de combinar as duas séries de dados. A relação entre déficits comerciais e emprego industrial permanece clara e ocupa apenas um pouco mais de espaço.
Erro: cores emaranhadas
50 tons de azul ( dados em csv )Este gráfico compara os gastos do governo com benefícios de aposentadoria com a proporção de pessoas com mais de 65 anos em vários países, com ênfase particular no Brasil. Para não aumentar o gráfico, o visualizador assinou apenas alguns países e os destacou em azul. A média da OCDE é destacada em azul claro.
O visualizador (fui eu!) Ignorou o fato de que a mudança de cor geralmente implica uma mudança de categoria. Aqui, também, o leitor pode ter uma idéia que todos os países azuis parecem pertencer a um grupo diferente dos países azuis. Isto não é verdade. A única diferença é que eles simplesmente não são assinados.
Na versão revisada, a cor é a mesma para todos. Mudei apenas a intensidade para os países assinados. A tipografia faz o resto: o Brasil, o país em foco, está em negrito e a média da OCDE está em itálico.
Gráficos que não fazem sentido
Erros nesta última categoria são menos óbvios. Esses diagramas não são enganosos nem muito confusos. Eles simplesmente não podem justificar sua existência. Eles foram construídos incorretamente ou tentamos compactar muitas informações em um espaço muito pequeno.
Erro: Muitos detalhes.
"Quanto mais flores, melhor!" ( dados em csv )Um verdadeiro arco-íris! Publicamos
este gráfico na coluna do excedente do orçamento alemão. Ele mostra o saldo orçamentário e o saldo atual de dez países na área do euro. Com tantas cores - algumas das quais são bastante difíceis de distinguir ou até de serem vistas porque os valores são muito pequenos - é difícil entender o significado do gráfico. Isso quase bloqueia o cérebro, fazendo o leitor pular o gráfico e seguir em frente. E, mais importante, como não fornecemos números para todos os países da zona do euro, não faz sentido adicionar dados.
Reli o artigo para encontrar uma maneira de simplificar o diagrama. O texto refere-se à Alemanha, Grécia, Holanda, Espanha e zona do euro. Na versão revisada do gráfico, decidi selecioná-los apenas e coloquei o restante na categoria "Outros" (o saldo total da conta corrente no gráfico processado é menor que no gráfico original, devido à revisão dos dados do Eurostat).
Erro: muitos dados, espaço insuficiente
Eu desisto ( dados em csv )Limitados pelo espaço na página, muitas vezes somos tentados a colocar todos os dados em um slot pequeno demais. Embora isso economize um espaço valioso na página, há consequências, como pode ser visto neste gráfico a partir de
março de 2017 . Este é um gráfico para um artigo afirmando que os homens dominam a ciência. Todas as posições são igualmente interessantes e relevantes para o artigo. Porém, é difícil assimilar essa quantidade de dados: aqui estão quatro categorias de áreas de pesquisa, bem como a proporção de autores de patentes em cada país.
Após reflexão, decidi não mudar esse diagrama. Se você salvar todos os dados, o gráfico será muito grande para um artigo pequeno. Nesses casos, é melhor cortar algo. Como alternativa, você pode mostrar um certo indicador médio: por exemplo, a participação média de artigos de mulheres em todas as áreas. (Por favor, deixe-me saber se você tem idéias sobre como visualizar isso em um espaço confinado!)
As melhores práticas estão se desenvolvendo rapidamente: o que é aceitável hoje, será condenado amanhã. O tempo todo, métodos novos e mais avançados aparecem. Você já cometeu um “crime infográfico” que pode ser facilmente corrigido?