مخططات غير صحيحة: تجربتنا

نحن في The Economist نأخذ التصور المرئي على محمل الجد. نقوم كل أسبوع بنشر حوالي 40 مخططًا في الإصدارات المطبوعة والإلكترونية ، وكذلك في التطبيقات. في كل مكان ، نسعى جاهدين لتمثيل الأرقام بدقة حتى توضح الموضوع بشكل أفضل. لكن في بعض الأحيان نخطئ. من المهم أن تتعلم هذه الدروس حتى لا ترتكب أخطاء في المستقبل. بالتأكيد ستكون تجربتنا مفيدة لك.

غرق في الأرشيف ، وجدت بعض الأمثلة المفيدة. يتم تصنيف الجرائم ضد التصور البيانات في ثلاث فئات. هذه هي الرسوم البيانية التي:

  1. مضللة.
  2. الخلط.
  3. لا يمكن أن يكون له معنى.

لكل منها ، يتم عرض نسخة منقحة ، والتي تأخذ نفس القدر من المساحة - وهو عامل مهم للنشر المطبوع.

(ملاحظة: يتم نشر معظم المخططات "الأصلية" قبل إعادة التصميم. يتم تجميع المخططات المحسّنة وفقًا للمواصفات الجديدة. البيانات هي نفسها).

المخططات المضللة


لنبدأ بأسوأ الجرائم: تقديم البيانات بطريقة مضللة. نحن لا نفعل هذا عن قصد! لكن في بعض الأحيان يحدث هذا. دعنا نفكر في ثلاثة أمثلة من أرشيفنا.

خطأ: اقتطاع



( البيانات في ملف CSV )

يوضح هذا الرسم البياني متوسط ​​عدد الإعجابات على Facebook على الصفحات اليسرى. كان الغرض من المخطط هو إظهار الفرق في أمثال وظائف السيد Corbin وغيره.

لا يقلل الجدول الزمني الأصلي من عدد أمثال كوربن فقط ، بل يبالغ في تقدير أداء المشاركين الآخرين (هنا مثال آخر على مثل هذا الخطأ). في النسخة المنقحة ، تم تحديد عمود السيد كوربن بالكامل. جميع الأعمدة الأخرى لا تزال مرئية.

الغريب الآخر هو اختيار اللون. في محاولة لتقليد نظام ألوان العمل ، استخدمنا ثلاثة ظلال من اللون البرتقالي / الأحمر المعينة إلى 1) Corbin ، 2) إلى نواب آخرين و 3) للأحزاب / المجموعات. لم يتم شرح هذا في أي مكان. على الرغم من أن المنطق قد يكون واضحًا لدى الكثيرين ، إلا أنه لا معنى لهؤلاء الذين ليسوا على دراية بالسياسة البريطانية.

خطأ: تأثير العلاقة بسبب تعديل المقاييس



مثال نادر على العلاقة المثالية؟ في الواقع لا ( البيانات في ملف CSV )

الرسم البياني أعلاه هو من مقال الكلب فقدان الوزن. للوهلة الأولى ، يبدو أن وزن ومحيط عنق الكلب مرتبطان تمامًا. لكن هل هذا صحيح؟ فقط إلى حد ما.

على الرسم البياني ، يتم تقليل كلا الميزان بثلاث وحدات (من 21 إلى 18 على اليسار ؛ من 45 إلى 42 على اليمين). ولكن من حيث النسبة المئوية ، يتم تقليل المقياس الأيسر بنسبة 14 ٪ ، واليمين - بنسبة 7 ٪. في المخطط المنقح ، حافظت على النطاق المزدوج ، لكنني عدلت النطاقات لتعكس تغيراً تناسبيًا مماثلًا.

بالنظر إلى موضوع المتعة في هذا المخطط ، قد يبدو الخطأ بسيطًا نسبيًا. في النهاية ، المعنى هو نفسه في كلا الإصدارين. لكن الاستنتاج مهم: إذا كان الرسمان البيانيان قريبان جدًا من بعضهما البعض ، فربما تحتاج إلى إلقاء نظرة فاحصة على المقاييس.

خطأ: طريقة التصور الخاطئ



الآراء حول خروج بريطانيا من الاتحاد الأوروبي شبه مستقرة مثل المفاوضات حولها ( البيانات في ملف CSV )

قمنا بنشر مخطط المسح هذا في تطبيق أخبار Espresso. يوضح العلاقة بنتائج استفتاء الاتحاد الأوروبي في شكل رسم بياني خطي. استنادا إلى البيانات ، يتقلب المجيبون بشكل كبير في وجهات نظرهم: تقفز النتائج ببضع نقاط مئوية.

بدلاً من منحنى سلس لعرض الاتجاه ، أشرنا إلى القيم الفعلية لكل مسح. حدث هذا في المقام الأول لأن أداة الرسوم البيانية لدينا لا تعرف كيفية بناء خطوط ناعمة. لقد أتقننا مؤخرًا برامج أكثر تقدمًا لمعالجة البيانات الإحصائية (على سبيل المثال ، R) باستخدام أساليب التصور الأكثر تطوراً. اليوم ، يمكن لأي شخص بناء منحنى سلس لاستطلاعات الرأي ، كخيار محسّن في الأعلى.

لا يزال هناك انتهاك للحجم. المخطط المصدر ينثر البيانات على نطاق أوسع مما ينبغي. في الإصدار المنقح ، أضفت بعض المساحة بين بداية المقياس والحد الأدنى لنقطة البيانات. يقدم Francis Gagnon صيغة جيدة لمثل هذه المواقف: اترك مساحة خالية بنسبة 33٪ على الأقل من الرسم البياني للخط ، والتي لا تبدأ من الصفر.

الرسوم البيانية التي مربكة


ليست مثل هذه الجريمة الخطيرة مضللة ، ولكن إذا كان من الصعب فهم الجدول الزمني ، فهذه علامة على ضعف أداء التصور.

خطأ: المخططات الفظيعة جدًا



ماذا؟ ( البيانات في ملف CSV )

يسعى الصحفيون في مجلة الإيكونوميست ، بطريقة جيدة ، إلى إرباك القارئ. لكن في بعض الأحيان نذهب بعيدا جدا. يوضح الرسم البياني أعلاه العجز التجاري للولايات المتحدة في السلع وعدد العاملين في الصناعة.

هذا المخطط يصعب فهمه. لديها مشكلتان رئيسيتان. أولاً ، قيم سلسلة واحدة (العجز التجاري) سالبة تمامًا ، بينما تكون القيم الأخرى (التوظيف في التصنيع) إيجابية. من الصعب الجمع بين هذه البيانات المختلفة في رسم تخطيطي واحد. يؤدي "الحل" الواضح إلى مشكلة ثانية: لا يحتوي صفين من البيانات على خط أساس مشترك. يقع خط الأساس للعجز التجاري في أعلى المخطط (يتم تمييزه باللون الأحمر ، ويمر عبر نصف المخطط). خط الأساس للمقياس الصحيح في الأسفل.

يوضح الرسم البياني المنقح أنه لم تكن هناك حاجة إلى الجمع بين سلسلتي البيانات. العلاقة بين العجز التجاري والعمالة الصناعية لا تزال واضحة وتستغرق سوى مساحة أكبر بقليل.

خطأ: الألوان المتشابكة



50 ظلال من اللون الأزرق ( البيانات في ملف CSV )

يقارن هذا الرسم البياني الإنفاق الحكومي على مزايا التقاعد مع نسبة الأشخاص الذين تزيد أعمارهم عن 65 عامًا في عدد من البلدان ، مع التركيز بشكل خاص على البرازيل. من أجل عدم تضخيم المخطط ، قام المتخيل بالتوقيع على بعض البلدان فقط وأبرزها باللون الأزرق. يتم تمييز متوسط ​​OECD باللون الأزرق الفاتح.

متخيل (كان أنا!) تجاهل حقيقة أن تغيير اللون غالبا ما ينطوي على تغيير فئة. وهنا أيضًا ، قد يكون لدى القارئ فكرة أن جميع البلدان الزرقاء تبدو تنتمي إلى مجموعة مختلفة عن تلك التي تنتمي إلى بلدان زرقاء. هذا ليس كذلك. الفرق الوحيد هو أنها ببساطة غير موقعة.

في الإصدار المنقح ، يكون اللون هو نفسه بالنسبة للجميع. لقد غيرت فقط كثافة البلدان الموقعة. الطباعة هي البقية: البرازيل ، بلد التركيز ، جريئة ، ومتوسط ​​منظمة التعاون والتنمية في الميدان الاقتصادي مائل.

الرسوم البيانية التي لا يمكن أن يكون له معنى


الأخطاء في هذه الفئة الأخيرة أقل وضوحًا. هذه المخططات ليست مضللة وغير مربكة للغاية. انهم ببساطة لا يستطيعون تبرير وجودهم. إما أنها بنيت بشكل غير صحيح ، أو حاولنا ضغط الكثير من المعلومات في مساحة صغيرة جدًا.

خطأ: الكثير من التفاصيل.



"كلما زاد عدد الزهور ، كان ذلك أفضل!" ( البيانات في ملف CSV )

قوس قزح الحقيقي! لقد نشرنا هذا المخطط في عمود فائض الميزانية الألمانية. يُظهر رصيد الميزانية والتوازن الحالي لعشرة دول في منطقة اليورو. مع وجود العديد من الألوان - بعضها يصعب تمييزه أو حتى رؤيته لأن القيم صغيرة جدًا - يصعب فهم معنى المخطط. يعمل هذا على حظر الدماغ تقريبًا ، مما يتسبب في تخطي القارئ للمخطط والمضي قدمًا. والأهم من ذلك ، بما أننا لا نعطي أرقامًا لجميع البلدان في منطقة اليورو ، فلا فائدة من إضافة البيانات.

أقوم بإعادة قراءة المقال لإيجاد طريقة لتبسيط المخطط. يشير النص إلى ألمانيا واليونان وهولندا وإسبانيا ومنطقة اليورو. في الإصدار المنقح من المخطط ، قررت تحديدهم فقط ، ووضع الباقي في فئة "أخرى" (إجمالي رصيد الحساب الجاري على الرسم البياني المعالج أقل من المخطط الأصلي ، بسبب مراجعة بيانات يوروستات).

خطأ: الكثير من البيانات ، وليس مساحة كافية



أستسلم ( البيانات في ملف CSV )

مقيدًا بالمساحة الموجودة على الصفحة ، غالبًا ما نميل إلى دفع جميع البيانات في فتحة صغيرة جدًا. على الرغم من أن هذا يوفر مساحة قيمة على الصفحة ، إلا أن هناك عواقب ، كما يتبين من هذا الرسم البياني من مارس 2017 . هذا رسم بياني لمقال يفيد أن الرجال يهيمنون على العلوم. جميع المواقف مثيرة للاهتمام على حد سواء وذات صلة لهذه المادة. ولكن من الصعب استيعاب مثل هذه الكمية من البيانات: فيما يلي أربع فئات من مجالات البحث ، وكذلك نسبة مؤلفي براءات الاختراع في كل بلد.

عند التفكير ، قررت عدم تغيير هذا المخطط. إذا قمت بحفظ جميع البيانات ، فسيكون المخطط كبيرًا جدًا لمقال صغير. في مثل هذه الحالات ، من الأفضل قطع شيء ما. بدلاً من ذلك ، يمكنك إظهار مؤشر متوسط ​​معين: على سبيل المثال ، متوسط ​​حصة مقالات النساء في جميع المجالات. (يرجى إعلامي إذا كانت لديك أفكار حول كيفية تصور ذلك في مكان محصور!)



إن أفضل الممارسات تتطور بسرعة: ما هو مقبول اليوم ، سيتم إدانته غدًا. في كل وقت ، تظهر أساليب جديدة وأكثر تقدما. هل سبق لك أن ارتكبت "جريمة معلوماتية" يمكن إصلاحها بسهولة؟

Source: https://habr.com/ru/post/ar446880/


All Articles