सभी को नमस्कार!
और यहाँ हम पाठ्यक्रम की अगली स्ट्रीम
"जावास्क्रिप्ट डेवलपर" लॉन्च करते हैं और,
शिक्षकों की सिफारिश पर, दिलचस्प पठन सामग्री तैयार करते हैं। आज, डेटा आउटपुट विज़ुअलाइज़ेशन के बारे में एक दिलचस्प नोट देखें।
चलो चलते हैं।
डेटा विज़ुअलाइज़ेशन के इतिहास में अब तक पाई गई सूचनाओं को प्रसारित करने के लिए एक पाई चार्ट सबसे भयानक तरीका है।
बेशक, अधिक असुविधाजनक तरीके हैं। लेकिन उनमें से एक पाई चार्ट के रूप में लोकप्रिय या विश्वसनीय नहीं है।
मुझे समझाएं कि उसके साथ क्या गलत है, और आपको जल्द से जल्द उसका उपयोग बंद करने की आवश्यकता क्यों है।
सबसे पहले, आइए बात करते हैं कि हम चार्ट का उपयोग क्यों करते हैं:
- चार्ट कुछ जानकारी लेने और इसे अधिक समझने योग्य बनाने का एक तरीका है।
- सामान्य तौर पर, आरेख का कार्य विभिन्न डेटा सेटों की तुलना को सरल बनाना है।
- अधिक जानकारी एक चार्ट बढ़ती जटिलता के बिना संचारित कर सकती है, बेहतर।
मैं दिखाऊंगा कि इन सभी मानदंडों में एक पाई चार्ट कैसे विफल होता है। पाई चार्ट का "कार्य" भागों और पूरे के संबंधों को दर्शाना है।

आइए देखें कि यह केवल उस कार्य के साथ कैसे खराब हो जाता है जिसके लिए इसे माना जाता था। इन तीन पाई चार्ट को देखें। मान लीजिए कि वे तीन अलग-अलग अवलोकन अंतराल ए, बी और सी में पांच उम्मीदवारों के बीच स्थानीय चुनावों में वोटों के वितरण को दर्शाते हैं:
ओपन सोर्स / विकिपीडियातो इस जानकारी से हम क्या सीख सकते हैं? चूंकि ये प्रत्येक उम्मीदवार को मिले वोटों के भिन्न होते हैं, इसलिए पाठक के लिए यह समझना आसान होना चाहिए कि दौड़ में क्या हो रहा है। लेकिन ऐसा है नहीं। क्या उम्मीदवार 5, उम्मीदवार 3 की तुलना में बेहतर परिणाम दिखाता है? समय ए और बी - उम्मीदवार 2 या उम्मीदवार 4 में सबसे अच्छा परिणाम किसने दिखाया? दौड़ में सबसे बड़ी गति किसके पास है?
इसलिए यदि कार्य को समझना आसान बनाना है, तो इन चार्टों ने आपकी कितनी मदद की है? वास्तव में, यदि मैंने आपको केवल वोटों के मूल्यों के साथ एक तालिका दी है, तो क्या जानकारी को समझना आसान नहीं होगा?
लेकिन अभी के लिए, हिस्टोग्राम के रूप में प्रस्तुत की गई समान जानकारी को देखें:

अब बहुत साफ है। पहली नज़र में, हम समझ सकते हैं कि दौड़ के प्रत्येक अवधि में उम्मीदवारों में से प्रत्येक के साथ वास्तव में क्या होता है। यह हिस्टोग्राम इस तथ्य के बावजूद कि यह इसका मुख्य कार्य है, पाई चार्ट की तुलना में अधिक स्पष्ट रूप से पूरे हिस्से को उजागर करता है।
अब आइए पाई चार्ट के एक और दोष को देखें, जो इस तथ्य से संबंधित है कि लोग वास्तव में हलकों को नहीं समझते हैं।
यूरोपीय संसद में पार्टियों के वितरण के साथ एक पाई चार्ट निम्नलिखित है:

मुख्य सवाल यह है कि क्या हम आरेख के सभी भागों के आकार में अंतर प्रकट करने के लिए शेयरों की तुलना कर सकते हैं? यदि केवल एक चीज हम यह पता लगाने की कोशिश कर रहे हैं कि ईपीपी एस एंड डी से बड़ा है, तो आरेख में क्या है? मैं इसे केवल दो नंबरों को देखकर समझ सकता हूं। नहीं, एक चार्ट केवल तभी उपयोगी है जब हम उसके सभी तत्वों की एक दूसरे के साथ तुलना कर सकते हैं।
तुलना के लिए नीचे दिए गए अलग-अलग शेयर संदर्भ से बाहर हैं। उन्हें देखें, और इस बारे में सोचें कि क्या आप उन्हें सबसे बड़े से लेकर छोटे तक की व्यवस्था कर सकते हैं।

जब यह आकार में आता है तो लोग आमतौर पर किसी चक्र के अंशों की तुलना करना नहीं जानते हैं।
यही कारण है कि आप त्रिकोणमिति और रेडियंस को आयतों की सामान्य ज्यामिति की तुलना में बहुत अधिक जटिल मान सकते हैं।
यह बुरा नहीं है, लेकिन सबसे व्यापक और सुलभ तरीके से जानकारी तैयार करने की कोशिश करते समय इसे ध्यान में रखना चाहिए। यहाँ एक ही डेटा है, लेकिन एक बार चार्ट के रूप में:

कृपया ध्यान दें कि आप प्रत्येक बैच की किसी अन्य बैच के साथ तुलना कर सकते हैं।
बस आयतों की लंबाई की तुलना करके देखें कि क्या होता है।
यदि आप वास्तव में चाहते थे, तो आप संसद के भीतर वितरण का पता लगाने के लिए बाएं अक्ष को प्रतिशत के साथ बदल सकते हैं। अब आप देख सकते हैं कि प्रत्येक पार्टियों को कितनी सीटें आवंटित की जाती हैं - ऐसी जानकारी शुरू में पाई चार्ट पर प्रस्तुत नहीं की गई थी।
अब, आइए देखें कि पाई चार्ट में हेरफेर करना कितना आसान है।
यहां ऊपर जैसा ही डेटा है, लेकिन अब 3D पाई चार्ट के रूप में:

लोग हर समय इसका उपयोग करते हैं क्योंकि कोण पर 3 डी पाई चार्ट आपको बेवकूफ बनाने का एक शानदार तरीका है। चार्ट पर एक नज़र डालें, एस एंड डी - लाल बैच - नीले-हरे रंग के ईपीपी बैच के बराबर दिखता है। लेकिन इस तरह की छाप केवल इसलिए बनाई जाती है क्योंकि मैंने परिप्रेक्ष्य को विकृत कर दिया, यह धारणा बनाई कि लाल बड़ा है।
यह इतना सरल है कि यह थोड़ा शर्मनाक है कि एक्सेल आपको ऐसा करने की अनुमति देता है।
नीचे एक पाई चार्ट की कमी का एक और उदाहरण है। वास्तव में, इस लेख को पढ़ने वाले 10% पुरुष यह भी नहीं समझ पाएंगे कि दांव पर क्या है।

पुरुषों में लाल-हरा रंग अंधापन
सबसे सुरुचिपूर्ण चार्ट में डेटा लेबलिंग की आवश्यकता नहीं होती है। विचार व्यक्त करने के लिए, बाहरी संख्या की आवश्यकता नहीं है। और यदि आवश्यक हो, तो आप गलत आरेख का उपयोग कर रहे हैं।
तो, हम निष्कर्ष निकालते हैं:
- यदि प्रस्तुत जानकारी में समान आकारों के अंश शामिल हैं, तो पाई चार्ट एक अनुचित विकल्प है।
- यदि कई अवलोकन (3 या अधिक) हैं, तो पाई चार्ट एक अनुचित विकल्प है।
- एक पाई चार्ट का आसानी से दुरुपयोग किया जा सकता है।
- एक पाई चार्ट एक अनुचित विकल्प है यदि आपको प्रत्येक प्रतिशत को लेबल करने की आवश्यकता है।
पाई चार्ट के अंतिम समालोचना पर जाने से पहले, आइए देखें कि वे क्या अच्छे हैं। एकमात्र स्थिति जिसमें पाई चार्ट अच्छे हैं, 2-3 अवलोकनों की तुलना बहुत भिन्न जानकारी के साथ कर रहे हैं।

बिजनेस इनसाइडर, डेट्रायट का डेटा
डेट्रॉइट, 2011 में पेड और अनपेड प्रॉपर्टी टैक्स
और वह सब है।
यही है, अगर आप इसके बारे में सोचते हैं, तो केवल एक चीज वे अच्छे हैं, इसका उपयोग करने का एकमात्र तरीका लोगों को यह दिखाना है कि शेयर कैसा दिखता है। ऊपर दिए गए चार्ट का एकमात्र कार्य यह दिखाना है कि 100 में से 32 कैसे दिखते हैं।
पिछले हफ्ते, मैंने टिप्पणी की कि पाई चार्ट डेटा विज़ुअलाइज़ेशन की दुनिया से निकलबैक है। यह हमला व्यापक रूप से फैल चुका है। लेकिन मैं इस नतीजे पर पहुंचा कि एक और भी उपयुक्त रूपक है। पाई चार्ट - डेटा दृश्य की दुनिया से एक्वामन।
एक्वामन केवल एक में अच्छा है। फिर भी, अन्य डीसी सुपरहीरो अक्सर एक्वामैन के काम को खुद से बेहतर कर सकते हैं। सुपरमैन अपनी सांस पानी के भीतर रखता है, बैटमैन के पास सिर्फ पनडुब्बी है। यदि एक तेल टैंकर डूब जाता है, तो आप किसे बुलाएंगे? एक्वामैन? या सुपरमैन? आप आश्चर्यचकित होने लगते हैं कि उन्होंने एक्वामैन को क्यों आमंत्रित किया।

और जब एक्वामैन या पाई चार्ट के लिए उपयोगी होने का एक वास्तविक मौका है - शायद आपको एक मछली से बात करने या समझाने की ज़रूरत है कि 32% एक सर्कल में कैसा दिखता है - इसमें संदेह है कि क्या यह बिल्कुल आवश्यक है। बस पाई चार्ट का उपयोग करना बंद करो। वे बेकार हैं, आसानी से उनके साथ खराब हो गए हैं, और वे केवल नेत्रहीन दृश्य को बनाने के लिए - आरेख के एकमात्र कार्य के साथ सामना नहीं कर सकते हैं। पाई चार्ट एक्वामन हैं।
तो क्या उपयोग करें?
जैसा कि ट्ववर्ड एडफ टुट्टे ने ट्वीट किया, एक डेटा वैज्ञानिक जिन्होंने पाई चार्ट की विफलता के बारे में विस्तार से लिखा है:
पाई चार्ट उपयोगकर्ता एक ही संदेह + संदेह के पात्र हैं कि भ्रमित होने वाले लोग अटक जाते हैं। तुलना के लिए, छोटे तालिकाओं, वाक्यों का उपयोग करें, लेकिन पाई चार्ट नहीं। एडवर्ड टफ्टे (@EdwardTufte)
हमेशा की तरह, हम यहां प्रश्नों और टिप्पणियों की प्रतीक्षा कर रहे हैं या आप
सिकंदर के लिए खुले दिन में जा सकते हैं।