डेटा परीक्षण: आवश्यकताएँ और स्तर



मेरा नाम एलेक्सी चुमगिन है, मैं प्रॉवीक्टस में एक परीक्षक हूं। इस लेख में मैं आपको बताऊंगा कि डेटा गुणवत्ता आवश्यकताएँ कैसे बनती हैं और डेटा परीक्षण के स्तर क्या हो सकते हैं।


युपीडी:
लेख विश्लेषण और एकत्रीकरण के आधार पर बड़े (या ऐसा नहीं) डेटा से संबंधित है, जो विभिन्न प्रक्रियाओं के निर्माण के लिए उपयोग किया जाता है, पैटर्न आगे के विश्लेषण में या निर्णय लेने के लिए उपयोग किया जाता है। डेटा को किसी विशिष्ट प्रोजेक्ट के लिए स्क्रैच से एकत्र किया जा सकता है, या अन्य प्रोजेक्ट्स के लिए या व्यावसायिक उद्देश्यों के लिए पहले एकत्रित डेटाबेस का उपयोग किया जा सकता है। इस डेटा के स्रोत विविधतापूर्ण हैं और इसमें न केवल ऑपरेटरों द्वारा इनपुट शामिल हैं, बल्कि स्वचालित रूप से और / या स्वचालित रूप से या डेटाबेस में व्यवस्थित रूप से संग्रहीत किए गए माप भी शामिल हैं (एक ढेर में, "फिर हम यह पता लगाएंगे कि इसके बारे में क्या करना है")।

अंत के- upd।


डेटा परीक्षण क्यों महत्वपूर्ण है


डेटा निर्णय लेने में तेजी से महत्वपूर्ण भूमिका निभाता है, रोजमर्रा की जिंदगी और व्यापार दोनों में। आधुनिक प्रौद्योगिकियां और एल्गोरिदम आपको बड़ी मात्रा में डेटा को संसाधित करने और संग्रहीत करने की अनुमति देते हैं, उन्हें उपयोगी जानकारी में परिवर्तित करते हैं।

यह किस तरह का डेटा है? उदाहरण के लिए, आपके ब्राउज़र का इतिहास, आपके नक्शे पर लेन-देन, एक उपकरण की गति का बिंदु। वे अवैयक्तिक हैं, लेकिन यह डेटा अभी भी एक विशिष्ट उपकरण से संबंधित है। यदि आप उन्हें इकट्ठा और संसाधित करते हैं, तो आप इस उपकरण के मालिक के बारे में काफी रोचक जानकारी प्राप्त कर सकते हैं। उदाहरण के लिए, वह कहाँ जाना पसंद करता है, उसका लिंग और आयु क्या है। इसलिए धीरे-धीरे हम डिवाइस को "मानवकृत" करते हैं और कुछ विशेषताओं के साथ इसे बंद करते हैं।

फिर इस जानकारी का उपयोग लक्षित विज्ञापन के लिए किया जा सकता है। यदि आप एक महिला हैं, तो उच्च संभावना के साथ आप कह सकते हैं कि आपको पुरुषों के लिए विज्ञापन रेजर में कोई दिलचस्पी नहीं है। आपको अपने हितों से संबंधित विज्ञापन दिखाने होंगे। विज्ञापन लक्ष्यीकरण की गुणवत्ता को इस तथ्य के कारण बेहतर किया जा सकता है कि यह उन उपकरणों के बारे में जाना जाता है जिन पर यह दिखाया गया है। आपको वह विज्ञापन दिखाया जाता है जिसे आप देखना चाहते हैं। तो, आप उस पर क्लिक करेंगे। जो लोग आपको यह विज्ञापन दिखाते हैं, उन्हें इसके लिए धन प्राप्त होगा, और विज्ञापन ग्राहक को आपके उत्पाद के बारे में जानने से लाभ प्राप्त होगा।

यह सब विभिन्न कंपनियों और लोगों के स्वामित्व वाले डेटा पर आधारित है। इस डेटा के प्रभावी उपयोग के लिए आवश्यक है कि यह विश्वसनीय हो और हम जानते हैं कि यह लेन-देन इसी खाते का है।

चूंकि बहुत अधिक डेटा है, इसलिए उन्हें संग्रहीत करने के लिए महत्वपूर्ण संसाधनों की आवश्यकता होती है। डेटा सफाई एक अलग कार्य है जिसे संबोधित करने की आवश्यकता है। हम केवल उस डेटा को संग्रहीत करना चाहते हैं जिसकी हमें वास्तव में आवश्यकता है। और हम डुप्लिकेट या रिकॉर्ड नहीं चाहते हैं जो हमारे डेटाबेस में संग्रहीत होने के लिए हमारे मानदंडों को पूरा नहीं करते हैं। उदाहरण के लिए, खाली खेतों के साथ रिकॉर्ड। इसलिए, डेटा गुणवत्ता के लिए आवश्यकताएं हैं और उनके परीक्षण पर सवाल उठता है।

गुणवत्ता क्या है?


मुझे यह परिभाषा पसंद है: उत्पाद की गुणवत्ता उपयोगकर्ता की संतुष्टि का एक उपाय है। यह स्पष्ट है कि यह सब उत्पाद के उपयोग के संदर्भ पर निर्भर करता है। यदि आप किसी प्रसिद्ध उत्पाद का उपयोग करते हैं, उदाहरण के लिए, फेसबुक या स्काइप, तो आपके पास समान गुणवत्ता की आवश्यकताएं हैं। आप कुछ गलतियाँ करेंगे, लेकिन फिर भी इस उत्पाद का उपयोग जारी रखेंगे। और यदि आप एक कार्यक्रम के ग्राहक हैं और इसके लिए पैसे का भुगतान किया है, तो गुणवत्ता की आवश्यकताएं अधिक होंगी। आप गलती पाएंगे, कुछ छोटी चीजें देखें। विभिन्न लोगों के पास गुणवत्ता के बारे में अलग-अलग विचार हैं, और विभिन्न कार्यक्रमों की अपनी गुणवत्ता की आवश्यकताएं भी हैं।

इसलिए, विकसित करने और परीक्षण करने से पहले, लोग आमतौर पर यह निर्धारित करते हैं कि वे एक गुणवत्ता वाले उत्पाद पर क्या विचार करेंगे। यह सब औपचारिक रूप से वर्णित किया जा सकता है। उदाहरण के लिए, हम अपने उत्पाद की गुणवत्ता पर विचार करेंगे यदि इसमें महत्वपूर्ण त्रुटियां नहीं हैं। या अगर वह एक गड़बड़ के बिना दो सप्ताह के लिए काम करता है।

इन आवश्यकताओं को परिभाषित करना आसान काम नहीं है। आमतौर पर, व्यावसायिक आवश्यकताएं सॉफ़्टवेयर आवश्यकताएं बनाती हैं, और यदि हम व्यवसाय से पूछते हैं कि डेटा क्या होना चाहिए, तो हमें जवाब मिल सकता है कि डेटा अच्छा और साफ होना चाहिए। परीक्षक का कार्य यह पता लगाना या स्पष्ट करना है कि यह किस प्रकार का डेटा है और किन मानदंडों से हम उनकी गुणवत्ता और शुद्धता का निर्धारण करते हैं। इन मानदंडों को औपचारिक और तय करने की आवश्यकता है, जिसे मापने योग्य बनाया गया है।

डेटा गुणवत्ता आवश्यकताएँ कैसे बनती हैं?


परीक्षक यह पता लगाना शुरू करता है कि उसके लिए क्या समझ से बाहर है और वह परीक्षण वस्तु के बारे में क्या जानना चाहता है। परीक्षक प्रश्नों की एक सूची संकलित करता है और ग्राहक से "साक्षात्कार" लेना शुरू करता है। उन्हें, सिद्धांत रूप में, पता होना चाहिए कि डेटा क्या होना चाहिए। उदाहरण के लिए, मैं पूछता हूं: खाली सेल या डुप्लिकेट पंक्तियाँ अनुमेय हैं।

आवश्यकताओं का एक उदाहरण यदि हमारे पास लोगों की सूची है, तो पहला नाम, अंतिम नाम और मध्य नाम दोहराया जा सकता है। लेकिन लाइनों के पूरे सेट को दोहराया नहीं जा सकता। एक सेल पर पुनरावृत्ति की अनुमति दी जा सकती है, लेकिन अब पूरी पंक्ति पर या कई सेल के कुल में नहीं। पूरा मैच नहीं होना चाहिए।

आगे हम एक विशिष्ट सेल में डेटा प्रारूप के बारे में पूछना शुरू करते हैं। उदाहरण के लिए, टेलीफोन नंबर में 12 अंक होने चाहिए, और बैंक कार्ड संख्या 16 होनी चाहिए। हमारे पास एक मानदंड हो सकता है कि इन वर्णों का प्रत्येक अनुक्रम बैंक कार्ड नंबर नहीं है। या हम समझते हैं कि केवल अक्षर एक उपनाम में हो सकते हैं। डेटा प्रारूप के बारे में हमारे कई सवाल हो सकते हैं। इस प्रकार, हमें परीक्षण के विषय के बारे में जानने के लिए आवश्यक हर चीज का पता चलता है।

गुणवत्ता डेटा क्या है?


गुणात्मक डेटा में कई विशेषताएं होनी चाहिए।

  • पूर्णता - रिकॉर्ड में कोई अंतराल नहीं है, सभी कोशिकाओं को भरना होगा। डेटा को अधिक से अधिक जानकारी ले जाना चाहिए।
  • विशिष्टता - डेटा के बीच समान रिकॉर्ड नहीं होना चाहिए।
  • विश्वसनीयता, इसके लिए, सब कुछ कल्पना की गई है। कोई भी उस डेटा के साथ काम नहीं करना चाहता है जिस पर भरोसा नहीं किया जा सकता है। उच्च-गुणवत्ता वाले डेटा वाले तालिकाओं के सेल में वे शामिल होने चाहिए जो: आईपी-पता, फोन नंबर, आदि।
  • शुद्धता। अगर हम डिजिटल डेटा के बारे में बात करते हैं, तो सटीक संख्या में वर्ण होने चाहिए। उदाहरण के लिए, 12 दशमलव स्थान। डेटा कुछ औसत मूल्य के करीब होना चाहिए।
  • संगति - डेटा को मूल्यों को बनाए रखना चाहिए, भले ही वे कैसे मापा जाए।
  • समयबद्धता - डेटा प्रासंगिक होना चाहिए, खासकर अगर यह समय-समय पर अद्यतन किया जाता है। उदाहरण के लिए, हर महीने डेटा की मात्रा बढ़नी चाहिए। डेटा पुराना नहीं होना चाहिए। यदि हम बैंकिंग लेनदेन के बारे में बात कर रहे हैं, तो हम उन्हें पिछले छह महीनों में, उदाहरण के लिए, उनमें रुचि रखते हैं।

डेटा परीक्षण स्तर


हम तथाकथित परतों द्वारा डेटा को समूहित कर सकते हैं - परीक्षण पिरामिड के साथ एक अच्छा सादृश्य यहां काम करता है। यह आवेदन के विभिन्न स्तरों पर परीक्षणों की संख्या का वितरण है।

  • इकाई परत तब होती है जब एक कार्यक्रम मॉड्यूल का परीक्षण किया जाता है, सबसे अधिक बार यह एक फ़ंक्शन या विधि है। इस तरह के परीक्षण सबसे अधिक होने चाहिए। डेटा के लिए एक इकाई परीक्षण तब होता है जब हम प्रत्येक सेल के लिए आवश्यकताओं को परिभाषित करते हैं। अगर हम सेल स्तर पर त्रुटियां करते हैं तो आगे परीक्षण करने का कोई मतलब नहीं है। यदि, उदाहरण के लिए, अंतिम नाम में संख्याएँ हैं, तो आगे कुछ जाँचने का क्या मतलब है? शायद इन नंबरों के समान अक्षर भी हों। और फिर हमें सब कुछ ठीक करने और अगले स्तर की जांच करने की आवश्यकता है ताकि हमारे पास एकवचन में सब कुछ हो और कोई डुप्लिकेट न हो, यदि वह आवश्यकताओं में बताया गया है।
  • एक एकीकरण परत तब होती है जब एक कार्यक्रम के कई टुकड़ों को एक साथ परीक्षण किया जाता है। जब हम संपूर्ण तालिका के बारे में बात करते हैं तो डेटा API परत होती है। माना कि हमारे पास डुप्लिकेट हो सकते हैं, लेकिन सौ से अधिक टुकड़े नहीं। अगर हमारे पास एक लाख से अधिक शहर है, तो एक गली में एक लाख लोग नहीं रह सकते। इसलिए, यदि हम सड़क के साथ चयन करते हैं, तो पते की संख्या दस हजार या एक हजार होनी चाहिए - यह निर्धारित किया जाना चाहिए। और अगर हमारे पास एक मिलियन है, तो डेटा के साथ कुछ गलत है।
  • सिस्टम लेयर तब होता है जब पूरा प्रोग्राम पूरी तरह से टेस्ट किया जाता है। डेटा के मामले में, इस परत का मतलब है कि पूरे सिस्टम का परीक्षण किया जा रहा है। इसमें आंकड़े शामिल हैं। उदाहरण के लिए, हम कहते हैं कि हमारे पास 1985 के बाद पैदा हुए 30% से अधिक पुरुष नहीं हो सकते। या हम कहते हैं कि 80% डेटा एक ही प्रकार का होना चाहिए।

अंत में, मैं कहूंगा कि डेटा परीक्षण एक ऐसा क्षेत्र है जो रचनात्मकता और विकास के लिए कई अवसर प्रदान करता है। यहां कोई चांदी की गोली नहीं है: डेटा का परीक्षण करने के लिए विभिन्न तरीकों का उपयोग किया जा सकता है। सच, हमेशा की तरह, बीच में कहीं है।

Source: https://habr.com/ru/post/hi416183/


All Articles