बड़े व्यवसाय और खूनी उद्यम ने लंबे समय तक DWH और विश्लेषिकी के लिए वयस्क rdbds के लिए एक प्रतिस्थापन पाया है। DWH बड़े पैमाने पर DataLake और Hadoop की ओर बढ़ रहा है। ऐसा लगता है कि छोटी कंपनियां अब गंभीर rsbd पर एनालिटिक्स लॉन्च करने के लिए ज्यादा समझ नहीं रखती हैं। छोटे व्यवसायों के लिए भी उपलब्ध कोर की बढ़ती संख्या के साथ, एक वयस्क उप-प्रकार के पूर्ण संस्करण को लाइसेंस देने की कोशिश कर रहा है जैसे कि ओरेकल बहुत कम समझ में आता है। मानक संस्करण ओरेकल, हालांकि सॉकेट के लिए लाइसेंस प्राप्त है, लेकिन एक ही समय में सबसे महत्वपूर्ण कार्यक्षमता को काट दिया। सबसे पहले, मानक संस्करण में कोई विभाजन नहीं है
, केवल एक विभाजन दृश्य है - पोस्टग्रेज के तरीके में तालिका साझाकरण, जो केवल कुछ स्थितियों में मदद कर सकता है। दूसरे, कोई पूर्ण स्टैंडबाय नहीं है, समानांतर संचालन बाहर कट जाता है। आरएसी क्लस्टर चार सॉकेट तक सीमित है। नतीजतन, आधुनिक डेटा विकास के साथ, आप जल्दी से मानक संस्करण की सीमाओं में भागना शुरू करते हैं, और एंटरप्राइज़ संस्करण का लाइसेंस मूल्य इस कार्य को बेकार कर देता है। ओरेकल में न केवल युद्ध सर्वर, बल्कि स्टैंडबाय सर्वर को लाइसेंस देना आवश्यक है, जबकि एंटरप्राइज़ संस्करण को कोर द्वारा लाइसेंस प्राप्त है। क्लस्टर, विभाजन और डेटागार्ड / स्टैंडबाय विकल्पों के लिए अलग-अलग लाइसेंसिंग और कोर की आवश्यकता होती है। नतीजतन, यहां तक कि 16 कोर के साथ एक एंट्री लेवल सर्वर और ईई लाइसेंस के लिए पहले से ही इसका स्टैनबी कई हजारों डॉलर के लिए खींच रहा है, और यहां तक कि खूनी उद्यम प्रबंधन बेहोश हो गया है।
हमें खडुपोव में एक विकल्प की तलाश करनी होगी। मैंने एक बैकअप में लकड़ी की छत पर निर्मित डेटा शोकेस के लिए कुछ अनुरोधों की तुलना करने की कोशिश की, ओरेकल स्टैंडर्ड के खिलाफ 8 xeon कोर, 196 जीबी फ्रेम, एचडीडी और एसएसडी कैश के साथ एक निश्चित उद्यम स्टोर, जो कई अन्य प्रणालियों के साथ अफवाह हो सकता है। पहली क्वेरी 4 तालिकाओं को प्रभावित करती है, ओरेकल में उन्होंने 62, 12, 6.5 और 3.5 जीबी पर कब्जा कर लिया। एक प्लेट में जो लगभग 880 मिलियन लाइनों से बड़ी है। अनुरोध योजना में ऐसा था:

योजना में, मैं विशेष रूप से फुलस्कैन और हैशजेंस देखना चाहता था जो मेरे विश्लेषणात्मक प्रश्नों में विशिष्ट हैं। वास्तव में, ओरेकल के मानक संस्करण के लिए एक अनुरोध में लगभग 7 मिनट लगते हैं। स्पार्क 2.3 को 4 कोर / 16 जीबी फ्रेम वाले 14 निष्पादकों के लिए स्पार्क 2-सबमिट के माध्यम से लॉन्च किया गया है, जो एक मिनट के भीतर 10k HDD डिस्क से लगभग समान अनुरोध का जवाब देता है। क्लूडेरा इम्पाला एक ही क्लस्टर पर यार्न और स्पार्क के साथ धकेलता है (8 नोड्स पर इम्पैलाड, 4 कोर के साथ 14 एक्ज़ीक्यूटर्स के बराबर संसाधन), 11-12 सेकंड में उत्तर देता है। उसी समय, इम्पाला लगातार लोड के समानांतर चलता है, जिसे कैश्ड डेटा को धोना चाहिए।
ब्लॉक आकार वाले खेल, ओरेकल ईई संस्करण के साथ इसकी समानता और वयस्क विभाजन के साथ आगे बढ़ रहे हैं, शायद निष्पादन समय कई बार कम हो जाएगा, लेकिन मुझे थोड़ा संदेह है कि स्पार्क में मुझे जो मिला, वह समय भी तुलनीय होगा। दूसरी ओर, व्यावहारिक रूप से मुक्त क्लाउडेरा हडोप के केवल 3-4 नोड्स आपको सामान्य एसक्यूएल में प्राप्त करने की अनुमति देते हैं, जिसके लिए ओरेकल के पास अतुलनीय रूप से बड़ा पैसा होगा।
ओरेकल को लाइसेंसिंग नीति के बारे में गंभीरता से सोचना चाहिए, अगर मेरे जैसे बड़े प्रशंसकों को एंटरप्राइज़ संस्करण के लिए भुगतान करने का कोई कारण नहीं मिलता है।