"पनामा पुरालेख" का संरचित आधार सार्वजनिक डोमेन में पोस्ट किया गया है

इंटरनेट इतिहास में सबसे बड़ा दस्तावेज़ रिसाव: 2.6 टेराबाइट्स




इंटरनेशनल कंसोर्टियम ऑफ इंवेस्टिगेटिव जर्नलिस्ट्स (ICIJ) ने अज्ञात लोगों द्वारा पनामा की लॉ फर्म मॉसैक फोंसेका द्वारा कंप्यूटरों से प्राप्त अपतटीय कंपनियों के सबसे बड़े डेटाबेस पनामा आर्काइव को अपलोड किया

बेनामी (जॉन डो) ने जर्मन अख़बार Süeddeustche Zeitung के पत्रकारों के लिए 2.6 टेराबाइट्स - स्प्रेडशीट, पत्र ग्रंथों, पीडीएफ, टीआईएफएफ और प्राचीन और पहले से उपयोग किए गए अन्य स्वरूपों को स्थानांतरित कर दिया । काम के पैमाने को महसूस करते हुए, उन्होंने आईसीजेआई को एक अंतरराष्ट्रीय संयुक्त परियोजना आयोजित करने के लिए कहा।

अमेज़ॅन क्लाउड में 40 अस्थायी सर्वरों पर टेसरेक्ट चरित्र पहचान सॉफ़्टवेयर के माध्यम से लाखों ग्राफिक छवियां संचालित की गईं अपाचे सोलर का उपयोग पाठ को अनुक्रमित करने के लिए किया गया था , अपाचे टीका का उपयोग विभिन्न स्वरूपों में दस्तावेजों को संसाधित करने के लिए किया गया था

वर्ष के दौरान, 80 देशों के 370 पत्रकारों ने संग्रह का अध्ययन किया । पत्रकारों के लिए अपना काम आसान बनाने के लिए, ICIJ डेवलपर्स ने प्रोजेक्ट ब्लैकलाइट लाइब्रेरी प्रोग्राम से एक ग्राफिकल इंटरफ़ेस कनेक्ट किया है । जानकारी को चित्रमय रूप में प्रदर्शित करने और वस्तुओं के बीच संबंध प्रदर्शित करने के लिए, मुझे लिंकरियस प्रोप्रायटरी प्रोग्राम का उपयोग करना पड़ा , और टैलेंड टूल का उपयोग करना पड़ा।Mossack Fonseca संबंधपरक SQL डेटाबेस सामग्री Neo4j प्रारूप में कनवर्ट की गई थी



अब डेवलपर्स के काम का परिणाम इंटरनेट पर सभी का मूल्यांकन करने के लिए आमंत्रित किया जाता है।

संरचित रूप में ICIJ डेटाबेस यहां उपलब्ध है:
https://www.occrp.org/en/panamapapers/database.html

आप अपने कंप्यूटर पर एक प्रति (संग्रह में 35.7 एमबी) डाउनलोड कर सकते हैं





डेटाबेस में 21 अपतटीय न्यायालयों में लगभग 214,000 अपतटीय कंपनियों की जानकारी है।

अपतटीय कंपनियों के ग्राहकों का इंटरेक्टिव मानचित्र। डेटाबेस में 11 516 कंपनियां हैं जो 6285 रूसी नागरिकों से संबंधित हैं। इनमें वरिष्ठ अधिकारियों के रिश्तेदार और दोस्त शामिल हैं। दस्तावेजों के इतने बड़े पैमाने पर रिसाव से कई हाई-प्रोफाइल इस्तीफे और आपराधिक मामले हो सकते हैं, हालांकि अपतटीय कंपनियां अक्सर कानून का उल्लंघन किए बिना ग्रे कानूनी क्षेत्र में काम करती हैं। दुनिया की सबसे बड़ी एक-दिवसीय जेनरेटर कंपनियों में से एक लॉ फर्म मोसाक फोंसेका के कंप्यूटरों से प्राप्त 11.5 मिलियन फाइलों की जानकारी का केवल एक भाग प्रकाशित किया गया था।






खोजी पत्रकारों के अंतरराष्ट्रीय संघ सभी उपलब्ध सूचनाओं को प्रकाशित नहीं करता है, कोई स्रोत दस्तावेज़ या व्यक्तिगत जानकारी के साथ एक बड़ा डेटाबेस नहीं है, कंपनियों के बैंक खाते, इलेक्ट्रॉनिक पत्राचार की सामग्री और कंपनियों के वित्तीय लेनदेन का संकेत नहीं है। यह उन लोगों के व्यक्तिगत डेटा को उजागर नहीं करने के लिए किया जाता है जो वित्तीय अपराधों में शामिल नहीं हैं।

केवल कंपनियों के नाम, उनके अधिकार क्षेत्र, डाक पते और अपतटीय कंपनियों के प्रमुखों के नाम सार्वजनिक किए जाते हैं। डेटा 1977 से 2015 तक की अवधि को कवर करता है।

पनामा आर्काइव डेटाबेस एक मुक्त क्रिएटिव कॉमन्स एट्रिब्यूशन-शेयरएलाइक लाइसेंस के तहत प्रकाशित किया गया है। खोजी पत्रकारों का एक अंतरराष्ट्रीय संघ प्रकाशित सूचना के अध्ययन और वर्गीकरण पर ध्यान केंद्रित करने के लिए पूरे समुदाय को आमंत्रित करता है।

युपीडी।Geektimes


UPD2 समुदाय की पहली खोजसमुदाय की दूसरी खोज

Source: https://habr.com/ru/post/hi393769/


All Articles