القاعدة المنظمة لـ "أرشيف بنما" المنشورة في المجال العام

أكبر تسرب للوثيقة في تاريخ الإنترنت: 2.6 تيرابايت




قام الاتحاد الدولي للصحفيين الاستقصائيين (ICIJ) بتحميل أرشيف بنما ، أكبر قاعدة بيانات للشركات الخارجية ، التي تم الحصول عليها من أجهزة الكمبيوتر من قبل مكتب محاماة بنما موساك فونسيكا من قبل أفراد مجهولين.

قام Anonymous (John Doe) بنقل 2.6 تيرابايت من الملفات - جداول البيانات ونصوص الرسائل و PDF و TIFF وتنسيقات أخرى ، بما في ذلك القديمة وغير المستخدمة بالفعل ، إلى الصحفيين في صحيفة Süeddeustche Zeitung الألمانية . إدراكًا لحجم العمل ، طلبوا من ICJI تنظيم مشروع دولي مشترك.

تم تشغيل الملايين من الصور الرسومية من خلال برنامج Tesseract للتعرف على الأحرف على 40 خادمًا مؤقتًا في سحابة Amazon. تم استخدام Apache Solr لفهرسة النص ، تم استخدام Apache Tika لمعالجة المستندات بتنسيقات مختلفة .

خلال العام ، قام 370 صحفيا من 80 دولة بدراسة الأرشيف . لتسهيل عملهم على الصحفيين ، قام مطورو ICIJ بتوصيل واجهة رسومية من برنامج مكتبة Project Blacklight . لعرض المعلومات في شكل رسوم بيانية وإظهار العلاقات بين الأشياء، وكان لاستخدام برنامج الملكية Linkurious ، مع وجود أداة Talendتم تحويل محتويات قاعدة بيانات Mossack Fonseca العلائقية إلى تنسيق Neo4j .



الآن نتيجة عمل المطورين مدعوة لتقييم الجميع على الإنترنت.

تتوفر قاعدة بيانات ICIJ في شكل منظم على:
https://www.occrp.org/en/panamapapers/database.html

يمكنك تنزيل نسخة إلى جهاز الكمبيوتر الخاص بك (35.7 ميغابايت في الأرشيف).





تحتوي قاعدة البيانات على معلومات حول ما يقرب من 214000 شركة خارجية في 21 ولاية قضائية خارجية.

خريطة تفاعلية لعملاء الشركات الخارجية ، تحتوي قاعدة البيانات على 11 516 شركة تنتمي إلى 6285 مواطنًا روسيًا. ومن بينهم أقارب وأصدقاء كبار المسؤولين. مثل هذا التسريب الواسع النطاق للوثائق يمكن أن يؤدي إلى عدد من الاستقالات البارزة والقضايا الجنائية ، على الرغم من أن الشركات الخارجية غالباً ما تعمل في مجال قانوني رمادي دون انتهاك القانون. تم نشر جزء فقط من المعلومات من 11.5 مليون ملف تم الحصول عليها من أجهزة كمبيوتر شركة Mossack Fonseca للمحاماة ، وهي واحدة من أكبر شركات المولدات ليوم واحد في العالم.






لا ينشر الكونسورتيوم الدولي للصحفيين الاستقصائيين جميع المعلومات المتاحة ، ولا توجد وثائق مصدر أو قاعدة بيانات كبيرة تحتوي على معلومات شخصية وحسابات مصرفية للشركات ومحتويات المراسلات الإلكترونية والمعاملات المالية للشركات غير مذكورة. يتم ذلك حتى لا يتم الكشف عن البيانات الشخصية للعديد من الأشخاص غير المتورطين في الجرائم المالية.

يتم الإعلان فقط عن أسماء الشركات وسلطاتها القضائية والعناوين البريدية وأسماء رؤساء الشركات الخارجية. تغطي البيانات الفترة من 1977 إلى 2015.

يتم نشر قاعدة بيانات أرشيف بنما تحت ترخيص Creative Commons Attribution-ShareAlike. يدعو اتحاد دولي من الصحفيين الاستقصائيين المجتمع بأسره إلى التركيز على دراسة وتصنيف المعلومات المنشورة.

UPDأول اكتشاف لمجتمع


Geektimes UPD2. الاكتشاف الثاني للمجتمع

Source: https://habr.com/ru/post/ar393769/


All Articles