Basis terstruktur dari "Panama Archive" diposting di domain publik
Kebocoran dokumen terbesar dalam sejarah Internet: 2,6 terabyte
International Consortium of Investigative Journalists (ICIJ) mengunggah Panama Archive, basis data terbesar perusahaan lepas pantai, yang diperoleh dari komputer oleh firma hukum Panama Mossack Fonseca oleh orang tak dikenal.Anonim (John Doe) mentransfer 2,6 terabyte file - spreadsheet, teks surat, PDF, TIFF, dan format lainnya, termasuk yang sudah kuno dan yang belum digunakan, kepada wartawan surat kabar Jerman Süeddeustche Zeitung . Menyadari skala pekerjaan, mereka meminta ICJI untuk mengatur proyek bersama internasional.Jutaan gambar grafis didorong melalui perangkat lunak pengenalan karakter Tesseract pada 40 server sementara di cloud Amazon. Apache Solr digunakan untuk mengindeks teks, Apache Tika digunakan untuk memproses dokumen dalam format yang berbeda .Selama tahun ini, 370 wartawan dari 80 negara mempelajari arsip tersebut . Untuk mempermudah pekerjaan mereka bagi jurnalis, pengembang ICIJ telah menghubungkan antarmuka grafis dari program perpustakaan Project Blacklight . Untuk menampilkan informasi dalam bentuk grafis dan menampilkan koneksi antara objek, saya harus menggunakan program eksklusif Linkurious , dan menggunakan alat TalendIsi database relasional Mossack Fonseca SQL dikonversi ke format Neo4j .
Sekarang hasil kerja para pengembang diundang untuk mengevaluasi semua orang di Internet.Basis data ICIJ dalam bentuk terstruktur tersedia di:https://www.occrp.org/en/panamapapers/database.htmlAnda dapat mengunduh salinan ke komputer Anda (35,7 MB dalam arsip).
Basis data berisi informasi tentang hampir 214.000 perusahaan lepas pantai di 21 yurisdiksi lepas pantai.Peta interaktif klien dari perusahaan lepas pantai.
Database ini berisi 11.516 perusahaan milik 6285 warga negara Rusia. Di antara mereka adalah kerabat dan teman pejabat senior. Kebocoran dokumen berskala besar semacam itu dapat menyebabkan sejumlah pengunduran diri dan kasus kriminal, meskipun perusahaan lepas pantai sering beroperasi di bidang hukum abu-abu tanpa melanggar hukum. Hanya sebagian informasi dari 11,5 juta file yang diperoleh dari komputer firma hukum Mossack Fonseca, salah satu perusahaan generator satu hari terbesar di dunia, diterbitkan.
Konsorsium wartawan investigasi internasional tidak mempublikasikan semua informasi yang tersedia, tidak ada dokumen sumber atau database besar dengan informasi pribadi, rekening bank perusahaan, isi korespondensi elektronik dan transaksi keuangan perusahaan tidak diindikasikan. Hal ini dilakukan agar tidak mengekspos data pribadi banyak orang yang tidak terlibat dalam kejahatan keuangan.Hanya nama-nama perusahaan, yurisdiksi mereka, alamat pos dan nama-nama kepala perusahaan lepas pantai yang dipublikasikan. Data mencakup periode dari 1977 hingga 2015.Basis data Panama Archive diterbitkan di bawah lisensi Creative Commons Attribution-ShareAlike gratis. Sebuah konsorsium wartawan investigasi internasional mengundang seluruh komunitas untuk fokus pada studi dan klasifikasi informasi yang dipublikasikan.UPDTemuan pertama dari komunitas Geektimes
UPD2. Temuan kedua dari komunitas
Source: https://habr.com/ru/post/id393769/
All Articles