Die strukturierte Basis des öffentlich zugänglichen „Panama-Archivs“

Das größte Dokumentenleck in der Internetgeschichte: 2,6 Terabyte




Das International Consortium of Investigative Journalists (ICIJ) hat das Panama Archive hochgeladen , die größte Datenbank von Offshore-Unternehmen, die von nicht identifizierten Personen von Computern der panamaischen Anwaltskanzlei Mossack Fonseca bezogen wurde .

Anonymous (John Doe) übertrug 2,6 Terabyte an Dateien - Tabellenkalkulationen, Brieftexte, PDF, TIFF und andere Formate, einschließlich alter und bereits unbenutzter, an Reporter der deutschen Zeitung Süeddeustche Zeitung . Sie erkannten den Umfang der Arbeit und baten das ICJI, ein internationales gemeinsames Projekt zu organisieren.

Millionen von Grafiken wurden über die Tesseract- Zeichenerkennungssoftware auf 40 temporären Servern in der Amazon-Cloud gesteuert . Apache Solr wurde verwendet, um den Text zu indizieren, Apache Tika wurde verwendet , um Dokumente in verschiedenen Formaten zu verarbeiten .

Im Laufe des Jahres untersuchten 370 Reporter aus 80 Ländern das Archiv . Um Journalisten die Arbeit zu erleichtern, haben ICIJ-Entwickler eine grafische Oberfläche aus dem Project Blacklight- Bibliotheksprogramm angeschlossen . Um Informationen in grafischer Form anzuzeigen und die Verbindungen zwischen Objekten anzuzeigen, musste ich das proprietäre Programm Linkurious und das Talend- Tool verwendenDer Inhalt der relationalen SQL-Datenbank von Mossack Fonseca wurde in das Neo4j- Format konvertiert .



Jetzt ist das Ergebnis der Arbeit der Entwickler eingeladen, alle im Internet zu bewerten.

Die ICIJ-Datenbank in strukturierter Form finden Sie unter:
https://www.occrp.org/en/panamapapers/database.html

Sie können eine Kopie auf Ihren Computer herunterladen (35,7 MB im Archiv).





Die Datenbank enthält Informationen zu fast 214.000 Offshore-Unternehmen in 21 Offshore-Ländern.

Interaktive Karte der Kunden von Offshore-Unternehmen. Die Datenbank enthält 11 516 Unternehmen, die 6285 russischen Bürgern gehören. Unter ihnen sind Verwandte und Freunde hoher Beamter. Ein derart umfangreiches Durchsickern von Dokumenten kann zu einer Reihe hochkarätiger Rücktritte und Strafsachen führen, obwohl Offshore-Unternehmen häufig in einem grauen Rechtsbereich tätig sind, ohne gegen das Gesetz zu verstoßen. Nur ein Teil der Informationen aus 11,5 Millionen Dateien, die von den Computern der Anwaltskanzlei Mossack Fonseca, einem der größten Eintagesgeneratorunternehmen der Welt, bezogen wurden, wurde veröffentlicht.






Das internationale Konsortium von investigativen Journalisten veröffentlicht nicht alle verfügbaren Informationen, es gibt keine Quelldokumente oder eine große Datenbank mit persönlichen Informationen, Bankkonten von Unternehmen, Inhalten elektronischer Korrespondenz und Finanztransaktionen von Unternehmen werden nicht angegeben. Dies geschieht, um die personenbezogenen Daten zahlreicher Personen, die nicht an Finanzverbrechen beteiligt sind, nicht preiszugeben.

Es werden nur die Namen der Unternehmen, ihre Gerichtsbarkeiten, Postanschriften und die Namen der Leiter von Offshore-Unternehmen veröffentlicht. Die Daten beziehen sich auf den Zeitraum von 1977 bis 2015.

Die Panama Archive-Datenbank wird unter einer kostenlosen Creative Commons Attribution-ShareAlike-Lizenz veröffentlicht. Ein internationales Konsortium von investigativen Journalisten lädt die gesamte Community ein, sich auf das Studium und die Klassifizierung veröffentlichter Informationen zu konzentrieren.

UPDDer erste Fund der Geektimes


UPD2 Community . Der zweite Fund der Community

Source: https://habr.com/ru/post/de393769/


All Articles