A base estruturada do “Arquivo do Panamá” publicada em domínio público

O maior vazamento de documentos na história da Internet: 2,6 terabytes




O Consórcio Internacional de Jornalistas Investigativos (ICIJ) enviou o Arquivo do Panamá: o maior banco de dados de empresas offshore obtidas de computadores desconhecidos pelo escritório de advocacia panamenho Mossack Fonseca .

O Anonymous (John Doe) transferiu 2,6 terabytes de arquivos - planilhas, textos de cartas, PDF, TIFF e outros formatos, incluindo antigos e já não utilizados, para repórteres do jornal alemão Süeddeustche Zeitung . Percebendo a escala do trabalho, pediram à ICJI para organizar um projeto conjunto internacional.

Milhões de imagens gráficas foram direcionadas pelo software de reconhecimento de caracteres Tesseract em 40 servidores temporários na nuvem da Amazon. O Apache Solr foi usado para indexar o texto, o Apache Tika foi usado para processar documentos em diferentes formatos .

Durante o ano, 370 repórteres de 80 países estudaram o arquivo . Para facilitar o trabalho dos jornalistas, os desenvolvedores do ICIJ conectaram uma interface gráfica do programa da biblioteca do Project Blacklight . Para exibir informações em forma gráfica e exibir as conexões entre objetos, tive que usar o programa proprietário Linkurious e a ferramenta TalendO conteúdo do banco de dados SQL relacional Mossack Fonseca foi convertido para o formato Neo4j .



Agora, o resultado do trabalho dos desenvolvedores é convidado a avaliar todos na Internet.

O banco de dados do ICIJ de forma estruturada está disponível em:
https://www.occrp.org/en/panamapapers/database.html

Você pode fazer o download de uma cópia para o seu computador (35,7 MB no arquivo).





O banco de dados contém informações sobre quase 214.000 empresas offshore em 21 jurisdições offshore.

Mapa interativo de clientes de empresas offshore O banco de dados contém 11 516 empresas pertencentes a 6285 cidadãos russos. Entre eles estão parentes e amigos de altos funcionários. Um vazamento de documentos em larga escala pode levar a várias renúncias e casos criminais de alto nível, embora as empresas offshore frequentemente operem em um campo jurídico cinzento, sem violar a lei. Somente parte das informações dos 11,5 milhões de arquivos obtidos nos computadores do escritório de advocacia Mossack Fonseca, uma das maiores empresas de geração de um dia no mundo, foi publicada.






O consórcio internacional de jornalistas investigativos não publica todas as informações disponíveis, não há documentos de origem ou um grande banco de dados com informações pessoais, contas bancárias de empresas, o conteúdo de correspondência eletrônica e transações financeiras de empresas não são indicados. Isso é feito para não expor os dados pessoais de inúmeras pessoas que não estão envolvidas em crimes financeiros.

Somente os nomes das empresas, suas jurisdições, endereços postais e os nomes dos chefes das empresas offshore são divulgados. Os dados abrangem o período de 1977 a 2015.

O banco de dados do Panama Archive é publicado sob uma licença Creative Commons Attribution-ShareAlike gratuita. Um consórcio internacional de jornalistas investigativos convida toda a comunidade a se concentrar no estudo e na classificação das informações publicadas.

UPDA primeira descoberta da comunidade Geektimes


UPD2. A segunda descoberta da comunidade

Source: https://habr.com/ru/post/pt393769/


All Articles