Die Technologie hinter den Paradise-Papers

Paradise-Papers-FB-ShareBei der Datenanalyse der Paradise-Papers setzt das International Consortium of Investigative Journalists (ICIJ) erneut auf die Graphdatenbank Neo4j. Das 1,3 Terabyte große Datenleak mit rund 13,4 Millionen Dokumenten entlarvt die Steuertricks, Briefkastenfirmen und Steueroasen von Politikern, Konzernen und Superreichen.  

Die Daten stammen von der Anwaltskanzlei Appleby, der Treuhandfirma Asiaciti Trust sowie aus 19 weiteren Steueroasen wie Bermuda und der Isle of Man. In den Dokumenten  tauchen  zahlreiche bekannte Namen auf, darunter enge Mitglieder der Trump-Regierung, Formel-1 Weltmeister Lewis Hamilton sowie Unternehmen wie Apple, Nike, Sixt, Deutsche Post oder Bayer. Das Datenpaket wurde der Süddeutschen Zeitung zugespielt und in Zusammenarbeit mit dem ICIJ und einem globalen Netzwerk an Journalisten ausgewertet.

Um die Recherche innerhalb der gigantischen und komplexen Datenmenge überhaupt zu ermöglichen, wurden die Rohdaten von einem kleinen Team beim ICIJ in eine Datenbank überführt. Wie bei den Panama-Papers nutzten die Journalisten dazu Neo4j, die Graph-Plattform zur Analyse für vernetzte Daten. In Kombination mit der Visualisierungsplattform Linkurious lassen sich die stark verknüpften Daten strukturieren, anschaulich darstellen und analysieren. Die Journalisten konnten so versteckte Zusammenhänge zwischen Personen, Unternehmen und Offshore-Konten aufdecken.

Video-Interview zum Thema mit Emil Eifrem, CEO von Neo4j, via Facebook-Post:

„Bei einem Großteil der Dokumente handelte es sich um Rohdaten. Diese in einer einzigen Datenbank zu speichern, war für uns zunächst eine Herausforderung“, erklärt Pierre Romera, Chief Technology Officer des ICIJ. „Mit Neo4j und Linkurious konnten unsere Entwickler schließlich den Datensatz auf eine Weise modellieren, die es den 382 Journalisten ermöglichte, die Daten zu analysieren, Muster zu visualisieren und sich auszutauschen. Es ist erstaunlich, wie intuitiv eine Graphdatenbank dabei ist  – unabhängig von der jeweiligen IT-Erfahrung der Anwender. Das vereinfachte die Analyse und bereitete den Weg für die nun veröffentlichten Berichte.“

#Netzpalaver #ICTJ