Forschenden ist es gelungen, die Anonymisierung in Gerichtsurteilen rückgängig zu machen. Wie sie das geschafft haben und warum man das nicht verhindern kann.
Beispiel eines Bundesverwaltungsgerichtsurteils (BVGer C-519/2015). Sowohl die Zulassungsinhaberin
sowie das betroffene Arzneimittel und die zu vergleichenden Arzneimittel wurden anonymisiert. Bildquelle: Re-Identifikation von Gerichtsurteilen durch «Linkage» von Daten(banken).
Beispiel eines Bundesverwaltungsgerichtsurteils (BVGer C-519/2015). Sowohl die Zulassungsinhaberin sowie das betroffene Arzneimittel und die zu vergleichenden Arzneimittel wurden anonymisiert. Bildquelle: Re-Identifikation von Gerichtsurteilen durch «Linkage» von Daten(banken).
Forschenden ist es gelungen, die Anonymisierung von Bundesgerichtsurteilen aufzuheben. Bild: Norbert Aepli.
Forschenden ist es gelungen, die Anonymisierung von Bundesgerichtsurteilen aufzuheben. Bild: Norbert Aepli.
Vom weissen Feld zum Namen der Firma. Über Pseudo-Identifikatoren in Gerichtsurteilen wie «Fertigspritze» fanden die Forscher durch Linkage den Namen der Firma Merck in Dokumenten des BAG. Bildquelle: Re-Identifikation von Gerichtsurteilen durch «Linkage» von Daten(banken).
Vom weissen Feld zum Namen der Firma. Über Pseudo-Identifikatoren in Gerichtsurteilen wie «Fertigspritze» fanden die Forscher durch Linkage den Namen der Firma Merck in Dokumenten des BAG. Bildquelle: Re-Identifikation von Gerichtsurteilen durch «Linkage» von Daten(banken).

Das Wichtigste in Kürze

  • In Urteilen des Bundesgerichtes sind die Namen von Personen und Firmen unkenntlich gemacht.
  • Diese Anonymisierung haben Wissenschaftler nun aufgehoben, indem sie Pharma-Urteile mit anderen Datenbanken verknüpften.
  • So fanden sich etwa charakteristische Informationen aus den Urteilen auch in nicht-anonymisierten Dokumenten des BAG.
Ad

Anonymisierungen sind in Gerichtsurteilen ein Mittel, um die Idenität von Klägern oder Angeklagten zu schützen. So sind zum Beispiel Personennamen sowie die Namen von Pharmafirmen, die gegen die Preisfestsetzungen des Bundesamt für Gesundheit (BAG) klagen, in Urteilen des Bundesgerichtes anonymisiert. Auch die Wirkstoffe, um die es geht, sind unkenntlich gemacht. Doch nun ist es zwei Wissenschaftlern der Universität Zürich gelungen, diese Details trotzdem öffentlich zu machen. In 21 von 25 Bundesgerichtsurteilen konnten sie die klagenden Pharmafirmen sowie die Arzneien und Wirkstoffe herausfinden, indem sie verschiedene öffentlich zugängliche Information zusammenführten. 

Informationen dank Webscraping

Dazu nutzten sie die Technik des Web scraping. Dabei stellt ein Program Suchanfragen an eine Website und lädt Dokumente automatisch herunter. So gelangten die Rechtswissenschaftlerin Kerstin Vokinger und ihr Kollege, der Mediziner Urs Mühlematter, in kurzer Zeit an über 120 000 Bundesgerichtsurteile, sowie fast 60 000 Urteile des vorinstanzlichen Bundesverwaltungsgerichtes, welche sie dann in einer Datenbank zusammenfassten.

«In diesen Urteilen sind zwar die Namen von Firma und Medikament nicht erkenntlich, aber sie enthalten Begriffe, die als so genannte Pseudo-Identifikatoren genutzt werden können», erklärt Carmela Troncoso, Leiterin des Labors für Sicherheits- und Datenschutztechnik an der Eidgenössischen Technischen Hochschule Lausanne (EPFL). Solche Pseudo-Identifikatoren sind zum Beispiel die Darreichungsform des Medikaments, ob es also als Fertigspritze verabreicht wird. Auch die Art der Preissenkung, um die es im Urteil geht, zum Beispiel 14,052 Prozent, kann der Identifikation dienen.

Gericht
Ein Gerichtshaus. - Pexels

Datensätze müssen für Verknüpfung gefunden werden

Diese Pseudo-Identifikatoren finden sich auch in öffentlich zugänglichen Informationen, wie dem Bulletin des BAG und der Spezialitätenliste von Swissmedic. Diese haben die Forschenden ebenfalls heruntergeladen und in die Datenbank mit den Gerichtsurteilen eingespeist. In den BAG-Bulletins und der Spezialitätenliste fanden sich Angaben wie «Fertigspritze» oder «14,052 Prozent», gleichzeitig aber auch die Namen von Firma und Wirkstoff. Durch Linkage, also durch das Verknüpfen der verschieden Datensätze, konnten die Forschenden die Anonymisierung der Urteile aufheben.

«Im Prinzip kann das jeder machen, dafür braucht es keine besonderen Kenntnisse oder Ressourcen», sagt Troncoso. «Die einzige Herausforderung ist, die richtigen Datensätze für die Verknüpfung zu finden.» Man muss also wissen, in welchen Dokumenten sowohl die Namen als auch die Pseudo-Identifikatoren genannt werden. 

100%-ige Anonymisierung ist nicht möglich

Wie man eine solche Re-Identifikation anonymisierter Daten, also auch von Personennamen, in Urteilen verhindern kann, ist unklar. Denn das Transparenzprinzip verböte es, sämtliche Information, also auch die Pseudo-Identifikatoren zu schwärzen. Es gäbe die Möglichkeit Störsignale in Datensätze einzuarbeiten, so dass etwa statt 14,052 Prozent immer 20 Prozent erwähnt wird. Aber auch das sei wegen des Transparenzprinzips schwierig und es gebe keine Garantie, dass das eine Verknüpfung zuverlässig verhindere, sagt Troncoso. «In Fällen, in denen die Informationen öffentlich, exakt und transparent sein müssen, sehe ich derzeit keine Lösung, wie eine De-Anonymisierung verhindert werden kann.» 

Produced by higgs – Facts statt Fake News.

Initiated by Gebert Rüf Stiftung

Ad
Ad

Mehr zum Thema:

Universität ZürichSwissmedicDatenFake News