Big Data in der Medizin: Quadratur des Kreises

Ein Berliner Start-up will Big-Data-Analysen in der Medizin ermöglichen. ( Foto: sdecoret - Fotolia.com)

Ein Berliner Start-up will Big-Data-Analysen in der Medizin ermöglichen – und trotzdem die Privatsphäre der Patienten schützen. Auf dem „Innovators Summit – Digital Health“ am 22. November 2017 in Berlin stellt es seinen Ansatz vor.

Gastbeitrag von Wolfgang Stieler

Das wichtigste Argument gegen Big Data in der Medizin ist der Datenschutz. Das Problem wird sich mit der neuen Datenschutzgrundverordnung (DSGVO) noch einmal verschärfen. Denn nach der im Mai 2018 in Kraft tretenden DSGVO sind alle Arten des Umgangs mit persönlichen Informationen so lange verboten, bis der Gesetzgeber die Handlung explizit erlaubt – oder der Betroffene ausdrücklich einwilligt. Doch diese Beschränkung steht Big-Data-Prozessen entgegen, die dann nur noch unter verschärften Bedingungen zulässig sind.

Technisch wäre es zwar möglich, Gesundheitsdaten zu anonymisieren. Da die anonymisierten Daten keinen Personenbezug mehr aufweisen, würden ihre Verarbeitung auch nicht der DSGVO unterliegen. Doch bisher ist die vollständige Anonymisierung von Gesundheitsdaten nur mit hohen Einbußen bei der Qualität möglich.

Weltweit arbeiten derzeit Forschungsgruppen und Unternehmen an technischen Lösungen für das Problem. Zu ihnen gehört auch das Berliner Start-up Statice. Es generiert aus Produktivdaten so genannte synthetische Daten, die keinerlei Rückschlüsse mehr auf den jeweiligen Patienten erlauben. „Unser Kernprodukt sind Algorithmen, die blind über die Kundendaten laufen, und ihre Struktur analysieren“, sagt Lynn Marx, Leiterin der Data Science bei Statice. „Der Algorithmus baut ein Modell, das versteht, was das für Daten sind, und welche Beziehungen zwischen den Daten bestehen. Sobald das Modell gelernt wurde, kann man komplett neue, synthetische Daten generieren.“ Auf dem „Innovators Summit – Digital Health“ von Technology Review stellt Statice am 22. November seine Methode vor.

Der jetzige Prototyp zeigt, dass mit dem Verfahren die Daten-Qualität zwar um einige Prozentpunkte sinkt. Dafür lassen sich Analysen durchführen, die sonst nicht mit den deutschen und europäischen Datenschutzregeln vereinbar wären. Zudem können Daten problemlos zur Kollaboration mit externen Parteien geteilt werden, um datengetriebene Projekte signifikant zu beschleunigen. „Wir wollen den Unternehmen nicht nur ermöglichen, auf interessanten Daten zu arbeiten, sondern gemeinsam mit Partnern aus der Analyse neue Geschäftsmodelle entwickeln, ohne die Privatsphäre ihrer jeweiligen Kunden zu gefährden“, sagt Statice-CEO Sebastian Weyer. „Das hört sich vielleicht radikal an, aber für uns war wichtig zu sagen, wenn das funktioniert, dann soll es auch auf jedem Datensatz funktionieren. Egal, wie privat die Daten sind.“

Der „Innnovators Summit Digital Health“ findet am 22. November 2017 in Berlin statt. Noch bis zum 24. Oktober ist die Anmeldung mit Frühbucherrabatt möglich.

Juristen und Datenschützer diskutieren allerdings noch, ob – und wenn ja unter welchen Bedingungen genau – solche technischen Verfahren dem verschärften Datenschutz genügen. In der DSGVO gibt es dazu nur sehr allgemeine Formulierungen. Sollten synthetische Daten aber tatsächlich keinen Personenbezug aufweisen, fielen sie tatsächlich nicht unter die DSGVO, bestätigt Marit Hansen vom Unabhängigen Landeszentrum für Datenschutz Schleswig-Holstein. „Aber sie müssten so generiert werden, dass nicht ‚aus Versehen‘ doch ein Personenbezug enthalten ist“, betont sie. Dies könnte beispielsweise passieren, „wenn einzelne Attribute in einer medizinischen Datenbank mit seltenen Werten auf echte Personen schließen lassen“.