Warum es wichtig ist, sich mit der Sammlung und Verwendung von Gesundheitsdaten zu befassen

Zur parlamentarischen Beratung der „Gesundheitsdatennutzungsoffensiven“ auf EU- und Bundesebene bietet der TAB-Bericht „Data-Mining“umfassendes Orientierungswissen zu Möglichkeiten, Schutzmaßnahmen und Grenzen der Nutzung von Datenbeständen
Big data analytics visualization technology with scientist analyzing information structure on screen with machine learning nicoelnino/123RF

Katrin Gerlinger | 20. April 2023

Mit der der Datenschutz-Grundverordnung wurden 2016 EU-weit einheitliche Regeln zur Verarbeitung personenbezogener Daten beschlossen – allerdings mit einer Reihe von Öffnungsklauseln, die u.a. den Erhalt nationaler gesundheitssystemischer Sonderregelungen zur Erhebung, Speicherung und Weiterverwendung personenbezogener Gesundheitsdaten erlaubten. Unmittelbaren Handlungsdruck zur Anpassung nationaler Regeln gab es daher zunächst nicht. Dann erstarkten die KI-Hoffnungen, Krankheiten mit datentrainierten Algorithmen früher erkennen und besser behandeln zu können, und es kam die Corona-Pandemie, die alle Gesundheitssysteme an ihre Grenzen brachte. In einer Gemengelage aus Notwendigkeiten (Gesundheitssysteme weiterzuentwickeln und aus der Pandemie zu lernen) Hoffnungen (gesundheitsbezogenen Nutzen zu generieren) und Befürchtungen (bei der KI-Entwicklung den Anschluss an die USA und China zu verpassen) gibt es inzwischen sowohl auf europäischer als auch auf nationaler politischer Ebene umfangreiche Initiativen, die sogenannten Datensilos des Gesundheitssystems zu öffnen und deren Bestände intensiver zu nutzen. Die Vision eines interoperablen nationalen und europäischen Gesundheitsdatenraumes wird gezeichnet, in dem jede und jeder überall seine Gesundheitsdaten für die Behandlung vor Ort zugänglich machen und elektronische Rezepte einlösen kann, in dem die Verbreitung von Krankheiten flächendeckend und zeitnah überwacht werden kann, in dem die Forschung mit umfangreichen und hochwertigen europäischen Gesundheitsdatenbeständen intensiviert sowie Algorithmen und KI-Systeme trainiert und Medizinprodukte und Gesundheitsdienste entwickelt werden können.

Politische Initiativen zur umfangreicheren Nutzung von Gesundheitsdaten

Die Europäische Kommission hat im Mai 2022 einen ersten Verordnungsentwurf zur Schaffung eines Europäischen Gesundheitsdatenraumes vorgelegt – zweifellos ein Mammutprojekt auf EU-Ebene. Eine gemeinsame Gesundheitsdateninfrastruktur soll entstehen, über die zum einen patientenbezogene Gesundheitsdaten für die Behandlung europaweit bereitgestellt werden sollen (auch als Primärnutzung bezeichnet). Zum anderen sollen perspektivisch auch alle elektronischen Gesundheitsdatenbestände aus 27 nationalen Gesundheitssystemen für vielfältige Forschungs-, Entwicklungs- und Anwendungsaktivitäten weiterverwendet werden können, um öffentliche Gesundheitsdienste und nationale Gesundheitssysteme zu verbessern, sowie Forschung und Entwicklung zu erleichtern (auch als Sekundärnutzung bezeichnet). Dazu soll ein zentraler Katalog eingerichtet werden, in den alle relevanten öffentlichen und wirtschaftlich agierenden Einrichtungen als Inhaber von Gesundheitsdaten standardisierte Informationen zu ihren jeweiligen Datenbeständen liefern. Dieser Katalog soll europaweite Datenrecherchen erleichtern. Bei berechtigtem Interesse sollen dann nationale Stellen den Zugang zu dezentralen Datenbeständen realisieren.

Vielfältige Akteursgruppen haben zu diesem Verordnungsentwurf auf europäischer Ebene bereits Stellung genommen. Im Februar 2023 wurde der erste Berichtsentwurf des Europäischen Parlaments mit mehr als 150 Änderungsanträgen vorgelegt. An weiteren Anträgen wird gearbeitet. Nach derzeitigem Planungsstand soll die Verordnung mit allen Änderungen im September 2023 im europäischen Parlament final diskutiert, verabschiedet und dann an den Rat überwiesen werden, in dem die Mitgliedsländer das letzte Wort haben.

Im März 2023 hat das Bundesministerium für Gesundheit (BMG) seine lange erwartete Digitalisierungsstrategie vorgelegt. Zudem sind ein Gesundheitsdatennutzungsgesetz und ein weiteres Digitalisierungsgesetz angekündigt worden, um die in der Strategie formulierten Veränderungen realisieren zu können. Schwerpunkte der angestrebten digitalen Transformation sind die verstärkte Generierung und Nutzung elektronischer Gesundheits- und Pflegedaten, der Einsatz innovativer digitaler Technologien und Anwendungen sowie die Neuausrichtung von Versorgungsprozessen. Passend zur europäischen Initiative soll ein nationaler Gesundheitsdatenraum entstehen, mit interoperablen Strukturen, in dem Versorgungs-, Routine-, Abrechnungs-, Studien-, Genom- und Registerdaten perspektivisch über ein lebenslanges Forschungspseudonym verknüpft und sowohl zu medizinischen Versorgungs- als auch zu gesundheitspolitischen Steuerungs- und Forschungszwecken intensiver genutzt werden sollen. Der elektronischen Patientenakte (ePA) und dem Ausbau des Forschungsdatenzentrums Gesundheit (FDZ) wird dazu eine besondere Bedeutung zugeschrieben. Durch den Wechsel von einem Opt-in- zu einem Opt-out-Angebot und entsprechenden Informationskampagnen sollen bis 2025 80% der gesetzlich Versicherten über eine solche Akte verfügen und ein Teil von ihnen soll die eingespeisten medizinischen Behandlungsdaten nicht nur selbst verwalten, sondern diese in pseudonymisierter Form dem FDZ spenden – eine Wette auf die Zukunft, denn die seit Anfang 2021 allen gesetzlich Versicherten angebotene ePA nutzen bisher weniger als 1% und zur freiwilligen Übermittlung höchst persönlicher Daten an staatliche Stellen gibt es keine Erfahrungswerte.

Zu beiden Initiativen gibt es sowohl Lob als auch Kritik. Übereinstimmend werden die Standardisierungs- und Interoperabilitätsverbesserungen medizinischer Daten sowie die dadurch leichtere primäre Datennutzung im Rahmen der Behandlung gelobt. Kritische Anmerkungen beziehen sich auf erhebliche begriffliche Unbestimmtheiten und die sekundäre Datennutzung. Was fällt alles unter den Begriff Gesundheitsdaten? Wie weit reichen die sekundären Verwendungszwecke, wie weit der Forschungsbegriff? Wer soll zum Kreis der Nutzungsberechtigten gehören? Kritisiert wird auch, dass die Initiativen zu Schutzmaßnahmen (u.a. Pseudonymisierungs-, Anonymisierungs- und Verschlüsselungsverfahren) bisher eher vage bleiben und die Rechte von Betroffenen (insbesondere deren Widerspruchsrechte) ungenügend beachtet werden. Teilweise wird auch die Angemessenheit der umfangreichen Zusammenführung von Gesundheitsdaten bezweifelt, die Sicherheitsrisiken und das Schadenspotenzial bei Cyberattacken in nicht erforderlicher Weise erhöhen.

Eine parlamentarische Auseinandersetzung mit diesen nationalen und europäischen Initiativen scheint dringend geboten, denn die anvisierte intensive Weiterverwendung von hochsensiblen personenbeziehbaren Gesundheitsdaten und die dafür notwendigen rechtlichen Veränderungen können nur gelingen, wenn

  • die vorgesehenen Verfahren und Strukturen im Einklang mit der freiheitlichen Grundordnung stehen,
  • Versicherte sowie Behandlungs- und Pflegepersonal die jeweiligen Vorgehensweisen akzeptieren und vom Mehrwert überzeugt sind sowie
  • Forschungen und Anwendungsentwicklungen den erhofften gesellschaftlichen Nutzen auch realisieren.

Der TAB-Bericht zu Data-Mining liefert vielfältige Informationen zum Umgang mit Gesundheitsdaten

Eine Orientierungshilfe bezüglich vielfältiger technischer und rechtlicher Aspekte der Generierung unterschiedlicher Gesundheitsdatenkategorien sowie bestehender Herausforderungen bei deren Standardisierung, Weiterleitung und Verwendung zu Forschungszwecken bietet der TAB-Bericht „Data-Mining – gesellschaftspolitische und rechtliche Herausforderungen“, der Möglichkeiten und Grenzen komplexer Datenanalysen vor allem zu Forschungszwecken in der Medizin und im Gesundheitswesen vertieft behandelt. Er skizziert allgemeine technische Voraussetzungen für die automatisierte Verarbeitung zunehmend großer Datenbestände, insbesondere deren semantische und syntaktische Standardisierung sowie deren Katalogisierung anhand von Metadatensätzen, um sie in Repositorien strukturiert ablegen und wiederfinden zu können. Auch auf datenbereitstellende Infrastrukturen und den Aufwand zum Aufbau ebendieser wird eingegangen.

Rechtliche Aspekte werden insbesondere hinsichtlich des Umgangs mit besonders schützenswerten personenbezogenen Daten angesprochen. Eine zentrale Rolle spielen die (Grund)Rechte Betroffener und die Pflichten Datenverarbeitender sowie die unterschiedlichen Öffnungsklauseln in der europäischen Datenschutz-Grundverordnung (DSGVO), durch die u.a. gesundheitssystemische Datenverarbeitungen sowie die Weiterverwendung entsprechender Daten zu Forschungszwecken in gewissen Grenzen national eigenständig reguliert werden können.

Vertieft behandelt werden die mit dem Oberbegriff „personenbezogene Gesundheitsdaten“ assoziierten unterschiedlichen Datenkategorien, wobei grundsätzlich unterschieden wird zwischen medizinischen und administrativen Daten (teilweise auch als Versorgungsdaten bezeichnet). Erstere werden im Rahmen der Behandlung immer detailreicher erhoben und in unterschiedlichen primär arztgeführten Patientenakten- und Informationssystemen dezentral gespeichert und geschützt. Dritte haben kaum Zugang. Diese medizinischen Primärdaten und die diesbezüglich notwendige Verwaltungssoftware haben bisher nur eine geringe Interoperabilität. Informationsübermittlungen und Datenübertragungen an Dritte sind aufwendig und bisher wenig digitalisiert. Traditionell liegt jegliches Handling medizinischer Daten in den Händen von Ärzt/innen und medizinischen Einrichtungen, was auch haftungsrechtliche Ursachen hat. Um diese medizinischen Daten zu Forschungszwecken weiterverwenden zu können, bauen sowohl Fachgesellschaften als auch Unikliniken seit Jahren spezielle medizinische Register und Datenzentren auf und aus, an die mit Einwilligung von Patient/innen ausgewählte Behandlungsdaten übermittelt werden. Die Verwaltung medizinischer Behandlungsdaten durch Patient/innen in von ihnen selbst zu führenden sekundären elektronischen Patientenakten stellt im Behandlungsalltag weitgehend Neuland dar und wirft derzeit vielfältige Fragen auf, u.a. zur Vollständigkeit, Verlässlichkeit, Mehrfachspeicherung, Reintegration von Daten in bestehende Behandlungsabläufe, aber auch zum vorgesehenen Einwilligungsverfahren zur pseudonymisierten Datenspende an das FDZ.

Medizinische Einrichtungen sind gesetzlich verpflichtet, vielfältige Datensätze zur Abrechnung medizinischer Leistungen im Rahmen der gesetzlichen Krankenversicherung (GKV), aber auch zur Qualitätssicherung, Planung und Weiterentwicklung der medizinischen Versorgung sowie zur Überwachung der gesundheitlichen Situation entweder aus den Behandlungsdaten abzuleiten oder strukturiert zusammenzustellen. Vor allem die Leistungsabrechnungsdaten haben Bezüge zu den behandelten Patient/innen und enthalten standardisierte Informationen zu Diagnosen und Behandlungen, jedoch keine spezifischen medizinischen Details (keine Laborwerte oder Röntgenbilder). Diese standardisierten Daten werden an festgelegte Institutionen der gesundheitssystemischen Selbstverwaltung übermittelt, dort zusammengeführt und für die jeweiligen gesetzlich definierten Aufgaben verwendet. Meist dürfen diese Institutionen ihre Datenbestände zu Planungs- und Forschungszwecken weiterverwenden, teilweise führen sie auch Analysen z.B. für Gesundheitsministerien durch. Zudem werden alle Leistungsabrechnungsdaten seit 2014 in einem aufwendigen Verfahren an das FDZ transferiert, um sie in bisher sehr engen Grenzen zu Forschungszwecken weiterverwenden zu können.

Mit den genannten politischen Aktivitäten auf europäischer und nationaler Ebene sollen die Weiterverwendungsmöglichkeiten sowohl der medizinischen als auch der administrativen Daten insbesondere zu Forschungszwecken verbessert werden. Dabei spielen Einwilligungsmanagementsysteme sowie unterschiedliche Maßnahmen und Verfahren zum Schutz der Daten und (Grund)Rechte betroffener Personen sowie zur Standardisierung und treuhändischen Verwaltung eine besondere Rolle.

Im TAB-Bericht werden die technischen Ansätze zur Pseudonymisierung, Anonymisierung, Verschlüsselung und Vergröberung vorgestellt. Anhand von Beispielen werden die für gesundheitssystemische Weiterverwendungen oft genutzten Mehrfach- oder Einwegpseudonymisierungen, die derzeit gängigen Datentreuhandstrukturen sowie unterschiedliche Ansätze, der dezentralen und zentralen Datenspeicherung und -analytik veranschaulicht. Dabei wird deutlich, dass für die Weiterverwendung von Versorgungsdaten statt der Einwilligung von Betroffenen gesetzlich eng definierte Sekundärnutzungen und zentrale Datenspeicher mit Datentreuhandverfahren favorisiert werden, auch wenn diese zentrale Zusammenführung aufwendig ist, lange dauert und zudem nur für wenige Untersuchungen zwingend nötig ist. Inwiefern die mit zentralisierten Datenzentren verbundenen hohen Nutzenerwartungen auch erfüllt werden, hängt von vielfältigen Faktoren ab und kann bisher schwer beurteilt werden. Mehr Transparenz bezüglich der Weiterverwendung soll mit zusätzlichen Registern zu den Weiterverwendungsanträgen und den erzielten Ergebnissen erreicht werden.

Eine Neuordnung der Weiterverwendung von Gesundheitsdaten steht an

Bisher wird die Weiterverwendung von geschützten Daten zu Forschungszwecken im europäischen und nationalen Recht auf unterschiedliche Weise zugelassen. Es wird erwartet, dass etliche Formulierungen zum Forschungsprivileg im Rahmen des Verordnungsentwurfs zur Schaffung eines gemeinsamen europäischen Gesundheitsdatenraumes und des angekündigten Gesundheitsdatennutzungsgesetzes harmonisiert und neu verhandelt werden. Eine parlamentarische Auseinandersetzung mit der Reichweite dieses Forschungsprivilegs, eine einheitliche rechtliche Verankerung im Sozialrecht sowie die Straffung der Antrags- und Genehmigungsverfahren scheint dringend geboten.

In der derzeitigen Dateneuphorie wird die Frage nach der Verhältnismäßigkeit und Angemessenheit der zentralisierten Gesundheitsdatenspeicherung und immer umfangreicheren Verknüpfung mit weiteren Kontextdaten oft nur am Rande gestellt. Um sich dieser Frage zu nähern, müssen die Nutzungsabsichten und die analytischen Möglichkeiten und Grenzen der jeweiligen Datenbestände in den Blick genommen werden. Auch dazu liefert der TAB-Bericht vielfältige Informationen.

Mit den im Raum stehenden Gesundheitsdatennutzungsoffensiven wird der Umgang mit hochsensiblen persönlichen Daten neu geregelt. Der Aufwand für den Auf- und Ausbau eines europaweit sicheren und vielfach nutzbaren Gesundheitsdatenraumes ist groß. Die Herausforderung ist, effiziente Verfahren und Vorgehensweisen zu finden, die von allen getragen werden können:

  • von Patient/innen, die ihre Daten in stärkerem Maße selbst verwalten und zudem spenden sollen,
  • von Ärzt/innen und anderen medizinischen Fachkräften, die Patient/innen vertrauensvoll und fachgerecht behandeln und dabei Gesundheits- und Pflegedaten primär generieren, diese vielfach weiterverarbeiten und übermitteln sollen – und gleichzeitig aufgrund des Fachkräftemangels dringend entlastet werden müssen,
  • von den „Weiterverwendenden“, die Informationen und Erkenntnisse ableiten sowie neue Dienste und Produkte schaffen sollen, genauso wie
  • von den Organen der Selbstverwaltung, die in der Verantwortung stehen, das Gesundheitssystem zukunftsfest weiterzuentwickeln.

Es ist sehr zu hoffen, dass die aktuellen Bemühungen zu belastbaren Lösungen führen, die auch mittelfristig Bestand haben. Und aus Sicht des TAB wäre es natürlich hochgradig wünschenswert, dass die Rezeption des TAB-Berichts „Data-Mining – gesellschaftspolitische und rechtliche Herausforderungen“ hierzu einen gewissen Beitrag leisten kann.

Dieser wie andere Beiträge zu "Themen im Kontext" spiegelt die Meinung der Autor/innen und weder notwendigerweise noch ausschließlich die Meinung des TAB wider. Für mehr Informationen zu den Inhalten dieser Beiträge und den assoziierten Projekten für den Deutschen Bundestag kontaktieren Sie bitte die Autor/innen oder wiko∂tab-beim-bundestag.de.

TA-Berichte in Plenar- und Ausschusssitzungen

Hintergrundbild: Technologie zur Visualisierung von Big Data-Analysen mit Wissenschaftlern, die die Informationsstruktur auf dem Bildschirm mit maschinellem Lernen analysieren (TAB-Projekbild: Data-Mining) NicoElNino&kues1/Adobe Stock
Beratung über Technik­folgenanalyse zu Data-Mining

Plenardebatte zum TAB-Bericht „Data-Mining – gesellschaftspolitische und rechtliche Herausforderungen“ am 21. April 2023.

Liveübertragung auf bundestag.de

Nachschauen
Hintergrundbild: Personen mit Notebooks und Bildschirmen bunt quadratiertem Hintergrundscusi (TAB-Projektbild: Algorithmen in digitalen Medien) scusi/123RF
Einfluss von Algorithmen in digitalen Medien auf die Meinungsbildung

Plenardebatte zum TAB-Bericht „Algorithmen in digitalen Medien und ihr Einfluss auf die Meinungsbildung“ am 10. Februar 2023 auf bundestag.de

Nachschauen