→Springe direkt zum Inhalt

Büro für Technikfolgen-Abschätzung beim Deutschen Bundestag Büro für Technikfolgen-Abschätzung beim Deutschen Bundestag

Informationen zur Vergabe von Gutachten

Data-Mining – gesellschaftspolitische und rechtliche Herausforderungen

Die Einreichungsfrist für Angebote ist abgelaufen.

Hintergrund

Die automatisierte Auswertung der kontinuierlich wachsenden öffentlichen und privaten Datenbestände gilt als ein, wenn nicht das fundamentale Geschäftsmodell der digitalen Gesellschaft. Unter »Data-Mining« wird im Rahmen dieses Projektes der Prozess der Wissensgenerierung aus den vielfältigen Datenbeständen durch Anwendung mathematisch-statistischer Verfahren und Algorithmen verstanden. Das Ziel ist, bisher unbekannte, neue Muster und Zusammenhänge zu erkennen, daraus verwertbare Informationen abzuleiten und gegebenenfalls prognostische Modelle und sogenannte Expertensysteme zu entwickeln, die auf Basis der Datenbestände Entscheidungshilfen für unterschiedliche Nutzergruppen ableiten. In der Wissenschaft ist dies eine seit Jahrzehnten angewendete methodische Herangehensweise, um mit den großen Datenmengen beispielsweise in der Physik, den Bio- und Geowissenschaften umgehen zu können. Auch in allen anderen Gesellschaftsbereichen nehmen seit Jahren Datengenerierung und -digitalisierung in enormem Maße zu, u. a. im Gesundheits- und Finanzwesen, im Verkehrs- und Energiebereich, bei der Überwachung öffentlicher Räume sowie in der öffentlichen Verwaltung (E-Government). In Verbindung mit den wachsenden technischen Möglichkeiten der immer schnelleren Verarbeitung weckt die Nutzung dieser großen und vielfältigen Datenbestände (Big Data) durch Industrie und Staat, aber auch durch Akteure der Zivilgesellschaft und Privatpersonen einerseits Hoffnungen auf individuell zugeschnittene (Dienst-)Leistungen sowie verbesserte Möglichkeiten der Kontrolle unterschiedlicher Geschäftsabläufe. Andererseits ergeben sich neue Herausforderungen in den Bereichen Informationsfreiheit, informationelle Selbstbestimmung, (geistige) Eigentumsrechte und Datenschutz. Seit Jahren befassen sich Teile der Wissenschaft, Industrie, Zivilgesellschaft und Politik intensiv mit den damit verbundenen Innovationspotenzialen, zunehmend auch mit rechtlichen und ethischen Fragen oder Regulierungsoptionen.

Im TA-Projekt »Data-Mining – gesellschaftspolitische und rechtliche Herausforderungen« sollen anhand von zwei Anwendungsbereichen rechtliche, ethische, politische und sozioökonomische Fragestellungen, die Data-Mining-Verfahren aufwerfen, dargestellt und diskutiert werden. Eine Fallstudie soll den Einsatz von Data-Mining-Verfahren in der Medizin und im Gesundheitssystem untersuchen, der insbesondere die Verwendung personenbezogener Gesundheitsdaten einschließt. Die zweite Fallstudie soll den Einsatz von Data-Mining-Verfahren bei der Erfüllung öffentlicher Aufgaben (jenseits des Gesundheitsschutzes) thematisieren, der insbesondere die Verwendung von Geodaten zur Beobachtung und Kontrolle unterschiedlicher Vorgänge auf der Erde (z.B. Wetterdienste, Umweltveränderungen, Überwachung öffentlicher Räume) umfasst.

Die Anwendungsbereiche der Fallstudien wurden aufgrund ihrer aktuellen und zukünftigen parlamentarischen Relevanz gewählt. Wenn öffentliche Dienste und deren Datenbestände für Data-Mining verwendet werden, ist der Gesetzgeber in besonderem Maße zur Ausgestaltung und Gewährleistung einer regelkonformen Datengewinnung und -nutzung verpflichtet. Viele der derzeit diskutierten Fragen in Bezug auf die gesellschaftlichen Herausforderungen durch die Digitalisierung (u.a. Umgang mit besonders schützenswerten Daten wie auch mit Open-Data-Initiativen und Informationsfreiheit) können in den Fallstudien beispielhaft untersucht werden.

Leistungsbeschreibung der zu vergebenden Gutachten

Zu den beiden Anwendungsbereichen soll jeweils ein Gutachten vergeben werden.

Fallstudie 1: Data-Mining in der Medizin und im Gesundheitssystem

Die Medizin wird oft als ein Vorreiter in der Anwendung von Data-Mining-Verfahren genannt, denn evidenzbasiert heißt dort seit langem datenbasiert. Die verfügbaren Daten und das existierende Wissen haben Dimensionen erreicht, die auch und gerade für spezialisierte Fachkräfte IT-Assistenz zur Informationsextraktion erforderlich machen, sowohl in der Forschung als auch bei der Behandlung von Patienten. Mit der Nutzung von Data-Mining-Verfahren wird in der Medizin die Hoffnung verbunden, Krankheiten früher und besser zu erkennen, individualisierter therapieren oder gar vermeiden zu können. Im Gesundheitssystem werden neben Qualitätsverbesserungen auch Kosteneinsparpotenziale erwartet.

Teil A: Anwendungsbeispiele

Beispiele für den Einsatz von Data-Mining-Verfahren (sowohl im engeren Sinn zum Erkennen neuer Zusammenhänge als auch im erweiterten Sinn zur Entwicklung von Expertensystemen und prognostischen Modellen) in der Medizin und im Gesundheitssystem sollen möglichst so ausgewählt werden, dass sie die Vielfalt der Möglichkeiten aufzeigen, die Potenziale und Grenzen veranschaulichen sowie die im Kontext von Data-Mining diskutierten offenen Fragen und unterschiedlichen Standpunkte verdeutlichen.

Folgende Fragestellungen sollen helfen, die Darstellung der Anwendungsbeispiele zu strukturieren:

  • Welche Verfahren (Data-/Text-Mining, Ausreißererkennung, Sortierung/Klassifikation) und Verarbeitungsmodelle (distributed computing, software as a service, cloud computing) werden verwendet? Welche Entwicklungen zeichnen sich ab (z.B. privacy preserving data-mining)? (Softwarekomponente)
  • Auf welche Datenbestände greifen die ausgewählten Anwendungsbeispiele zu, wie (un-)strukturiert können bzw. müssen die Daten sein? (Datenkomponente)
  • Welche neuen/zusätzlichen Informationen können gewonnen werden? Wie (un)sicher/zuverlässig sind diese, welche medizinische Aussagekraft haben sie? (Ergebniskomponente)
  • In welchen Kontexten sollen die Informationen verwendet werden, welche Nutzergruppen kommen in Betracht? Welche Aussagen lassen sich zur Akzeptanz der Verfahren bei relevanten Akteursgruppen machen? (Nutzerkomponente)
  • Wo liegen die Grenzen der Verfahren, was können sie nicht?
  • Welche normativen und ethischen Fragen werden gegebenenfalls aufgeworfen?

(Bereits im Gutachtenangebot sollen Vorschläge für Anwendungsbeispiele gemacht und eine kurze Begründung für die Auswahl geliefert werden. Die endgültige Festlegung wird dann in Abstimmung mit dem TAB erfolgen.)

Teil B: relevante Datenbestände und deren Zugänglichkeit

Vielfältige Datenbestände (z.B. klinische Studien, Biobanken, Dokumentation und Verwaltung im Gesundheitssystem) und wissenschaftliche Publikationen sind einzeln und/oder in Registern und Repositorien abgelegt. Die besonderen Schutzstandards der vielfach zu Grunde gelegten personenbezogenen Gesundheitsdaten wirken sich auf die Datenerhebung, den Zugang und die Verwendungsmöglichkeiten aus. Pseudonymisierungs- oder Anonymisierungsverfahren spielen bei medizinischen Datenbeständen eine zentrale Rolle. Patientenschutz und Geschäftsgeheimnisse begrenzen Transparenzinitiativen und Informationsfreiheit im Gesundheitsbereich. Im Gutachten soll ein strukturierter Überblick über wesentliche potenziell relevante Datenbestände unterschiedlicher Akteursgruppen gegeben werden (an den TAB-Arbeitsbericht Nr. 112 »Biobanken« kann angeknüpft werden). Folgende Fragestellungen sollen kompakt und überblicksartig beantwortet werden:

  • Welche relevanten Datensammler (z.B. Forschungseinrichtungen, Privatwirtschaft, Zulassungs- und Überwachungsbehörden, Leistungserbringer und Leistungsträger des Gesundheitssystems) gibt es?
  • Welche Datenbestände bauen sie auf? Wie und durch wen werden die Daten erhoben?
  • Welche Datenpolitik verfolgen die relevanten Akteure? Welche Transparenz-/Open-Access-Aktivitäten gibt es? Für wen sollen welche Daten wie zugänglich gemacht werden und für wen nicht?
  • Werden im medizinischen Bereich auch Alternativen zum direkten Datenzugang verfolgt (z.B. analytics as a service)?
  • Welche offenen Fragen in Bezug auf die Nutzung der Daten gibt es, wo besteht Klärungs- und Handlungsbedarf? Muss z.B. die Analyseabsicht offengelegt werden, um einen Datenzugang zu bekommen? Wie erfolgt die Grenzziehung zwischen Informationsfreiheit und Geschäftsschutz bei den jeweiligen Akteursgruppen? Wer trägt welche Kosten)?
Teil C: Rechte, Pflichten und neue Möglichkeiten und Herausforderungen

Die im medizinischen Bereich gesammelten und verwendeten Datensätze beruhen zum erheblichen Teil auf personenbezogenen Gesundheitsdaten, aus denen durch den Erkenntnisfortschritt und mit neuen Verfahren kontinuierlich mehr Informationen abgeleitet werden können. Schutzstandards in Bezug auf Datengeber und -sammler, aber auch bezüglich der Verarbeitung und Verwendung der daraus abgeleiteten Informationen wurden rechtlich verankert.

  • Welche Regeln gelten für das Sammeln und Verwenden von personenbezogenen Gesundheitsdaten? Welche Rechte haben Datengeber, welche Pflichten Datensammler? Gibt es Interessenvertretungen von Personen/Patienten als Datengeber, welche Mitspracherechte haben sie?
  • Wem »gehören« die Daten, wer entscheidet über ihre Verwendung? Wie wird die Verwendung im medizinischen Bereich vereinbart, gibt es einheitliche Verfahren?
  • Welche Kontrollverfahren und -möglichkeiten gibt es?
  • Inwiefern ist Data-Mining mit den Grundsätzen und Verfahren des europäischen/deutschen Datenschutzes vereinbar bzw. nicht vereinbar?
  • Welche neuen Möglichkeiten der Deanonymisierung eröffnen sich durch Data-Mining-Verfahren?
  • Welche Veränderungen oder Herausforderungen könnten sich durch Data-Mining zukünftig zwischen den Akteursgruppen des Gesundheitssystems (Verhältnis zwischen Sozialversicherungsgebern und -nehmern, zwischen Ärzten und Patienten, zwischen Leistungsträgern und Leistungserbringern z.B. in Bezug auf eine gezieltere Einflussnahme auf Diagnostik und Prävention), aber auch zwischen den einzelnen Mitgliedern innerhalb einer Gruppe (z.B. bessere Vergleichbarkeit von Versicherungsnehmern oder Leistungserbringern, schnelleres Erkennen von Abweichungen und Ausreißern, Priorisierung einzelner Gruppen, Einflussnahme auf das Verhalten) ergeben?
Teil D: Ausblick: neue Ansätze, Geschäftsmodelle und Akteure

Durch die Digitalisierung und die damit einhergehenden Entwicklungen entstehen viele neuartige Geschäftsmodelle, die bisher etablierte Strukturen mitunter ergänzen. Zeichnen sich neue, bisher nicht berücksichtigte Akteure und Vorgehensweisen ab (u.a. Quantified-Self-Bewegung, medizinische und/oder Gesundheitsapps, Google Flu-Trends)? Können sich daraus weitgehend neuartige Vorgehensweisen in der Medizin und/oder im Gesundheitssystem ergeben?

Dieser Teil D soll die Möglichkeit eröffnen, das Blickfeld zu erweitern und auch Entwicklungen jenseits der etablierten Strukturen zu berücksichtigen. Eigene Akzentuierungen durch die Gutachter sind erwünscht.

Fallstudie 2: Data-Mining mit Geodaten

Die zweite Fallstudie soll den Einsatz von Data-Mining-Verfahren bei der Erfüllung öffentlicher Aufgaben (jenseits des Gesundheitsschutzes) thematisieren, der insbesondere die Verwendung von Geodaten zur Beobachtung und Kontrolle unterschiedlicher Vorgänge auf der Erde (z.B. Wetterdienste, Umweltveränderungen, Überwachung öffentlicher Räume) einschließt. Die seit Jahrzehnten kontinuierlich wachsenden Satellitendatenarchive haben Größenordnungen erreicht, die Data-Mining-Verfahren nahezu zwingend erfordern, um Informationen und Wissen zu extrahieren. Wettervorhersagen und Szenarien zur Entwicklung des Klimas beruhen schon seit langem auf komplexen, hochgradig datenintensiven Modellen. Durch die derzeitige massive Förderung der Entwicklung weiterer satellitendatenbasierter Informationsdienste für vielfältige öffentliche Aufgaben (z.B. »Copernicus«, »GEOSS«) werden Data-Mining-Verfahren breit eingesetzt, um Informationsdienste u.a. in den Bereichen Umwelt, Verkehr, Sicherheit, Energie, Gesundheit auch für öffentliche Aufgaben zu entwickeln.

Fallstudie 2 sollte möglichst weitgehend die Struktur der ersten Fallstudie übernehmen, um Gemeinsamkeiten und Unterschiede bei den Akteuren, dem Datenmanagement oder auch den rechtlichen Rahmenbedingungen aufzuzeigen. Sie kann bei unterschiedlichen Fragestellungen (Geodatenaufbereitung, internationale Vereinbarungen, Anwendungsinitiativen, Geschäftsmodelle) an den TAB-Arbeitsbericht Nr. 154 »Erdfernerkundung« anknüpfen und darauf Bezug nehmen.

Teil A: Anwendungsbeispiele

Beispiele für den Einsatz von Data-Mining-Verfahren (sowohl im engeren Sinn zum Erkennen neuer Zusammenhänge als auch im erweiterten Sinn zur Entwicklung von Expertensystemen und prognostischen Modellen) sollen möglichst so ausgewählt werden, das sie die Vielfalt der Möglichkeiten zeigen, deren Potenziale und Grenzen veranschaulichen sowie die im Kontext von Data-Mining diskutierten offenen Fragen und unterschiedlichen Standpunkte verdeutlichen können.

Folgende Fragestellungen sollen helfen, die Darstellung der Anwendungsbeispiele zu strukturieren:

  • Welche Verfahren (Klassifikation, Mustererkennung, prognostische Modelle) und Verarbeitungsmodelle (distributed computing, software as a service, open source) werden verwendet? Welche Entwicklungen zeichnen sich ab? (Softwarekomponente)
  • Auf welche Datenbestände (Satelliten-/In-situ-Daten) greifen die jeweiligen Anwendungsbeispiele zu, wie (un-)strukturiert können bzw. müssen die Daten sein? (Datenkomponente)
  • Welche neuen/zusätzlichen Informationen können gewonnen werden? Wie (un-)sicher/zuverlässig sind diese, welche Aussagekraft haben sie? (Ergebniskomponente)
  • In welchen Kontexten sollen die Informationen und Dienste verwendet werden, welche Nutzergruppen kommen in Betracht? (Nutzerkomponente)
  • Wo liegen die Grenzen der Verfahren, was können sie nicht?
  • Welche normativen und ethischen Fragen werden gegebenenfalls aufgeworfen (z.B. bei Anwendungen im Bereich Sicherheit, beim Spannungsverhältnis zwischen den Grundrechten und den Interessen des Einzelnen sowie dem staatlichen Auftrag einer Gewährleistung der Sicherheit des öffentlichen Raums und öffentlicher Veranstaltungen)?

(Bereits im Gutachtenangebot sollen Vorschläge für Anwendungsbeispiele gemacht und eine kurze Begründung für die Auswahl geliefert werden. Ein Beispiel sollte den Bereich Sicherheit/Überwachung öffentlicher Räume, ein weiteres eine grenzüberschreitende Anwendung thematisieren. Die endgültige Festlegung wird dann in Abstimmung mit dem TAB erfolgen.)

Teil B: relevante Datenbestände und deren Zugänglichkeit

Mit Hilfe der kontinuierlich ausgebauten Satellitensensorik können vielfältige Vorgänge auf der Erde immer detaillierter erfasst werden. Einzelne Staaten stufen inzwischen auch hochaufgelöste Satellitendaten als besonders sensibel ein und versuchen die Erhebung und/oder Verwendung zu begrenzen. Auch werden erhebliche Anstrengungen unternommen, um vielfältige In-situ-Datenbestände für die Vernetzung mit Satellitendaten aufzubereiten. Im Gutachten soll ein strukturierter Überblick über wesentliche Datenbestände, Initiativen zur Verknüpfung sowie Gemeinsamkeiten und Unterschiede zum Umgang mit personenbezogenen Gesundheitsdaten herausgearbeitet werden. Folgende Fragestellungen sollen beachtet werden:

  • Welche Daten insbesondere deutscher Fernerkundungsaktivitäten sind über welche Geschäftsmodelle und Strukturen zugänglich? Welche Datenzugangsverfahren sind im Rahmen von »Copernicus« vorgesehen?
  • Welche Datenpolitik verfolgen die relevanten Akteure? Welche Transparenz-/Open-Access-Aktivitäten gibt es (auch im internationalen Vergleich)? Für wen sollen welche Daten wie zugänglich gemacht werden und für wen nicht?
  • Werden auch Alternativen zum direkten Datenzugang verfolgt (z.B. analytics as a service)?
  • Welche offenen Fragen in Bezug auf die Nutzung der Daten gibt es, wo besteht Klärungs- und Handlungsbedarf?
  • Welche Gemeinsamkeiten und Unterschiede im gesellschaftlichen Umgang mit als besonders sensibel eingestuften personenbezogenen und Geodaten gibt es?
Teil C: Rechte, Pflichten und neue Möglichkeiten und Herausforderungen

Das Weltall als hoheitsfreier Raum bietet besondere Möglichkeiten, auch hoheitsfremde Gebiete zu erkunden, Daten zu erfassen und zu verwenden.

  • Welche Regeln gelten für das Sammeln und Verwenden von Geodaten innerhalb und außerhalb des Hoheitsgebietes?
  • In welchen Fällen können Bürger wiedersprechen? Welche Möglichkeiten gibt es bzw. zeichnen sich ab, um von Geodaten auf personenbezogene Informationen zu schließen?
  • Welche Rechte haben Staaten bei der Fernerkundung ihres Hoheitsgebietes?
  • Wem »gehören« die Daten, wer entscheidet über ihre Verwendung?
  • Inwiefern kann Data-Mining zu neuen Ungleichheiten, Ungerechtigkeiten im zwischenstaatlichen Handeln führen?
  • Welche Herausforderungen könnten sich durch Data-Mining zukünftig insbesondere zwischen Ländern mit und ohne Verfügungsgewalt über die Technik ergeben?
Teil D: neue Geschäftsmodelle und Akteure

Durch die Digitalisierung und die damit einhergehenden Entwicklungen entstehen viele neue Geschäftsmodelle, die bisher etablierte Strukturen mitunter ergänzen. Zeichnen sich neue, bisher nicht berücksichtigte Akteure und Vorgehensweisen ab?

Dieser Teil D soll die Möglichkeit eröffnen, das Blickfeld zu erweitern und auch Entwicklungen jenseits der etablierten Strukturen zu berücksichtigen. Eigene Akzentuierungen durch die Gutachter sind erwünscht.

Allgemeines

Angebote sollten pro Fallstudie erstellt und eingereicht werden. Aus den Angeboten muss neben der inhaltlichen Schwerpunktsetzung und dem methodischen Vorgehen auch klar ersichtlich sein, welcher Arbeitsaufwand und welche Kosten kalkuliert werden. Insgesamt wird eine interdisziplinäre Herangehensweise angestrebt. Bei mehreren Auftragnehmern wird die Bereitschaft zur Kooperation untereinander vorausgesetzt. Bei der Gutachtenerstellung ist die Abstimmung zwischen den beiden Teams und dem TAB erwünscht.

Termine

  • Abgabetermin für die Angebote ist der 18.09.2014.
  • Mit der Bearbeitung der Gutachten soll (voraussichtlich) am 15.10.2014 begonnen werden. Eine Zwischenberichterstattung ist bis zum 01.12.2014 vorzusehen.
  • Die Gutachten müssen bis zum 15.05.2015 fertiggestellt sein.
  • Der Bearbeitungsaufwand sollte sechs bis acht Personenmonate nicht wesentlich überschreiten.

Hinweise zur Angebotserstellung

Die Bereitschaft zur intensiven Diskussion und engen Kooperation mit dem TAB wird vorausgesetzt.

Bei der Erarbeitung der Angebote sind die »Hinweise für Gutachter« zu beachten. Insbesondere muss die Kompetenz der Anbietenden aus den Angeboten hervorgehen, und es müssen die beabsichtigte Vorgehensweise und der erforderliche Bearbeitungsaufwand verdeutlicht werden.

Nach unseren Erfahrungen müssen die eingehenden Angebote oft inhaltlich wie kalkulatorisch noch modifiziert werden. Senden Sie uns deshalb zunächst möglichst frühzeitig eine elektronische Version Ihres vollständigen Angebots zusammen mit dem FormblattPDF [0,04 MB] (s.a. Hinweise für Gutachter) an unsere E-Mail-Adresse Sollten wir Ihr Angebot nach Prüfung durch uns in die engere Wahl ziehen und dem Deutschen Bundestag zur Vergabe vorschlagen wollen, werden wir Sie um die Zusendung eines unterschriebenen Originalangebots an das TAB bitten (Neue Schönhauser Str. 10, 10178 Berlin).

Die vorgesehene Gutachtenvergabe zu den genannten Terminen erfolgt vorbehaltlich der rechtzeitigen Mittelbewilligung durch den Deutschen Bundestag.

Zum Seitenanfang