
Perspektiven der DFG auf KI und Open Access, Teil III
Dieser Post ist der letzte von drei in einer Blogpostreihe der DFG, die sich mit der Bedeutung von Künstlicher Intelligenz für die gute wissenschaftliche Praxis und Open Science auseinandersetzt:
- Teil I: Die Rolle Künstlicher Intelligenz in der wissenschaftlichen Praxis
- Teil II: Beziehungen zwischen Open Science und Künstlicher Intelligenz
- Teil III: Datentracking und Künstliche Intelligenz
Teil III: Datentracking und Künstliche Intelligenz
Wie kann die Wissenschaftslandschaft auf die Analyse von möglicherweise unerlaubt getrackten und gesammelten Daten reagieren?
Hier kommen zwei verschiedene Aspekte zusammen: Der eine betrifft das Thema Datentracking, d.h. die Erfassung, Sammlung und Analyse von Daten über das Nutzungsverhalten bei der Verwendung von digitalen Dienstleistungen. In der Wissenschaftslandschaft findet man dies bspw. bei der Literaturrecherche auf Verlagsplattformen – welche Suchbegriffe werden verwendet, welche Webseiten angeklickt, wer nutzt wann wo welche Publikation? Dieses Tracken reicht von legalen, zur Legitimation und Optimierung von Services notwendigen Formen des Datentracking über kontrovers diskutierte Grauzonen im Bereich der Bewertung wissenschaftlicher Qualität oder der predictive science bis hin zu datenschutzwidrigen und wissenschaftsethisch bedenklichen Analyse- und Weitergabepraktiken. Die Grenzen sind dabei häufig nicht trennscharf voneinander zu unterscheiden. Kritisch wird es, wenn die gesammelten Nutzungsdaten mit weiteren, außerhalb des Systems im „Real Life“ gesammelt personenbezogenen Daten verknüpft werden – etwa durch eingebundene Dienstleister oder kommerzielle Analyse-Dienste. So können individuelle Nutzungsprofile entstehen, die Rückschlüsse auf Personen und ihre Vorlieben zulassen. Ohne dass Forschende es überhaupt merken, geht ihre digitale Anonymität verloren. Noch gravierender: Solche Daten können Missbrauchspotentiale eröffnen, die bspw. in persönlicher Diskriminierung oder anderen sozialen Implikationen enden können.
Was die Problematik zusätzlich verschärft: Vielen Nutzenden ist oft gar nicht klar, dass sie getrackt werden, was genau getrackt wird und warum. Und nicht immer liegen die expliziten Einwilligungen der Nutzenden vor, die datenschutzrechtlich notwendig sind. Durch die Digitalisierung der Wissenschaften hat sich nicht nur eine Machtverschiebung zugunsten der Informationsplattformen und Verlage vollzogen, sondern auch eine Verschiebung der Datenkontrolle und der Verantwortung für den digitalen Datenschutz der Wissenschaftler*innen – weg von vormals datenschutz-freundlichen Bibliotheksumgebungen mit hohem, den wissenschaftlichen Anforderungen entsprechenden Datenschutzstandards, hin zu heutigem oftmals über die kommerziellen Plattformen stattfindenden digitalen Umgang mit persönlichen Nutzungsdaten, der kommerziellen „Privacy Standards“ folgt, die es ethisch zu hinterfragen gilt.
Diese Entwicklung berührt die Wissenschaftsfreiheit und die akademischen Informationsanbietenden – kommerzielle wie nicht-kommerzielle – müssen dringend aktiv und ihrer ethischen Verantwortung gerecht werden: für Transparenz sorgen, zwingend rechtliche Datenschutzanforderungen einhalten, und datensparsam nur für den Service der Informationsinfrastruktur notwendige Daten erheben, idealerweise unter Einsatz von Privacy-by-Design. Transparenz schafft Vertrauen, und die Wissenschaft braucht Vertrauen in verlässliche und ethisch integre akademische Informationsplattformen.
KI und Datentracking
Der zweite Aspekt betrifft die Analyse dieser Trackingdaten durch KI-Systeme. Positiv eingesetzt können diese Analysen z.B. Serviceangebote verbessern, die Erstellung gewünschter persönlicher Suchprofile ermöglichen oder auch als Science Analytics verwendet werden; im negativen Sinne können sie zu Machtmissbrauch und Diskriminierung, predictive science und versteckten Steuerungsmechanismen im Wissenschaftssystem führen. Sind die für die KI-Systeme verwendeten personenbezogenen Daten unerlaubt ohne Einwilligung der Nutzenden getrackt worden, ist dies ein klarer Verstoß gegen geltendes Datenschutzrecht und bringt rechtliche Konsequenzen mit sich. Zudem stehen sämtliche Ergebnisse der KI-Verarbeitung auf rechtlich wackeligem Boden. Auch hier spielt das Thema Transparenz eine große Rolle: Forschung muss wissen und kritisch hinterfragen, welche Datenbasis für KI-Analysen verwendet wird, woher die Daten kommen und wie die Analyse durchgeführt wird. Gerade bei der KI-Nutzung von personenbezogenen Daten bedarf es klarer ethischer Leitlinien. Wenn diese Fragen nicht eindeutig beantwortet werden können, verlieren wir die Vertrauensbasis in die KI-Systeme und Analyseergebnisse.
Die Position der DFG zum Datentracking im Publikationswesen
Die zunehmende Praxis der Wissenschaftsverlage und Plattformbetreiber, das Nutzungsverhalten der Forschenden durch Tracking zu erfassen, zu analysieren und an Dritte weiterzugeben, gefährdet die Anonymität der Forschenden und steht im Widerspruch zur Wissenschaftsfreiheit. Die DFG hat sich deshalb in den letzten Jahren intensiv mit der Herausforderung des Datentracking in der Wissenschaft auseinandergesetzt und klare Positionen wie Handlungsempfehlungen formuliert (DFG, 2021).
Im Zentrum steht die Forderung nach einer ethischen Reflektion des Themas, die über die technischen wie auch rechtlichen Fragestellungen, die mit der Tracking-Praxis verbunden sind, hinausgeht. In erster Linie gilt es, Transparenz über die Art und den Umfang des Trackings zu schaffen, Nutzende klar über die Verwendung ihrer Daten zu informieren und auf Anbieterseite bestehende Datenschutzbestimmungen konsequent einzuhalten. Letzteres ist – obwohl gesetzlich eindeutig formuliert – bislang oft die Ausnahme. Darüber hinaus fordert die DFG einen ethischen Umgang mit Daten: Es sollen nur unbedingt notwendige Daten erhoben werden (Datensparsamkeit) und Datenschutz sollte nach Privacy-by-Design-Prinzipien in die Systemarchitektur integriert werden. Auch wissenschaftliche und bibliothekarische Einrichtungen stehen in der Verantwortung: Sie sind aufgerufen, ihre Verträge mit Verlagen und Plattformen kritisch zu prüfen und sicherzustellen, dass Datenschutz und ethische Standards gewahrt werden.
Die DFG gestaltet den Prozess aktiv mit, etwa durch die Einsetzung einer Expert*innengruppe, die erstmals Datenschutz-Aspekte in die nationalen DEAL-Verhandlungen eingebracht hat. (Altschaffel, et al. 2024) Damit wurde Pionierarbeit geleistet, indem rechtliche Rahmenbedingungen systematisch beleuchtet und erstmalig umfassendere Datenschutzanforderungen gegenüber den großen Wissenschaftsverlagen eingebracht und vertraglich festgehalten wurden. Auch wenn aus Wissenschaftssicht nicht weitreichend genug, stellen die vertraglichen Datenschutzregelungen doch eine gute Diskussionsbasis dar. Darüber hinaus gilt es im gesetzlichen Sinne nachzubessern, um wissenschaftsfreundlichere Datenschutzlösungen legitim und langfristig abzusichern.
Kritisch denken
Sowohl im beruflichen wie auch im privaten Bereich lohnt es sich, sein eigenes Lese- und Suchverhalten im digitalen Raum zu hinterfragen und einen kritischen Blick auf die Privacy Policies von Onlineanbietern zu werfen. Nur so kann man wissen, wer was trackt und an wen die eigenen Daten weitergereicht werden. Und nur so versetzt man sich in die Lage, souverän und selbstbestimmt zu handeln, technologische Tools wie bspw. Blocker als zusätzlichen Tracking-Schutz anzuwenden oder gar bewusst datenschutzfreundlichere Alternativen den kommerziellen und/oder trackenden Plattformen vorzuziehen. Dies gilt im gleichen Maße für das wissenschaftliche Publizieren: Forschende können ihren Publikationsort frei wählen und sollten idealerweise dabei nicht allein etablierten Reputationsmechanismen folgen. Fragen, die man sich stellen kann, sind z.B. nicht nur die nach der Form der Lizenz (eine offene Open Access Lizenz wie CC BY), sondern auch, ob man bei rein kommerziellen Anbietern oder eben solchen mit intransparentem Tracking publizieren möchte, oder sich stattdessen für ein Diamond-Open-Access-Publikationsorgan entscheiden will.
Bibliotheken und Informationseinrichtungen können in dem Themengebiet wertvolle Aufklärungsarbeit leisten, indem sie Forschende und Studierende zu persönlichen Datenschutzaspekten und ethisch korrekter Nutzung von KI schulen, technische Tipps zum Tracking-Schutz geben und umfassende Informationsangebote, auch im Bereich des verantwortungsvollen Publizierens, anbieten. Es gilt, die Wissenschaft weiterhin für diese Thematik zu sensibilisieren und Awareness zu schaffen.
Literaturliste
- Altschaffel, R., Beurskens, M., Dittmann, J., Horstmann, W., Kiltz, S., Lauer, G., Ludwig, J., Mittermaier, B., & Stump, K. (2024). Datentracking und DEAL – Zu den Verhandlungen 2022/2023 und den Folgen für die wissenschaftlichen Bibliotheken. RuZ – Recht und Zugang, 5(1), 23–40. https://doi.org/10.5771/2699-1284-2024-1-23
- Deutsche Forschungsgemeinschaft (DFG, German Research Foundation). (2021). Data tracking in research: Aggregation and use or sale of usage data by academic publishers. https://www.dfg.de/resource/blob/174924/d99b797724796bc1a1 37fe3d6858f3 26/datentracking-papier-en-data.pdf
Zitiervorschlag
Bilic-Merdes, M., Brandt, S., & Lentze, M. (2025). Perspektiven der DFG auf KI und Open Access, Teil III. Datentracking und Künstliche Intelligenz. open-access.network. doi.org/10.64395/6kdx2-jsf90.
Dieser Beitrag ist lizenziert unter der Creative Commons Namensnennung 4.0 International Lizenz (CC BY 4.0).
Schreibe einen Kommentar
Kommentare
Keine Kommentare