Lieber Herr Putnings,
vielen Dank für Ihren Kommentar und den Hinweis auf den Link zur Ausschreibung. Diesen haben wir jetzt zusätzlich in den Text eingefügt.

Dieser Post ist der zweite von drei in einer Blogpostreihe der DFG, die sich mit der Bedeutung von Künstlicher Intelligenz für die gute wissenschaftliche Praxis und Open Science auseinandersetzt:
Open Science und der Einsatz Künstlicher Intelligenz in der Wissenschaft sind auf vielfältige Weise miteinander verbunden. Hier seien zwei Aspekte genannt.
Offene Daten bilden einerseits eine wichtige Grundlage für Künstliche Intelligenz. Die jüngsten KI-Erfolge und die erheblichen Fortschritte auf diesem Feld verdanken sich zu einem nicht geringen Teil dem enormen Wachstum digitaler Datenproduktion – zweifellos nicht nur, aber auch im Forschungsumfeld. Von Open-Science-Praktiken kann die Entwicklung von KI-Modellen und -Anwendungen insofern profitieren, als aus diesen Praktiken – so lange gängige Standards gewahrt werden – qualitativ hochwertige, offen zugängliche, leicht und rechtssicher nachnutzbare Daten hervorgehen.
Ein zweiter Aspekt betrifft die Offenheit der KI-Systeme, -Modelle und -Instrumente selbst. Diese lassen sich nicht zuletzt daran unterscheiden, in welchem Maße die ihnen zugrundeliegenden Trainingsdaten, Methoden, Algorithmen usw. transparent gemacht werden. Die aktuellen Diskussionen um „vertrauenswürdige“ oder „verantwortliche“ KI stellen ganz maßgeblich auf diese Transparenz-Frage ab. Da Transparenz und Nachvollziehbarkeit des Forschungsprozesses gleichzeitig zentrale Prinzipien wissenschaftlicher Integrität darstellen, setzt der Einsatz Künstlicher Intelligenz in der Wissenschaft voraus, dass auch die Funktionsweise der verwendeten Modelle und Instrumente zumindest so weit nachvollzogen werden kann, dass gravierende Verzerrungen vermieden werden (vgl. DFG 2023). Offenheit spielt hierbei eine entscheidende Rolle.
Die Nutzung von generativer KI kann sicherlich die Erstellung von wissenschaftlichen Publikationen erleichtern, sofern sie in regelhafter und verantwortungsvoller Weise vonstattengeht. Was wir allerdings auch beobachten, ist die Zunahme von fake publications, die von KI generiert werden und dann das Publikationssystem belasten. Viele Verlage bauen ihre Abteilungen zur Prüfung von Publikationen aus und setzen hierfür auch KI-Tools ein.
Die DFG unterstützt den offenen Zugang zu den aus Forschungsvorhaben resultierenden Erkenntnissen, etwa durch Maßgaben zum Umgang mit Forschungsdaten oder Aktivitäten zur offenen Lizenzierung wissenschaftlicher Publikationen. Bei Publikationen ist wichtig, dass eine Nachnutzbarkeit sichergestellt wird, die Verwertungsrechte aber bei den Autor*innen verbleiben. Als problematisch in diesem Kontext könnten sich die Bestrebungen mancher Wissenschaftsverlage erweisen, sich KI-Nutzungsrechte an Publikationen – selbst Open-Access-Publikationen – zu sichern und hier restriktive, teils unter den gesetzlichen Erlaubnissen bleibende Einschränkungen bzw. KI-Nutzungsverbote vertraglich zu vereinbaren. Für die Wissenschaft würde dies bedeuten, dass sie entlang dieser Regelungen kein KI-Training etc. mit den von ihr selbst erstellten Publikationen durchführen darf. Dies trägt zu der bereits bestehenden asymmetrischen Machtverteilung im Publikationswesen bei und wird sich – insbesondere und gerade bedingt durch die innovativen und zukunftsformenden KI-Anwendungen und -Entwicklungen – noch stärker manifestieren.
Eine jüngst veröffentlichte Ausschreibung des Ausschusses für Wissenschaftliche Bibliotheken und Informationssysteme (AWBI) zielt ganz direkt auf den Aufbau von Datenkorpora zum Trainieren Künstlicher Intelligenz. Während die Förderung erkenntnisgeleiteter Spitzenforschung ihre primäre Aufgabe bleibt, stärkt die DFG somit mittelbar wie unmittelbar auch die Grundlagen für künftige KI-Entwicklungen. Nur wenn auch umfassende wissenschaftliche Daten und Publikationen in KI-Ergebnisse eingehen, sind diese belastbar.
Bilic-Merdes, M., Brandt, S., & Lentze, M. (2025). Perspektiven der DFG auf KI und Open Access, Teil II. Beziehungen zwischen Open Science und Künstlicher Intelligenz. open-access.network. doi.org/10.64395/njk7k-gpm12.
Dieser Beitrag ist lizenziert unter der Creative Commons Namensnennung 4.0 International Lizenz (CC BY 4.0).
Lieber Herr Putnings,
vielen Dank für Ihren Kommentar und den Hinweis auf den Link zur Ausschreibung. Diesen haben wir jetzt zusätzlich in den Text eingefügt.
Ein kleiner Korrekturhinweis: die AWBI Ausschreibung findet man unter dem benannten Link nicht, korrekt wäre https://www.dfg.de/de/foerderung/foerdermoeglichkeiten/programme/infrastruktur/lis/lis-foerderangebote/forschungsdaten/ausschreibung-datenkorpora.
Und ein Anschlussgedanke zur Ausschreibung: ich bin mir nicht sicher, ob Datenkorpora für offene KI-Modelle reichen, wenn die bestehenden Platzhirsche schon so viel weiter sind. Niemand nutzt ein schlechtes Werkzeug, wenn ein gut funktionierendes direkt daneben liegt. Äquivalent frustriert einem z.B. ChatAI über die Academic Cloud enorm, wenn man im Vergleich sieht, wie gut ChatGPT bei komplexeren Anfragen funktioniert. Man müsste hier entweder für Chancengleichheit sorgen und ChatGPT um alle Inhalte "lobotomisieren", die illegal, ohne Rechtsgrundlage, oder nicht datenschutzkonform zum Training integriert wurden. Oder umgekehrt eine Rechtsgrundlage schaffen, dass jegliches Training erlaubt ist (plus Optimierung, z.B. dass jedoch Quellenangaben mitgeführt werden müssen) -oder es keine Wettbewerbsnachteile gegeben darf, weil alle auf einen offengelegten globalen Trainingspeichersatz zugreifen bzw. dieser stets kollaborativ erweitert wird.