Ein nationales Infrastrukturprojekt nimmt Form an. Von Manfred Ronzheimer

Ein Hauch von Klondyke-Goldrausch liegt über der deutschen Forschungslandschaft. Neue Goldadern sind entdeckt worden, die Claims wurden inzwischen abgesteckt, etwa 30 sind es; die Schürfrechte werden gerade verteilt. Natürlich geht es nicht um reale Nuggets, sondern um das Gold des Digitalzeitalters: Daten, die dann Gold wert sind, wenn man sie richtig zu nutzen versteht.

Materielle Reichtümer anzuhäufen ist allerdings nicht das Ziel von York Sure-Vetter, Informatikprofessor am Karlsruher Institut für Technologie (KIT). Er amtiert seit Anfang März als Direktor der Nationalen Forschungsdateninfrastruktur (NFDI), einer neuen Serviceeinrichtung, die von den Wissenschaftsministerien des Bundes und der Länder gegründet wurde, um effizienter und nachhaltiger mit den Daten umzugehen, die im Zuge von Forschungsprojekten erhoben wurden. »Es gibt Zehntausende von Studien, die in dieser Hinsicht eine Auswertung lohnen«, sagt Sure-Vetter, der in den Bereichen Künstliche Intelligenz und Data Science forscht.

Künstliche Intelligenz (KI) und Hochleistungsrechner sind heute die Mittel der Wahl, um frische Daten zu bündeln, aber auch schon bejahrten Forschungsdaten neues Leben einzuhauchen. Das Problem: Nahezu alle öffentlich geförderten Forschungsprojekte - egal, ob in den Sozialwissen-, Natur- oder Ingenieurwissenschaften -, für die per Fragenbogen oder mittels Sensoren Daten erhoben werden, kümmern sich nach Abschluss des Projektberichts nicht mehr um diese »Rohdaten«. Sie werden in den Instituten nach dem Weggang des Doktoranden oder der Emeritierung des Professors schlichtweg vergessen oder schlimmstenfalls gelöscht. Um dem Einhalt zu gebieten, wurde von der deutschen Forschungspolitik die Nationale Forschungsdateninfrastruktur auf den Schild gehoben. Mit Unterstützung der Deutschen Forschungsgemeinschaft (DFG) wurden an die 30 Themenfelder definiert, zu denen künftig Forschungsdaten zentral gesammelt werden. Derzeit werden Konsortien aus mehreren Universitäten und Rechenzentren gebildet, die um die jährlich 90 Millionen Euro Anschubfinanzierung konkurrieren. Ende Juni wurden die ersten neun NFDI-Konsortien ausgewählt.

Eines von ihnen ist das Konsortium »DataPLANT« unter der Leitung der Universität Freiburg, das in den kommenden fünf Jahren insgesamt circa elf Millionen Euro von der DFG erhält. Partnerinstitutionen sind die Universität Tübingen, das Forschungszentrum Jülich und die Technische Universität Kaiserslautern. Aufgabe ist es, neben der Sammlung großer Datenmengen aus der modernen Pflanzenforschung auch Methoden zu entwickeln, wie sich diese Daten für unterschiedliche Nutzungsbereiche mittels KI auswerten lassen - sei es zur Ertragssteigerung von Getreide oder um die Klimaresistenz zu verbessern. »Im Fehlen einer nationalen Infrastruktur sehen wir bislang ein wesentliches Hindernis auf dem Weg, das volle Potenzial der Pflanzenforschung in Europa ausschöpfen zu können«, erklärte Ralf Reski, Professor für Pflanzenbiotechnologie an der Universität Freiburg, zum Start des »DataPLANT«-Verbundes.

Das Konsortium »NFDI4BioDiversity« hat Partnereinrichtungen aus den Bereichen Biodiversität, Ökologie und Umweltdaten versammelt. »In Zeiten, in denen eine Million Arten vom Aussterben bedroht ist, ist der Zugang zu umfangreichen, qualitätsgesicherten Forschungsdaten entscheidend für die jetzt anstehenden Entscheidungen in Politik und Gesellschaft«, sagt Frank Oliver Glöckner von der Uni Bremen als Koordinator. In Bremen hat seit 2013 auch das Projekt GFBio (German Federation for Biological Data) seinen Sitz, das durch die Vernetzung von sieben biologischen Datenzentren über die weltweit vielfältigste mikrobiologische Ressourcensammlung verfügt. Das Konsortium »NFDI4BioDiversity« wird ab Herbst 2020 mit bis zu 25 Millionen Euro für zunächst fünf Jahre gefördert. Beteiligt sind 49 universitäre und außeruniversitäre Partnereinrichtungen in ganz Deutschland.

Die Daten stammen übrigens nicht nur von Profi-Wissenschaftlern. »Große Teile der für die Biodiversitätsforschung relevanten Daten werden von Fachgesellschaften und Bürgerwissenschaftlern erhoben«, bemerkt Aletta Bonn vom Helmholtz-Zentrum für Umweltforschung, die mitverantwortlich für die Schnittstelle zu Citizen-Science-Projekten ist. »In mehr als 20 Vorhaben binden wir diese Communities ein«, so Bonn.

Das Konsortium »NFDI4Chem« unter der Leitung der Friedrich-Schiller-Universität Jena will die Digitalisierung aller Bereiche der chemischen Forschung vorantreiben. »Wir werden am frühestmöglichen Zeitpunkt im Forschungsprozess, nämlich bei der Planung von Experimenten und ihrer Durchführung im Labor ansetzen und die dabei anfallenden Daten in elektronischer und wiederverwendbarer Form erfassen«, sagt der Jenaer Chemieinformatiker Christoph Steinbeck als Sprecher der Gruppe mit 27 universitären und außeruniversitären Partnern. »Von dort fließen die Daten noch vor ihrer Verwertung in lokale, nationale und internationale Repositorien, um ihre Wiederverwendbarkeit zu fördern und die Validierung der Forschung zu ermöglichen.« Die Validierung dient auch der Prüfung auf wirtschaftliche Verwertbarkeit. »Dies wird auch den Publikationsprozess in der Wissenschaft stark verbessern«, erwartet Steinbeck.

Einen kulturwissenschaftlichen Schwerpunkt hat das Konsortium »NFDI4Culture«, an dem die Abteilung für Digitale Musikwissenschaft der Uni Paderborn beteiligt ist. Ziel der Forscher ist es, geisteswissenschaftliche Forschungsfragen durch digitale Methoden zu beantworten. Dazu gehört insbesondere die digitale Verarbeitung von Texten, Notenmaterial, Abbildungen, Audio- und Videoaufnahmen sowie weiteren Quellen.