Warum maschinenlesbeare Daten nicht nur für KI eine gute Idee sind

Neuer Podcast von Philip Strömert und Steffen Neumann

NFDI4Chem hat zum NFDI-Podcast mit einem für die Chemie sehr wichtigen Thema beigetragen: Künstliche Intelligenz verändert die chemische Forschung – aber sie ist nur so gut wie die Daten, mit denen sie gefüttert wird.

Der Podcast kann auf den folgenden Plattformen gehört werden:

Künstliche Intelligenz verändert die chemische Forschung – aber sie ist nur so gut wie die Daten, mit denen sie gefüttert wird. In dieser Folge sprechen Philipp Strömert und Steffen Neumann darüber, warum Metadaten, Ontologien und digitale Repositorien für maschinenlesbare Daten essenziell sind. Wie können KI-Modelle mit retrospektiven Datensätzen trainiert werden? Was muss sich in Lehre, Labor und Publikationspraxis ändern? Und warum ist es höchste Zeit, die digitale Souveränität der Chemie in Europa zu sichern?

Themen der Episode:

  • Datenmanagement als wissenschaftliche Praxis: Warum die digitale Dokumentation von Laborprozessen kein „Extraaufwand“, sondern Teil guter wissenschaftlicher Praxis ist – und warum man selbst als erster davon profitiert.

  • Metadaten: Wieso Daten ohne Kontext wenig wert sind – und wie Ontologien dabei helfen, Fachbegriffe weltweit einheitlich und eindeutig zu definieren.
  • ELNs, Repositorien & Annotation: Wie Tools wie Chemotion-ELN und -Repositorium von NFDI4Chem schon heute maschinenlesbare, FAIR aufbereitete Daten ermöglichen – direkt aus dem Labor und ohne Copy-Paste aus PDFs.
  • KI braucht saubere Trainingsdaten: Wie maschinelles Lernen alte Datenbestände nutzbar macht – vorausgesetzt, sie sind korrekt annotiert, standardisiert und auffindbar. Warum das heute die Basis für die KI-Anwendungen von morgen ist.

  • Digitale Souveränität in Europa sichern: Was auf dem Spiel steht, wenn Europa die Standards für chemische Forschungsdaten anderen überlässt. Warum gemeinsame, offene Dateninfrastrukturen alternativlos sind – für Wissenschaft, Wirtschaft und Demokratie.

Gäste:

Dr. Steffen Neumann ist Bioinformatiker am Leibniz-Institut für Pflanzenbiochemie in Halle (Saale). Er entwickelt digitale Lösungen zur Verarbeitung chemischer und biochemischer Forschungsdaten und setzt sich für maschinenlesbare, interoperable Datensätze ein.

Philipp Strömert ist Experte für Metadaten und Ontologien bei NFDI4Chem (Task Area 6 „Synergies“) und arbeitet an der TIB – Leibniz-Informationszentrum für Technik und Naturwissenschaften in Hannover.