Chemistry Data Days 2025

Zweite Auflage einer Erfolgsgeschichte

Am 3. und 4. Juni 2025 fanden zum zweiten Mal die Chemistry Data Days an der Johannes Gutenberg-Universität Mainz statt und lockten fast 80 Teilnehmer*innen ins Atrium Maximum.

Klarer Fokus auf zwei Themen

Der erste Tag konzentrierte sich auf die Frage, wie man Student*innen der Chemie und verwandter Fächer gutes Forschungsdatenmanagement in der Lehre vermitteln kann.

Georg Manolikakes (RPTU Kaiserslautern), Sonja Herres-Pawlis (RWTH Aachen), Heiko Weber (FAIRMat, FAU Erlangen), Ingo Mey (Georg-August-Universität Göttingen) und Albert Engstfeld (Universität Ulm) berichteten, wie sie bereits elektronisches Laborjournal (ELN), Jupyter oder Datenmanagement für die Grundlagenforschung in ihre Lehre integriert haben. Dabei gab es unterschiedliche Ansätze, aber dort, wo Umfragen unter den Studierenden vorlagen, waren die Ergebnisse durchweg deutlich positiv. Der Umgang mit Daten im Sinne der FAIR-Prinzipien wird immer selbstverständlicher und die Studierenden nehmen die angebotenen Programme zur digitalen Kompetenz gerne an. Daher planen mehrere Dozenten, ihren Ansatz in naher Zukunft zu veröffentlichen, was einen tieferen Einblick geben wird.

Nicole Parks, Data Steward des SFB 985 an der RWTH Aachen, gab anschließend Einblicke aus der Perspektive derjenigen, die Forscher*innen beim Datenmanagement unterstützen. Viele Teilnehmer*innen stimmten ihr zu, dass die Datenorganisation zunächst dem Forschenden und seiner Arbeitsgruppe zugute kommt, lange bevor die Daten veröffentlicht werden.

Am frühen Abend stellte Till Biskup die Frage nach dem Verhältnis von Daten(-veröffentlichung) und guter Wissenschaft, bevor der erste Tag mit der Postersession und einem Buffet zu Ende ging. Ein von der Zeitschrift Digital Discovery (RSC) gestifteter Posterpreis ging an Bernadette Mohr von der HU Berlin, Mitglied des FAIRMat-Konsortiums.

Tools und KI

Der zweite Tag konzentrierte sich auf Datentools zur Unterstützung des Datenlebenszyklus. Präsentationen über unsere Vorlagen für den Datenmanagementplan (DMP), das Chemotion ELN und die Auswahl des am besten geeigneten Repositoriums gaben einen Einblick in das breite Spektrum der von unserem Konsortium angebotenen Dienstleistungen.

Anschließend wurde der Schwerpunkt auf Automatisierung und KI gelegt. Felix Bänsch und Markus Nietfeld (Beilstein-Institut) stellten BChemXtract vor, eine neue Innovation für alle Zeitschriften des Beilstein-Instituts, die demnächst eingeführt wird. Sie konvertiert automatisch alle in Publikationen enthaltenen molekularen Daten in eine maschinenlesbare Form, was die Wiederverwendbarkeit der Daten erheblich verbessert. Mathias Christmann stellte ein KI-gestütztes Tool vor, das automatisch die Richtigkeit von Massendaten in Publikationen überprüft, nachdem in einer Studie festgestellt wurde, dass nur 40% aller getesteten Publikationen korrekte Massendaten enthielten. Schließlich zeigte Sandra Geisler, wie LLM bereits heute nützliche Unterstützung bei der Organisation und Verarbeitung von Daten bieten kann.

Die lebhafte Diskussion über KI-gestützte Tools zum Schluss zeigte, wohin die Reise bei Forschungsdaten geht: Die Automatisierung wird viele Schritte von der Datenerhebung bis zur Veröffentlichung erheblich erleichtern, auch wenn noch viel Arbeit vor uns liegt.

Dankeschön

Auch in diesem Jahr hätten die CDD nicht ohne die Unterstützung unserer Partner und Sponsoren stattfinden können, denen wir an dieser Stelle unseren besonderen Dank aussprechen möchten:

  • Gesellschaft Deutscher Chemiker (GDCh),
  • Jungchemiker-Netzwerk (JCF) der GDCh und
  • Buchler GmbH