Hacking für Chem

Deutsche und europäische Hackathons

In den letzten Monaten fanden zwei Hackathons mit NFDI4Chem-Beteiligung statt.

Der erste war der ELIXIR 2023 BioHackathon Europe. Er wurde in hybrider Form auf dem wunderbaren Campus Belloch in der Nähe von Barcelona und online organisiert.

Mehrere NFDI4Chem’ler waren an dem Projekt zur Erstellung von Wissensgraphen aus unserem Datenressourcen MassBank, Chemotion Repository und nmrXiv beteiligt. Die Hauptaktivitäten waren der Import der SchemaOrg-Metadaten aus unseren Ressourcen MassBank, Chemotion und nmrXiv in (Knowledge) sowie der Import von Ressourcen aus dem DataPlant-Konsortium in Graph-Datenbanken und die anschließende Verknüpfung und Abfrage dieser Datenquellen;

Der nächste Hackathon war der 2. BioHackathon Deutschland #BHG2023. Hier organisierten Oliver Koepler und Steffen Neumann ein Projekt zu einem Ökosystem der Ontologien und Terminologiedienste, da die Welt der Ontologien und Terminologiedienste ein kritischer Bereich für die Dateninteroperabilität in den Naturwissenschaften und darüber hinaus ist.

Strukturierung des Projekts in vier zentralen Bereichen

Die Abteilung Terminologiedienst (TS): Sie widmet sich der effizienten Verwaltung und Bereitstellung von Terminologien sowie der Entwicklung innovativer Dienstleistungskomponenten Die Teilnehmer lernten den TIB TS-Dienst kennen (von TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek). Die Informationen darüber, wie Ontologien in die TIB TS aufgenommen werden können, wurden von unserem benachbarten NFDI-Konsortium DataPlant sofort in die Praxis umgesetzt, das nun über eine maßgeschneiderte DataPlant Sammlung verfügt, auf der Grundlage des gemeinsamen Übersichtspapiers 10.3389/fpls.2023.1279694.

Abteilung Verbraucher: Erstellung von benutzerfreundlichen HTML-Widgets für die Anzeige und Auswahl von Begriffen und nahtlose Integration dieser Tools in eine Reihe von Rechercheressourcen.

Konkret wurden die Ontologie-Widgets in das Low-Code-Web-Framework Streamlit integriert. Das Google Spreadsheet Add-on OntoMaton wurde aktualisiert, um mit TIB TS (und dem jüngsten OLS4-Update) zusammenzuarbeiten. Das DataPlant-Team wird sein SWATE-Tool ebenfalls mit TIB TS verbinden.

Wir sind sehr gespannt auf die Widgets, die in Chemotion und LabIMotion integriert sind, um kundenspezifische Formulare zu erstellen, die kontrollierte Begriffe aus der TIB-Terminologie-Service-API enthalten. Unsere derzeitige Herausforderung besteht darin, die schiere Menge an Ontologie- und Terminologiebegriffen zu bewältigen. Ziel ist es, Lösungen zu entwickeln, die effizient die relevantesten Ontologien für spezifische Begriffsannotationen innerhalb dieser Annotationswerkzeuge empfehlen.

Außerdem konnten wir viele inspirierende Anwendungsfälle für das kommende #NFDI-Basisdienstprojekt #TS4NFDI sammeln, das ein zentrales API-Gateway für den Zugang zu den Terminologiediensten der NFDI entwickeln wird.

Darüber hinaus untersuchten wir die breitere Anwendung von Ontologiebegriffen durch das DefinedTerm-Konzept in SchemaOrg, insbesondere im Kontext von Metadatensammlungen, die in verschiedenen Repositories und Disziplinen gemeinsam genutzt werden.

Die unerwartete (aber höchst willkommene!) Zusammenarbeit mit dem BioCypher-Projekt könnte es uns im nächsten Jahr ermöglichen, unsere Wissensgraphen (erinnern Sie sich an den oben erwähnten ersten Hackathon?) mit natürlicher Sprache abzufragen, wobei ein großes Sprachmodell die Anfrage in eine Graphenabfrage umsetzt.

Oliver und Roman haben einige Beiträge auf LinkedIn veröffentlicht und auf Mastodon getwittert.

Die Veranstaltung bot eine spannende Gelegenheit zur Zusammenarbeit und zum Gedankenaustausch mit einer bunt gemischten Gruppe von Ontologie-Enthusiasten aus verschiedenen NFDI-Konsortien und anderen innovativen Projekten.

Und schließlich lesen Sie gerade die erste Ausgabe der Abteilung für Verbreitung und Öffentlichkeitsarbeit, zu der noch weitere folgen werden. Wir werden unsere Erfahrungen in die NFDI-Sektion Metadaten einbringen. Wenn alles klappt, werden Sie 2024 beim NFDI-eigenen Metadaten-Hackathon oder bei der EOSC-Veranstaltung im Oktober in Berlin mehr sehen.

Bitte merken Sie sich die Termine für zwei kommende NFDI-Vorträge vor

1) Terminologiedienste 4 NFDI am 22.01.2024 @ 16:00, und

2) SchemaOrg4NFDI am 18.03.2024 @ 16:00.