Hacking für Metabolomik und Massenspektrometrie – Interoperabilität von Formaten

European BioHackathon 2025

Der ELIXIR BioHackathon Europe fand vom 3. bis 7. November 2025 in Bad Saarow bei Berlin statt. Unter den rund 30 Projekten befand sich auch das „Metabolomics and proteomics file format interoperability fest”, das von Steffen Neumann mitorganisiert wurde. Unser Projekt konzentrierte sich auf das mzTab-M-Format und dessen Spezifikation und Implementierungen.

Wir hatten etwa 40 Teilnehmer im Slack-Kanal, die aus mindestens elf Ländern kamen, und bis zu zehn Teilnehmer vor Ort, die an den Tischen saßen. Wir haben sie über Zoom, Slack und die Online-Dokumente miteinander verbunden.

Die mzTab-Normenfamilie reicht mehr als zehn Jahre zurück und erfasst die Ergebnisse von Proteomik-, Metabolomik- und Lipidomik-Experimenten [10.1074/mcp.O113.036681, 10.1021/acs.analchem.8b04310]. Seitdem wurde mzTab-M von einer Reihe von Metabolomik- und Lipidomik-Tools und -Ressourcen übernommen. Tatsächlich war es ein ursprüngliches Ziel und eine Voraussetzung für das Projekt, einen Überblick über die verfügbaren Implementierungen zu erhalten. Die Arbeit im Projekt selbst war in mehrere Abteilungen unterteilt.

In der Abteilung für Software und Bibliotheken haben wir Implementierungen untersucht und ihre Funktionen (und Einschränkungen) charakterisiert, Beispieldateien für reale Metabolomik- und Lipidomikstudien beschafft und sie durch den jmzTab-M-Validator laufen lassen. Beispieldateien in HUPO-PSI/mzTab-M werden nun durch ausgeklügelte GitHub-Aktionen validiert, die während des Hackathons entwickelt wurden.

Das eigentliche Interoperabilitätsfest bestand dann darin, zu testen, ob und wie gut die Lesegeräte die Daten importieren und anschließend ihre jeweiligen Analysen durchführen können. Wir hatten Ausgaben von mzmine, MS-Dial, xcms, LipidDataAnalyzer und LipidCompass, Progenesis QI, MetaboScape und MASSter. Diese wurden an GNPS, LipidCompass, MetFamily, MetaboLights und MetaboAnalyst weitergeleitet. Und es gab gute, schlechte und (einige wenige) sehr schlechte Ergebnisse. Am Ende erreichten wir 20 Kombinationen, von denen fast alle größtenteils erfolgreich waren.

Steffen Neumann (rechts) im Gespräch mit anderen Teilnehmern

Der Schwerpunkt der zweiten Hälfte lag daher auf der Verbesserung des Zustands der Software-Implementierungen. Glücklicherweise (und dank all unserer Teilnehmer!) konnten wir auf die Mitwirkung fast aller Software-Ökosysteme zählen, die mzTab-M erstellen und akzeptieren. So konnten einige Probleme direkt vor Ort gelöst werden, für andere haben wir klare Problemberichte erstellt, die zeitnah bearbeitet werden sollen.

In der mzTab-M-Verbesserungsabteilung haben wir diskutiert, wie die reale Anwendung und die oben genannten Erkenntnisse zu einer (vorsichtigen) Weiterentwicklung der mzTab-M-Spezifikation führen können. Eines der drängendsten Probleme ist die Kodierung multifaktorieller Versuchsdesigns, die vor zwei Jahrzehnten in der Proteomik noch ungewöhnlich waren, heute in der Metabolomik jedoch die Norm sind. Ein weiterer unklarer Punkt in der Spezifikation ist der Umgang mit Mehrdeutigkeiten, z. B. in Fällen, in denen mehrere Molekülstrukturen vorgeschlagen werden, die aus unterschiedlichen Addukt-Hypothesen oder anderen Quellen der Mehrdeutigkeit resultieren. Das Modell akzeptiert nun auch eine gelockerte Version der Ladungen für chemische Merkmale. Und natürlich gibt es bei der Dokumentation, den Beispielen und Empfehlungen in der Spezifikation immer Raum für Verbesserungen.

Schließlich lesen Sie gerade eines der Produkte der Abteilung für Schulung und Öffentlichkeitsarbeit 🙂 Zusätzlich zu diesem Artikel arbeiten wir an einem Folgeartikel, in dem die praktische Anwendung und die Vorteile von mzTab-M beschrieben werden.

Erneut hat der ELIXIR BioHackathon gezeigt, wie vorteilhaft es ist, Experten aus verschiedenen Bioinformatikprojekten mit Erfahrung in verschiedenen Sprachen und Frameworks, aber auch Anwender mit Erfahrung aus Metabolomik-Infrastrukturen und -Repositorien zusammenzubringen: Diese Kombination trug dazu bei, die Veröffentlichung, den Austausch und die Interoperabilität von Daten zu validieren und zu verbessern.