Die Zukunft von InChI gestalten

Technisches Treffen an der RWTH Aachen, Juli 2025

An zwei äußerst produktiven Tagen kamen führende Chemoinformatiker, Entwickler und Praktiker an der RWTH Aachen zusammen, um die Entwicklung des IUPAC International Chemical Identifier (InChI) voranzutreiben. Der Fokus war ehrgeizig: Es ging um die komplexe stereochemische Darstellung in Anorganika und Polymeren, die Erforschung von Verbesserungen für Atropisomerie, die Verfeinerung der Anforderungen an das Dateiformat und die Erstellung eines klaren Fahrplans für kommende InChI-Versionen und die Verwaltung.

Neue Betrachtung der Stereochemie in der molekularen Anorganik

Eines der Kernthemen der Tagung war die Herausforderung, die Stereochemie in der molekularen Anorganik zu erfassen, insbesondere bei Koordinationskomplexen mit nicht-trivialen Geometrien. Gerd Blanke, Thomas Dörner, Ulrich Schatzschneider und Andrey Yerin leiteten die Diskussionen, die sich um die konzeptionellen und praktischen Anforderungen der Definition der Stereochemie jenseits von tetraedrischen und planaren Zentren drehten.

Ein wichtiger Vorschlag war die Einführung einer neuen /x-Ebene für die anorganische Stereochemie, die polyedrische Umgebungen wie oktaedrische, trigonal-bipyramidale und quadratische Pyramidengeometrien darstellt. Die Gruppe war sich einig, dass die kanonisierte Atomnummerierung die Grundlage für diese Ebene bildet. Wichtig ist, dass stereochemische Informationen nur dann berechnet werden, wenn sie explizit definiert sind, entweder durch keilförmige/gestrichelte Bindungen oder durch 3D-Koordinaten. Die Geometrien von Pseudo-3D-Darstellungen, die 2D-Darstellungen der Struktur(!) sind, werden ignoriert. Dies ist eine notwendige Einschränkung, um die Konsistenz mit organischen InChI-Schichten zu wahren.

Das Konzept der Verwendung von „multizentrischen Atomen“ anstelle des mehrdeutigen „*-Atoms“ fand ebenfalls Unterstützung, insbesondere im Zusammenhang mit haptischen und Polyhapto-Bindungen.

Vertrauen Sie der Zeichnung: Über Atropisomere und Eingabeautorität

Ein weiterer Schwerpunkt war die Darstellung der Atropisomerie, die aufgrund ihrer Abhängigkeit von der Konformationsstabilität und ihrer mehrdeutigen Darstellung in 2D-Diagrammen seit langem eine Herausforderung darstellt. Die Gruppe einigte sich auf ein Leitprinzip: Der InChI sollte das widerspiegeln, was gezeichnet wird. Wenn stereochemische Elemente wie Atropisomerie durch Keilbindungen oder zuverlässige 3D-Geometrie angezeigt werden, sollten sie kodiert werden. Wenn nicht, sollten sie weggelassen werden.

Mit diesem „Vertrauen in die Eingabe“-Ansatz wird der Unmöglichkeit Rechnung getragen, die Atropisomerie in allen Fällen algorithmisch zu bestimmen, ohne dass es zu Inkonsistenzen oder Überinterpretationen kommt. Atropisomere werden anhand des von Andrey Yerin vorgeschlagenen Modells beschrieben. Wenn keine stereochemischen Marker vorhanden sind, wird InChI nicht versuchen, sie zu erraten, so wie auch undefinierte Stereozentren derzeit ignoriert werden.

Polymer-InChI: Von der Vision zur Prioritätensetzung

Am zweiten Tag des Treffens wurde die Aufmerksamkeit auf Polymere gelenkt, die zu den strukturell mehrdeutigen (und industriell relevanten) chemischen Materialien gehören. Thomas Exner und Gerd Blanke stellten die jüngsten Fortschritte bei der Entwicklung von Polymer-InChI vor, darunter die Unterstützung für strukturelle Wiederholungseinheiten (SRUs), Copolymere und Platzhalteratome (*-Atome).

Obwohl die Begeisterung für Polymer-InChI groß war, kam die Gruppe zu dem Schluss, dass Polymere noch nicht vollständig in die „Standard“-InChI integriert werden können, ohne stärkere Garantien für strukturelle Einzigartigkeit. Stattdessen wird die Entwicklung mit dem Schwerpunkt auf produktbasierten Darstellungen und nicht auf synthetischen Rezepten fortgesetzt. Die Fähigkeit, das zu beschreiben, was bekannt ist – insbesondere für zufällige oder undefinierte Polymere – wurde als entscheidend für reale Anwendungsfälle wie Tenside und industrielle Mischungen angesehen.

Auf der Tagung wurde betont, dass klar zwischen polymerartigen Molekülen (mit definierter atomarer Präzision) und abstrakteren Materialien unterschieden werden muss. Beispiele wie „Tween 80“ und COFs verdeutlichten die Komplexität der Schaffung universeller Darstellungen für solche Systeme. Die Gruppe einigte sich darauf, klarere Definitionen und Beispielsätze zu erarbeiten und die /z-Ebene für polymerbezogene Informationen weiter zu verfeinern.

InChI-Entwicklungsphilosophie: Fortschritt statt Perfektion

Während des gesamten Treffens kamen die Teilnehmer immer wieder auf ein zentrales Spannungsfeld bei der Entwicklung wissenschaftlicher Infrastrukturen zurück: Wann ist ein Modell „gut genug“, um freigegeben zu werden? Jonathan Goodman brachte es auf den Punkt: Es ist weniger sinnvoll, auf eine perfekte 99%ige Lösung zu warten, als eine robuste 90%ige Lösung zu entwickeln und darauf aufbauend schrittweise vorzugehen. Die Gruppe sprach sich nachdrücklich für ein schrittweises Vorgehen aus: Die Stereokodierung für anorganische Stoffe wird schrittweise eingeführt, wobei mit klar umrissenen polyedrischen Systemen begonnen und später auf komplexere Szenarien ausgeweitet wird.

Steuerung, Umsetzung und Kommunikation

Ian Bruno gab einen Überblick über die Entwicklungen der InChI-Governance, einschließlich der Bildung neuer Arbeitsgruppen und des Entwurfs einer Checkliste für die Freigabe künftiger Versionen. Die Teilnehmer erörterten, wie wichtig es ist, ein Gleichgewicht zwischen akademischen und industriellen Anwendungsfällen herzustellen und sicherzustellen, dass die Teilnehmer aus allen Bereichen der Chemie (organisch, anorganisch, nano usw.) eine Stimme haben.

Die Gruppe befasste sich auch mit der Versionierung und der Planung der Roadmap. Es wurde vorgeschlagen, die kommende Version als v1.50 zu bezeichnen. Neben der Behandlung von Bindungen in der molekularen Anorganik wird die Version auch eine bessere Testinfrastruktur und Dokumentation enthalten. Die nächste Vollversion (verbesserte Bindungsbehandlung und Stereochemie) wird folgen, sobald die Stereochemie in der molekularen Anorganik gründlich validiert wurde.

Werkzeuge, APIs und Referenzdaten

Die technische Seite des Treffens umfasste Diskussionen über Toolchains und Implementierungsstrategien. Die Entwickler waren sich einig, dass die InChI-Web-Demo als API zugänglich gemacht werden sollte, und es ist geplant, einen Referenztestsatz für molekulare Anorganika zu erstellen – mit Beispielen wie cis- und trans-Platin-Komplexen.

Die Notwendigkeit einer besseren Kompatibilität der Dateiformate wurde ebenfalls deutlich. Molfile ist nach wie vor die derzeitige Standardeingabe, aber es fehlen einige Darstellungsfunktionen wie Blockbindungen (z. B. in Zuckerdarstellungen), die in der gewünschten InChI-Datei nicht enthalten sind. Die Diskussionen über das Potenzial eines eigenen InChI-Dateiformats werden fortgesetzt, auch wenn weiterhin Bedenken hinsichtlich der Akzeptanz bestehen. Die Erweiterung der InChI-API wurde als alternativer Ansatz diskutiert.

Blick in die Zukunft

Die Sitzung endete mit einem gemeinsamen Gefühl von Schwung und Richtung. Die Teilnehmer waren sich einig, dass die nächste technische Online-Sitzung Mitte September 2025 stattfinden wird, um die /x- und /z-Ebenen weiter zu verfeinern, Beispiele zu diskutieren und die Governance-Strukturen voranzutreiben. InChI schlägt ein neues Kapitel auf, das die Komplexität der realen Welt stärker einbezieht und besser für die fortgeschrittene Chemiekommunikation gerüstet ist.

Diese Arbeit wäre nicht möglich ohne die kontinuierliche Unterstützung durch den InChI Trust, die VolkswagenStiftung, NFDI4Chem, das BMFTR (DALIA-Projekt) und das Beilstein-Institut.

Wir bedanken uns herzlich bei allen Mitwirkenden – im Saal und online – für ihr Fachwissen, ihre Offenheit und ihre Bereitschaft zur Zusammenarbeit. Unsere besondere Anerkennung gilt dem Entwicklerteam: Djordje Baljozovic, Nauman Ullah Khan, Jan Brammer, Felix Bänsch, Jan Holst Jensen und Frank Lange für die Bereitstellung der InChI-Webdemo-Infrastruktur.


Möchten Sie mehr erfahren? 🔗 Web Demo: https://iupac-inchi.github.io/InChI-Web-Demo/