InChI-Workshop über anorganische Stereochemie

RWTH Aachen, 10. und 11. Mai 2023

Organisiert von Sonja Herres-Pawlis (RWTH Aachen, Deutschland)
und Gerd Blanke (InChI Trust)

Für die nächste Version arbeiten die Entwickler von InChI an einer Überarbeitung der chemischen Darstellung von anorganischen und metallorganischen Stoffen. Das Ziel dieses InChI-Workshops war die Identifizierung von Methoden, die es InChI ermöglichen, die Stereochemie von metallorganischen und koordinativen Verbindungen zu behandeln, die bis zur aktuellen Version noch nicht behandelt wurde.

Ein chemischer Identifikator

Im Rahmen seinen Vortrags “My journey from nomenclature and terminology to data infrastructures”
oder “What can we learn from old line notation systems?” setzte Jeremy G. Frey (University of Southampton) den Rahmen, in dem sich InChI als chemischer Identifikator wiederfinden muss im Universum der chemischen Verbindungen, in der Geschichte der chemischen Darstellungen von Wiswesser-Liniennotation bis Smiles, in den Erfordernissen der FAIR-Datenverarbeitung und die Anforderungen von AI/ML.

Anforderungen

In seinem Vortrag “Polyhedral Symbols, Configuration Indices, and What can be Learned from Applying Classical Nomenclature” beschrieb Richard Hartshorn (University of Canterbury, New Zeeland) die Anforderungen, die ein chemischer Identifikator erfüllen muss, um in der Chemischen Community allgemein akzeptiert zu werden, und stützte sich dabei auf seine Erfahrungen mit der Entwicklung der IUPAC-Nomenklatur für anorganische und metallorganische Stoffe. Durch die Beschreibung des Weges von einer getrennten Namensgebung für Liganden, der Geometrien um das Zentralatom und der eindeutigen Anordnung der Liganden um das Zentrum unter Verwendung von CIP-Prioritäten kam er zu der problematischen Identifizierung von Symmetrien höherer Ordnung, die sich nicht wesentlich voneinander unterscheiden.

Implementierung in Bibliotheken

Basierend auf Richard Hartshorns Entwurf zeigte Andrey Yerin (ACD/Labs) in seinem Vortrag mit dem Titel “Generation of systematic stereodescriptors for coordination structures and possible application for InChI”, wie ACD/Labs die Regeln in ihre automatischen IUPAC-Namensbibliotheken implementiert hat, die auch von anderen Softwareanbietern verwendet werden. Er wies darauf hin, dass die Generierung chemischer Namen ein sehr anspruchsvoller Bereich ist, der weiterer Arbeit und Verbesserungen bedarf, und erwähnte, dass es einfacher wäre, systematische Namen durch InChI zu ersetzen, doch werden sie in verschiedenen Bereichen immer noch gefordert und verwendet.

Jeder Koordinationstyp wird durch einen eigenen Regelsatz behandelt, der die Konfigurationsdeskriptoren ableitet, die durch die Priorität der Liganden spezifiziert werden. Die Priorität der Liganden wird mit hierarchischen Digraphen auf der Grundlage der CIP-Regeln erklärt. Die Erkennung spezifischer Koordinationstypen basiert zumeist auf der Erkennung von Achsen, wobei das Vorhandensein von Stereobindungen und deren räumliche Anordnung berücksichtigt werden. Neben 2D-Strukturen werden auch die Konfiguration von 2,5D- und 3D-Strukturen erkannt.

Auf der Grundlage seiner Erfahrungen hat er Wege vorgeschlagen, wie die Konzepte in die InChI-Umgebung übertragen werden können, basierend auf der Priorität der Ligandenatome und ihrer Geometrie um das Zentralatom. Aber schon die Analyse von cis-Platin hat gezeigt, dass die eindeutige Nummerierung der 4 Donor-Atome auf der Grundlage der InChI-Atomzahlen für die eindeutige Darstellung dieses chemischen Komplexes möglicherweise nicht ausreicht. Das bedeutet, dass die derzeitige InChI-Nummerierung nicht stereospezifisch ist und keine diastereotopischen Gruppen erkennt.

Umsetzung der Stereochemie

Für die Umsetzung der Stereochemie für metallorganische und anorganische Verbindungen schlug Andrey Yerin die folgenden Anforderungen vor:

  • Festlegung eines Formats, das die Konfiguration und Chiralität definiert
  • Unterstützung verschiedener Darstellungen von Koordinationsbindungen (koordinative Bindungen, haptische Bindungen, etc.)
  • Erkennung der Koordinationsarten wie e. g. T-4, SP-4, TBPY-5, OC-6
  • Erkennen von räumlichen Anordnungen in 2D, 2,5D und 3D
  • Verfahren zur Bestimmung konfigurationsmäßig unäquivalenter Liganden
  • Bindungsmodell für delokalisierte Liganden – im Allgemeinen und in Bezug auf die Konfiguration

Graphenbasierte Implementierung

Ulrich Schatzschneider (Universität Würzburg, Deutschland) schlug eine graphbasierte Implementierung der Stereochemie von metallorganischen und anorganischen Verbindungen auf der Grundlage von “Stereographen” vor. Das Koordinationspolyeder wird als ungerichteter Graph mit Atomen als Knoten und den Atom-Atom-Verbindungsvektoren als Kanten dargestellt. Dementsprechend sind alle Knoten Kanten, aber auch die Verbindungen zwischen Atomen, die nicht direkt gebunden sind, werden zu Kanten. Knoten befinden sich innerhalb, außerhalb oder an den Ecken von Polyedern, die Kanten des Graphen befinden sich innerhalb, außerhalb, innerhalb von Flächen oder an den Kanten von Polyedern. Die Geometrie der metallorganischen Verbindung ist in die entsprechenden Polyeder integriert. Für jeden der Polyedertypen beschrieb Ulrich Schatzschneider den Weg zu einer eindeutigen Darstellung der Stereochemie. Für diese Darstellungen verwendet er ein Tupelformat, das auf den Atomzahlen basiert, die die Knoten des eigentlichen Polyeders bilden.

TUCAN

Das Konzept der Stereographen geht in TUCAN ein – ein Identifikator und Deskriptor für alle Bereiche der Chemie.

In “Stereoselective organometallic catalysts – how do we identify them in InChi?” folgt Per-Ola Norrby (F&E, AstraZeneca, Göteborg) den Stereochemie-Definitionen von InChi und schlägt die folgenden Regeln vor:

  • Kodierung geometrischer Isomerie durch Kennzeichnung von trans-Paaren in einer neuen Schicht
  • Unterscheidung von Enantiomeren durch Codierung der Chiralität des Zentralatoms in der /t-Schicht
  • Darstellung von π-Systemen durch Zuweisung einer Koordinationsposition zum Schwerpunkt
  • Starr koordinierte π-Systeme benötigen ebenfalls eine trans-Zuweisung

Die Geometrie wird durch Tupel von Ordnungszahlen beschrieben, beginnend mit dem Atom 1 (als höchste Ordnungszahl) und seinem trans-Gegenstück; Es folgt das Atompaar mit der nächsthöheren Priorität. Atome in π-Systemen werden in Klammern mit Bindestrichen als Trennzeichen unter Verwendung aufsteigender Ordnungszahlen aufgeführt.

Ökosystem der anorganischen Stereochemie

John Mayfield (NextMove Software, Cambridge, UK) gab in seinem Vortrag “Inorganic Stereochemistry Ecosystem” einen allgemeinen Überblick über die stereochemische Darstellung von anorganischen Systemen. Für die Stereochemie von Systemen höherer Ordnung schlägt er vor, die Idee der Permutationstabellen für tetraedrische Zentren auf höhere Symmetrien zu übertragen. Ein tetraedrisches Zentrum besteht aus 2 Paritäten, die es erlauben, die 24 Permutationen in 2 Gruppen zu je 12 Permutationen zu ordnen. Man kann eine bestimmte Permutation einer der Gruppen zuordnen, so dass man je nach Zuordnung @TH1 oder @TH2 erhält.

Im Falle der oktaedrischen Geometrie erhält man 30 verschiedene Gruppen, wenn sich alle Liganden voneinander unterscheiden. Wenn zwei oder mehr Liganden identisch sind, verringert sich die Anzahl der potenziellen Gruppen entsprechend, kann aber immer noch mit einer der oktaedrischen Gruppen verbunden sein. In diesen Fällen werden die oktaedrischen Gruppen identisch, und die niedrigste Gruppe wird als kanonische Darstellung angesehen. Geometrien, die niedriger sind als die der oktaedrischen Zentren (z. B. quadratisch planar, quadratisch pyramidal usw.), können als oktaedrische Entartungen bezeichnet werden. Damit kann ihre Konfiguration auch durch die zugehörige oktaedrische Gruppe beschrieben werden.

MolBar

Christoph Bannwarth und Nils van Staalduinen (RWTH Aachen) stellten in ihrem Beitrag “Molecular Barcode” den neuen molekularen Identifikator MolBar für Moleküle der organischen und anorganischen Chemie mit voller Unterstützung der Stereoisomerie vor. Molekulare Graphen können als von Hückel inspirierte erweiterte Adjazenzmatrizen dargestellt werden, deren Spektrum (= Menge der geordneten Eigenwerte) a priori permutationsinvariant ist. Dies bildet die Grundlage für die “Molbar”, die durch die Einführung von Coulomb-Matrizen, die Fragmentierung der Matrix in starre Molekülteile und eine zusätzliche Strukturvereinheitlichung unter Verwendung eines speziellen Kraftfelds zur eindeutigen Behandlung der Stereochemie weiter verfeinert wird. Das macht MolBar besonders geeignet, um die Stereochemie von Anorganika und Organometallen zu behandeln.

Diskussion

Zu Beginn des Workshops präsentierten Djordje Baljozovic, Jan Brammer, Nauman Kahn und Frank Lage den Stand der technischen Entwicklungen rund um den InChI-Code; Dazu gehörten die Testumgebungen für Testchargen und in Webbrowsern.

Während der Diskussion kam Thomas Dörner auf die Idee, die Stereochemie anorganischer Stoffe durch sphärische Projektionen darzustellen. In der weiteren Diskussion wurde die Einführung von Polarkoordinaten um das Zentrum des chemischen Komplexes angesprochen und wird weiter untersucht.

Die Arbeitsgruppe “Organometallics and inorganic” des IUPAC-Unterkomitees konsolidiert die Ergebnisse dieses Workshops; Als nächster Schritt muss die Syntax für die Darstellung der Stereochemie von anorganischen Stoffen im InChI-String definiert werden;