SPP 2363 - Teilprojekt: Fingerprints entschlüsseln - Auf dem Weg zu einem ganzheitlichen Erklärungsinstrumentarium für molekulares maschinelles Lernen (EXFP-MML)

Grunddaten zu diesem Projekt

Art des ProjektesTeilprojekt in DFG-Verbund koordiniert an der Universität Münster
Laufzeit an der Universität Münster01.04.2022 - 31.03.2025 | 1. Förderperiode

Beschreibung

Unser zentrales Anliegen mit diesem Antrag ist die Entwicklung von allgemein nutzbaren Algorithmen für interpretierbares und erklärbares Molekulares Maschinelles Lernen auf einer strukturellen Ebene. Im Rahmen dieses Projekts werden weit verbreitete molekulare Repräsentationen entwickelt, angepasst und verwendet, um robuste und präzise Modelle zu trainieren (z.B. Gradient Boost Algorithmen). Ausgehend von diesen Modellen wird eine Open-Source Softwarepipeline konstruiert, um die Wichtigkeit, den Einfluss und die Abhängigkeiten von Features sowie die Konfidenz von Modellen auf die Molekülstruktur abzubilden und somit ausgebildeten Chemikern eine einfache Möglichkeit zum Molekül- und Reaktionsdesign zu eröffnen. Ein wichtiger Teil dieser Arbeit wird die Entwicklung von Visualisierungen sein, die einerseits ein hohes Maß an Genauigkeit bieten und andererseits für Wissenschaftler, die im Bereich der Molekularwissenschaften arbeiten, leicht zu verstehen sind. Diese Werkzeuge sollen sowohl für die Untersuchung und Verbesserung der zugrundeliegenden Datensätze als auch für das molekulare Design verwendet werden können. Neben der Colorierung und Visualisierung einzelner Moleküle sollen Methoden zur statistischen Auswertung hinsichtlich des generellen Einflusses funktioneller Gruppen entwickelt werden, um daraus Regeln für das weitere Reaktionsdesign abzuleiten. Schließlich sollen diese Regeln im Labor angewendet werden, um die im Rahmen dieses Antrags entwickelten Erklärungsmethoden zu validieren. Mit diesen Zielen zielt der Vorschlag darauf ab, die folgenden allgemeinen Ziele des SPPs zu erfüllen: "Anwendung moderner ML-Algorithmen - Erklärbare KI", "Entwicklung von (domänenspezifischen) molekularen Repräsentationen - Allgemein verbesserte molekulare Repräsentationen" und "Vorhersage, Verständnis und Interpretation molekularer Eigenschaften - Verbesserung der derzeitigen Anwendungen". In diesem Kontext liegt ein besonderer Schwerpunkt auf Interpretations- und Erklärungsmodellen für die quantitative Ausbeutevorhersage. Dadurch sollen Ansatzpunkte für eine systematische Verbesserung in diesem unterentwickelten Bereich der MML geschaffen werden. Dieser wurde als ein Hauptthema des SPP definiert.

StichwörterMolekulares maschinelles Lernen; Künstliche Intelligenz; Chemie
Webseite des Projektshttps://www.uni-muenster.de/SPP2363/
DFG-Gepris-IDhttps://gepris.dfg.de/gepris/projekt/497089464
FörderkennzeichenGL 349/15-1; JI 104/10-1 | DFG-Projektnummer: 497089464
Mittelgeber / Förderformat
  • DFG - Schwerpunktprogramm (SPP)

Projektleitung der Universität Münster

Glorius, Frank
Professur für Organische Chemie (Prof. Glorius)
Jiang, Xiaoyi
Professur für Praktische Informatik (Prof. Jiang)

Antragsteller*innen der Universität Münster

Glorius, Frank
Professur für Organische Chemie (Prof. Glorius)
Jiang, Xiaoyi
Professur für Praktische Informatik (Prof. Jiang)