MultiGML kombiniert relevantes Wissen und experimentelle Daten (z. B. Genexpressionsdaten, Mikroskopiebilder, Proteinsequenzen) in einer umfassenden, strukturierten und objektivierenden (unbiased) Weise.

Ausgangssituation und Kontext

Das richtige Arzneimittelziel finden
In der pharmazeutischen Forschung ist die Identifizierung eines guten Targets entscheidend für die Wirksamkeit und Sicherheit eines Arzneimittelkandidaten. Traditionell basiert die Identifizierung von Zielmolekülen auf dem menschlichen Wissen und dem Verständnis der grundlegenden Krankheitsmechanismen. Angesichts der zunehmenden Flut an wissenschaftlicher Literatur besteht bei diesem manuellen Ansatz jedoch die Gefahr, dass relevante Daten und Informationen übersehen werden, was zu suboptimalen Entscheidungen führen kann.

Abbildung 1: MultiGML Graphengenerierung

Unerwünschte Arzneimittelwirkungen als Risiko für klinische Studien

Unerwünschte Arzneimittelwirkungen (UAW) sind definiert als Schädigungen, die sich aus der Anwendung eines Arzneimittels ergeben, einschließlich Schäden, die durch das Arzneimittel verursacht werden (unerwünschte Arzneimittelwirkungen und Überdosierungen), und Schäden, die sich aus der Anwendung des Arzneimittels ergeben (einschließlich Dosisreduzierungen und Abbruch der Arzneimitteltherapie). Das Auftreten einer UAW kann zumindest teilweise mit der Wahl des primären Zielproteins oder den Eigenschaften der chemischen Struktur eines Arzneimittels in Verbindung gebracht werden. Experimentelle Ansätze zur Untersuchung potenzieller unerwünschter Wirkungen (z. B. Lebertoxizität) auf der Grundlage von Tier- und Gewebemodellen sind gut etabliert. Allerdings spiegeln die in solchen Modellsystemen erzielten Ergebnisse nicht immer die Situation beim Menschen wider, und es gibt ethische Bedenken hinsichtlich der Verwendung von Tiermodellen. Außerdem gibt es nicht für alle UAWs und Indikationsbereiche zuverlässige Modellsysteme.

Die Grenzen der Humangenetik

Eine Möglichkeit, die oben genannten Bedenken auszuräumen, besteht darin, zu prüfen, ob genetische Varianten in einem Arzneimittelkandidaten mit einem ungünstigen Phänotyp in Verbindung gebracht wurden. Zwar hat sich dieser Ansatz in den Fällen, in denen ein solcher Zusammenhang festgestellt werden konnte, als äußerst wirksam erwiesen, doch muss man sich darüber im Klaren sein, dass ein hohes Risiko besteht, relevante Zusammenhänge zu übersehen, weil die statistische Aussagekraft nicht ausreicht.

Kategorie:
Entwickelt von

Fraunhofer SCAI

Ihre Ansprechpartnerin

Gerne gebe ich Ihnen Auskunft zu unseren Softwareprodukten.

Bettina Keller
Bettina KellerProduktvertrieb

Unvoreingenommenes (objektiviertes) Lernen aus umfassendem Wissen und experimentellen Daten

Unsere Lösung kombiniert relevantes Wissen und experimentelle Daten (z. B. Genexpressionsdaten, Mikroskopiebilder, Proteinsequenzen) in einer umfassenden, strukturierten und unvoreingenommenen Weise. Technisch wird dies durch einen semantisch harmonisierten Wissensgraphen realisiert, den wir aus 14 kuratierten biologischen Datenbanken zusammengestellt haben. Das Ergebnis sind rund 400.000 Beziehungen zwischen Proteinen, Medikamenten und Phänotypen, einschließlich UAWs (Abbildung 1). Auf der Grundlage dieser Fülle von Informationen trainierten wir eine multimodale Graph-Neural-Network-Architektur, die in der Lage ist, neue Assoziationen zwischen Substanzen und Phänotypen oder zwischen Protein-Targets und Phänotypen genau vorherzusagen. Ein Unterschied zu alternativen Lösungen ist die Möglichkeit von MultiGML, Erklärungen für Modellvorhersagen zu liefern (Abbildung 2).

Wir bieten MultiGML in zwei Varianten an:

  1. MultiGML_Modell: Unser vollständig trainiertes MultiGML-Modell in den Varianten RGCN und RGAT (PyTorch Version 1.9.1) ist einsatzbereit und enthält Anweisungen zur Installation der Umgebung und zur Anwendung des trainierten Modells.
  2. MultiGML_Code: Der Code zur Ausführung von MultiGML mit einem benutzerdefinierten Wissensgraphen, einschließlich unserer Skripte zur Generierung von Knotenpunkteigenschaften des Wissensgraphen, die in unserer früheren Veröffentlichung verwendet wurden, sowie Skripte zur Erklärung von Vorhersagen post-hoc unter Verwendung der Methode der integrierten Gradienten. Die Skripte zur Erzeugung von Knotenpunkteigenschaften enthalten Skripte für die folgenden Merkmale:
    1. Medikamente: molekularer Fingerabdruck, Genexpressionssignatur, morphologischer Fingerabdruck
    2. Proteine: Sequenzeinbettung, Gen-Ontologie-Fingerprint
    3. Phänotypen: Einbettung des medizinischen Konzepts

Anleitungen für die Installation von Umgebungen und die Verwendung der Befehlszeilenschnittstelle sind enthalten. Dies gibt Ihnen volle Flexibilität, einschließlich der Möglichkeit, Ihren Wissensgraphen nach Ihren Wünschen anzureichern, Ihre individuelle MultiGML-Instanz zu trainieren und anschließend Ihre Vorhersagen zu erklären.

Abbildung 2: EIn Beispiel für eine Modellvorhersage durch MultiGML. MultiGML sagte einen Zusammenhang zwischen dem Wirkstoff Karamycin und dem Phänotyp Lähmung voraus. Das Diagramm zeigt die Nachbarschaft erster Ordnung zwischen der Substanz und dem interessierenden Phänotyp und hebt die Verbindungen hervor, die MultiGML für diese Vorhersage als besonders relevant erachtet. Die Dicke der Kanten zeigt an, wie viel Aufmerksamkeit MultiGML den einzelnen Beziehungen widmet, um die Vorhersage zu treffen.