EN | DE
Zwei Wissenschaftler im Büro

Wirkstoffbioinformatik

Prof. Dr. Olga Kalinina

Die Bioinformatik unterstützt und kooperiert mit anderen Bereichen der Molekularbiologie indem sie unter anderem Verfahren zur Analyse von Genomsequenzen entwickelt oder Vorhersagen der dreidimensionalen Struktur von Wirkstoff-Ziel-Komplexen generiert. Wir verwenden modernste Techniken der Bioinformatik und Informatik an, um neuartige Resistenzmechanismen zu entdecken und die Wirkungsweise bioaktiver Verbindungen vorherzusagen.

Unsere Forschung

Ein besonderer Schwerpunkt unserer Gruppe ist die Entwicklung von Machine Learning Methoden zur Vorhersage funktioneller Konsequenzen genetischer Varianten, die mit einer bestimmten Krankheit oder einem bestimmten Resistenzphänotyp in Verbindung gebracht werden können. Dabei ist es unser Ziel, nicht nur die Richtung und das Ausmaß des Effekts vorherzusagen, d.h. ob eine bestimmte Variante wahrscheinlich pathogen ist oder Resistenzen gegen ein Medikament hervorruft, sondern auch den genauen molekularen Mechanismus, der dafür verantwortlich ist, zu finden. Dazu kombinieren wir phylogenetische Methoden mit Ansätzen aus der strukturellen Bioinformatik: Modellierung der dreidimensionalen Struktur von Proteinen, ihren Wechselwirkungen und ihrer Dynamik, deren Ergebnisse vereint für Machine Learning Methoden genutzt werden. Ein besonderer Schwerpunkt dieser Arbeit liegt in der Entdeckung neuartiger Resistenzmechanismen. Ein weiterer Fokus der Arbeitsgruppe ist die Untersuchung von Protein-Wirkstoff-Wechselwirkungen und Wirkstoffbindungstaschen mit Hilfe von auf Data-Mining und Graphentheorie basierenden Ansätzen. Dafür entwickeln wir Machine-Learning-Methoden, welche die funktionelle Motive von Proteinen und Wirkstoffbindungsmuster beschreiben und schließlich maschinelle Vorhersagemethoden für die Wirkstoffaffinität entwickeln, welche auf strukturellen Deskriptoren von Protein-Wirkstoff-Wechselwirkungen basieren.

Team-Mitglieder

Forschungsprojekte

Strukturelle Annotation genetischer Varianten

Durch die Analyse der räumlichen Verteilung genetischer Varianten im Kontext dreidimensionaler Strukturen von Proteinen und deren Homologen, können wir Hypothesen über die funktionellen Konsequenzen dieser Varianten aufstellen. Zum Beispiel kann eine Mutation, die durch einen einzelnen Nukleotid-Polymorphismus verursacht wird und sich auf einer Interaktionsoberfläche mit einem anderen Protein oder in einer Ligandenbindetasche befindet, die entsprechende Bindungsaffinität beeinflussen. Ein anderes Beispiel sind Mutationen, die im Proteininneren liegen. Diese können die Stabilität des Proteins beeinträchtigen. Wir entwickeln Methoden, mit denen sehr große Datensätze auf diese Weise annotiert werden können und die einen Einblick in die Beziehung zwischen der annotierten pathogenen oder funktionellen Wirkung von Mutationen und ihrer Position in den dreidimensionalen Strukturen von Proteinen und ihren Komplexen geben.

Vorhersage der funktionellen Wirkung von Mutationention

Wir entwickeln Methoden des maschinellen Lernens zur Vorhersage der Auswirkungen von Mutationen unter Verwendung einer Vielzahl von Merkmalen, die sich auf dreidimensionale Proteinstrukturen, deren Wechselwirkungen und die Evolution beziehen. Die Methoden können so trainiert werden, dass sie die Auswirkungen auf die Proteinfunktion vorhersagen, ebenso wie ihre Pathogenität (welche mit der Auswirkung auf die Proteinfunktion korreliert). Darüber hinaus untersuchen wir die Möglichkeit, solche Methoden zu trainieren, um die Auswirkungen auf bestimmte Phänotypen, wie z. B. die Resistenz gegen antibakterielle Substanzen, vorherzusagen.

Systemmedizinische Untersuchung des alternativen Spleißens bei Herz- und Nierenerkrankungen (Sys_CARE)

In diesem vom BMBF geförderten Projekt in Kooperation mit der Universität Hamburg und dem Universitätsklinikum Greifswald setzen wir unsere Expertise in der Strukturmodellierung und -annotation ein, um neue Mechanismen der Pathogenese von Herz- und Nierenerkrankungen zu untersuchen. Dabei konzentrieren wir uns auf die Veränderungen von Proteinsequenzen, die durch krankheitsspezifische, alternative Spleißereignisse verursacht werden.

AI-BASIERTE METHODEN ZUR SYNERGETISCHEN ERFORSCHUNG VON KRANKHEITSSYMPTOMEN UND ARZNEIMITTELNEBENWIRKUNGEN (DRUGSIDERAI)

Nebenwirkungen von Medikamenten sind weit verbreitet, ihre Mechanismen sind jedoch nur unzureichend erforscht. In diesem vom BMBF geförderten Projekt wollen wir in Zusammenarbeit mit der Universität Hamburg und DESY die molekularen Grundlagen und die Bedeutung solcher Mechanismen für die Population untersuchen. Wir kombinieren Systembiologie, strukturelle Bioinformatik, Chemieinformatik und maschinelles Lernen, um die Auswirkungen der Off-Target-Wirkstoffbindung und den Einfluss genetischer Variation darauf zu untersuchen.

IDENTIFIZIERUNG NEUARTIGER RESISTENZMECHANISMEN MIT AI (AMR-XAI)

Die antimikrobielle Resistenz (AMR) ist vielleicht die dringendste Bedrohung für das menschliche Gesundheitswesen. Während einzelne Resistenzmutationen gut erforscht sind, ist das Wissen darüber, welche neuen Mutationen eine antimikrobielle Resistenz verursachen können, der Schlüssel zur Entwicklung von Medikamenten, die die mikrobielle Abwehr zuverlässig umgehen. In einem von der Helmholtz-Gemeinschaft geförderten Projekt in Zusammenarbeit mit dem CISPA untersuchen wir AMR mittels erklärbarer künstlicher Intelligenz, indem wir neuartige Methoden zur Entdeckung leicht interpretierbarer, lokaler Muster, die im Hinblick auf eine oder mehrere Resistenzklassen von Bedeutung sind, entwickeln und anwenden. Wir lernen eine Anzahl leicht interpretierbarer Modelle, die zusammen den Resistenzphänotyp in den Daten erklären. Dabei verwenden wir statistisch robuste Methoden zur Entdeckung signifikanter Untergruppen sowie informationstheoretische Ansätze zur Entdeckung prägnanter Mengen rauschresistenter Regeln.

AUF PROTEINSTRUKTUREN BASIERENDE DARSTELLUNGSMODELLE

Die jüngsten Entwicklungen auf dem Gebiet der Proteinstrukturvorhersage haben zu einem drastischen Anstieg der Anzahl der verfügbaren dreidimensionalen Proteinstrukturen geführt. Einerseits stellt dies eine neue Herausforderung dar, andererseits bietet es die Möglichkeit, geeignete Ansätze zu finden, um solche neuen Datensätze in verschiedenen Bereichen des maschinellen Lernens zu nutzen. Es haben sich große Sprachmodelle (Large Language Models, LLMs), die auf Proteinsequenzen trainiert wurden, sogenannte Protein Large Language Models (PLLMs), in verschiedenen bioinformatischen Fragestellungen als nützlich erwiesen. In unserer Arbeit fokussieren wir uns auf die Anwendung von PLLMs und deren Erweiterung durch Berücksichtigung der dreidimensionalen Struktur von Proteinen. Wir verwenden sequenzbasierte, vortrainierte PLLMs und unsere eigenen strukturbasierten Repräsentationen, sowohl einzeln als auch kombiniert, und versuchen, ihr Verhalten auf eigenen biomedizinischen Daten zu interpretieren. Wir haben einen selbstüberwachten Lernansatz für dreidimensionale Proteinstrukturen entwickelt, der auf convolutional Graph Neural Networks und Graph Transformern basiert und sinnvolle Repräsentationen von Proteinstrukturen erzeugt. Wir haben seine Nützlichkeit in einer Reihe von nachgelagerten Aufgaben (downstream tasks) demonstriert, darunter die Vorhersage von Wirkstoff-Zielprotein-Interaktionen und die Vorhersage von Produkten biosynthetischer Gencluster.

ERKLÄRBARES DEEP LEARNING FÜR WIRKSTOFF-ZIELPROTEIN-INTERAKTIONEN (NEXTAID, XAI-GRAPH)

Wir nutzen die neuesten Entwicklungen bei Protein-basierten, vortrainierten Modellen, um effiziente Deep-Learning-Modelle für die Vorhersage von Wirkstoff-Zielprotein-Interaktionen zu erstellen. In diesen Modellen verwenden wir nicht nur dreidimensionale Strukturen von Wirkstoffen, sondern auch die von den Zielproteinen. Dies macht unsere Modelle einzigartig in diesem Bereich. Um diese Modelle für die biomedizinische Forschung noch nützlicher zu machen, erforschen wir in Zusammenarbeit mit dem NextAID-Projekt an der Universität des Saarlandes (https://nextaid.cs.uni-saarland.de/) Erklärungsansätze, um die Aminosäuren in den Zielproteinen zu identifizieren, die am meisten zu den Wechselwirkungen beitragen. Ein ähnlicher Ansatz wird in dem HelmholtzAI-geförderten Projekt “XAI-Graph” mit dem UFZ verfolgt, in dem wir erklärbare Graph-basierte Wirkstoff-Ziel-Interaktionsmodelle für die toxikologische Forschung untersuchen.

Publikationen

2020

An extended catalogue of tandem alternative splice sites in human tissue transcriptomes

Mironov A, Denisov S, Gress A, Kalinina O, Pervouchine D (2020)

BookDOI: 10.1101/2020.09.11.292722

The bottromycin epimerase BotH defines a group of atypical α/β-hydrolase-fold enzymes

Sikandar A, Franz L, Adam S, Santos-Aberturas J, Horbal L, Luzhetskyy A, Truman A, Kalinina O, Koehnke J (2020)

Nat Chem Biol 16 (9): 1013-1018DOI: 10.1038/s41589-020-0569-y

DIGGER: exploring the functional role of alternative splicing in protein interactions

Louadi Z, Yuan K, Gress A, Tsoy O, Kalinina O, Baumbach J, Kacprowski T, List M (2020)

Nucleic Acids ResDOI: 10.1093/nar/gkaa768

Frequent subgraph mining for biologically meaningful structural motifs

Keller S, Miettinen P, Kalinina O (2020)

BookDOI: 10.1101/2020.05.14.095695

SphereCon-a method for precise estimation of residue relative solvent accessible area from limited structural information

Gress A, Kalinina O (2020)

Bioinformatics (Oxford, England) 36 (11): 3372-3378DOI: 10.1093/bioinformatics/btaa159

Resistance-associated substitutions in patients with chronic hepatitis C virus genotype 4 infection

Dietz J, Kalinina O, Vermehren J, Peiffer K, Matschenz K, Buggisch P, Niederau C, Schattenberg J, Müllhaupt B, Yerly S, …, Welsch C, Sarrazin C (2020)

J. Viral Hepat.DOI: 10.1111/jvh.13322.

Non-active site mutants of HIV-1 protease influence resistance and sensitisation towards protease inhibitors

Bastys T, Gapsys V, Walter H, Heger E, Doncheva N, Kaiser R, Groot B, Kalinina O (2020)

Retrovirology 17 (1)DOI: 10.1186/s12977-020-00520-6

A shift of dynamic equilibrium between the KIT active and inactive states causes drug resistance

Srikakulam S, Bastys T, Kalinina O (2020)

ProteinsDOI: 10.1002/prot.25963

2019

Relative Principal Components Analysis: Application to Analyzing Biomolecular Conformational Changes

Ahmad M, Helms V, Kalinina O, Lengauer T (2019)

Journal of chemical theory and computation 15 (4): 2166-2178DOI: 10.1021/acs.jctc.8b01074

Adenosine-to-Inosine RNA Editing in Mouse and Human Brain Proteomes

Levitsky L, Kliuchnikova A, Kuznetsova K, Karpov D, Ivanov M, Pyatnitskiy M, Kalinina O, Gorshkov M, Moshkovskii S (2019)

Proteomics 19 (23)DOI: 10.1002/pmic.201900195.

Targeting actin inhibits repair of doxorubicin-induced DNA damage: a novel therapeutic approach for combination therapy

Pfitzer L, Moser C, Gegenfurtner F, Arner A, Foerster F, Atzberger C, Zisis T, Kubisch-Dohmen R, Busse J, Smith R, …, Vollmar A, Zahler S (2019)

Cell Death Dis. 10 (4)DOI: 10.1038/s41419-019-1546-9

2018

Epistatic Interactions in NS5A of Hepatitis C Virus Suggest Drug Resistance Mechanisms

Knops E, Sierra S, Kalaghatgi P, Heger E, Kaiser R, Kalinina O (2018)

Genes 9 (7)DOI: 10.3390/genes9070343

Consistent Prediction of Mutation Effect on Drug Binding in HIV-1 Protease Using Alchemical Calculations

Bastys T, Gapsys V, Doncheva N, Kaiser R, Groot B, Kalinina O (2018)

Journal of chemical theory and computation 14 (7): 3397-3408DOI: 10.1021/acs.jctc.7b01109

2017

Spatial distribution of disease-associated variants in three-dimensional structures of protein complexes

Gress A, Ramensky V, Kalinina O (2017)

Oncogenesis 6 (9)DOI: 10.1038/oncsis.2017.79.

2016

Patterns of amino acid conservation in human and animal immunodeficiency viruses

Voitenko O, Dhroso A, Feldmann A, Korkin D, Kalinina O (2016)

Bioinformatics (Oxford, England) 32 (17): 685-DOI: 10.1093/bioinformatics/btw441

StructMAn: annotation of single-nucleotide polymorphisms in the structural context

Gress A, Ramensky V, Büch J, Keller A, Kalinina O (2016)

Nucleic Acids Res 44 (W1): 463-8DOI: 10.1093/nar/gkw364