Analyzing Compounds’ Mode of Action - A Use Case for New Approaches Utilizing Protein Interaction Networks and Prior Knowledge to Complement State-of-the-Art Gene Expression Analyses

Schmid, Ramona

German Title: Analyse der Wirkungsweisen von Arzneistoffen - Ein Anwendungsbeispiel unter Verwendung von Protein-Interaktions-Netzwerken und Vorwissen zur Ergänzung moderner Genexpressions Analysen

Preview

PDF, English
Download (8MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

DOI: 10.11588/heidok.00013830
URN: urn:nbn:de:bsz:16-opus-138305
URL: http://www.ub.uni-heidelberg.de/archiv/13830

Abstract

Background: Scientists in pharmaceutical as well as academic research work together to solve the challenging puzzle from the basic causes of disease at the level of genes, proteins and cells up to a marketed new drug. Analyses of mode of action (MoA) of new chemical entities (NCEs) are a very important step in the development of new drugs. One distinguishes between effects induced by modulating the compounds’ actual target protein (on-target effects) and effects induced by additional, possibly unknown targets (off-target effects). Quite often knowledge about either of these effects is limited. Since MoA is mainly triggered by the interplay of proteins or signaling cascades, investigating the change and subsequent influence of the changed molecules in a protein interaction (PI) network is a promising initial step to further analyses. As more and more data from diverse sources becomes available, the integration of this knowledge is important for generating a deeper insight into biology. In addition, expression experiments based on disease tissue and/or compound treatment are frequently conducted to get insight into transcriptional changes that could explain compounds’ MoA. Status quo: MoA could be analyzed by investigating those parts of a PI network that show changes based on compound treatment. Mathematical or graph theoretical in silico methods to identify interesting parts of a network based on different criteria are widely used. Criteria range from detection of highly connected subgraphs to subgraphs maximizing weights assigned to parts of the network under investigation. These methods can be transferred to biology and can be used to, e. g. identify condition responsive subnetworks on various types of molecular networks. Present questions addressed mainly focus on the detection of subnetworks enriched in information from functional genomics, e.g. differentially expressed genes. They neglect the existence of distance regulatory functions on the post-transcriptional as well as post-translational level like miRNA interference or protein phosphorylation. Further, available methods usually detect relatively large modules. It is easily possible that more processes, i. e. the on- and several off-target effects, are covered by one larger module. Thus, the individual effects are difficult to detect and interpret. To be able to derive individual effects, it is necessary to reveal small modules that are related to the individual effects present in the biological system under investigation. Methods & Results: In this work, I made use of a gene expression data set investigating the inhibition of the TGF-beta signaling pathway by different compounds targeting TGF-betaR1. To gain a sound basis for follow-up analyses, different aspects of how to select the best suited normalization procedure for the underlying expression data are proposed in the first part of this thesis. To analyze compounds’ MoA, I propose a method that weights interactions between proteins based on different kinds of evidence. In this method, the relevance of the proteins is based on the biological relatedness to other possibly not deregulated protein coding genes. Thereby, analyses are expanded beyond transcriptional deregulation. To elucidate the biological relatedness, information on molecular function, biological processes and cellular compartment, information on transcription factor binding sites and literature-based confidence scores are integrated for weighting the edges between proteins. To transfer the network into the biological context of interest, expression experiments are used as anchoring points for the analyses. Further, I introduce modEx, a method to extract small modules out of a weighted protein interaction network. Modules extracted using modEx reflect the individual effects present in the biological system under investigation. For the expression data set used, the proposed edge scoring is shown to be superior to the widely accepted STRING scoring. Furthermore, modEx extracts modules that represent the underlying mechanism better than jActiveModule, a commonly used subgraph extraction method. These newly proposed approaches are applied to elucidate the MoA, i. e. the on- as well as off-target effects, of compounds. They are shown to grant a more focused view on the effects of compounds than current state-of-the-art methods applied for the analysis of gene expression data.

Translation of abstract (German)

Hintergrund: Wissenschaftler der pharmazeutischen Industrie und der akademischen Forschung arbeiten gemeinsam an der Erforschung der grundlegenden Ursache einer Erkrankung auf zellulärer Ebene bis hin zum zugelassenen neuen Medikament. Analysen der Wirkungsweise (mode of action) neuer Substanzen sind unter zunehmenden Sicherheits- und Nutzenanforderungen ein immer wichtiger werdender Beitrag in der Entwicklung eines neuen Wirkstoffs. Dabei wird zwischen den Effekten am gewünschten Zielprotein (on-target) und den Effekten an möglicherweise unbekannten Zielproteinen (off-targets) unterschieden. Häufig ist das Wissen über diese Effekte sehr begrenzt. Da die Wirkung hauptsächlich durch Wechselwirkungen von Proteinen oder Signalkaskaden vermittelt wird, ist ihre Untersuchung auf der Basis von Proteininteraktionsnetzwerken (PI-Netzwerke) ein vielversprechender Ansatz. Die Menge an verfügbaren biologische Daten aus verschiedensten Quellen steigt stetig an. Die Integration dieses Wissens ist wichtig, um ein tieferes Verständnis der zugrundeliegenden Biologie zu erlangen. Häufig werden Genexpressionsstudien von erkranktem Gewebe und/oder wirkstoffbehandelten biologischen Proben durchgeführt, um die Wirkungsweise neuer Wirkstoffe unter Berücksichtigung von transkriptionellen Änderungen verstehen zu können. Vorgehen & Ergebnisse: In der vorliegenden Arbeit werden Genexpressionsdaten analysiert, die der Aufdeckung von on- und off-target Effekten verschiedener Wirkstoffe zur Inhibition von TGF-betaR1 dienen sollen. Um eine verlässliche Basis für die Datenanalyse zu schaffen, werden im ersten Teil der Arbeit verschiedene Aspekte zur Auswahl einer geeigneten Normalisierungsmethode vorgestellt. Unter deren Berücksichtigung wird schließlich eine optimale Normalisierungsstrategie gewählt. Um die Wirkmechanismen der verschiedenen Substanzen zu analysieren, wird ein Verfahren vorgeschlagen, das die Interaktionen zwischen Proteinen mittels verschiedener Evidenzien gewichtet. Die Relevanz der Proteine wird dabei nicht nur über die Expression ihrer kodierenden Gene sondern auch durch ihre Beziehung zu anderen Proteinen bewertet. Dadurch werden Analysen über die Genexpressionsebene hinaus erweitert. Die Bewertung dieser Beziehungen erfolgt über die Gewichtung der Proteininteraktionen. Dazu werden Informationen über molekulare Funktionen, biologische Prozesse, zelluläre Kompartimente, Transkriptionsfaktorbindestellen und literaturbasierte Konfidenzwerte integriert, um die entsprechenden Kanten im Netzwerk zu gewichten. Expressionsdaten dienen als Ankerpunkt der Analysen, um das Netzwerk schließlich in den biologischen Kontext zu transferieren. Des Weiteren wird in dieser Arbeit eine neue Methode zur Extraktion von Modulen aus gewichteten PI-Netzwerken entwickelt, modEx. Mittels der durch modEx extrahierten Module ist es möglich, Einzeleffekte innerhalb des biologischen Systems abzugreifen. Für den vorliegenden Expressiondatensatz kann gezeigt werden, dass die vorgeschlagene Kantengewichtung der weit akzeptierten STRING-Gewichtung überlegen ist. Darüber hinaus können unter Verwendung von modEx Module extrahiert werden, die den zugrundeliegenden biologischen Mechanismus besser repräsentieren als Module, die durch das gängige jActiveModule identifiziert werden. Die vorgestellten Methoden werden verwendet, um den Wirkungmechanismus, d. h. sowohl die on- als auch off-target Effekte verschiedener Wirkstoffe zu analysieren. Es kann gezeigt werden, dass dadurch ein fokussierterer Blick auf die Effekte der Wirkstoffe möglich ist als durch gegenwärtige state-of-the-art Analysen eines Genexpressionsdatensatzes.

Document type:	Dissertation
Supervisor:	Eils, Prof. Dr. Roland
Date of thesis defense:	26 September 2012
Date Deposited:	10 Oct 2012 15:20
Date:	2012
Faculties / Institutes:	The Faculty of Mathematics and Computer Science > Department of Computer Science
DDC-classification:	004 Data processing Computer science
Uncontrolled Keywords:	Mode of Action , Gene Expression Analyses , Protein Interaction Networks , Data Integration , Module Extraction