Classification of Metabolic Reactions based on Physicochemical Properties and Search for Enzyme Inhibitors

Language
en
Document Type
Doctoral Thesis
Issue Date
2007-05-21
Issue Year
2007
Authors
Reitz, Martin
Editor
Abstract

This work shows how a database containing chemical structure and reaction data can be explored by methods of chemoinformatics to gain new knowledge for biological or pharmaceutical purposes. Particularly, the storage of all compounds and reactions as connection tables, the annotations with atom-atom mapping numbers and reaction center-marking which are contained in the database presented here allow the access of these data by chemoinformatics methods. The following results were achieved in this work: 1) A database of metabolic reactions (BioPath) was used as a starting point for the investigations presented here. The database is based on the posters ‘Biochemical Pathways’ which were up to this point only available in printed form or as a scanned picture on the internet, and the appending atlas with extended information. Therefore, all reactions together with the available annotations, especially on the corresponding enzymes, were stored in the database. Additionally, a) care was taken on stoichimetrically correct input of all reactions, b) all atoms on the side of reagents and products were marked by atom-atom mapping numbers to allow an exact correlation between these atoms, and c) all bonds which are part of the reaction center, therefore which are built or broken in the reaction process, were marked. The database is available in different versions, amongst others for MDL ISIS/Base, IBM DB2, and for the C@ROL system developed by Molecular Networks. Using the C@ROL system allows data retrieval over the internet and the use of enhanced search methods like sub-structure or reaction sub-structure searches. The BioPath database was extensively presented in a publication in the journal Organic and Biomolecular Chemistry. In a subsequent revision the data quality and user interface of the database was improved. 2) The information on the bonds broken and made in the BioPath database was used to generate intermediates of enzymatic reactions. By 3D superimposition of these intermediates onto several transition state analog inhibitors, we have shown that the reaction intermediate can be considered as structurally quite similar to the transition state. This was investigated for the enzymes AMP deaminase, Triosephosphate isomerase, and Arginase II. These studies were performed in preparation to use such generated intermediates as a template for an automated screening for transition state analog inhibitors in large compound databases. The results of these investigations were published in the Journal of Chemical Information and Modeling. Moreover, with these studies it was shown that a search solely based on the 3D structure, optionally enriched by constraints on physico-chemical properties, can deliver results comparable to a knowledge based-superimposition. Subsequent, a database screening was performed for inhibitors of the enzyme AMP deaminase using the reaction intermediate of its reaction as a search template. It was shown that those compounds were enriched having the activity to inhibit the enzyme Adenosine deaminase, respectively AMP deaminase. Further, the retrieved compounds have activities reported which correlate with inhibitors of AMP deaminase. 3) The information on the reacting bonds contained in the BioPath database was used to develop a new classification of metabolic reactions. The classification is based on a selection of bond descriptors. For this, six physico-chemical descriptors, describing the reactivity of a bond, were calculated for the bonds which are involved in the reaction process and which are part of the substrate. The resulting vector then can serve as an input for data analysis methods. Here, the visualization was performed by Kohonen neural networks. For the investigated dataset consisting of reactions catalyzed by Hydrolases we have shown that the classification by this method delivers results comparable to the established EC nomenclature. Further, our classification can deliver finer details reflecting how the reacting bonds are influenced by the atoms and bonds in the neighborhood. The results of these investigations were submitted for publication to the journal Proteins: Structure, Function, and Bioinformatics.

Abstract

Diese Arbeit beschreibt wie eine Datenbank chemischer Struktur- und Reaktionsdaten durch Methoden der Chemoinformatik ausgewertet werden kann um daraus neue Erkenntnisse für biologische und pharmazeutische Fragestellungen zu gewinnen. Insbesondere die Speicherung der Strukturen und Reaktionen in Form von „Connection Tables“ sowie deren Annotation durch „Atom-Atom Mapping“ Nummern und durch Markierung der Reaktionszentren erlaubt den Zugriff durch diese Methoden. Folgende Ergebnisse wurden in dieser Arbeit erzielt: 1) Es wurde eine Datenbank metabolischer Reaktionen (BioPath) als Ausgangspunkt für die hier gezeigten Anwendungen benutzt. Die Datenbank basiert auf den bis dato nur als Druck bzw. als gescanntes Abbild im Internet verfügbaren Postern „Biochemical Pathways“ und dem dazugehörigen Atlas mit erweiterter Information. Dafür wurden alle Reaktionen mit den verfügbaren Annotationen, vor allem auch den dazugehörigen Enzyminformationen, in der Datenbank gespeichert. Darüber hinaus wurde a) auf stöchiometrisch korrekte Eingabe aller Reaktionen geachtet, b) alle Atome auf Edukt und Produktseite durch so genannte „Atom-Atom Mapping“ Nummern markiert um eine exakte Zuordnung zwischen den Atomen zu ermöglichen und c) alle Bindungen, welche Teil des Reaktionszentrums sind und damit die im Reaktionsprozess gebrochen oder gebildet werden, markiert. Die Datenbank ist in verschiedenen Versionen verfügbar, z.B. für MDL ISIS/Base, IBM DB2 und für das C@ROL System der Firma Molecular Networks. Mithilfe des C@ROL Systems ist es möglich die Datenbank über das Internet abzufragen sowie erweiterte Suchmethoden zu verwenden, z.B. Substruktur- oder Reaktionssubstruktur-Suchen. Die BioPath Datenbank wurde ausführlich in einer Publikation im Journal Organic and Biomolecular Chemistry vorgestellt. In einer anschließenden Revision wurde die Datenbank hinsichtlich der Qualität der Daten und der Benutzeroberfläche überarbeitet. 2) Die in der BioPath Datenbank enthaltene Information zu den gebrochenen und gebildeten Bindungen wurde genutzt um Intermediate solcher Reaktionen zu generieren, welche von einem sp2-hybridisierten C-Atom über einen sp3-Zustand wieder zu einem sp2-Hybrid verlaufen. Diese so erzeugten Intermediate konnten erfolgreich als Ausgangspunkt für eine automatisierte Suche nach Übergangszustands-Analoga für das die jeweilige Reaktion katalysierende Enzym eingesetzt werden. Dies wurde anhand der Enzyme AMP-Deaminase, Triosephosphat-Isomerase sowie Arginase II verdeutlicht. An diesen Beispielen konnte dargestellt werden, dass eine Suche anhand der 3D Struktur, optional angereichert durch Einschränkungen anhand physiko-chemischer Eigenschaften, Ergebnisse ähnlicher Qualität liefern wie ein wissensbasierter Ansatz. Die Ergebnisse dieser Untersuchungen wurden im Journal of Chemical Information and Modeling publiziert. Weiterhin wurde eine Datenbanksuche anhand dieser Methode nach Inhibitoren des Enzyms AMP Deaminase durchgeführt. Dabei wurde gezeigt, dass Substanzen angereichert werden konnten, welche die Eigenschaft tragen die Enzyme Adenosin Deaminase bzw. AMP Deaminase zu inhibieren. Einige weitere der zu den gefundenen Substanzen annotierten Aktivitäten sind in der Literatur als im Zusammenhang mit AMP Deaminase Inhibitoren stehend beschrieben. 3) Die Information zu den reagierenden Bindungen in der BioPath Datenbank wurde zur Entwicklung einer neuartigen Klassifizierung enzymatischer Reaktionen genutzt. Diese Klassifizierung beruht auf einer Auswahl an Bindungs-Deskriptoren für diejenigen Bindungen im Substrat einer enzymatischen Reaktion, welche an der Reaktion beteiligt sind. Für jede dieser Bindungen wurden sechs physiko-chemische Eigenschaften berechnet welche die Reaktivität der jeweiligen Bindung beschreiben. Der daraus resultierende Vektor kann anschließend als Eingabe für verschiedene Daten-Analyse Methoden verwendet werden. Die Visualisierung der Ergebnisse wurde hier mit Hilfe selbst-organisierender Kohonen-Karten durchgeführt. Für den untersuchten Datensatz, bestehend aus Reaktionen die der Klasse der Hydrolasen angehören, konnte gezeigt werden dass die Klassifizierung mittels dieser Methode Ergebnisse liefert die mit der bestehenden EC Nomenklatur vergleichbar sind. Weiterhin konnten wir mit dieser Klassifizierung feinere Details aufzeigen welche die Beinflussung der reagierenden Bindungen durch die benachbarten Atome und Bindungen aufzeigen. Eine Publikation dieser Ergebnisse wurde im Journal Proteins: Structure, Function, and Bioinformatics eingereicht.

DOI
Document's Licence
Faculties & Collections
Zugehörige ORCIDs