Classification of Organic Compounds into Modes of Toxic Action

dc.contributor.advisorGasteiger, Johann
dc.contributor.authorSpycher, Simon Lukas
dc.date.accessioned2005-11-10
dc.date.available2023-10-15T20:12:22Z
dc.date.created2005
dc.date.issued2005-11-10
dc.description.abstractTraditionally, quantitative structure-activity relationships (QSAR) for toxic effects are derived from a series of compounds belonging to the same chemical class. However, structural similarity does not necessarily lead to similar toxic effects. As a consequence, considerable effort has been made to move toxicity QSAR from a class-based perspective to one that is consistent with modes of toxic action (MOA). The prerequisite for screening large databases of compounds with MOA-based QSARs is the successful classification of compounds into the different MOAs. The goal of this work is therefore to improve MOA classification methods. Toxicity QSAR is based on three main disciplines: data analysis, chemistry and toxicology. Therefore this work is structured around these three disciplines with each chapter consisting of a study on MOA classificationx but with a main focus on one of these disciplines. Data analysis methods: Data analysis methods contribute in several ways to improved MOA classification. First of all, they provide classification methods. Secondly, data analysis methods are necessary to estimate the predictive power of classification models. The predictive power of different classification models was compared using data set of 104 compounds with seven different MOAs. The predictive power varied surprisingly little between the four compared methods and ranged from 52% to 59% overall correct classification when appropriate parameters and descriptor selection methods were chosen. The fact that no approach could further improve the predictive power was attributed to the combination of high diversity, small size of the data set and the large number of classes. Concerning the validation methods, descriptor selection appeared to be one of the crucial processes of too optimistic estimates of predictive power. However, a methodology to correct this optimistic bias in cross-validation methods was developed. Thus, the main conclusion from this study is that it is not possible to say a priori which classification methods works best for a given data set, therefore it is advisable to use both a linear and a nonlinear method for each data set. Chemistry: Progress in computational chemistry allows the calculation of an increasing number of molecular and atomic descriptors. In this second study, a data set of 220 phenols with exhibiting four MOAs was used. The structures were described by a representation previously developed in drug design. The structure representation used consists of vectors based on empirical atomic Pi-charge and sigma-electronegativity encoded by topological autocorrelation and of vectors based on hydrogen bonding potential encoded by surface autocorrelation. The performance of autocorrelation descriptors proved to be equal to the results obtained in the evaluation of previously published quantum-chemical descriptors with overall correct classification percentages over 90%. Thus, the greatest advantage of the proposed structure representation is the ease and speed of calculation. This advantage was utilized to screen all 3142 monocyclic phenols contained in the open NCI database in an exploratory study. Toxicology: If mechanistic knowledge of a toxic effect is available, this knowledge can simplify both descriptor selection and data analysis. As a third study a mechanistic QSAR model of uncouplers of oxidative and photo-phosphorylation was developed based on insights gained in kinetic experimental studies. The model was based on a data set of 21 phenols with measured biological activity, and additionally with experimental membrane-water distribution coefficients. This allowed the calculation of effect concentrations at the site of action, which is an advantage compared with the traditional approach of estimating the uptake with octanol-water coefficients. A linear regression model of good quality could be established using four mechanistic descriptors. The proposed model has a potential to establish MOA based QSARs containing data from different chemical classes which is one of the central goals of MOA based QSAR. In a last study, a pragmatic approach for a classification model for uncouplers was presented. It is based on a data set of 31 uncouplers and 18 compounds showing no activity in this MOA and could classify 46 of the 49 compounds correctly. The experiences made in these three studies can help to guide future studies. The size of data set and the knowledge of toxic mechanisms are taken as the two criteria which should guide through the QSAR model building process. Concerning the state of MOA classification in general one must say that this field is still in an early stage. However, given that tens of thousands of compounds will be tested over the next years, even models with intermediate or modest predictive power used for the prioritization of testing needs are of remarkable practical value.en
dc.description.abstractDie meisten quantitativen Struktur-Wirkungsbeziehungen (quantitative structure-activity relationships: QSAR) für toxische Effekte basieren auf Strukturen der gleichen chemischen Klasse. Strukturelle Ähnlichkeit führt jedoch nicht notwendigerweise zu ähnlichen toxischen Wirktypen. Aus diesem Grund wird in den letzten Jahren vermehrt versucht, QSARs von der Basis der chemischen Klasse weg zu bringen und auf der Basis toxischer Wirktypen (mode of toxic action: MOA) zu arbeiten. Die Voraussetzung, um grosse Datenbanken mit MOA-basierten QSARs nach problematischen Chemikalien zu durchsuchen, ist eine erfolgreiche Klassifikation der Chemikalien in ihre MOAs. Ziel dieser Arbeit ist deshalb, die Untersuchung und Verbesserung von MOA-Klassifikationsmodellen. QSARs zur Toxizität basieren hauptsächlich auf drei Disziplinen: Datenanalyse, Chemie und Toxikologie. Diese Arbeit wurde deshalb auch anhand dieser drei Disziplinen gegliedert, wobei in jedem Kapitel ein MOA-Datensatz mit Hauptbezug auf eine dieser Disziplinen untersucht wurde. Datenanalyse: Methoden der Datenanalyse tragen in verschiedenen Bereichen zu Verbesserungen der MOA-Klassifikation bei, wobei die Entwicklung von Klassifikationsmethoden und von Methoden zur Abschätzung der Vorhersagekraft die wichtigsten sind. Anhand eines MOA-Datensatzes mit 104 Verbindungen und sieben MOAs wurde die Vorhersagekraft vier verschiedener Klassifikationsmodelle unterschiedlicher Komplexizität getestet. Die Unterschiede in der Vorhersagekraft der Modelle waren relativ gering und reichten mit optimierter Parameterwahl und mit Deskriptorselektionsmethoden von 52% zu 59% insgesamt korrekt vorhergesagten Verbindungen. Die Tatsache, dass sich die Vorhersagekraft mit keinem Ansatz weiter erhöhen liess, wurde auf die sehr hohe molekulare Diversität des Datensatzes und auf dessen geringe Grösse des im Verhältnis zur Anzahl Klassen, zurückgeführt. In weiteren Untersuchungen konnte die Deskriptorselektion als eine der Hauptursachen für die Überschätzung der Vorhersagekraft identifiziert werden. Deshalb wurde eine Methodologie, um solche Überschätzungen in Kreuzvalidierungsmethoden zu korrigieren, erarbeitet. Hauptfolgerung dieser Studie war, dass es sich nicht a priori sagen lässt, welche Klassifikationsmethoden für einen bestimmten Datensatz am besten funktionieren wird und deshalb jeweils lineare und nichtlineare Methoden ergänzend eingesetzt werden sollten. Chemie: Fortschritte in der theoretischen Chemie erlauben die zunehmend genaue Berechnung einer Vielzahl von molekularen und chemischen Deskriptoren. Die zweite Studie beruht auf einem Datensatz von 220 Phenolen mit vier MOAs. Eine für die Wirkstoffforschung entwickelte Strukturrepräsentation wurde dabei verwendet. Die Strukturrepräsentation basiert auf empirisch berechneten atomaren Pi-Ladungen und Sigma-Elektronegativitäten, welche mit Autokorrelationsvektoren codiert wurden. Zusätzlich wurden Wasserstoffbrückenbindungspotentiale mit Oberflächenautokorrelation codiert. Die Vorhersagekraft der Klassifikationsmodelle wurde auf über 90% korrekt vorhergesagter Verbindungen abgeschätzt und war damit vergleichbar mit denjenigen, die in publizierten Arbeiten mit quanten-chemischen Deskriptoren erreicht wurde, wobei die hier vorgeschlagenen Deskriptoren erheblich einfacher und schneller zu berechnen sind. Dieser Vorteil wurde genutzt für eine explorative Analyse der 3142 monocyclischen Phenole in der open NCI Database. Toxikologie: Ist mechanistisches Wissen über toxische Effekte verfügbar, kann es die Wahl der Deskriptoren und die Datenanalyse vereinfachen. In einer dritten Studie wurde ein mechanistisches QSAR-Modell für Entkoppler der oxidativen und Photo-Phosphorylierung entwickelt, das auf Ergebnissen experimentell hergeleiteter kinetischer Modelle basiert. Ein Datensatz von 21 Phenolen mit gemessener Aktivität und zusätzlich mit gemessenen Membran-Wasser-Verteilungskoeffizienten wurde an dieser Stelle verwendet. Daraus liess sich die Konzentration der Verbindungen am Wirkort berechnen. Basierend auf vier mechanistischen Deskriptoren liess sich ein lineares Regressionsmodell guter Qualität bilden. Das vorgeschlagene Modell hat ein Potential, auch Verbindungen anderer chemischer Klassen in das Modell zu integrieren, welches ein zentrales Ziel des MOA-basierten Ansatzes darstellt. In einer zusätzlichen Studie wurde ein pragmatischer Ansatz zur Klassifikation von Entkopplern entwickelt. Er basiert auf einem Datensatz von 31 aktiven Entkopplern und 18 nicht aktiven Verbindungen und erlaubte, 46 der 49 Verbindungen korrekt zu klassifizieren. Was den Stand der MOA-Klassifikationsmethoden im Allgemeinen betrifft, muss gesagt werden, dass sich dieses Gebiet noch in einem frühen Stadium befindet. Die Tatsache, dass in den nächsten Jahren, zehntausende von Chemikalien getestet werden sollen, bedeutet aber auch, dass schon Modelle mit relativ bescheidener Vorhersagekraft von grossem praktischem Nutzen sein können.de
dc.identifier.opus-id198
dc.identifier.urihttps://open.fau.de/handle/openfau/198
dc.identifier.urnurn:nbn:de:bvb:29-opus-2497
dc.language.isoen
dc.subjecttoxische Wirktypen
dc.subjecttoxische Mechanismen
dc.subjectToxicology
dc.subjectClassification
dc.subjectMode of Toxic Action
dc.subjectMOA
dc.subjecttoxic Mechanisms
dc.subject.ddcDDC Classification::5 Naturwissenschaften und Mathematik :: 54 Chemie :: 540 Chemie und zugeordnete Wissenschaften
dc.titleClassification of Organic Compounds into Modes of Toxic Actionen
dc.titleKlassifizierung Organischer Verbindungen in Toxische Wirktypende
dc.typedoctoralthesis
dcterms.publisherFriedrich-Alexander-Universität Erlangen-Nürnberg (FAU)
local.date.accepted2005-10-18
local.sendToDnbfree*
local.subject.fakultaetNaturwissenschaftliche Fakultät / Naturwissenschaftliche Fakultät -ohne weitere Spezifikation-
local.subject.gndQSAR
local.subject.gndStruktur-Aktivitäts-Beziehung
local.subject.gndToxikologie
local.subject.gndUmwelttoxikologie
local.subject.gndComputational chemistry
local.subject.gndKlassifikation
local.thesis.grantorFriedrich-Alexander-Universität Erlangen-Nürnberg (FAU) Naturwissenschaftliche Fakultät
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
198_SimonSpycherDissertation.pdf
Size:
647.38 KB
Format:
Adobe Portable Document Format
Description:
Faculties & Collections