Maschinelles Lernen zur automatisierten Klassifikation von pädiatrischen Anämien

Language
de
Document Type
Doctoral Thesis
Granting Institution
Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU), Medizinische Fakultät
Issue Date
2024-04-12
Authors
Niemeier, Philipp Alexander
Editor
Abstract

1.1. Abstract Objectives Anemia is a common laboratory finding in children, caused by a multitude of common to rare and minor to life-threatening diseases. Current diagnostic tests enable early and accurate recognition of the underlying diagnosis, but their use varies with physician experience and patient setting. The age- and sex-dependent dynamics of the blood count additionally complicate the diagnosis in childhood and require support for pediatric decision-making. We investigated whether machine-learning algorithms for the automated interpretation of pediatric blood counts can support the differential diagnosis of anemia. Design & Methods A comprehensive database of pediatric blood counts from different German pediatric departments (14.604 healthy children [Erlangen] and 926 pathological samples: 45.9% iron deficiency anemia [Erlangen], 9.3% Diamond Blackfan anemia [Freiburg], 28.7% myelodysplastic syndrome or severe aplastic anemia [Freiburg], 9.0% vitamin B12- deficiency [Erlangen], and 7.1% heterozygous β-Thalassemia [Berlin]) was used to develop and validate different machine learning models. We used Python and established machine learning algorithms from the scikit-learn library to implement classification methods for the specified diseases. Observations & Results The best performing models predicted the diagnoses in the validation dataset with an accuracy of 96% (95.0 – 97.0%) (classification as either “normal” or “abnormal”) and 84% (78.0 – 90.0%) (classification as “healthy” or specific diagnoses) and a balanced accuracy of 84.0% (78.0 – 90.0%). Even rare diseases (e.g. Diamond Blackfan anemia) were correctly classified with an accuracy of 96.0% (95.8 – 96.2%). Compared to a naive clinical diagnostic pathway, the machine learning algorithms were able to achieve a higher classification accuracy and a higher balanced accuracy. Conclusions We implemented different classification methods for pediatric anemias which achieve very good classification accuracy using only frequently performed laboratory tests. This provides a proof-of-concept application of machine learning algorithms to support the diagnosis of complex hematological diseases in children.

Abstract

1.2. Zusammenfassung

1.1.1. Hintergrund und Ziele

Anämien zählen zu den häufigsten Befunden in laboranalytischen Untersuchungen in allen Altersgruppen (Freeman and Morando, 2020). Sie werden durch eine Vielzahl von häufigen bis seltenen und wenig bis stark lebensbedrohlichen Erkrankungen verursacht und präsentieren sich sehr heterogen (Turner, Parsi and Badireddy, 2020). Die alters- und geschlechtsabhängige Dynamik des Blutbildes erschwert im Kindesalter die Diagnosestellung und erfordert einen besonderen Bedarf an Diagnoseunterstützung (Allali et al., 2017). Die verfügbaren diagnostischen Untersuchungsmethoden ermöglichen eine frühe und genaue Erkennungsrate der zugrundeliegenden Erkrankungen, die Nutzung dieser Methoden variiert jedoch mit der Erfahrung der behandelnden Ärzte sowie mit der individuellen Konstellation eines Patientenfalles (Karakochuk et al., 2019; Freeman and Morando, 2020). Ziel dieser Arbeit ist es, zu untersuchen ob maschinelle Lernalgorithmen (ML) zur automatisierten Klassifikation von pädiatrischen Blutbildern die Differentialdiagnostik von Anämien unterstützen können.

1.1.2. Methoden (Patienten, Material und Untersuchungsmethoden)

Die Grundlage dieser Arbeit bildet ein umfassender Datensatz von pädiatrischen Blutbildern aus unterschiedlichen deutschen pädiatrischen Zentren (14.604 gesunde Kinder und 926 pathologische Blutbilder: 45,9% Eisenmangelanämie [Universitätsklinikum Erlangen], 9,3% Diamond Blackfan Anämie [GPOH-DBA, (Niemeyer, 2000)], 28,7% myelodysplastisches Syndrom oder schwere aplastische Anämie [EWOG-SAA, EWOG-MDS, (Niemeyer, 2006)], 9,0% Vitamin B12-Mangel-Anämie [Universitätsklinikum Erlangen] sowie 7,1% heterozygote ß-Thalassämie [Charité Berlin]). Diese wurden im Zeitraum von 1970 – 2016 im Rahmen der klinischen Patientenversorgung oder der Referenzdiagnostik erhoben und von uns zur Analyse mit maschinellen Lernalgorithmen verwendet. In dieser Arbeit wurden mit Hilfe der Programmiersprache Python (Van Rossum and Drake Jr, 1995) maschinelle Lernalgorithmen verwendet, um auf Grundlage von fünf hämatologischen Messwerten des Blutbildes, die für alle Erkrankungen zur Verfügung standen (Hämoglobin, Thrombozyten, Erythrozyten, Leukozyten, MCV), sowie den zugehörigen demographischen Daten (Alter und Geschlecht) Klassifikationssysteme zur automatisierten Diagnosestellung zu erstellen. Hierzu wurde der Datensatz in einen Trainings- und einen Testdatensatz aufgeteilt und mit verschiedenen maschinellen Lernmethoden (ML) verarbeitet. Für diese Anwendung wurden etablierte Algorithmen aus der Scikit-learn Bibliothek verwendet (Durmus, 2017).

1.1.3. Ergebnisse und Beobachtungen

Die Modelle mit der höchsten Klassifizierungsgenauigkeit differenzieren auf Grundlage von 5 hämatologischen Analyten des Blutbilds sowie Alter und Geschlecht mit einer Präzision von 96% (95,0 – 97,0%) zwischen „Gesunden“ und „Anämien“. Die korrekte Klassifikation zwischen „Gesunden“ und spezifischen Diagnosen erfolgt mit einer Präzision von 84% (78,0 – 90,0%). Hierbei werden auch seltene Erkrankungen wie z.B. die Diamond Blackfan Anämie mit einer Genauigkeit von 96,0% (95,8 - 96,2%) detektiert. Im Vergleich zu einem vereinfachten klinischen Diagnosepfad (Klassifizierungsgenauigkeit von 95,0% (93,0 - 96,0%), balancierte Genauigkeit von 79,0% (75,0 - 83,0%)), konnten mit Hilfe der ML-Klassifizierer (Klassifizierungsgenauigkeit 96,8% (95,8 - 97,8%), balancierte Genauigkeit von 92,9% (89,6% - 95,5%)) eine höhere Gesamtgenauigkeit sowie eine höhere balancierte Genauigkeit erreicht werden. Wie bereits in der Literatur beschrieben, wiesen die komplexeren ML-Algorithmen nicht unbedingt auch eine höhere Präzision auf (Sidey-Gibbons and Sidey-Gibbons, 2019), sodass insgesamt mehrere Algorithmen gute Genauigkeiten erzielten.

1.1.4. (Praktische) Schlussfolgerungen

Maschinelle Lernmethoden können klinische Entscheidungen unabhängig von einer konkreten ML-Methode unterstützen (Deo, 2015). Sie helfen dabei, die existierende Vielzahl an möglichen Diagnosen zu berücksichtigen und ergänzen die menschlichen Fähigkeiten um das Klassifizieren in hochdimensionalen Räumen. ML-Algorithmen beziehen alle verfügbaren Parameter mit ein, insbesondere auch diejenigen, die in klinische Entscheidungsprozesse üblicherweise nicht mit einbezogen werden, da beispielsweise ihr diagnostischer Mehrwert (noch) nicht bekannt ist, gering ist oder sich erst durch Kombination ergibt. Sie können hierdurch potentiell die Genauigkeit der Klassifizierung erhöhen und somit die klinische Diagnostik verbessern. Die durchgeführten Analysen und die erhaltenen Ergebnisse stellen einen Machbarkeitsnachweis von maschinellen Lernalgorithmen zur Unterstützung des Diagnoseprozesses von komplexen hämatologischen Erkrankungen bei Kindern, demonstriert an einem umfassenden Datensatz von pädiatrischen Blutbildern, dar. Ihr Nutzen sollte im weiteren Verlauf in ihrer klinischen Umsetzung mit dem langfristigen Ziel der Integration in Systeme für klinische Anwender getestet werden.

DOI
URN
Faculties & Collections
Zugehörige ORCIDs