Cancer Research

Machine Learning-Algorithmen zur Früherkennung von Knochenmetastasen in einem experimentellen Rattenmodell

Published: August 16, 2020 doi: 10.3791/61235

Stephan Ellmann¹, Lisa Seyler¹, Clarissa Gillmann², Vanessa Popp¹, Christoph Treutlein¹, Aline Bozec³, Michael Uder¹, Tobias Bäuerle¹

¹Department of Radiology, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg, ²Department of Medical Physics in Radiation Oncology, German Cancer Research Center, ³Department of Internal Medicine 3, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg

Summary

Dieses Protokoll wurde entwickelt, um einen Machine Learning-Algorithmus zu trainieren, um eine Kombination von bildgebenden Parametern zu verwenden, die aus der Magnetresonanztomographie (MRT) und der Positronenemissionstomographie/Computertomographie (PET/CT) in einem Rattenmodell von Brustkrebsknochenmetastasen abgeleitet wurden, um frühe metastasierende Erkrankungen zu erkennen und das spätere Fortschreiten zu Makrometastasen vorherzusagen.

Abstract

Machine Learning (ML)-Algorithmen ermöglichen die Integration verschiedener Features in ein Modell, um Klassifizierungs- oder Regressionsaufgaben mit einer Genauigkeit durchzuführen, die ihre Bestandteile überschreitet. Dieses Protokoll beschreibt die Entwicklung eines ML-Algorithmus, um das Wachstum von Brustkrebsknochenmetastasen in einem Rattenmodell vorherzusagen, bevor Anomalien mit Standard-Bildgebungsmethoden beobachtet werden können. Ein solcher Algorithmus kann die Erkennung von frühen metastasierenden Erkrankungen (d. h. Mikrometastasen) erleichtern, die bei Staging-Untersuchungen regelmäßig übersehen werden.

Das angewandte Metastasenmodell ist standortspezifisch, was bedeutet, dass die Ratten Metastasen ausschließlich in ihrem rechten Hinterbein entwickeln. Die Tumoraufnahmerate des Modells liegt bei 60%–80%, wobei Makrometastasen in der Magnetresonanztomographie (MRT) und der Positronenemissionstomographie/Computertomographie (PET/CT) in einer Teilmenge von Tieren 30 Tage nach der Induktion sichtbar werden, während eine zweite Teilmenge von Tieren kein Tumorwachstum aufweist.

Ausgehend von Bilduntersuchungen, die zu einem früheren Zeitpunkt erfasst wurden, beschreibt dieses Protokoll die Extraktion von Merkmalen, die auf eine durch MRT erkannte Gewebevaskularisation, den Glukosestoffwechsel durch PET/CT und die anschließende Bestimmung der relevantesten Merkmale für die Vorhersage makrometastasierender Erkrankungen hinweisen. Diese Merkmale werden dann in ein modellgemitteltes neuronales Netzwerk (avNNet) eingespeist, um die Tiere in eine von zwei Gruppen einzuteilen: eine, die Metastasen entwickelt, und die andere, die keine Tumore entwickelt. Das Protokoll beschreibt auch die Berechnung von Standard-Diagnoseparametern, wie Gesamtgenauigkeit, Empfindlichkeit, Spezifität, negative/positive Vorhersagewerte, Wahrscheinlichkeitsverhältnisse und die Entwicklung eines Empfängerbetriebsmerkmals. Ein Vorteil des vorgeschlagenen Protokolls ist seine Flexibilität, da es leicht angepasst werden kann, um eine Vielzahl von verschiedenen ML-Algorithmen mit einstellbaren Kombinationen einer unbegrenzten Anzahl von Funktionen zu trainieren. Darüber hinaus kann es verwendet werden, um verschiedene Probleme in der Onkologie zu analysieren, Infektion, und Entzündungen.

Introduction

Der Zweck dieses Protokolls ist es, mehrere funktionale Bildgebungsparameter aus MRT und PET/CT in einen modellgemittelten neuronalen Netzwerk(avNNet) ML-Algorithmus zu integrieren. Dieser Algorithmus sagt das Wachstum von Makrometastasen in einem Rattenmodell von Brustkrebsknochenmetastasen zu einem frühen Zeitpunkt voraus, wenn makroskopische Veränderungen innerhalb des Knochens noch nicht sichtbar sind.

Vor dem Wachstum von Makrometastasen tritt eine Knochenmarkinvasion von disseminierten Tumorzellen auf, die gemeinhin als mikrometastasierende Erkrankung¹^,²bezeichnet wird. Diese anfängliche Invasion kann als ein früher Schritt in der metastasierenden Krankheit betrachtet werden, wird aber in der Regel bei herkömmlichen^{Inszenierungsuntersuchungen}3^,⁴übersehen. Obwohl die derzeit verfügbaren bildgebenden Modalitäten die Mikroinvasion des Knochenmarks nicht erkennen können, wenn sie allein verwendet werden, hat sich gezeigt, dass eine Kombination von bildgebenden Parametern, die Informationen über Vaskularisation und stoffwechselaktivität liefern,^besser5 funktioniert. Dieser ergänzende Nutzen wird durch die Kombination verschiedener Bildparameter zu einem avNNet, einem ML-Algorithmus, erreicht. Ein solches avNNet ermöglicht die zuverlässige Vorhersage der Knochenmakrometastasenbildung, bevor sichtbare Metastasen vorhanden sind. Daher könnte die Integration von bildgebenden Biomarkern in ein avNNet als Ersatzparameter für die Mikroinvasion des Knochenmarks und frühe metastasierende Erkrankungen dienen.

Zur Entwicklung des Protokolls wurde ein zuvor beschriebenes Modell von Brustkrebsknochenmetastasen bei nackten Ratten⁶^,⁷^,⁸verwendet. Der Vorteil dieses Modells ist seine Standortspezifität, was bedeutet, dass die Tiere knöcherne Metastasen ausschließlich in ihrem rechten Hinterbein entwickeln. Die Tumoraufnahmerate dieses Ansatzes liegt jedoch bei 60 %–80 %, so dass eine beträchtliche Anzahl der Tiere während der Studie keine Metastasen entwickelt. Anhand von bildgebenden Verfahren wie MRT und PET/CT ist das Vorhandensein von Metastasen ab Tag 30 nach der Injektion (PI) nachweisbar. Zu einem früheren Zeitpunkt (z. B. 10 PI) unterscheidet die Bildgebung nicht zwischen Tieren, die eine metastasierende Krankheit entwickeln, und solchen, die nicht auftreten(Abbildung 1).

Ein avNNet, der auf funktionellebildende Parameter trainiert, die am Tag 10 PI erfasst wurden, wie im folgenden Protokoll beschrieben, sagt das Wachstum von Makrometastasen innerhalb der folgenden 3 Wochen zuverlässig voraus oder schließt es aus. Neurale Netzwerke kombinieren künstliche Knoten in verschiedenen Schichten. Im Studienprotokoll stellen die funktionellen bildgebenden Parameter für die Blutversorgung und metabolische Aktivität des Knochenmarks die untere Schicht dar, während die Vorhersage der Malignität die oberste Schicht darstellt. Eine zusätzliche Zwischenebene enthält ausgeblendete Knoten, die sowohl mit der oberen als auch mit der unteren Ebene verbunden sind. Die Stärke der Verbindungen zwischen den verschiedenen Knoten wird während des Trainings des Netzwerks aktualisiert, um die jeweilige Klassifizierungsaufgabe mit hoher Genauigkeit^{auszuführen 9}. Die Genauigkeit eines solchen neuronalen Netzwerks kann durch die Mittelung der Ausgänge mehrerer Modelle weiter erhöht werden, was zu einem avNNet¹⁰führt.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Alle Pflege- und Versuchsverfahren wurden in Übereinstimmung mit den nationalen und regionalen Tierschutzvorschriften durchgeführt, und alle Tierverfahren wurden von der Landesregierung Von Franken genehmigt (Referenznummer 55,2 DMS-2532-2-228).

1. Induktion von Brustkrebsknochenmetastasen im rechten Hinterbein von nackten Ratten

HINWEIS: Eine detaillierte Beschreibung der Induktion von Brustkrebsknochenmetastasen bei nackten Ratten wurde an anderer Stelle veröffentlicht⁶^,⁸. Die wichtigsten Schritte sind unten dargestellt.

Kultur MDA-MB-231 menschliche Brustkrebszellen in RPMI-1640, ergänzt durch 10% fetales Kalbsserum (FCS). Halten Sie die Zellen unter Standardbedingungen (37 °C, 5%_CO2) und durchgehen Sie die Zellen 2-3 mal pro Woche.
Waschen Sie die kollidierenden MDA-MB-231-Zellen mit 2 mM EDTA in phosphatgepufferter Saline (PBS) und lösen Sie die Zellen dann mit 0,25 % Trypsin. Bestimmen Sie die Zellkonzentration mit einer Neubauer-Kammer und setzen Sie sie in 200 l RPMI-1640 in einer Konzentration von 1,5 x 10⁵ Zellen/200 l wieder aus.
Verwenden Sie 6–8 Wochen alte nackte Ratten und halten Sie sie unter pathogenenfreien, kontrollierten Bedingungen (21 °C ± 2 °C Raumtemperatur, 60% Luftfeuchtigkeit und 12 h hell-dunkler Rhythmus). Bieten Autoklavierfutter und Wasser ad libitum.
Vor der Operation ein Schmerzmedikament (z. B. Carprofen 4 mg/kg) subkutan injizieren. Anästhesisieren Sie Ratten mit einem Isofluran (1–1,5 Vol. %)/Sauerstoffgemisch mit einer Durchflussrate von 2 L/min. Überprüfen Sie die Anästhesietiefe durch Zehenkneifen.
Für die Chirurgie verwenden Sie ein Operationsmikroskop mit einer 16-fachen Vergrößerung.
Führen Sie einen Schnitt von 2–3 cm im rechten Leistenbereich der Ratte durch. Sezieren Sie alle Arterien in der rechten Leistenregion, einschließlich der Femoralarterie (FA), der oberflächlichen epigastrischen Arterie (SEA), der absteigenden Geniculararterie (DGA), der poplitealen Arterie (PA) und der Halsschlagader (SA). Legen Sie zwei abnehmbare Clips auf die FA: einen proximalen am Anfang der SEA und einen weiteren direkt proximal enden den Anfang der DGA.
Ligate den distalen Teil der SEA. Führen Sie einen Schnitt der SEA-Wand durch und legen Sie eine Nadel mit einem Durchmesser von 0,3 mm in die SEA ein. Schließen Sie eine Spritze mit der Zellsuspension aus Schritt 1.2 an die Nadel an. Entfernen Sie den distalen Clip aus der FA, und schneiden Sie stattdessen die SA ab.
Injizieren Sie die MDA-MB-231-Zellsuspension ab Schritt 1.2 (1,5 x 10⁵ Zellen/200 l) langsam in die SEA. Entfernen Sie die Nadel, ligaten Sie die SEA, und entfernen Sie die Arterienclips. Schließen Sie die Wunde mit chirurgischen Clips und beenden Sie die Anästhesie. Überwachen Sie die Tiere täglich, um die Tumorgröße und alle Anzeichen von Schmerzen zu bewerten.

2. Magnetresonanztomographie (MRT)

HINWEIS: Eine detaillierte Beschreibung der MRT-Verfahren finden Sie in Bäuerle et al.¹¹.

Führen Sie MRT 10 Tage PI mit einem speziellen experimentellen Scanner (siehe Tabelle der Materialien) oder einem menschlichen MR-System mit einer geeigneten Tierspule.
Anästhetisieren Sie die Ratte mit einem Isofluran (1–1,5 Vol. %)/Sauerstoffgemisch wie oben beschrieben. Legen Sie einen Katheter in die Schwanzvene der Ratte und kleben Sie ihn an den Schwanz. Schließen Sie eine Spritze mit dem Kontrastmittel (0,1 mmol/kg Gd-DTPA in ca. 0,5 ml) an.
Legen Sie die anästhesierte Ratte in das MR-System. Suchen Sie den distalen Oberschenkelknochen und die proximale Tibia des rechten Hinterbeins in einer anatomischen Sequenz (z. B. T2-gewichtete Turbospin-Echosequenz; TR = 8.654 ms; TE = 37 ms; Matrix 320 x 272; FOV = 65 mm x 55 mm; Scheibendicke = 1 mm; Scanzeit 11:24 min).
Bestimmen Sie die Scheiben, die den distalen Oberschenkelknochen und die proximale Tibia des rechten Hinterbeins abdecken, und starten Sie die DCE-MRT-Sequenz (z. B. schnelle Low-Winkel-Schusssequenz; TR = 3,9 ms; TE = 0,88 ms; Matrix = 256 x 216; FOV = 65 x 54 mm²; Scheibendicke = 1 mm; 8 Scheiben; 100 Zeitpunkte; Scanzeit = 8:25 min). Nach 30 s beginnen Sie, das Kontrastmittel über einen Zeitraum von 10 s zu injizieren.
HINWEIS: Die Gesamtzeit für eine MRT-Untersuchung beträgt ca. 20 min pro Tier.

3. Positronen-Emissionstomographie/Computertomographie (PET/CT)

HINWEIS: Eine detaillierte Beschreibung der PET-Verfahren finden Sie in Cheng unter Al.¹².

Führen Sie PET/CT-Bildgebung 10 Tage PI mit einem speziellen experimentellen Scanner (siehe Tabelle der Materialien).
Halten Sie die Tiere vor der Bildgebung fasten. Anästhetisieren Sie die Ratte wie in Schritt 2.2 beschrieben und legen Sie einen Katheter in die Schwanzvene ein, wie oben beschrieben.
Injizieren Sie 6 MBq ^{von 18}F-Fluorodeoxyglucose (¹⁸F-FDG) in die Schwanzvene und warten Sie 30 min, damit sich der Tracer richtig verteilen kann.
Führen Sie eine CT-Erfassung (Rohrspannung = 80 kV, Röhrenstrom = 500 A, isotrope Auflösung = 48,9 m, Dauer = 10 min) durch.
Führen Sie eine statische PET-Erfassung durch (untere/obere diskriminierende Ebene = 350/650 keV; Zeitfenster = 3,438 ns; Dauer = 15 min).

4. Alternative Bildgebungsstrategien

Für eine frühzeitige Beurteilung der MDA-MB-231-Zellen im Hinterbein 1,5 x 10⁵ markierte Zellen /200 l für Biolumineszenz (d. h. Zellen, die Luziferin exdrücken, MDA-MB-231-LUC¹³) oder Fluoreszenzbildgebung (d. h. Zellen, die grünes oder rotes fluoreszierendes Protein exdrücken, MDA-MB-231-GFP/RFP¹³). Verwenden Sie das System für die präklinische optische Bildgebung, um intraosseöse MDA-MB-231-Zellen nach Tumorzellimpfung¹⁴zu detektieren.
Führen Sie experimentellen Ultraschall mit einem speziellen Scanner nach intravenöser Injektion von Mikroblasen durch, um morphologische und funktionelle Parameter der Vaskularisation abzuleiten, vergleichbar mit MRT⁷.

5. MRT-Analyse

Verwenden Sie einen DICOM Viewer¹⁵ mit einem DCE Plugin¹⁶ und laden Sie die DCE-Sequenz im 4D-Modus, indem Sie im oberen Menü auf die Schaltfläche "Importieren"klicken, den DICOM-Ordner mit den MR-Bildern aus Schritt 2.4 auswählen und im oberen Menü auf "4D Viewer"klicken.
Platzieren Sie einen kreisförmigen 2-dimensionalen Bereich von Interesse (ROI), mit einer Zielgröße von 1,5 mm², in das Knochenmark des rechten Hinterbeins des proximalen Tibialschafts, vorzugsweise unter Verwendung der Bildnummern 4 oder 5 aus der Sequenz, die aus 8 Bildern besteht, da diese Mittelbilder stabilere Ergebnisse liefern.
Starten Sie das DCE-Plugin aus dem oberen Menü, wählen Sie "Relative Enhancement" im Feld "Plot type" aus, und definieren Sie den Basisbereich von den Zeitpunktpunkten 1 bis 5, indem Sie diese Zahlen in die entsprechenden Felder eingeben. Exportieren Sie die Analyse als .txt-Datei mit der entsprechenden Schaltfläche und wählen Sie "DCEraw.txt" als Dateinamen.
Öffnen Sie RStudio¹⁷ und laden Sie die mitgelieferte Datei DCE-Script.R über das Menü "Datei" durch Auswahl von "Datei öffnen". Führen Sie das gesamte Skript aus, indem Sie "Code", dann "Run Region" und dann "Run All" aus dem Menü auswählen. Kopieren Sie die Ausgabe in die bereitgestellte Vorlagendatei mit dem Namen "ImagingFeatures.xlsx" (Abbildung 2).
Platzieren Sie im DICOM-Viewer einen zweiten ROI innerhalb des Rückenmuskels des Tieres und wiederholen Sie die Schritte 5.2–5.4, um die Muskel-DCE-Messungen für Normalisierungszwecke zu erhalten. In der Tabelle "ImagingFeatures.xlsx" werden die jeweiligen Knochenmessungen zu Normalisierungszwecken automatisch durch die jeweiligen Muskelmessungen geteilt.
Wiederholen Sie die Schritte 5.1–5.5 für alle Tiere, und vervollständigen Sie die Kalkulationstabelle.

6. PET/CT-Analyse

Öffnen Sie die PET/CT-Analysesoftware und importieren Sie die in Schritt 3 erhaltenen Daten, indem Sie auf "Datei" klicken, gefolgt von "Manueller Import". Markieren Sie die Dateien ct.img.hd und pet.img.hdr. Klicken Sie auf "Öffnen" und wählen Sie "Alle importieren".
Öffnen Sie die Datensätze, indem Sie "Allgemeine Analyse", gefolgt von "OK" auswählen.
Wählen Sie "ROI Quantification", gefolgt von "Create", und erstellen Sie dann" Erstellen Eines ROI aus einer Vorlage". Legen Sie einen 2-dimensionalen ROI ca. 4 mm x 6 mm in das Knochenmark des rechten Hinterbeins des proximalen Tibialschafts.
Wählen Sie "ROIs (Target 1 Overlay)" und notieren Sie Mittelwert-, Minimal- und Maximalwerte in Bq/mL.
Berechnen Sie den maximalen standardisierten Aufnahmewert (SUV_max): Dividieren Sie den Maximalwert (Bq/ml) durch die injizierte Aktivität und multiplizieren Sie das Ergebnis mit dem Gewicht des Tieres in Gramm. Geben Sie das Ergebnis in die Kalkulationstabelle ein (Abbildung 2).

7. Bestimmung der Tumor-Take-Rate

Um das Tumorwachstum im rechten Hinterbein zu diagnostizieren, wiederholen Sie die MR- und PET/CT-Bildgebung am Tag 30 PI, wie oben beschrieben.
HINWEIS: Tumore werden an Tag 30 PI deutlich sichtbar sein und t2w-hyperintensive Läsionen und eine deutliche Kontrastverbesserung im MRT aufweisen, zusammen mit einem deutlich erhöhten SUV_max in PET/CT. Nach früheren Experimenten entwickeln 60 bis 80 % der Tiere Metastasen im rechten Hinterbein.
Vervollständigen Sie die Tabelle, indem Sie eine zusätzliche Spalte "Tumor" hinzufügen und "1" für jedes Tier eingeben, das Metastasen darstellt, und "0" für jedes Tier ohne sichtbare Tumorbelastung (Abbildung 2). Speichern Sie die Kalkulationstabelle als "ImagingFeatures.xlsx" im Ordner Downloads.

8. Feature-Auswahl

Um die relevantesten Features für die Vorhersage des zukünftigen Tumorwachstums zu ermitteln, importieren Sie die Kalkulationstabelle in eine Open-Source-Datenvisualisierung, maschinelles Lernen und Data Mining Toolkit¹⁸.
Zeichnen Sie die Dateiunterroutine aus dem Menü Daten in den Arbeitsbereich auf der rechten Seite, und doppelklicken Sie darauf. Laden Sie die Kalkulationstabelle, indem Sie auf das Symbol"Ordner"klicken und die Datei "ImagingFeatures.xlsx" auswählen. Wählen Sie das Arbeitsblatt "Exportieren" aus und weisen Sie das Zielattribut der Variablen "Tumor" zu. Weisen Sie der Tiernummer die Funktion "Überspringen" zu (Abbildung 3).
Zeichnen Sie die Unterroutine "Rank" aus dem Datenmenü in den Arbeitsbereich und verbinden Sie die Unterroutinen "Datei" und "Rang", indem Sie eine Linie zwischen ihnen zeichnen.
Öffnen Sie die Unterroutine "Rank", indem Sie auf ihr Symbol doppelklicken, und wählen Sie den "Information Gain" Algorithmus¹⁹.
Verwenden Sie aus den fünf erfassten Parametern die ersten drei für weitere Analysen (SUV_max, PE und AUC).
Hinweis: Diese Parameter spiegeln die metabolische Aktivität (SUV_max) und die Gewebevaskularisation (PE und AUC) wider.

9. ML-Analyse

Öffnen Sie RStudio 3.4.1¹⁷ und laden Sie das mitgelieferte TrainModel.R-Script über das Menü "Datei".
Installieren Sie die erforderlichen Bibliotheken (dies muss nur einmal geschehen), indem Sie: install.packages(c("caret", "readxl", "pROC", "RcmdrPlugin.EZR", "ggplot2"))
Um die erforderlichen Bibliotheken zu laden und den Ordner Downloads als Arbeitsverzeichnis festzulegen, wählen Sie die Zeilen 3–5 im TrainModel.R-Skript aus.
Führen Sie den ausgewählten Code aus, indem Sie im Menü auf "Code" und dann auf "Ausgewählte Zeile ausführen"..

10. Training eines avNNet ML-Algorithmus

Um einen avNNet-Algorithmus zu trainieren, wählen Sie die Linien 8–39 aus dem TrainModel.R-Script aus (siehe Schritt 9.1).
Führen Sie den ausgewählten Code aus, indem Sie im Menü auf "Code" und dann auf "Ausgewählte Zeile ausführen"..

11. Analysieren der Ergebnisse des ML-Algorithmus

Um Standardparameter der Diagnosegenauigkeit (Empfindlichkeit, Spezifität, positive und negative Vorhersagewerte und Wahrscheinlichkeitsverhältnisse) zu bewerten, wählen Sie die Zeilen 41–50 aus dem TrainModel.R-Script aus.
Führen Sie den ausgewählten Code aus, indem Sie im Menü auf "Code" und dann auf "Ausgewählte Zeile ausführen"..

12. Vergleich der Empfänger-Betriebskennlinie (ROC) des endgültigen Modells mit den ROC-Kurven seiner Konstituierenden Parameter

Um Die DeLong-Tests zum Vergleich der ROC-Kurve des Modells mit den ROC-Kurven seiner konstituierenden Parameter durchzuführen, wählen Sie die Linien 52–62 aus dem TrainModel.R-Script aus (siehe Schritt 9.1).
Führen Sie den ausgewählten Code aus, indem Sie im Menü auf "Code" und dann auf "Ausgewählte Zeile ausführen"..

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Die Ratten erholten sich schnell von der Operation und Injektion der MDA-MB-231 Brustkrebszellen und wurden dann an den Tagen 10 und 30 PI der MR- und PET/CT-Bildgebung unterzogen (Abbildung 1). Eine repräsentative DCE-Analyse der rechten proximalen Tibia einer Ratte ist in Abbildung 2Adargestellt. Die DCE-Rohmessungen wurden gespeichert, indem Sie die Schaltfläche "Exportieren" und "DCEraw.txt" als Dateinamen wählten.

Nachfolgende Berechnungen der dynamischen Parameter AUC, PE und Washout wurden im RStudio mit dem entsprechenden Skript durchgeführt. Die Ausgabe der DCE-Messungen musste als "DCEraw.txt" im Ordner "Downloads" gespeichert werden, so dass das Skript direkt ohne zusätzliche Konfigurationen ausgeführt werden konnte, um eine Datentabelle bereitzustellen, wie in Abbildung 2Bdargestellt. Diese Daten wurden in die bereitgestellte Kalkulationstabelle kopiert (Abbildung 2C). Ebenso wurden die DCE-Parameter für Muskelgewebe ermittelt und in die Tabelle übertragen (Abbildung 2D,E). Diese Werte wurden normalisiert, indem die Knochenmessungen durch die Muskelmessungen dividiert wurden; Dies wurde automatisch in der Kalkulationstabelle durchgeführt. Aus dem PET/CT wurden die berechneten_{SUV-Höchstwerte} anschließend in die Tabelle übertragen (Abbildung 2F).

Am Tag 30 PI wurden alle Tiere bewertet, um festzustellen, ob sie Metastasen entwickelten oder nicht, und die Tabelle wurde durch Kodierung positiver Tumorbelastung als "1" und gesunde Tiere als "0" in der rechten Spalte der Tabelle(Abbildung 2C)ergänzt.

Die Kalkulationstabelle wurde in das Open-Source-Datenvisualisierungs-, Machine Learning- und Data-Mining-Toolkit importiert, und das Feature-Ranking ergab das SUV_max, PE und AUC als die drei wichtigsten Merkmale für die Vorhersage von metastasierenden Erkrankungen (Abbildung 3). Diese Parameter spiegeln die metabolische Aktivität (SUV_max) und die Gewebevaskularisation (PE und AUC) wider.

Durch Ausführen des TrainModel.R-Skripts wurde die Kalkulationstabelle automatisch importiert und ein avNNet berechnet. Die optimale Hyperparameter-Kombination wurde ermittelt (Abbildung 4A) und das endgültige Modell wurde dann mit der optimalen Hyperparameter-Kombination berechnet (Abbildung 4B). Anschließend wurde eine Reihe von Standarddiagnoseparametern berechnet (Abbildung 4C) und eine ROC-Kurve des Modells wurde geplottet (Abbildung 4D).

Das positive Ergebnis ist in Abbildung 4B–Ddargestellt. Ein Vergleich der ROC-Kurve des Modells mit der ROC-Kurve seiner drei Bestandteile (d. h. AUC, PE und SUV_max) ergab, dass das Modell deutlich besser abgeschnitten hat als alle seine drei Bestandteile (p = 0,01 für AUC, p = 0,003 für PE und p = 0,007 für SUV_max). Die Kombination der drei ausgewählten Parameter zu einem avNNet war empfindlicher, so dass eine Vorhersage makroskopischer Erkrankungen mit einer Gesamtgenauigkeit von 85,7% (95% Konfidenzintervall = 67,3% –96,0%) möglich war. Diese Ergebnisse wurden aus einer Analyse von 28 Proben gewonnen. Die Konfidenzintervalle können durch die Erhöhung der Anzahl der Tiere weiter eingeschränkt werden.

Die negativen Ergebnisse konnten wie hier beschrieben erzielt werden. Die Genauigkeitsmessungen waren sehr empfindlich gegenüber bestimmten Arten von Machine Learning-Algorithmen und Schritten der Datenvorverarbeitung. Insbesondere neuronale Netzwerke tendierten dazu, besser zu funktionieren, wenn die Eingabedaten normalisiert wurden. Dies wurde durch die Funktion "BoxCox" in Abschnitt 10 des Protokolls (Linien 22 und 36 innerhalb des mitgelieferten TrainModel.R-Script) erreicht. Der Verzicht auf die Normalisierung und die Verwendung eines anderen Algorithmus (z. B. ein neuronales Netzwerk, das nicht gemittelt ist), durch Ändern der Methode in "nnet" (Zeilen 21 und 35 innerhalb des bereitgestellten TrainModel.R-Script) führte zu einer Fläche von 0,594 unter der ROC-Kurve(Ergänzende Abbildung 1). Ein solches Modell übertraf seine drei Bestandteile nicht signifikant (alle p > 0,15).

Da das Skript für RStudio 3.4.1 und das Caret-Paket Version 6.0-84 optimiert wurde, kann die Verwendung verschiedener Softwareversionen zu unterschiedlichen Ergebnissen führen. Das Ausführen der bereitgestellten Skripte mit den in diesem Manuskript verwendeten Softwareversionen wird zu ähnlichen Ergebnissen führen. Wenn Leser jedoch das Skript ändern, zusätzliche Variablen hinzufügen, Dokumentordner oder Dateinamen ändern oder die Machine Learning-Algorithmen detaillierter ändern möchten, sind entsprechende Anpassungen des Codes erforderlich. Für diese Fälle bietet das Handbuch des Caret-Pakets ausführliche Erläuterungen²⁰.

Abbildung 1: Repräsentative MR- und PET/CT-Bilder. MR- und PET/CT-Bilder des rechten Hinterbeins eines Tieres, das im Laufe der Studie keine Metastasen entwickelt hat (zwei linke Spalten, mit Bildern vom Tag 10 und Tag 30 PI), und ein Tier, das Metastasen zwischen Tag 10 und Tag 30 PI entwickelte (zwei rechte Spalten, metastases mit Pfeilen markiert). Beachten Sie die hohe Signalintensität von Metastasen in den T2w-Bildern (obere Reihe), die Kontrastverstärkung, die durch die vergrößerte Fläche unter der Kurve (AUC; zweite Reihe) dargestellt wird, und den erhöhten maximalen standardisierten Aufnahmewert im PET/CT (SUV_max;dritte Reihe). Beachten Sie, dass es keine sichtbaren Unterschiede in den Bildern gibt, die am Tag 10 PI (erste und dritte Spalte) zwischen dem Tier mit Metastasen am Tag 30 PI und dem Tier, das keine Knochenmetastasen entwickelt hat, aufgenommen wurden. Diese Zahl wurde von Ellmann et al.⁵geändert. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 2: Bewertung der Bildverarbeitungsfunktionen und Zusammenstellung in einer Kalkulationstabelle. (A) Die dynamische Kontrastverbesserung des Knochenmarks der proximalen Tibia wurde mit einem Freeware DICOM Viewer¹⁵ mit einem DCE-Plugin^{analysiert 16}. Die jeweiligen Messungen wurden gespeichert und (B) mit der mitgelieferten DCE-Script.R-Datei in RStudio¹⁷weiter analysiert. (C) Die Ausgabe wurde in eine Kalkulationstabelle kopiert (siehe Ergänzendes Material für eine Vorlage). (D) Ebenso wurde die DCE-Messung für benachbartes Muskelgewebe durchgeführt, mit RStudio (E )analysiert und dann in die Kalkulationstabelle kopiert. Die Daten wurden normalisiert, indem die Ergebnisse der Knochenmessungen durch die Ergebnisse der Muskelmessungen (C; lachsschattierte Zellen) dividiert wurden. (F) Die PET/CT-Messungen wurden mit der Software des Herstellers durchgeführt. Der maximale standardisierte Aufnahmewert wurde berechnet, indem die jeweilige Messung durch die injizierte Aktivität dividiert und mit dem Körpergewicht des Tieres multipliziert wurde. Das Ergebnis wurde anschließend in die Kalkulationstabelle kopiert. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 3: Feature-Ranking. Das Ranking der erworbenen Imaging-Features wurde innerhalb einer Open-Source-Datenvisualisierung, maschinellem Lernen und Data Mining Toolkit¹⁸ durchgeführt, indem die Kalkulationstabelle über die "Datei"-Unterroutine importiert und über die "Rank"-Unterroutine analysiert wurde. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 4: Repräsentative RStudio-Ausgabe. Der Machine Learning-Algorithmus wurde mit RStudio¹⁷ mit der bereitgestellten TrainModel.R-Script-Datei entwickelt. (A) Eine Rastersuche zwischen verschiedenen Hyperparameterkombinationen für das modellgemittelte neuronale Netzwerk ergab eine Größe von drei Neuronen und einen Zerfall von 0,0005 als Optimum. (B) Mit dieser Hyperparameter-Kombination wurde ein vollständiges Netzwerk trainiert und kreuzvalidiert, was eine Gesamtgenauigkeit von 85,7 % erreichte. (C) Standardparameter der diagnostischen Genauigkeit, einschließlich Empfindlichkeit, Spezifität, positive und negative Vorhersagewerte und Wahrscheinlichkeitsverhältnisse, wurden aus einer Verwechslungsmatrix berechnet. (D) Ein repräsentatives ROC-Diagramm des kreuzvalidierten Modells ergab eine Fläche unter der Kurve (AUC) von 0,917. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Ergänzende Abbildung 1: Negatives Ergebnis. Das Ändern des ML-Algorithmus in ein neuronales Netzwerk ohne Mittelung und Unterlassung der Normalisierung der Eingabeparameter führte zu einem Rückgang des Bereichs unter der Kurve der ROC-Kurve von 0,917 (Abbildung 4D) auf 0,594. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 2: Alternative Feature-Ranking. Im Gegensatz zur in Abbildung 3dargestellten Standardmethode wurde auch eine Zufallsvariable eingeführt ("Random"; blau hervorgehoben), wobei ihre Bedeutung in das Ranking aufgenommen wurde. Dieser Ansatz bestätigte die angewandte Auswahl der Variablen SUV_max, PE und AUC. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

ML-Algorithmen sind leistungsstarke Werkzeuge, die verwendet werden, um mehrere prädiktive Features in ein kombiniertes Modell zu integrieren und eine Genauigkeit zu erhalten, die die ihrer einzelnen Bestandteile übertrifft, wenn sie allein verwendet werden. Dennoch hängt das tatsächliche Ergebnis von mehreren kritischen Schritten ab. Erstens ist der verwendete ML-Algorithmus ein entscheidender Faktor, da verschiedene ML-Algorithmen unterschiedliche Ergebnisse liefern. Der in diesem Protokoll verwendete Algorithmus ist ein avNNet, aber andere vielversprechende Algorithmen sind Extreme Gradient Boosting²¹ oder Random Forests. Das Caret-Paket²⁰ für RStudio bietet eine Vielzahl verschiedener Algorithmen (derzeit >175), und das vorgeschlagene Protokoll ist sehr flexibel, wenn es darum geht, von einem Algorithmus zum anderen zu wechseln, indem einfach einzelne Codezeilen geändert werden (z. B. Ändern der Methode = "avNNet" auf Methode ="rf") und die TunedGrid-Einstellungen an den jeweiligen ML-Algorithmus angepasst werden. Weitere Informationen finden Sie im Caret-Github-Repository²². Ein ausgezeichneter Überblick über die verschiedenen Algorithmen und deren Leistung in Bezug auf unterschiedliche Klassifizierungsprobleme wurde von Fernéndez-Delgado et al.²³ veröffentlicht und könnte als Ausgangspunkt für andere Experimente dienen.

Ein weiterer entscheidender Faktor ist die Wahl relevanter Funktionen, die in einen ML-Algorithmus aufgenommen werden sollen. Dieses Protokoll schlägt die Verwendung der Filtermethode "Information Gain"¹⁹vor, um die verfügbaren Funktionen in absteigender Reihenfolge zu ordnen und die relevantesten zu verwenden, um das avNNet zu trainieren. Filtermethoden basieren nur auf allgemeinen Annahmen, wie z. B. Korrelation mit der zu prognostizierenden Variablen, daher sollten Forscher Features unabhängig vom verwendeten Klassifizierer²⁴^,²⁵vorwählen. Solche Methoden sind besonders effektiv in der Berechnungszeit und robust bis überfitting. Der Cutoff, der relevante von irrelevanten Features trennt, wird jedoch vom Benutzer definiert, was ihn etwas willkürlich macht. Für das vorgeschlagene Protokoll wurden die Funktionen mit der oberen 75%-Informationszunahme verwendet, die SUV_max, PE und AUC entsprechen. Diese Auswahl kann jedoch systematisch verstärkt werden, indem eine Zufallsvariable, die keine Beziehung zum Ziel hat, eingeht, deren Informationsgewinn berechnet und dann mit dem Informationsgewinn der realen Merkmale verglichen wird (Ergänzende Abbildung 2). Dieser etwas ausgeklügeltere Ansatz bestätigte zusätzlich die Wahl der drei oben genannten Merkmale als die relevantesten. Nichtsdestotrotz gibt es mehrere verschiedene Filtermethoden, zusammen mit anderen Ansätzen, die Features in Bezug auf einen bestimmten Klassifieralgorithmus auswählen, z. B. Featureextraktions- und Wrappermethoden. Unterschiedliche Feature-Auswahlansätze können zu unterschiedlichen Ergebnissen führen.

Um die Verallgemeinerbarkeit des ML-Algorithmus zu gewährleisten und eine Überanpassung weiter zu verhindern, wendet das vorgeschlagene Protokoll die Leave-One-Out-Cross-Validierung (LOOCV) an. Der beste Ansatz wäre jedoch, eine Teilmenge nach dem Zufallsprinzip aus dem gesamten Datensatz zu entfernen und als Testsatz zu behandeln. Der ML-Algorithmus wird dann auf den Rest der Daten (d. h. den Trainingssatz) trainiert, um anschließend das Ergebnis des Testsatzes vorherzusagen. Dieser Ansatz erfordert jedoch einen ausreichend großen Datensatz. Bei kleineren Stichprobengrößen ist die Anwendung von LOOCV üblich, da es eine nahezu unvoreingenommene Schätzung der tatsächlichen Verallgemeinerungsfähigkeit eines Modells bietet²⁶. In LOOCV wird der erste Datenpunkt aus dem Datensatz entfernt, und das avNNet wird mit den gespeicherten Daten trainiert. Dann wird das Ergebnis des zuvor zurückgehaltenen Datenpunkts vorhergesagt und gespeichert. Dieser Vorgang wird für alle Datenpunkte wiederholt, so dass schließlich jedes Ergebnis mit Daten vorhergesagt wird, die nicht für das Training des Algorithmus verwendet wurden. Andere Validierungsansätze umfassen x-fache Kreuzvalidierungen (meist 10-fach) und können einfach angewendet werden, indem Der entsprechende trainControl-Parameter innerhalb des Codes in method="CV" geändert wird.

Aus quantitativer Sicht werden medizinische Bilder in der Regel sehr grundlegend ausgewertet, die sich weitgehend auf Messungen von Größe und Form potenziell verdächtiger Läsionen oder Bereiche²⁷^,²⁸stützen. Der Vorteil des DICOM-Standards (Digital Imaging and Communications in Medicine) liegt jedoch darin, dass er die Extraktion vieler Funktionen, die als Radiomik bezeichnet werden, ermöglicht. Der Begriff "Radiomik" wurde ursprünglich als hochdurchsatzhohe Extraktion großer Mengen von Bildmerkmalen²⁹definiert, wurde aber später um die Konvertierung von Bildern in höherdimensionale Daten³⁰erweitert. Die höherdimensionalen Daten werden jedoch hauptsächlich verwendet, um Korrelationen zu identifizieren, anstatt³⁰zu verursachen. Die in diesem Protokoll beschriebenen Merkmale liegen zwischen klassischen radiologischen Merkmalen wie Größe und Form und Radiomik, da sie allgemein akzeptierten Parametern der Vaskularisation und metabolischen Aktivität ähneln. Dies bietet einen möglichen kausalen Zusammenhang mit der Mikroinvasion von disseminierten Tumorzellen. Auf Wunsch des Benutzers kann eine Extraktion von radiomischen Funktionen mit verschiedenen Softwarepaketen durchgeführt werden³¹.

Das bereitgestellte Protokoll ist nicht auf eine begrenzte Anzahl von Features beschränkt. Somit kann es mit großen Radiomics-Datensätzen verwendet werden. Die oben erwähnte Frage der Feature-Auswahl wird jedoch mit wachsenden Datensätzen immer wichtiger. Das vorgestellte Protokoll kann auch auf verschiedene Studieneinstellungen übertragen werden, z.B. aus den Bereichen Onkologie, Infektion oder Entzündung³².

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren erklären keinen Interessenkonflikt. Die Geldgeber spielten bei der Gestaltung der Studie keine Rolle; bei der Erhebung, Analyse oder Interpretation von Daten; schriftlich des Manuskripts oder in der Entscheidung, die Ergebnisse zu veröffentlichen.

Acknowledgments

Diese Arbeit wurde von der Deutschen Forschungsgemeinschaft (DFG, Sonderforschungsbereich CRC 1181, Teilprojekt Z02; Schwerpunktprogramm "Knochen", Projekte BA 4027/10-1 und BO 3811), einschließlich zusätzlicher Unterstützung für die Scangeräte (INST 410/77-1 FUGG und INST 410/93-1 FUGG) sowie durch die Emerging Fields Initiative (EFI) "Big Thera" der Friedrich-Alexander-Universität Erlangen-Nürnberg.

Materials

Name	Company	Catalog Number	Comments
Binocular Operating Microscope	Leica	NA
ClinScan MR System	Bruker	NA
DICOM Viewer	Horos	NA	www.horosproject.org
Excel: Spreadsheet	Microsoft	NA
FCS	Sigma	F2442-500ML
Gadovist	Bayer-Schering	NA
Inveon PET/CT	Siemens	NA
Inveon Research Workplace Software	Siemens Healthcare GmbH	NA
IVIS Spectrum	PerkinElmer	NA
MDA-MB-231 human breast cancer cells	American Type Culture Collection	N/A
Open-source data visualization, machine learning and data mining toolkit.	Orange3, University of Ljubljana	NA	https://orange.biolab.si/
RPMI-1640	Invitrogen/ThermoFisher	11875093
Trypsin	Sigma	9002-07-7
Vevo 3100	VisualSonics	NA

DOWNLOAD MATERIALS LIST

References

D'Oronzo, S., Brown, J., Coleman, R. The role of biomarkers in the management of bone-homing malignancies. Journal of Bone Oncology. 9, 1-9 (2017).
Ellmann, S., Beck, M., Kuwert, T., Uder, M., Bäuerle, T. Multimodal imaging of bone metastases: From preclinical to clinical applications. Journal of Orthopaedic Translation. 3 (4), 166-177 (2015).
Braun, S., Pantel, K. Clinical significance of occult metastatic cells in bone marrow of breast cancer patients. The Oncologist. 6 (2), 125-132 (2001).
Braun, S., Rosenberg, R., Thorban, S., Harbeck, N. Implications of occult metastatic cells for systemic cancer treatment in patients with breast or gastrointestinal cancer. Seminars in surgical oncology. 20 (4), 334-346 (2001).
Ellmann, S., et al. Prediction of early metastatic disease in experimental breast cancer bone metastasis by combining PET/CT and MRI parameters to a Model-Averaged Neural Network. Bone. 120, 254-261 (2018).
Bäuerle, T., Komljenovic, D., Berger, M. R., Semmler, W. Multi-modal imaging of angiogenesis in a nude rat model of breast cancer bone metastasis using magnetic resonance imaging, volumetric computed tomography and ultrasound. Journal of Visualized Experiments. (66), e4178 (2012).
Merz, M., Komljenovic, D., Semmler, W., Bäuerle, T. Quantitative contrast-enhanced ultrasound for imaging antiangiogenic treatment response in experimental osteolytic breast cancer bone metastases. Investigative Radiology. 47 (7), 422-429 (2012).
Bäuerle, T., et al. Characterization of a rat model with site-specific bone metastasis induced by MDA-MB-231 breast cancer cells and its application to the effects of an antibody against bone sialoprotein. International Journal of Cancer. 115 (2), 177-186 (2005).
Patel, J., Goyal, R. Applications of Artificial Neural Networks in Medical Science. Current Clinical Pharmacology. 2 (3), 217-226 (2008).
Naftaly, U., Intrator, N., Horn, D. Optimal ensemble averaging of neural networks. Network: Computation in Neural Systems. 8 (3), 283-296 (1997).
Bäuerle, T., Merz, M., Komljenovic, D., Zwick, S., Semmler, W. Drug-induced vessel remodeling in bone metastases as assessed by dynamic contrast enhanced magnetic resonance imaging and vessel size imaging: A longitudinal in vivo study. Clinical Cancer Research. 16 (12), 3215-3225 (2010).
Cheng, C., et al. Evaluation of treatment response of cilengitide in an experimental model of breast cancer bone metastasis using dynamic PET with 18F-FDG. Hellenic Journal of Nuclear Medicine. 14 (1), 15-20 (2011).
Marturano-Kruik, A., et al. Human bone perivascular niche-on-a-chip for studying metastatic colonization. Proceedings of the National Academy of Sciences of the United States of America. 115 (6), 1256-1261 (2018).
Sonntag, E., et al. In vivo proof-of-concept for two experimental antiviral drugs, both directed to cellular targets, using a murine cytomegalovirus model. Antiviral Research. 161, 63-69 (2019).
Horos - Free DICOM Medical Image Viewer | Open-Source. , Available from: https://www.horosproject.org/ (2015).
DCE Tool Plugin. , Available from: http://kyungs.bol.ucla.edu/software/DCE_tool/DCE_tool.html (2020).
RStudio Team RStudio: Inteegrated Development for R. , Available from: https://rstudio.com (2015).
Demšar, J., et al. Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research. 14, 2349-2353 (2013).
Saeys, Y., Inza, I., Larrañaga, P. A review of feature selection techniques in bioinformatics. Bioinformatics. 23 (19), 2507-2517 (2007).
Kuhn, M. CRAN - Package caret. , Available from: https://cran.r-project.org/web/packages/caret/index.html (2016).
Chen, T., et al. CRAN: Package xgboost - Extreme Gradient Boosting. , Available from: https://cran.r-project.org/web/packages/xgboost/ (2019).
Available Models | The caret Package. , Available from: http://topepo.github.io/caret/available-models.html (2020).
Fernández-Delgado, M., Cernadas, E., Barro, S., Amorim, D., Fernández-Delgado, A. Do we Need Hundreds of Classifiers to Solve Real World Classification Problems. Journal of Machine Learning Research. 15, 3133-3181 (2014).
Hira, Z. M., Gillies, D. F. A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data. Advances in Bioinformatics. 2015, 198363 (2015).
Sánchez-Maroño, N., Alonso-Betanzos, A., Tombilla-Sanromán, M. Filter methods for feature selection - A comparative study. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 4881, 178-187 (2007).
Cawley, G. C., Talbot, N. L. C. C. Fast exact leave-one-out cross-validation of sparse least-squares support vector machines. Neural Network. 17 (10), 1467-1475 (2004).
Forghani, R., et al. Radiomics and Artificial Intelligence for Biomarker and Prediction Model Development in Oncology. Computational and Structural Biotechnology Journal. 17, 995-1008 (2019).
Jaffe, C. C. Measures of response: RECIST, WHO, and new alternatives. Journal of Clinical Oncology Official Journal of the American Society of Clinical Oncology. 24 (20), 3245-3251 (2006).
Lambin, P., et al. Radiomics: Extracting more information from medical images using advanced feature analysis. European Journal of Cancer. 48 (4), 441-446 (2012).
Gillies, R. J., Kinahan, P. E., Hricak, H. Radiomics: Images are more than pictures, they are data. Radiology. 278 (2), 563-577 (2016).
Nioche, C., et al. Lifex: A freeware for radiomic feature calculation in multimodality imaging to accelerate advances in the characterization of tumor heterogeneity. Cancer Research. 78 (16), 4786-4789 (2018).
Ellmann, S., et al. Application of machine learning algorithms for multiparametric MRI-based evaluation of murine colitis. PLOS ONE. 13 (10), 0206576 (2018).

Cancer Research

Machine Learning-Algorithmen zur Früherkennung von Knochenmetastasen in einem experimentellen Rattenmodell

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.