Medicine

Vorhersage der Behandlungserfolg für bildgestützte Therapien mit maschinellem lernen: ein Beispiel für eine Trans-arterielle Behandlung des hepatozellulären Karzinoms

Published: October 10, 2018 doi: 10.3791/58382

Aaron Abajian¹, Nikitha Murali¹, Lynn Jeanette Savic^1,2, Fabian Max Laage-Gaupp¹, Nariman Nezami¹, James S. Duncan³, Todd Schlachter¹, MingDe Lin⁴, Jean-François Geschwind⁵, Julius Chapiro¹

¹Department of Radiology and Biomedical Imaging, Yale School of Medicine, ²Department of Diagnostic and Interventional Radiology, Universitätsmedizin Charité Berlin, ³Department of Biomedical Engineering, Yale School of Engineering and Applied Science, ⁴Philips Research North America, ⁵Prescience Labs

Summary

Intra-arterielle Therapien sind der Standard der Versorgung von Patienten mit Leberzellkarzinom, die chirurgische Resektion unterziehen kann nicht. Eine Methode für die Vorhersage der Reaktion zu diesen Therapien wird vorgeschlagen. Die Technik nutzt Pre Verfahrensinformationen klinische, demographischen und bildgebenden Maschine Lernmodelle zur Vorhersage der Reaktion vor der Behandlung zu trainieren.

Abstract

Intra-arterielle Therapien sind der Standard der Versorgung von Patienten mit Leberzellkarzinom, die chirurgische Resektion unterziehen kann nicht. Das Ziel dieser Studie war es, eine Methode zur Vorhersage der Reaktion auf die Intra-arterielle Behandlung vor dem Eingriff zu entwickeln.

Die Methode bietet einen allgemeinen Rahmen für die Vorhersage der Ergebnisse vor der Intra-arterielle Therapie. Es geht um Bündelung einer Kohorte von Patienten klinische, demographische und bildgebende Daten und verwenden diese Daten, um eine Machine-Learning-Modell zu trainieren. Das trainierte Modell wird auf neue Patienten angewendet, um die Wahrscheinlichkeit des Ansprechens auf die Intra-arterielle Therapie abschätzen zu können.

Die Methode umfasst die Akquisition und Analyse von klinischen, demographischen und bildgebenden Daten aus N -Patienten, die bereits Trans-arterielle Therapien unterzogen haben. Diese Daten sind in diskrete Merkmale (Alter, Geschlecht, Leberzirrhose, Tumor-Enhancement usw.) analysiert und binarisiert in True/False-Werten (z.B. Alter über 60, Männliches Geschlecht, Tumor-Erweiterung über eine Schwelle, etc.). Low-Varianz und Features mit niedrigen Univariate Assoziationen mit dem Ergebnis werden entfernt. Jeden behandelten Patienten ist beschriftet, nach ob sie reagiert oder nicht auf Behandlung reagieren. Jeder Patient Training ist somit durch eine Reihe von binären Funktionen und ein Ergebnis-Label vertreten. Machine Learning Modelle sind mit N - 1 Patienten mit Tests auf der linken Seite-Out Patient trainiert. Dieser Prozess wird für jedes der N Patienten wiederholt. Die N -Modelle werden gemittelt, um eine endgültige Modell zu erreichen.

Die Technik ist erweiterbar und ermöglicht die Aufnahme von zusätzlichen Funktionen in der Zukunft. Es ist auch eine verallgemeinerbare Prozess, der die klinische Forschungsfragen außerhalb der interventionellen Radiologie angewendet werden kann. Die Haupteinschränkung besteht die Notwendigkeit Funktionen manuell jeden Patienten abgeleitet. Eine beliebte moderne Form des maschinellen Lernens genannt Tiefe erfordert lernen, nicht unter diese Beschränkung leidet sondern größeren Datasets.

Introduction

Patienten mit Leberzellkarzinom, die nicht chirurgische Kandidaten werden Intra-arterielle Therapien¹^,²^,³angeboten. Es gibt keine einzige Metrik, die bestimmt, ob ein Patient auf eine Intra-arterielle Therapie ansprechen wird, bevor die Behandlung verabreicht wird. Das Ziel dieser Studie war es, eine Methode zu demonstrieren, mit dem Behandlungserfolg vorhergesagt durch die Anwendung von Methoden aus maschinellem lernen. Solche Modelle betreuen Ärzte und Patienten bei der Wahl ob Sie mit einer Behandlung fortfahren möchten.

Das Protokoll beinhaltet einen reproduzierbaren Prozess für Weiterbildung und Aktualisierung eines Modells primäre Patientendaten (klinische Hinweise, Demographie, Labordaten und Imaging) ab. Die Daten werden zunächst für Besonderheiten, mit jedem Patienten vertreten durch eine Reihe von binären Funktionen und eine binäre Ergebnis Zielbezeichnung analysiert. Das Ergebnis-Label wird mittels einer etablierten Imaging-basierte Antwort Kriterium für hepatozellulären Therapie⁴^,⁵^,⁶^,⁷ermittelt. Die Funktionen und die Ziel-Etiketten sind an Maschine Lernsoftware übergeben, die die Zuordnung zwischen Funktionen und Ergebnisse unter einem bestimmten Modell (logistische Regression oder zufällige Wald)⁸^,⁹^,¹⁰lernen lernt. Ähnliche Techniken wurden in Radiologie und anderen Bereichen der Krebsforschung für Diagnose und Behandlung Vorhersage¹¹^,¹²^,¹³angewendet.

Die Methode passt sich Techniken aus der Informatik auf dem Gebiet der interventionellen Radiologie. Traditionelle Bedeutung Studien in der interventionellen Radiologie und Medizin im allgemeinen verlassen auf Mono - oder Oligo-Feature Analysen. Beispielsweise enthält das Modell für End Stage Liver Disease fünf klinischen Metriken, um das Ausmaß der Lebererkrankung zu beurteilen. Der Vorteil des vorgeschlagenen Verfahrens ist die Fähigkeit, Funktionen hinzuzufügen, großzügig; 25 Funktionen sind in der Beispiel-Analyse berücksichtigt. Zusätzliche Funktionen können hinzugefügt werden wie gewünscht.

Die Technik kann auf andere radiologischen Interventionen angewendet werden, wo die Pre- und Post-Intervention Bilddaten zur Verfügung stehen. Ergebnisse nach perkutane Behandlung könnte beispielsweise in einer ähnlichen Weise vorhergesagt werden. Die wichtigste Einschränkung der Studie ist die Notwendigkeit, manuelle Kurat Funktionen für die Aufnahme in das Modell. Datenextraktion Kuration und Funktion ist zeitaufwendig für den Praktiker und klinischen Einführung dieser Maschine Lernmodelle behindern kann.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Workstation-Setup für Maschinelles Lernen

Verwenden Sie ein System mit den folgenden:
Intel Core 2 Duo oder höher CPU mit 2,0 GHz
4 GB oder mehr Systemspeicher
POSIX-kompatiblen Betriebssystem (Linux oder Mac OS) oder Microsoft Windows 7
Benutzerberechtigungen zum Ausführen von Programmen und Dateien speichern
Installieren Sie die folgenden Tools:
Anaconda Python3: https://www.anaconda.com/download
DICOM NIfTI Konverter (dcm2niix) - https://github.com/rordenlab/dcm2niix
Sublime Text-Editor: https://www.sublimetext.com/
ITK-SNAP (optional): http://www.itksnap.org
1. Installieren Sie Anaconda Python3, dcm2nii und Sublime Text zu, besuchen Sie deren Websites für Betriebssystem spezifischen Installationsschritte.
2. Erstellen und Aktivieren einer Anakonda-Umgebung.
  Conda erstellen--Name Mlenv
  Conda aktivieren mlenv
3. Anaconda-Installationspakete für Maschinelles Lernen.
  Conda installieren Numpy Scipy Scikit-Nltk Nibabel lernen
  Hinweis: Das Nltk Paket eignet sich für das Parsen von Klartext klinische Hinweise, während die Nibabel für medizinische Bildbearbeitung nützliche Funktionen bietet. ITK-SNAP kann installiert werden, für die Segmentierung Organe und Tumoren von medizinischen Bildern. Es ist nützlich für einschränkende Merkmale auf bestimmte Regionen.

2. Merkmalsextraktion Klartext klinischen Aufzeichnungen und strukturierte klinische Daten

Erstellen Sie ein übergeordnetes Verzeichnis für das Projekt und erstellen Sie einen Ordner für jeden Patienten innerhalb des übergeordneten Ordners. Verzeichnis-Struktur sollte ähneln:
Projekt /
Projekt/Patient_1 /
Projekt/Patient_2 /
Projekt/Patient_3 /
...
Erhalten Sie Klartext von der elektronischen Patientenakte (EMR) klinische Hinweise. Abrufen von Noten manuell durch das EMR oder mit Hilfe der Informationstechnologie (IT)-Informationsbüro Krankenhaus durch einen Daten-Dump. Jeder Patient Notizen in den jeweiligen Ordnern zu speichern.
Project/Patient_1/History_and_Physical.txt
Project/Patient_1/Procedure_Note.txt
1. Beschlossen die klinischen Merkmale in das Modell aufzunehmen. Analysieren Sie die Klartext-Klinik-Noten für diese Features. Die Python Natural Language Toolkit (Nltk)-Bibliothek bietet nützliche Befehle für Dokumente in Sätze aufteilen. Jeder Satz kann entsprechende Begriffe wie Gelbsucht gesucht werden. Speichern Sie jeden Patienten Funktionen in einer Datei mit einem Element pro Zeile.
  Project/Patient_1/Features.txt:
  Alter von 67 Jahren
  Geschlecht männlich
  Albumin 3.1
  zirrhotischen Nein
  Hepatitis_c keine
  ...
2. Nehmen Sie für nicht-binären Funktionen den Medianwert der einzelnen Funktionen über alle Patienten. Jede Funktion als true(1) oder false(0) Wert basierend auf der Medianwert vollständig.
  Project/Patient_1/Binary_Features.txt:
  age_over_60 0
  Male_sex 1
  albumin_less_than_3.5 1
  Presence_of_cirrhosis 0
  Hepatitis_c 0
  ...

3. Merkmalsextraktion von medizinischen Bildern

Hinweis: Finden Sie unter Schritt 3 ergänzende Materialien für Code-Beispiele.

Pre- und Post-Therapie-Magnet-Resonanz-DICOM-Bilder aus dem Krankenhaus PACS herunterladen. Speichern von Bildern in den entsprechenden Ordnern Patienten.
Projekt /
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast.dcm
Project/Patient_1/Pre_TACE_MRI_Arterial.dcm
Project/Patient_1/Post_TACE_MRI_Pre-Constrast.dcm
Project/Patient_1/Post_TACE_MRI_Arterial.dcm
Umwandeln Sie DICOM-Bilder in NIfTI Format mit dem dcm2niix-Programm. Die folgenden Befehle konvertiert alle Hunderte Bilder im angegebenen Ordner. Wiederholen Sie für alle Patienten.
dcm2niix Projekt/Patient_1 /
dcm2niix Projekt/Patient_2 /
Laden Sie jede NIfTI Datei in Python.
Import nibabel
Bild = nibabel.load('Project/Patient_1/Pre_TACE_MRI_Pre-Contrast.dcm')
1. Die Ausrichtung der einzelnen Bilder Kanonisierung. Dadurch wird sichergestellt, dass die x-, y- und Z-Achsen identisch, unabhängig von der Maschine benutzt, um die Bilder zu erwerben sind.
  cImage = nibabel.as_closest_canonical(image)
Verwenden Sie Itk-SNAP (oder eine gleichwertige Software-Paket) um binäre Leber und Tumor-Masken für jedes Bild zu segmentieren.
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Liver_Mask.bin
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Tumor_Mask.bin
Lesen Sie die Leber und Tumor Masken in Python. Der folgende Code veranschaulicht, wie Orientierung Probleme zu beheben, um die Masken entlang der gleichen kanonische Achsen wie die MRT-Bilder zu orientieren.
Numpy als Np importieren
mit Open (Liver_mask_file, "Rb") als f:
Liver_mask = f.read()
Liver_mask = np.fromstring (Liver_mask, Dtype = "uint8")
Liver_mask = np.reshape (Liver_mask, diff.shape, Order = 'F')
Liver_mask = Liver_mask [:,::-1:]
Liver_mask [Liver_mask > 0] = 1
1. Verwenden Sie die Leber und Tumor Masken Voxel mit Leber und Tumor zu isolieren.
  Leber = np.copy(cImage)
  Leber [Liver_mask < = 0] = 0
Meine Leber Verbesserung Funktion zu berechnen.
Mean_liver_enhancement = mean(liver)
1. Lebervolumen Funktion zu berechnen.
  Pixdim = cImage.header['pixdim "]
  Einheiten = pre.header['xyzt_units]
  DX, dy, Dz = Pre_pixdim [1,4]
  Liver_volume = length(liver) * Dx * Dx * Dz
2. (Optional) Zusätzliche Funktionen wie gewünscht zu berechnen.
Patienten-spezifische Features Updatedatei mit den Bild-Funktionen.
Project/Patient_1/Features.txt:
Alter von 67 Jahren
Geschlecht männlich
Albumin 3.1
zirrhotischen Nein
Hepatitis_c keine
Pre_tace_mean_liver_enhancement 78
Pre_tace_liver_volume 10000
1. Mittlere Werte für jede bildgebende Funktion berechnen und vollständig wie in Schritt 2.2.2.
  Project/Patient_1/Binary_Features.txt:
  age_over_60 0
  Male_sex 1
  albumin_less_than_3.5 1
  Presence_of_cirrhosis 0
  Hepatitis_c 0
  Pre_tace_mean_liver_enhancement 1
  Pre_tace_liver_volume 0

(4) verfügen Sie über Aggregation und Reduzierung

Hinweis: Siehe Schritt 4 ergänzende Materialien für Code-Beispiele.

Kombinieren Sie die Binary_Features.txt-Dateien für jeden Patienten in eine Tabellenkalkulation mit Patienten auf der y-Achse und Funktionen auf der x-Achse.

Patienten	> 60 Jahren	Männliches Geschlecht	Albumin < 3,5	Vorhandensein von Leberzirrhose	Hepatitis C vorhanden	meine Leber Erweiterung > 50	lebervolumen > 20000
1	0	1	1	0	0	1	0
2	1	1	1	0	0	0	0
3	0	1	1	0	1	0	0

QEASL Ergebnis Antwortkennungen als in der letzten Spalte hinzufügen.

Patienten	> 60 Jahren	Männliches Geschlecht	Albumin < 3,5	Vorhandensein von Leberzirrhose	Hepatitis C vorhanden	meine Leber Erweiterung > 50	lebervolumen > 20000	qEASL Responder
1	0	1	1	0	0	1	0	1
2	1	1	1	0	0	0	0	1
3	0	1	1	0	1	0	0	0

Exportieren Sie die Kalkulationstabelle als tabulatorgetrennte Datei.
Project/ML_Matrix.tsv:
PatientAge > 60 männliche Sex-Albumin < 3.5 Präsenz der Zirrhose Hepatitis C vorhanden meine Leber Erweiterung > 50 lebervolumen > 20000 qEASL Responder
1 0 1 1 0 0 1 0 1
2 1 1 1 0 0 0 0 1
3 0 1 1 0 1 0 0 0

Entfernen Sie geringer Varianz Features aus der Betrachtung.
Numpy als Np importieren
Importieren von sklearn.feature_selection VarianceThreshold

# Lesen Sie in der binären Matrix.
Funktionen =]
Labels =]
denn ich, L in enumerate(sys.stdin):
Wenn ich == 0
weiter
N_fs_L = L.strip().split('\t')
Features.Append([float(_) für _ in n_fs_L[1:-1]])
Labels.Append(n_fs_L[-1])
X = np.array(features)
y = np.array(labels)

# Funktionen erscheinen in mindestens 20 % der Responder und non-Respnders zu berechnen.
Modell = VarianceThreshold (Schwelle = 0,8 * (1 - 0,8))
X_new = model.fit_transform (X, y)
Die männlichen Geschlechts, Albumin < 3.5, Vorhandensein von Zirrhose und lebervolumen > 2000-Features wurden entfernt.

Patienten	> 60 Jahren	Hepatitis C vorhanden	meine Leber Erweiterung > 50	qEASL Responder
1	0	0	1	1
2	1	0	0	1
3	0	1	0	0

Entfernen Sie Features mit niedrigen Univariate-Verband mit dem Ergebnis. Filtern Sie nur die Funktionen, die 4.2 übergeben. Behalten ceil (Log₂(N)) Funktionen, wo N ist die Anzahl Patienten. Ceil (Log₂(3)) = 2.

Import-Mathematik
Importieren von sklearn.feature_selection SelectKBest
import aus sklearn.feature_selection chi2

# Lesen Sie in der binären Matrix wie in 4.2.1
...

# Top ceil(log2(N)) Funktionen von Univariate Association zu berechnen.
k = math.ceil(log2(length(y)))
Modell = SelectKBest (chi2, k = k)
X_new = model.fit_transform (X, y)

Das männliche Geschlecht Alter > 60 Feature wurde von den restlichen Features von 4.2.1 entfernt.

Patienten	Hepatitis C vorhanden	meine Leber Erweiterung > 50	qEASL Responder
1	0	1	1
2	0	0	1
3	1	0	0

5. Modelltraining und Tests

Finden Sie unter Schritt 5 ergänzende Materialien für Code-Beispiele

Ein logistisches Regressionsmodell mit binären Funktionen Matrix von 4,3 zu trainieren.
Import-Mathematik
Importieren von sklearn.linear_model LogisticRegression

# Lesen Sie in der binären Matrix wie in 4.2 und 4.3.
...

# Für jeden Patienten trainieren Sie ein Modell auf andere Patienten.
Ergebnis = 0.0
Modelle [] =
für Patienten in len(X):
# Trainieren Sie Modell auf alle, aber einer der Patienten.
Train_x = np.array ([_ i _ in enumerate(X) If i! = Patient])
Train_y = np.array ([_ i _ in enumerate(y) If i! = Patient])
Modell = LogisticRegression(C=1e15)
Model.fit (Train_x, Train_y)

# Auf der Links-Out-Patient testen.
Y_prediction = model.predict(X[patient])
Wenn Y_prediction == y [Patienten]:
Ergebnis += 1
Models.Append(Model)
Trainieren Sie ein random Forest-Modell mit Hilfe der binären Funktionen Matrix aus 4.2.2. Schritte sind identisch mit 5.2.1, außer die Instanziierung Modell wie folgt aktualisiert werden soll:
Importieren von sklearn.ensemble RandomForestClassifier
...
Modell = RandomForestClassifier(n_estimators=100)
...
Ergebnis ausdrucken / Len (X) für 5.1 und 5.2. Dies entspricht die durchschnittliche Genauigkeit der alle logistischen Regressionsmodellen und alle zufälligen Wald Modelle, beziehungsweise. Alle N -Modelle sollte auf neue Patienten mit der durchschnittlichen Klassifizierung als Vorhersage Ergebnis angewendet werden

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Die vorgeschlagene Methode wurde an 36 Patienten angewendet, die Trans-arterielle Therapien für das Leberzellkarzinom unterzogen hatte. 25 Funktionen wurden identifiziert und binarisierten mit den Schritten 1-5. Fünf Funktionen erfüllt, die Varianz und die Univariate Verband Filter (siehe Schritte 5.1 und 5.2) und dienten für Modelltraining. Jeder Patient wurde als Responder oder non-Responder unter die qEASL ansprechkriterien beschriftet. Die Funktionen Matrix war somit ein 36 x 5-Array während der Ziel-Etiketten-Vektor 36 x 1.

Für Modell passende wurden logistische Regression und zufällige Wald Klassifikatoren verwendet. Leave-One-Out Kreuzvalidierung wurde zur Bewertung der Leistung der daraus resultierenden Modelle. Zwei weitere Modelle wurden nur die ersten beiden Funktionen (Vorhandensein von Zirrhose und Pre-TACE Tumor Signalintensität größer als 27,0) mit trainiert. Abbildung 1 zeigt die Leistung der Modelle, wie Funktionen hinzugefügt wurden. Logistische Regression und zufällige Wald Modellen vorhergesagt Trans-arterielle Chemoembolisation Behandlungserfolg mit einer Genauigkeit von 78 % (Sensitivität 62,5 %, Spezifität 82,1 %, 50,0 % positive prädiktive Wert, negativen prädiktiven Wert 88,5 %).

Abbildung 1 : Performance Machine Learning-Algorithmen. (a, b) Logistische Regression und (c, d) random Forest Klassifikators Genauigkeiten als Features werden hinzugefügt. Funktionen wurden hinzugefügt, in der folgenden Reihenfolge: (1) Ethiodized Öl, Sorafenib (2), Zirrhose (3), (4) Pre-Transarterial Chemo-Embolisation relative Tumor Signalintensität > 27,0 und (5) Anzahl der Tumoren > 2. Abbildung mit freundlicher Genehmigung in unveränderter Form aus dem Journal für vaskuläre und Interventionelle Radiologie¹⁴verwendet. Bitte klicken Sie hier für eine größere Version dieser Figur.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Patienten mit Leberzellkarzinom, die nicht Kandidaten für chirurgische Resektion werden Intra-arterielle Therapien angeboten. Gibt es einige Methoden um festzustellen, ob ein Patient Pre reagiert-Behandlung. Nach der Behandlung Evaluierungstechniken stützen sich auf Veränderungen in der Größe des Tumors oder Tumor Kontrast Aufnahme. Diese nennt man ansprechkriterien mit der genauesten wird die Quantitative Europäische Vereinigung für die Studie des Kriteriums der Leber (qEASL). qEASL stützt sich auf beide Volumetrische und Erweiterung Veränderungen nach der Therapie um eine Wahrscheinlichkeit des Ansprechens zu prognostizieren. Trotz der Stärken des qEASL es ist dennoch eine Nachbehandlung Bewertungskriterien und kann nicht Hilfe bei der Behandlungsplanung.

Es ist erforderlich zu prüfen, welche Patienten wahrscheinlich auf Intra-arterielle Therapien reagieren, vor der Durchführung der Intervention sind. Die Methode demonstriert in diesem Protokoll umfasst klinische, Labor und Bildgebung features in ein Vorhersagemodell mit Techniken aus den Bereichen der Informatik und Statistik. Machine Learning-Modell wird trainiert, die diese Funktionen von Patienten zuordnet, die Intra-arterielle Therapien, deren Ergebnisse qEASL unterzogen haben. Das Modell kann dann auf neue Patienten angewendet werden, die Behandlung um ihre qEASL Reaktion mit nur ihre Vorbehandlung Merkmale vorherzusagen unterzogen wird.

Schritt 1 beschreibt Workstation-Setup für Maschinelles Lernen. Es enthält kurze Anleitung zum Einrichten einer Arbeitsstation mit erforderlichen Werkzeuge. Schritte 2 bis 4 ins technische Detail wie klinischen und bildgebenden Daten gehen könnte analysiert werden, um Eigenschaften von Interesse zu erhalten. Diese Schritte sind wichtig, da die Auswahl der entsprechenden Features wird die Effektivität des Modells zu ermitteln. Bestimmte Teilschritte wurden ausgewählt, um die Merkmalsextraktion zu erleichtern. Radiologische Bilder sind zum Beispiel in der Regel im DICOM-Format gespeichert ist nicht ideal für die Bildanalyse. Die National Institutes of Health (NIH) Neuroimaging Zweig entwickelt den Neuroimaging Informatik-Technologie-Initiative (NIfTI) Standard um Bildbearbeitung in Forschungsumgebungen zu erleichtern. Schritt 3.2 bringt die Umstellung von DICOM auf NIfTI-Format, um den Prozess der Merkmalsextraktion erleichtern. Leber und Tumor-Masken können von NIfTI Format mit einem Programm wie Itk-SNAP o.ä. Segmentierung Software extrahiert werden.

Jedes Feature sollte ob klinische Hinweise oder Bilddaten, erwarb als True-False-Werten binarisiert. Beispielsweise kann ein kontinuierliches Bild Verbesserung Steigung von 0 bis 10, ein einzelnes Feature vertreten Verstärkung größer oder kleiner als 5 binarisiert. Alternativ könnte die Funktion in mehrere binäre Funktionen aufgeteilt werden: x < 3; 3 < = x < 7; 7 < = x. Machine Learning Modelle, die mit binären Funktionen arbeiten leichter sind zu trainieren.

Das Endergebnis der Schritte 2-4 ist eine binäre Matrix mit Patienten auf der y-Achse, Features auf der x-Achse und eine letzte Spalte das Ergebnis (Responder oder non-Responder) bestimmt für Patienten unter die qEASL Reaktion Kriterium darstellt. Bestimmte Funktionen möglicherweise unterrepräsentiert oder in einer Ergebnis-Bevölkerung überrepräsentiert. Wenn alle Behandlung Responder männlich waren, kann es z. B. nicht falsch geschlossen werden, dass männliche Geschlecht Antwort impliziert. Eine Möglichkeit zur Bewältigung dieser Trugschluss ist, alle Funktionen zu entfernen, die nicht in Responder und non-Responder über einen Schwellenwert z. B. 20 % gefunden werden.

Andere Funktionen möglicherweise lediglich begrenzte Bedeutung bei der Bestimmung der Ergebnis unter Studie. Z. B. Augenfarbe ist wahrscheinlich irrelevant für Ergebnisse nach Intra-arterielle Therapien. Solche Funktionen haben eine niedrige Univariate Vereinigung mit dem Ergebnis. Obwohl kein einziges Feature eine signifikante (p < 0,05) Assoziation mit dem Ergebnis zu haben voraussichtlich wird, ist eine wirksame Strategie zu verlangen, dass Funktionen einige minimale Univariate Korrelation oberhalb einer definierten Schwelle.

Schritt 5 umfasst den Prozess der Ausbildung und der Anwendung einer Machine learning-Modell. Es ist nicht unbedingt notwendig, um in der Weise beschrieben, Vorgehen, solange das Endergebnis das gleiche ist. Der Trainingsprozess verwendet Leave-One-Out Kreuzvalidierung wobei N Modelle für jede der N Patienten trainiert werden. Die daraus resultierenden N -Modelle aus Leave-One-Out Kreuzvalidierung generiert können gemittelt werden, um eine endgültige Modell zu produzieren.

Die Technik gilt auch für andere Verfahren unter Bildgebung durchgeführt. Machine Learning Funktionen aus einer Reihe von Schulungen Patienten nimmt und gewichtet sie entsprechend ihrer relativen Beitrag an ein Zielergebnis. Gewichtung richtet sich nach dem gewählten Modell; logistische Regressionsmodelle berechnen eine Linearkombination potenziert, während zufällige Wald Modelle eine Reihe von gewichtete Entscheidungsbäume beschäftigen. Es war das Ziel, die in diesem Protokoll verwendeten Antwort unter das qEASL Kriterium. Andere Ziele, wie z. B. des krankheitsfreien Überlebens oder Lebensqualität Jahre können je nach dem gewünschten Ergebnis unter Frage gewählt werden.

Die wichtigste Einschränkung des Protokolls ist manuell definieren und erhalten die Merkmale in Betracht gezogen werden müssen. Dies bedeutet eine erhebliche Menge an Handarbeit wie klinische Hinweise Analyse, Segmentierung Tumor Bände und zählen die Anzahl der Läsionen. Tiefen Computerlernen versucht automatisch Funktionen aus den rohen Quelldaten ableiten, aber erfordert deutlich mehr Trainingsdaten. Diese wachsende Technologie nachweislich überlegen betreutes lernen in einer Vielzahl von Kontexten und werden wahrscheinlich die nächste Evolutionsstufe der Vorhersagemodelle für Patienten, die eine bildgebende Verfahren.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

A.A arbeitet als eine Software Consult für Gesundheit Fidelity, Inc., die ähnliche Maschine Lerntechniken auf klinische Hinweise für die Optimierung von medizinischen Erstattung beschäftigt.

J.F.G. erhält persönliche Gebühren aus sowohl Medizin, BTG, Schwelle Pharmaceuticals (San Francisco, Kalifornien), Boston Scientific und Terumo (Elkton, Maryland); und hat eine bezahlte Beratung für Prescience Labs (Westport, Connecticut).

Keiner der anderen Autoren haben einen Interessenkonflikt identifiziert.

Acknowledgments

A.A erhielt finanzielle Unterstützung von der Office of Student Research, Yale School of Medicine.

L.J.S. erhält Zuschüsse von der National Institutes of Health (NIH/NCI R01CA206180), Leopoldina Postdoctoral Fellowship und die Rolf W. Guenther Foundation radiologische Wissenschaften (Aachen, Deutschland).

J.c. erhält Zuschüsse von der National Institutes of Health (NIH/NCI R01CA206180), Philips Healthcare und die deutsch-israelische Stiftung für wissenschaftliche Forschung und Entwicklung (Jerusalem, Israel und Neuherberg, Deutschland); und Stipendien von der Rolf W. Guenther Foundation radiologische Wissenschaften und der Charite Berlin Institut für klinische Wissenschaftler Gesundheitsprogramm (Berlin, Deutschland).

J.S.D. und m.l. Zuschüsse aus dem National Institutes of Health (NIH/NCI R01CA206180) und Philips Healthcare (Best, Niederlande).

J.F.G. erhält Zuschüsse aus dem National Institutes of Health (NIH/NCI R01CA206180), Philips Healthcare, BTG (London, Vereinigtes Königreich), Boston Scientific (Marlborough, Massachusetts), und sowohl Healthcare (Villepinte, Frankreich)

Materials

Name	Company	Catalog Number	Comments
Computer workstation	N/A	N/A	Intel Core 2 Duo or higher CPU at 2.0 GHz; 4 GB or more system memory; POSIX-compliant operating system (Linux or Mac OS) or Microsoft Windows 7; User permissions for executing programs and saving files
Anaconda Python 3	Anaconda, Inc.	Version 3.6	Python 3 system and libraries packaged for scientists and researchers
DICOM to NIfTI	NeuroImaging Tools & Resources Collaboratory	Version 1.0 (4/4/2018 release)	Standalone program for converting DICOM imaging files to NIfTI format
Sublime Text Editor	Sublime HQ Pty Ltd	Version 3 (Build 3143)	Text-editor for writing Python code
Required Python Libraries	N/A	Version 3.2.25 (nltk) Version 0.19.1 (scikit-learn)	Natural Language Toolkit (nltk) Scikit-learn
ITK-SNAP	N/A	Version 3.6.0	Optional toolkit for performing segmentation of organ systems in medical images.