Medicine

छवि-निर्देशित चिकित्सा मशीन सीखने का उपयोग करने के लिए उपचार प्रतिक्रिया की भविष्यवाणी: Hepatocellular कार्सिनोमा के ट्रांस धमनी उपचार के लिए एक उदाहरण

Published: October 10, 2018 doi: 10.3791/58382

Aaron Abajian¹, Nikitha Murali¹, Lynn Jeanette Savic^1,2, Fabian Max Laage-Gaupp¹, Nariman Nezami¹, James S. Duncan³, Todd Schlachter¹, MingDe Lin⁴, Jean-François Geschwind⁵, Julius Chapiro¹

¹Department of Radiology and Biomedical Imaging, Yale School of Medicine, ²Department of Diagnostic and Interventional Radiology, Universitätsmedizin Charité Berlin, ³Department of Biomedical Engineering, Yale School of Engineering and Applied Science, ⁴Philips Research North America, ⁵Prescience Labs

Summary

इंट्रा धमनी चिकित्सा hepatocellular कार्सिनोमा जो शल्य चिकित्सा लकीर से गुजरना नहीं कर सकते के साथ रोगियों के लिए देखभाल के मानक हैं । इन उपचारों के जवाब की भविष्यवाणी के लिए एक विधि प्रस्तावित है । तकनीक का उपयोग करता है पूर्व प्रक्रियात्मक नैदानिक, जनसांख्यिकीय, और इमेजिंग जानकारी मशीन सीखने के लिए उपचार से पहले प्रतिक्रिया की भविष्यवाणी करने में सक्षम मॉडल ट्रेन ।

Abstract

इंट्रा धमनी चिकित्सा hepatocellular कार्सिनोमा जो शल्य चिकित्सा लकीर से गुजरना नहीं कर सकते के साथ रोगियों के लिए देखभाल के मानक हैं । इस अध्ययन का उद्देश्य एक पद्धति विकसित करने के लिए हस्तक्षेप करने से पहले अंतर धमनी उपचार के जवाब की भविष्यवाणी करने के लिए किया गया था ।

विधि परिणाम की भविष्यवाणी के लिए एक सामांय रूपरेखा प्रदान करता है पहले अंतर धमनी चिकित्सा के लिए । यह रोगियों के एक पलटन भर में नैदानिक, जनसांख्यिकीय और इमेजिंग डेटा पूलिंग शामिल है और इन आंकड़ों का उपयोग कर एक मॉडल सीखने की मशीन को प्रशिक्षित करने के लिए । प्रशिक्षित मॉडल नए रोगियों के लिए लागू किया जाता है ताकि अंतर धमनी चिकित्सा के जवाब की उनकी संभावना की भविष्यवाणी करने के लिए ।

विधि N रोगियों जो पहले से ही ट्रांस धमनी चिकित्सा आया है से नैदानिक, जनसांख्यिकीय और इमेजिंग डेटा के अधिग्रहण और पार्सिंग पर जोर देता है । इन आंकड़ों असतत सुविधाओं में पार्स कर रहे है (उंर, लिंग, सिरोसिस, ट्यूमर वृद्धि की डिग्री, आदि) और सही/झूठी मूल्यों (जैसे, ६० से अधिक आयु, पुरुष लिंग, एक सेट सीमा से परे ट्यूमर वृद्धि, आदि) में बायनेरिज़ । कम विचरण सुविधाओं और परिणाम के साथ कम univariate संघों के साथ सुविधाओं को हटा रहे हैं । प्रत्येक इलाज रोगी के अनुसार लेबल किया गया है कि क्या वे जवाब या इलाज के लिए जवाब नहीं दिया । प्रत्येक प्रशिक्षण रोगी इस प्रकार बाइनरी सुविधाओं और एक परिणाम लेबल का एक सेट द्वारा प्रतिनिधित्व किया है । मशीन लर्निंग मॉडल के साथ एन -1 रोगियों का उपयोग कर प्रशिक्षित कर रहे है छोड़ दिया रोगी पर परीक्षण । यह प्रक्रिया N रोगियों में से प्रत्येक के लिए दोहराया है । N मॉडल के लिए एक अंतिम मॉडल पर पहुंचने औसत रहे हैं ।

तकनीक एक्सटेंसिबल है और भविष्य में अतिरिक्त सुविधाओं को शामिल करने के लिए सक्षम बनाता है । यह भी एक सामांय प्रक्रिया है कि चिकित्सीय अनुसंधान के लिए लागू किया जा सकता है हस्तक्षेप रेडियोलॉजी के बाहर प्रश्न । मुख्य सीमा प्रत्येक रोगी से मैंयुअल रूप से सुविधाओं को प्राप्त करने की आवश्यकता है । मशीन लर्निंग नामक एक लोकप्रिय आधुनिक रूप गहरी सीखने इस सीमा से ग्रस्त नहीं है, लेकिन बड़े डेटासेट की आवश्यकता है ।

Introduction

hepatocellular कार्सिनोमा के साथ रोगियों जो शल्य उंमीदवारों नहीं है अंतर धमनी उपचार¹^,²^,³की पेशकश कर रहे हैं । वहां कोई एक मीट्रिक है कि निर्धारित करता है कि एक मरीज को इलाज से पहले एक अंतर धमनी चिकित्सा का जवाब होगा प्रशासित है । इस अध्ययन का उद्देश्य एक तरीका है कि मशीन सीखने से तरीकों को लागू करने से उपचार प्रतिक्रिया भविष्यवाणी का प्रदर्शन किया गया । इस तरह के मॉडल चिकित्सकों और रोगियों को मार्गदर्शन जब चुनने के लिए कि एक इलाज के साथ आगे बढ़ना है प्रदान करते हैं ।

प्रोटोकॉल प्रशिक्षण और प्राथमिक रोगी डेटा (नैदानिक नोट्स, जनसांख्यिकी, प्रयोगशाला डेटा, और इमेजिंग) से शुरू एक मॉडल को अद्यतन करने के लिए एक reproducible प्रक्रिया पर जोर देता है । डेटा प्रारंभिक रूप से विशिष्ट सुविधाओं के लिए पार्स किया जाता है, प्रत्येक रोगी के साथ बाइनरी सुविधाओं का एक सेट और एक बाइनरी परिणाम लक्ष्य लेबल का प्रतिनिधित्व करते हैं । परिणाम लेबल hepatocellular थेरेपी⁴^,⁵^,⁶^,⁷के लिए एक स्थापित इमेजिंग आधारित प्रतिक्रिया मापदंड का उपयोग कर निर्धारित किया जाता है । सुविधाओं और लक्ष्य लेबल मशीन सीखने सॉफ्टवेयर है कि एक विशिष्ट अधिगम मॉडल (रसद प्रतिगमन या यादृच्छिक वन)⁸^,⁹^,¹⁰के तहत सुविधाओं और परिणामों के बीच मानचित्रण सीखता को पारित कर रहे हैं । इसी तरह की तकनीक के निदान और उपचार भविष्यवाणी¹¹^,¹²^,¹³के लिए रेडियोलॉजी और कैंसर अनुसंधान के अंय क्षेत्रों में लागू किया गया है ।

विधि कंप्यूटर विज्ञान से हस्तक्षेप रेडियोलॉजी के क्षेत्र में तकनीक के अनुकूल है । पारंपरिक महत्व के हस्तक्षेप रेडियोलॉजी में अध्ययन, और सामांय में दवा, मोनो या oligo-सुविधा के विश्लेषण पर भरोसा करते हैं । उदाहरण के लिए, अंत चरण जिगर की बीमारी के लिए मॉडल जिगर की बीमारी की हद का आकलन करने के लिए पांच नैदानिक मैट्रिक्स को शामिल किया गया. प्रस्तावित विधि का लाभ उदार रूप से सुविधाओं को जोड़ने की क्षमता है; पच्चीस सुविधाओं का उदाहरण विश्लेषण में माना जाता है. अतिरिक्त सुविधाओं के रूप में वांछित जोड़ा जा सकता है ।

तकनीक अंय रेडियोग्राफिक हस्तक्षेप जहां पूर्व और बाद में हस्तक्षेप इमेजिंग डेटा उपलब्ध है के लिए लागू किया जा सकता है । उदाहरण के लिए, percutaneous उपचार के बाद परिणाम एक समान तरीके से भविष्यवाणी की जा सकती है । अध्ययन के मुख्य सीमा मॉडल में शामिल करने के लिए मैनुअल उपपादरी सुविधाओं की जरूरत है । डेटा उपचारात्मक और सुविधा निष्कर्षण व्यवसायी के लिए समय लेने वाली है और इस तरह की मशीन सीखने मॉडल के नैदानिक गोद लेने में बाधा हो सकती है ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. मशीन लर्निंग के लिए कार्यस्थान सेटअप

निंन के साथ एक सिस्टम का उपयोग करें:
इंटेल कोर 2 डुओ या उच्च २.० GHz पर सीपीयू
4 GB या अधिक सिस्टम स्मृति
POSIX-आज्ञाकारी ऑपरेटिंग सिस्टम (लिनक्स या मैक ओएस) या माइक्रोसॉफ्ट विंडोज 7
प्रोग्राम निष्पादित करने और फ़ाइलों को सहेजने के लिए उपयोगकर्ता अनुमतियां
निंन उपकरण स्थापित करें:
एनाकोंडा Python3: https://www.anaconda.com/download
DICOM NIfTI कनवर्टर (dcm2niix)-https://github.com/rordenlab/dcm2niix
उदात्त पाठ संपादक: https://www.sublimetext.com/
itk-स्नैप (वैकल्पिक): http://www.itksnap.org
1. एनाकोंडा Python3, dcm2nii और उदात्त पाठ स्थापित करें, ऑपरेटिंग सिस्टम विशिष्ट स्थापना चरणों के लिए उनके संबंधित वेबसाइटों पर जाएं ।
2. बनाएं और एक एनाकोंडा वातावरण को सक्रिय करें ।
  conda create--नाम mlenv
  conda कध mlenv
3. मशीन लर्निंग के लिए एनाकोंडा संकुल स्थापित करें ।
  conda स्थापित numpy scipy scikit-learn nltk nibabel
  नोट: nltk पैकेज plaintext नैदानिक नोट्स पार्स करने के लिए उपयोगी है, जबकि nibabel पैकेज चिकित्सा छवि हेरफेर के लिए उपयोगी कार्य प्रदान करता है । itk-स्नैप अंगों और चिकित्सा छवियों से ट्यूमर के विभाजन के लिए स्थापित किया जा सकता है । यह विशिष्ट क्षेत्रों के लिए सुविधाओं को विवश करने के लिए उपयोगी है ।

2. Plaintext नैदानिक नोट्स और संरचित नैदानिक डेटा से सुविधा निष्कर्षण

प्रोजेक्ट के लिए कोई पैरेंट निर्देशिका बनाएँ और पैरेंट फ़ोल्डर में प्रत्येक रोगी के लिए एक फ़ोल्डर बनाएँ । निर्देशिका संरचना सदृश होनी चाहिए:
परियोजना
Project/Patient_1/
Project/Patient_2/
Project/Patient_3/
...
इलेक्ट्रॉनिक मेडिकल रिकॉर्ड (EMR) से plaintext नैदानिक नोट्स प्राप्त करें । EMR के माध्यम से या अस्पताल सूचना प्रौद्योगिकी (आईटी) कार्यालय के माध्यम से एक डेटा डंप के माध्यम से मैंयुअल रूप से नोट्स प्राप्त करें । उनके संबंधित फ़ोल्डरों में प्रत्येक रोगी के नोटों की दुकान ।
Project/Patient_1/History_and_Physical. txt
Project/Patient_1/Procedure_Note. txt
1. निर्णय लिया है जो नैदानिक सुविधाओं को मॉडल में शामिल करने के लिए । इन सुविधाओं के लिए plaintext क्लिनिक नोट्स को पार्स । अजगर प्राकृतिक भाषा Toolkit (nltk) पुस्तकालय वाक्यों में बंटवारे दस्तावेजों के लिए उपयोगी आदेश प्रदान करता है । प्रत्येक वाक्य में पीलिया जैसे उचित शब्दों की खोज की जा सकती है । प्रति पंक्ति एक सुविधा के साथ एक फ़ाइल में प्रत्येक रोगी की सुविधाओं को स्टोर ।
  Project/Patient_1/features. txt:
  आयु ६७
  सेक्स पुरुष
  एल्ब्युमिन ३.१
  cirrhotic कोई
  hepatitis_c कोई
  ...
2. गैर-बाइनरी सुविधाओं के लिए, सभी रोगियों में प्रत्येक सुविधा का माध्य मान लें । Binarize प्रत्येक सुविधा के रूप में एक सच्चे (1) या झूठी (0) मूल्य औसत मूल्य पर आधारित है ।
  Project/Patient_1/Binary_Features. txt:
  age_over_60 0
  male_sex १
  albumin_less_than_ 3.5 1
  presence_of_cirrhosis 0
  hepatitis_c 0
  ...

3. चिकित्सा छवियों से सुविधा निष्कर्षण

नोट: कोड उदाहरण के लिए चरण 3 अनुपूरक सामग्री देखें ।

अस्पताल से पूर्व और बाद चिकित्सा चुंबकीय अनुनाद DICOM छवियों को डाउनलोड करें शुर । इसी रोगी फ़ोल्डर में छवियों को स्टोर ।
परियोजना
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast. डीसीएम
Project/Patient_1/Pre_TACE_MRI_Arterial. डीसीएम
Project/Patient_1/Post_TACE_MRI_Pre-Constrast. डीसीएम
Project/Patient_1/Post_TACE_MRI_Arterial. डीसीएम
dcm2niix प्रोग्राम का उपयोग करके DICOM छवियों को NIfTI स्वरूप में कनवर्ट करें । निंन आदेश निर्दिष्ट फ़ोल्डर में सभी. डीसीएम छवियां कनवर्ट करता है । सभी रोगियों के लिए दोहराएँ ।
dcm2niix Project/Patient_1/
dcm2niix Project/Patient_2/
अजगर में प्रत्येक NIfTI फ़ाइल लोड ।
आयात nibabel
image = nibabel. लोड (' Project/Patient_1/Pre_TACE_MRI_Pre-Contrast. डीसीएम ')
1. प्रत्येक छवि का ओरिएंटेशन Canonicalize । यह सुनिश्चित करता है कि एक्स, वाई, और जेड अक्ष समान हैं, छवियों को प्राप्त करने के लिए इस्तेमाल मशीन की परवाह किए बिना ।
  cImage = nibabel. as _closest_canonical (image)
प्रत्येक छवि के लिए बाइनरी लीवर और ट्यूमर मास्क खंड करने के लिए itk-स्नैप (या एक समकक्ष सॉफ्टवेयर पैकेज) का प्रयोग करें ।
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Liver_Mask. bin
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Tumor_Mask. bin
अजगर में जिगर और ट्यूमर मास्क पढ़ें । नीचे दिए गए कोड को दर्शाता है कैसे अभिविन्यास मुद्दों को सही करने के लिए श्री छवियों के रूप में एक ही विहित कुल्हाड़ियों के साथ मुखौटे ओरिएंट ।
np के रूप में आयात numpy
ओपन के साथ (liver_mask_file, ' आरबी ') के रूप में एफ:
liver_mask = f. read ()
liver_mask = np. fromstring (liver_mask, dtype = ' uint8 ')
liver_mask = np. reshape (liver_mask, रचनाकार. आकृति, क्रम = ' F ')
liver_mask = liver_mask [:,::-1,:]
liver_mask [liver_mask > 0] = 1
1. यकृत और ट्यूमर युक्त voxels को अलग करने के लिए जिगर और ट्यूमर मास्क का प्रयोग करें ।
  यकृत = np. copy (cImage)
  जिगर [liver_mask < = 0] = 0
मतलब जिगर वृद्धि की गणना की सुविधा ।
mean_liver_enhancement = meaning (जिगर)
1. जिगर की मात्रा सुविधा की गणना.
  pixdim = cImage. header [' pixdim ']
  इकाइयों = पूर्व शीर्षक [' xyzt_units ']
  dx, उपसंचालक, dz = pre_pixdim [१:४]
  liver_volume = लंबाई (जिगर) * dx * dx * dz
2. वैकल्पिक वांछित के रूप में अतिरिक्त सुविधाओं की गणना ।
छवि सुविधाओं के साथ रोगी-विशिष्ट सुविधाओं फ़ाइल का अद्यतन करें ।
Project/Patient_1/features. txt:
आयु ६७
सेक्स पुरुष
एल्ब्युमिन ३.१
cirrhotic कोई
hepatitis_c कोई
pre_tace_mean_liver_enhancement ७८
pre_tace_liver_volume १००००
1. प्रत्येक इमेजिंग सुविधा के लिए माध्य मानों की गणना और चरण -8 में के रूप में binarize.
  Project/Patient_1/Binary_Features. txt:
  age_over_60 0
  male_sex १
  albumin_less_than_ 3.5 1
  presence_of_cirrhosis 0
  hepatitis_c 0
  pre_tace_mean_liver_enhancement १
  pre_tace_liver_volume 0

4. सुविधा एकत्रीकरण और कमी

नोट: कोड उदाहरण के लिए चरण 4 अनुपूरक सामग्री देखें ।

प्रत्येक रोगी के लिए y-अक्ष और x-अक्ष पर सुविधाओं पर रोगियों के साथ एक स्प्रेडशीट में Binary_Features. txt फ़ाइलों का मिश्रण ।

रोगी	आयु > ६०	पुरुष सेक्स	एल्ब्युमिन < ३.५	सिरोसिस की उपस्थिति	हेपेटाइटिस सी मौजूद	जिगर की वृद्धि का मतलब > ५०	जिगर की मात्रा > २००००
1	0	1	1	0	0	1	0
2	1	1	1	0	0	0	0
3	0	1	1	0	1	0	0

अंतिम स्तंभ के रूप में qEASL परिणाम प्रतिसाद लेबल्स जोड़ें ।

रोगी	आयु > ६०	पुरुष सेक्स	एल्ब्युमिन < ३.५	सिरोसिस की उपस्थिति	हेपेटाइटिस सी मौजूद	जिगर की वृद्धि का मतलब > ५०	जिगर की मात्रा > २००००	qEASL उत्तरदाता
1	0	1	1	0	0	1	0	1
2	1	1	1	0	0	0	0	1
3	0	1	1	0	1	0	0	0

स्प्रेडशीट टैब-सीमांकित फ़ाइल के रूप में निर्यात करें ।
Project/ML_Matrix. tsv:
रोगी > ६० पुरुष सेक्स एल्ब्युमिन < ३.५ की उपस्थिति सिरोसिस हेपेटाइटिस सी वर्तमान मतलब जिगर वृद्धि > ५० जिगर की मात्रा > २०००० qEASL उत्तरदाता
१ ० १ १ ० ० १ ० १
२ १ १ १ ० ० ० ० १
३ ० १ १ ० १ ० ० ०

विचार से कम-प्रसरण सुविधाओं को निकालें ।
np के रूप में आयात numpy
से sklearn. feature_selection आयात VarianceThreshold

# बाइनरी मैट्रिक्स में पढ़ें ।
विशेषताएं = []
labels = []
के लिए मैं, गणना में एल (sys. stdin):
अगर मैं = = 0
जारी
n_fs_L = L. strip (). बखर (' \t ')
features. के पीछे ([नाव (_) के लिए _ n_fs_L में [1:-1]])
labels. पीछे (n_fs_L [-1])
X = np. सरणी (विशेषताएं)
y = np. सरणी (लेबल)

# दोनों प्रतिक्रिया और गैर respnders के कम से 20% में प्रदर्शित होने सुविधाओं की गणना ।
मॉडल = VarianceThreshold (थ्रेशोल्ड = 0.8 * (1-०.८))
X_new = model. fit _transform (X, y)
पुरुष सेक्स, एल्ब्युमिन < ३.५, सिरोसिस की मौजूदगी और लिवर की मात्रा > २००० फीचर्स निकाले गए हैं ।

रोगी	आयु > ६०	हेपेटाइटिस सी मौजूद	जिगर की वृद्धि का मतलब > ५०	qEASL उत्तरदाता
1	0	0	1	1
2	1	0	0	1
3	0	1	0	0

परिणाम के साथ कम univariate-संबद्धता के साथ सुविधाओं को निकालें । फ़िल्टर केवल उन सुविधाओं है कि ४.२ पारित कर दिया । ceil बरकरार रखें (लॉग₂(एन)) विशेषताएं, जहां N संख्या रोगियों है । Ceil (लॉग₂(3)) = 2.

गणित आयात करें
से sklearn. feature_selection आयात SelectKBest
से sklearn. feature_selection आयात chi2

# 4.2.1 में के रूप में बाइनरी मैट्रिक्स में पढ़ें
...

# गणना शीर्ष ceil (log2 (एन)) univariate एसोसिएशन द्वारा सुविधाएं ।
k = मठ. ceil (log2 (लंबाई (y)))
मॉडल = SelectKBest (chi2, कश्मीर = कश्मीर)
X_new = model. fit _transform (X, y)

पुरुष सेक्स आयु > ६० सुविधा 4.2.1 से शेष सुविधाओं से हटा दिया गया है ।

रोगी	हेपेटाइटिस सी मौजूद	जिगर की वृद्धि का मतलब > ५०	qEASL उत्तरदाता
1	0	1	1
2	0	0	1
3	1	0	0

5. मॉडल प्रशिक्षण और परीक्षण

कोड उदाहरण के लिए चरण 5 अनुपूरक सामग्री देखें

४.३ से बाइनरी सुविधाएँ मैट्रिक्स का उपयोग कर एक रसद प्रतिगमन मॉडल को प्रशिक्षित.
गणित आयात करें
से sklearn. linear_model आयात LogisticRegression

# ४.२ और ४.३ में के रूप में बाइनरी मैट्रिक्स में पढ़ें ।
...

# प्रत्येक रोगी के लिए, अंय सभी रोगियों पर एक मॉडल को प्रशिक्षित ।
स्कोर = ०.०
मॉडल = []
लेन (एक्स) में रोगी के लिए:
# सभी लेकिन मरीजों में से एक पर ट्रेन मॉडल ।
train_x = np. सरणी ([_ for i, _ में गणना (x) यदि i! = रोगी])
train_y = np. सरणी ([_ for i, _ में गणना (y) यदि i! = रोगी])
model = LogisticRegression (C = 1e15)
मॉडल. fit (train_x, train_y)

# परीक्षण पर छोड़ दिया रोगी ।
y_prediction = model. भविष्यवाणी (एक्स [रोगी])
यदि y_prediction = = y [रोगी]:
स्कोर + = 1
मॉडल. पीछे जोड़ें (मॉडल)
4.2.2 से द्विआधारी सुविधाओं मैट्रिक्स का उपयोग कर एक यादृच्छिक वन मॉडल ट्रेन । चरण 5.2.1 करने के लिए समान हैं, सिवाय मॉडल प्रारंभ निम्नानुसार अद्यतन किया जाना चाहिए:
से sklearn. पहनावा आयात RandomForestClassifier
...
मॉडल = RandomForestClassifier (n_estimators = 100)
...
५.१ और ५.२ के लिए स्कोर/लेन (एक्स) बाहर प्रिंट । यह सभी रसद प्रतिगमन मॉडल और सभी यादृच्छिक वन मॉडल, क्रमशः की औसत सटीकता का प्रतिनिधित्व करता है । सभी N मॉडल औसत भविष्यवाणी परिणाम के रूप में लिया वर्गीकरण के साथ नए रोगियों को लागू किया जाना चाहिए

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

प्रस्तावित विधि ३६ रोगियों जो ट्रांस hepatocellular कार्सिनोमा के लिए धमनी चिकित्सा आया था करने के लिए लागू किया गया था । पच्चीस सुविधाओं की पहचान की गई थी और 1-5 चरणों का उपयोग कर बायनेरिज़ । पाँच सुविधाएँ प्रसरण और univariate संबद्धता फ़िल्टर्स संतुष्ट (चरण ५.१ और ५.२ देखें) और मॉडल प्रशिक्षण के लिए उपयोग किए गए थे । प्रत्येक रोगी qEASL प्रतिक्रिया मापदंड के अंतर्गत या तो एक उत्तरदाता या गैर-उत्तरदाता के रूप में लेबल किया गया था । मैट्रिक्स विशेषताएं इस प्रकार एक ३६ x 5 सरणी था, जबकि लक्ष्य लेबल वेक्टर ३६ x 1 था ।

उपस्कर प्रतिगमन और यादृच्छिक वन classifiers मॉडल फिटिंग के लिए इस्तेमाल किया गया । छोड़ो-एक-से-बाहर क्रॉस-सत्यापन परिणामी मॉडल्स के प्रदर्शन का आकलन करने के लिए किया गया था । दो अतिरिक्त मॉडल सिर्फ शीर्ष-दो सुविधाओं (सिरोसिस और पूर्व TACE ट्यूमर संकेत तीव्रता २७.० से अधिक की उपस्थिति) का उपयोग कर प्रशिक्षित किया गया । चित्र 1 सुविधाओं के रूप में जोड़ा गया मॉडल का प्रदर्शन दिखाता है । दोनों उपस्कर प्रतिगमन और यादृच्छिक वन मॉडल ७८% की एक समग्र सटीकता के साथ ट्रांस धमनी chemoembolization उपचार प्रतिक्रिया की भविष्यवाणी की (संवेदनशीलता ६२.५%, विशिष्टता ८२.१%, सकारात्मक भविष्यवाणी मूल्य ५०.०%, नकारात्मक पूर्वानुमान मूल्य ८८.५%) ।

चित्रा 1 : मशीन लर्निंग एल्गोरिदम का प्रदर्शन. (a, b) उपस्कर प्रतिगमन और (ग, घ) यादृच्छिक वन वर्गीकारक accuracies के रूप में सुविधाओं को जोड़ रहे हैं. विशेषताएं निंनलिखित क्रम में जोड़ा गया: 1) ethiodized तेल, 2) sorafenib, 3) सिरोसिस, 4) पूर्व transarterial chemo-embolization सापेक्ष ट्यूमर संकेत तीव्रता > 27.0, और 5) ट्यूमर की संख्या > 2 । आंकड़ा संवहनी और हस्तक्षेप रेडियोलॉजी 14 के जर्नलसे unmodified रूप में अनुमति के साथ प्रयोग किया जाता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

hepatocellular कार्सिनोमा के साथ रोगियों जो सर्जिकल लकीर के लिए उंमीदवार नहीं है अंतर धमनी चिकित्सा की पेशकश कर रहे हैं । कुछ तरीकों को निर्धारित अगर एक मरीज को पूर्वउपचार जवाब होगा मौजूद हैं । बाद उपचार मूल्यांकन तकनीक ट्यूमर आकार या ट्यूमर विपरीत में परिवर्तन पर भरोसा करते हैं । इन प्रतिक्रिया मापदंड कहा जाता है, सबसे सटीक जिगर (qEASL) कसौटी के अध्ययन के लिए मात्रात्मक यूरोपीय संघ जा रहा है के साथ । qEASL दोनों volumetric और वृद्धि के बाद चिकित्सा परिवर्तन पर निर्भर करता है प्रतिक्रिया की संभावना की भविष्यवाणी । qEASL की ताकत के बावजूद, यह फिर भी एक के बाद उपचार मूल्यांकन मानदंड है, और उपचार योजना में सहायता नहीं कर सकता ।

इस बात का आकलन करने की जरूरत है कि हस्तक्षेप करने से पहले किन रोगियों को इंट्रा-धमनी उपचारों का जवाब देने की संभावना है । इस प्रोटोकॉल में प्रदर्शित विधि नैदानिक, प्रयोगशाला और इमेजिंग सुविधाओं को शामिल किया गया एक पूर्वानुमान मॉडल में कंप्यूटर विज्ञान और सांख्यिकी के क्षेत्रों से तकनीक का उपयोग कर । एक मशीन सीखने मॉडल प्रशिक्षित किया जाता है कि नक्शे रोगियों जो अपने qEASL परिणामों के लिए इंट्रा धमनी चिकित्सा आया है से इन सुविधाओं । मॉडल तो नए रोगियों को जो इलाज से गुजरना होगा उनके qEASL केवल उनके पूर्व उपचार सुविधाओं का उपयोग कर प्रतिक्रिया की भविष्यवाणी करने के लिए लागू किया जा सकता है ।

चरण 1 मशीन लर्निंग के लिए कार्यस्थान सेटअप का वर्णन करता है । यह कैसे सेटअप करने के लिए आवश्यक टूलींग के साथ एक कार्य केंद्र पर संक्षिप्त निर्देश प्रदान करता है । चरण 2-4 कैसे नैदानिक और इमेजिंग डेटा ब्याज की सुविधाओं को प्राप्त करने के लिए पार्स किया जा सकता है के बारे में तकनीकी विवरण में जाओ । इन चरणों उपयुक्त सुविधाओं के चयन के रूप में महत्वपूर्ण है मॉडल की प्रभावशीलता का निर्धारण करेगा । सुविधा निष्कर्षण को सुगम बनाने के लिए कुछ उपचरण चुने गए । उदाहरण के लिए, रेडियोग्राफिक छवियां आमतौर पर DICOM स्वरूप में संग्रहित होती है जो छवि विश्लेषण के लिए आदर्श नहीं है । राष्ट्रीय स्वास्थ्य संस्थान (NIH) Neuroimaging शाखा Neuroimaging सूचना प्रौद्योगिकी पहल (NIfTI) मानक विकसित करने के लिए अनुसंधान के वातावरण में छवि हेरफेर की सुविधा । चरण ३.२ सुविधा निष्कर्षण की प्रक्रिया को कम करने के लिए NIfTI प्रारूप करने के लिए DICOM से रूपांतरण जरूरत पर जोर देता । जिगर और ट्यूमर मास्क NIfTI प्रारूप से निकाला जा सकता है जैसे itk-स्नैप या इसी तरह के विभाजन सॉफ्टवेयर के रूप में एक कार्यक्रम का उपयोग कर ।

प्रत्येक सुविधा, चाहे नैदानिक नोट्स या इमेजिंग डेटा से प्राप्त की गई हो, सही-गलत मानों के रूप में बायनेरिज़ की जानी चाहिए । उदाहरण के लिए, 0 से 10 तक एक सतत छवि वृद्धि ग्रैडिएंट को एक से अधिक या 5 से कम वृद्धि का प्रतिनिधित्व करने वाली किसी एकल सुविधा के लिए बायनेरिज़ किया जा सकता है । वैकल्पिक रूप से, सुविधा एकाधिक बाइनरी सुविधाओं में विभाजित किया जा सकता है: x < 3; 3 < = x < 7; 7 < = x. मशीन सीखने मॉडल है कि बाइनरी सुविधाओं पर संचालित करने के लिए ट्रेन आसान कर रहे हैं ।

चरण 2-4 के अंतिम-परिणाम y-अक्ष पर रोगियों के साथ एक बाइनरी मैट्रिक्स है, x-अक्ष पर सुविधाएँ, और qEASL प्रतिक्रिया मापदंड के तहत उस रोगी के लिए निर्धारित के रूप में परिणाम (उत्तरदाता या गैर-उत्तरदाता) का प्रतिनिधित्व करने वाले अंतिम स्तंभ । कुछ सुविधाओं के तहत प्रतिनिधित्व या अधिक एक परिणाम जनसंख्या में प्रतिनिधित्व हो सकता है । उदाहरण के लिए, यदि सभी उपचार प्रतिक्रियाएं पुरुष थे, यह गलत तरीके से निष्कर्ष निकाला जा सकता है कि पुरुष लिंग प्रतिक्रिया का तात्पर्य है । एक तरह से इस भ्रम से निपटने के लिए सभी सुविधाओं है कि दोनों प्रतिक्रिया और गैर में पाया नहीं कर रहे है हटाने के लिए है कुछ दहलीज के ऊपर ऐसे 20% के रूप में जवाब ।

अंय सुविधाओं के अध्ययन के तहत परिणाम निर्धारित करने में सीमित महत्व हो सकता है । उदाहरण के लिए, आंख का रंग संभावना है कि अंतर-धमनी चिकित्सा के बाद परिणामों के लिए अप्रासंगिक है । इस तरह की सुविधाओं के परिणाम के साथ एक कम univariate संघ होगा । परिणाम के साथ एक महत्वपूर्ण (p < ०.०५) संबद्धता है करने के लिए कोई एकल सुविधा अपेक्षित है, यद्यपि एक परिभाषित थ्रेशोल्ड के ऊपर कुछ न्यूनतम univariate सहसंबंध सुविधाओं की आवश्यकता है कि एक प्रभावी रणनीति है ।

चरण 5 प्रशिक्षण की प्रक्रिया को शामिल किया गया है और एक मशीन सीखने मॉडल लागू । यह कड़ाई से वर्णित फैशन में आगे बढ़ना आवश्यक नहीं है, जब तक कि अंत-परिणाम एक ही है । प्रशिक्षण प्रक्रिया का उपयोग करता है छोड़ एक बाहर पार मांयता जिससे n मॉडल n रोगियों में से प्रत्येक के लिए प्रशिक्षित किया जाता है । N से उत्पंन मॉडल के परिणामस्वरूप छोड़ एक बाहर पार मांयता एक अंतिम मॉडल का उत्पादन करने के लिए औसत हो सकता है ।

तकनीक भी इमेजिंग के तहत किया अंय प्रक्रियाओं के लिए लागू है । मशीन लर्निंग प्रशिक्षण रोगियों का एक सेट से सुविधाओं लेता है और उंहें एक लक्ष्य परिणाम के लिए अपने रिश्तेदार के योगदान के अनुसार वजन । भार प्रक्रिया चुना मॉडल पर निर्भर करता है; रसद प्रतिगमन मॉडल एक exponentiated रैखिक संयोजन की गणना करते हुए यादृच्छिक वन मॉडल भारित निर्णय पेड़ों का एक सेट को रोजगार । इस प्रोटोकॉल में इस्तेमाल लक्ष्य qEASL कसौटी के तहत प्रतिक्रिया थी । अन्य लक्ष्य, जैसे रोग-मुक्त अस्तित्व या जीवन वर्ष की गुणवत्ता के वर्षों के रूप में, प्रश्न के अंतर्गत वांछित परिणाम के आधार पर चुना जा सकता है.

प्रोटोकॉल की मुख्य सीमा को मैंयुअल रूप से परिभाषित करने और विचार के तहत सुविधाओं को प्राप्त करने की आवश्यकता है । यह इस तरह के नैदानिक नोट्स पार्स करने के रूप में मैन्युअल काम की एक महत्वपूर्ण राशि पर जोर देता है, ट्यूमर वॉल्यूम सेगमेंट और घावों की संख्या गिनती. डीप मशीन लर्निंग स्वचालित रूप से अपुष्ट स्रोत डेटा से सुविधाएँ प्राप्त करने का प्रयास करता है, लेकिन काफी अधिक प्रशिक्षण डेटा की आवश्यकता होती है. इस बढ़ती प्रौद्योगिकी के संदर्भों की एक किस्म में पर्यवेक्षण सीखने के लिए बेहतर होना दिखाया गया है, और संभावना छवि के दौर से गुजर रोगियों के लिए पूर्वानुमान मॉडल के अगले विकास होगा निर्देशित प्रक्रियाओं ।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

A.A. एक सॉफ्टवेयर स्वास्थ्य निष्ठा, Inc के लिए परामर्श के रूप में काम करता है कि चिकित्सा प्रतिपूर्ति के अनुकूलन के लिए नैदानिक नोटों पर इसी तरह की मशीन सीखने तकनीक कार्यरत हैं ।

J.F.G. Guerbet हेल्थकेयर, BTG, दहलीज फार्मास्यूटिकल्स (सैन फ्रांसिस्को, कैलिफोर्निया), बोस्टन वैज्ञानिक, और Terumo (Elkton, मैरीलैंड) से व्यक्तिगत शुल्क प्राप्त करता है; और (वेस्टपोर्ट, कनेक्टिकट) विज्ञान प्रयोगशालाओं के लिए एक भुगतान परामर्श दिया है ।

दूसरे लेखकों में से किसी ने भी हितों के टकराव की पहचान नहीं की है ।

Acknowledgments

A.A. छात्र अनुसंधान, येल स्कूल ऑफ मेडिसिन के कार्यालय से धन समर्थन प्राप्त किया ।

L.J.S. स्वास्थ्य के राष्ट्रीय संस्थानों से अनुदान प्राप्त करता है (NIH/NCI R01CA206180), Leopoldina Postdoctoral फैलोशिप, और रॉल्फ Guenther (रेडियोलॉजिकल, जर्मनी) विज्ञान फाउंडेशन ।

J.C. स्वास्थ्य के राष्ट्रीय संस्थानों से अनुदान प्राप्त करता है (NIH/NCI R01CA206180), फिलिप्स हेल्थकेयर, और वैज्ञानिक अनुसंधान और विकास के लिए जर्मन-इजरायल फाउंडेशन (यरूशलेम, इजराइल और Neuherberg, जर्मनी); और रेडियोलॉजिकल विज्ञान के रॉल्फ डब्ल्यू Guenther फाउंडेशन और चैरिटेबल बर्लिन स्वास्थ्य नैदानिक वैज्ञानिक कार्यक्रम (बर्लिन, जर्मनी) संस्थान से छात्रवृत्ति ।

J.S.D. और एमएल स्वास्थ्य के राष्ट्रीय संस्थानों (NIH/NCI R01CA206180) और फिलिप्स हेल्थकेयर (सर्वश्रेष्ठ, नीदरलैंड) से अनुदान प्राप्त करते हैं ।

J.F.G. स्वास्थ्य के राष्ट्रीय संस्थानों से अनुदान प्राप्त करता है (NIH/NCI R01CA206180), फिलिप्स हेल्थकेयर, BTG (लंदन, यूनाइटेड किंगडम), बोस्टन वैज्ञानिक (मार्लबोरो, मैसाचुसेट्स), और Guerbet हेल्थकेयर (Villepinte, फ्रांस)

Materials

Name	Company	Catalog Number	Comments
Computer workstation	N/A	N/A	Intel Core 2 Duo or higher CPU at 2.0 GHz; 4 GB or more system memory; POSIX-compliant operating system (Linux or Mac OS) or Microsoft Windows 7; User permissions for executing programs and saving files
Anaconda Python 3	Anaconda, Inc.	Version 3.6	Python 3 system and libraries packaged for scientists and researchers
DICOM to NIfTI	NeuroImaging Tools & Resources Collaboratory	Version 1.0 (4/4/2018 release)	Standalone program for converting DICOM imaging files to NIfTI format
Sublime Text Editor	Sublime HQ Pty Ltd	Version 3 (Build 3143)	Text-editor for writing Python code
Required Python Libraries	N/A	Version 3.2.25 (nltk) Version 0.19.1 (scikit-learn)	Natural Language Toolkit (nltk) Scikit-learn
ITK-SNAP	N/A	Version 3.6.0	Optional toolkit for performing segmentation of organ systems in medical images.