Summary
इंट्रा धमनी चिकित्सा hepatocellular कार्सिनोमा जो शल्य चिकित्सा लकीर से गुजरना नहीं कर सकते के साथ रोगियों के लिए देखभाल के मानक हैं । इन उपचारों के जवाब की भविष्यवाणी के लिए एक विधि प्रस्तावित है । तकनीक का उपयोग करता है पूर्व प्रक्रियात्मक नैदानिक, जनसांख्यिकीय, और इमेजिंग जानकारी मशीन सीखने के लिए उपचार से पहले प्रतिक्रिया की भविष्यवाणी करने में सक्षम मॉडल ट्रेन ।
Abstract
इंट्रा धमनी चिकित्सा hepatocellular कार्सिनोमा जो शल्य चिकित्सा लकीर से गुजरना नहीं कर सकते के साथ रोगियों के लिए देखभाल के मानक हैं । इस अध्ययन का उद्देश्य एक पद्धति विकसित करने के लिए हस्तक्षेप करने से पहले अंतर धमनी उपचार के जवाब की भविष्यवाणी करने के लिए किया गया था ।
विधि परिणाम की भविष्यवाणी के लिए एक सामांय रूपरेखा प्रदान करता है पहले अंतर धमनी चिकित्सा के लिए । यह रोगियों के एक पलटन भर में नैदानिक, जनसांख्यिकीय और इमेजिंग डेटा पूलिंग शामिल है और इन आंकड़ों का उपयोग कर एक मॉडल सीखने की मशीन को प्रशिक्षित करने के लिए । प्रशिक्षित मॉडल नए रोगियों के लिए लागू किया जाता है ताकि अंतर धमनी चिकित्सा के जवाब की उनकी संभावना की भविष्यवाणी करने के लिए ।
विधि N रोगियों जो पहले से ही ट्रांस धमनी चिकित्सा आया है से नैदानिक, जनसांख्यिकीय और इमेजिंग डेटा के अधिग्रहण और पार्सिंग पर जोर देता है । इन आंकड़ों असतत सुविधाओं में पार्स कर रहे है (उंर, लिंग, सिरोसिस, ट्यूमर वृद्धि की डिग्री, आदि) और सही/झूठी मूल्यों (जैसे, ६० से अधिक आयु, पुरुष लिंग, एक सेट सीमा से परे ट्यूमर वृद्धि, आदि) में बायनेरिज़ । कम विचरण सुविधाओं और परिणाम के साथ कम univariate संघों के साथ सुविधाओं को हटा रहे हैं । प्रत्येक इलाज रोगी के अनुसार लेबल किया गया है कि क्या वे जवाब या इलाज के लिए जवाब नहीं दिया । प्रत्येक प्रशिक्षण रोगी इस प्रकार बाइनरी सुविधाओं और एक परिणाम लेबल का एक सेट द्वारा प्रतिनिधित्व किया है । मशीन लर्निंग मॉडल के साथ एन -1 रोगियों का उपयोग कर प्रशिक्षित कर रहे है छोड़ दिया रोगी पर परीक्षण । यह प्रक्रिया N रोगियों में से प्रत्येक के लिए दोहराया है । N मॉडल के लिए एक अंतिम मॉडल पर पहुंचने औसत रहे हैं ।
तकनीक एक्सटेंसिबल है और भविष्य में अतिरिक्त सुविधाओं को शामिल करने के लिए सक्षम बनाता है । यह भी एक सामांय प्रक्रिया है कि चिकित्सीय अनुसंधान के लिए लागू किया जा सकता है हस्तक्षेप रेडियोलॉजी के बाहर प्रश्न । मुख्य सीमा प्रत्येक रोगी से मैंयुअल रूप से सुविधाओं को प्राप्त करने की आवश्यकता है । मशीन लर्निंग नामक एक लोकप्रिय आधुनिक रूप गहरी सीखने इस सीमा से ग्रस्त नहीं है, लेकिन बड़े डेटासेट की आवश्यकता है ।
Introduction
hepatocellular कार्सिनोमा के साथ रोगियों जो शल्य उंमीदवारों नहीं है अंतर धमनी उपचार1,2,3की पेशकश कर रहे हैं । वहां कोई एक मीट्रिक है कि निर्धारित करता है कि एक मरीज को इलाज से पहले एक अंतर धमनी चिकित्सा का जवाब होगा प्रशासित है । इस अध्ययन का उद्देश्य एक तरीका है कि मशीन सीखने से तरीकों को लागू करने से उपचार प्रतिक्रिया भविष्यवाणी का प्रदर्शन किया गया । इस तरह के मॉडल चिकित्सकों और रोगियों को मार्गदर्शन जब चुनने के लिए कि एक इलाज के साथ आगे बढ़ना है प्रदान करते हैं ।
प्रोटोकॉल प्रशिक्षण और प्राथमिक रोगी डेटा (नैदानिक नोट्स, जनसांख्यिकी, प्रयोगशाला डेटा, और इमेजिंग) से शुरू एक मॉडल को अद्यतन करने के लिए एक reproducible प्रक्रिया पर जोर देता है । डेटा प्रारंभिक रूप से विशिष्ट सुविधाओं के लिए पार्स किया जाता है, प्रत्येक रोगी के साथ बाइनरी सुविधाओं का एक सेट और एक बाइनरी परिणाम लक्ष्य लेबल का प्रतिनिधित्व करते हैं । परिणाम लेबल hepatocellular थेरेपी4,5,6,7के लिए एक स्थापित इमेजिंग आधारित प्रतिक्रिया मापदंड का उपयोग कर निर्धारित किया जाता है । सुविधाओं और लक्ष्य लेबल मशीन सीखने सॉफ्टवेयर है कि एक विशिष्ट अधिगम मॉडल (रसद प्रतिगमन या यादृच्छिक वन)8,9,10के तहत सुविधाओं और परिणामों के बीच मानचित्रण सीखता को पारित कर रहे हैं । इसी तरह की तकनीक के निदान और उपचार भविष्यवाणी11,12,13के लिए रेडियोलॉजी और कैंसर अनुसंधान के अंय क्षेत्रों में लागू किया गया है ।
विधि कंप्यूटर विज्ञान से हस्तक्षेप रेडियोलॉजी के क्षेत्र में तकनीक के अनुकूल है । पारंपरिक महत्व के हस्तक्षेप रेडियोलॉजी में अध्ययन, और सामांय में दवा, मोनो या oligo-सुविधा के विश्लेषण पर भरोसा करते हैं । उदाहरण के लिए, अंत चरण जिगर की बीमारी के लिए मॉडल जिगर की बीमारी की हद का आकलन करने के लिए पांच नैदानिक मैट्रिक्स को शामिल किया गया. प्रस्तावित विधि का लाभ उदार रूप से सुविधाओं को जोड़ने की क्षमता है; पच्चीस सुविधाओं का उदाहरण विश्लेषण में माना जाता है. अतिरिक्त सुविधाओं के रूप में वांछित जोड़ा जा सकता है ।
तकनीक अंय रेडियोग्राफिक हस्तक्षेप जहां पूर्व और बाद में हस्तक्षेप इमेजिंग डेटा उपलब्ध है के लिए लागू किया जा सकता है । उदाहरण के लिए, percutaneous उपचार के बाद परिणाम एक समान तरीके से भविष्यवाणी की जा सकती है । अध्ययन के मुख्य सीमा मॉडल में शामिल करने के लिए मैनुअल उपपादरी सुविधाओं की जरूरत है । डेटा उपचारात्मक और सुविधा निष्कर्षण व्यवसायी के लिए समय लेने वाली है और इस तरह की मशीन सीखने मॉडल के नैदानिक गोद लेने में बाधा हो सकती है ।
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. मशीन लर्निंग के लिए कार्यस्थान सेटअप
- निंन के साथ एक सिस्टम का उपयोग करें:
इंटेल कोर 2 डुओ या उच्च २.० GHz पर सीपीयू
4 GB या अधिक सिस्टम स्मृति
POSIX-आज्ञाकारी ऑपरेटिंग सिस्टम (लिनक्स या मैक ओएस) या माइक्रोसॉफ्ट विंडोज 7
प्रोग्राम निष्पादित करने और फ़ाइलों को सहेजने के लिए उपयोगकर्ता अनुमतियां - निंन उपकरण स्थापित करें:
एनाकोंडा Python3: https://www.anaconda.com/download
DICOM NIfTI कनवर्टर (dcm2niix)-https://github.com/rordenlab/dcm2niix
उदात्त पाठ संपादक: https://www.sublimetext.com/
itk-स्नैप (वैकल्पिक): http://www.itksnap.org- एनाकोंडा Python3, dcm2nii और उदात्त पाठ स्थापित करें, ऑपरेटिंग सिस्टम विशिष्ट स्थापना चरणों के लिए उनके संबंधित वेबसाइटों पर जाएं ।
- बनाएं और एक एनाकोंडा वातावरण को सक्रिय करें ।
conda create--नाम mlenv
conda कध mlenv - मशीन लर्निंग के लिए एनाकोंडा संकुल स्थापित करें ।
conda स्थापित numpy scipy scikit-learn nltk nibabel
नोट: nltk पैकेज plaintext नैदानिक नोट्स पार्स करने के लिए उपयोगी है, जबकि nibabel पैकेज चिकित्सा छवि हेरफेर के लिए उपयोगी कार्य प्रदान करता है । itk-स्नैप अंगों और चिकित्सा छवियों से ट्यूमर के विभाजन के लिए स्थापित किया जा सकता है । यह विशिष्ट क्षेत्रों के लिए सुविधाओं को विवश करने के लिए उपयोगी है ।
2. Plaintext नैदानिक नोट्स और संरचित नैदानिक डेटा से सुविधा निष्कर्षण
- प्रोजेक्ट के लिए कोई पैरेंट निर्देशिका बनाएँ और पैरेंट फ़ोल्डर में प्रत्येक रोगी के लिए एक फ़ोल्डर बनाएँ । निर्देशिका संरचना सदृश होनी चाहिए:
परियोजना
Project/Patient_1/
Project/Patient_2/
Project/Patient_3/
... - इलेक्ट्रॉनिक मेडिकल रिकॉर्ड (EMR) से plaintext नैदानिक नोट्स प्राप्त करें । EMR के माध्यम से या अस्पताल सूचना प्रौद्योगिकी (आईटी) कार्यालय के माध्यम से एक डेटा डंप के माध्यम से मैंयुअल रूप से नोट्स प्राप्त करें । उनके संबंधित फ़ोल्डरों में प्रत्येक रोगी के नोटों की दुकान ।
Project/Patient_1/History_and_Physical. txt
Project/Patient_1/Procedure_Note. txt- निर्णय लिया है जो नैदानिक सुविधाओं को मॉडल में शामिल करने के लिए । इन सुविधाओं के लिए plaintext क्लिनिक नोट्स को पार्स । अजगर प्राकृतिक भाषा Toolkit (nltk) पुस्तकालय वाक्यों में बंटवारे दस्तावेजों के लिए उपयोगी आदेश प्रदान करता है । प्रत्येक वाक्य में पीलिया जैसे उचित शब्दों की खोज की जा सकती है । प्रति पंक्ति एक सुविधा के साथ एक फ़ाइल में प्रत्येक रोगी की सुविधाओं को स्टोर ।
Project/Patient_1/features. txt:
आयु ६७
सेक्स पुरुष
एल्ब्युमिन ३.१
cirrhotic कोई
hepatitis_c कोई
... - गैर-बाइनरी सुविधाओं के लिए, सभी रोगियों में प्रत्येक सुविधा का माध्य मान लें । Binarize प्रत्येक सुविधा के रूप में एक सच्चे (1) या झूठी (0) मूल्य औसत मूल्य पर आधारित है ।
Project/Patient_1/Binary_Features. txt:
age_over_60 0
male_sex १
albumin_less_than_ 3.5 1
presence_of_cirrhosis 0
hepatitis_c 0
...
- निर्णय लिया है जो नैदानिक सुविधाओं को मॉडल में शामिल करने के लिए । इन सुविधाओं के लिए plaintext क्लिनिक नोट्स को पार्स । अजगर प्राकृतिक भाषा Toolkit (nltk) पुस्तकालय वाक्यों में बंटवारे दस्तावेजों के लिए उपयोगी आदेश प्रदान करता है । प्रत्येक वाक्य में पीलिया जैसे उचित शब्दों की खोज की जा सकती है । प्रति पंक्ति एक सुविधा के साथ एक फ़ाइल में प्रत्येक रोगी की सुविधाओं को स्टोर ।
3. चिकित्सा छवियों से सुविधा निष्कर्षण
नोट: कोड उदाहरण के लिए चरण 3 अनुपूरक सामग्री देखें ।
- अस्पताल से पूर्व और बाद चिकित्सा चुंबकीय अनुनाद DICOM छवियों को डाउनलोड करें शुर । इसी रोगी फ़ोल्डर में छवियों को स्टोर ।
परियोजना
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast. डीसीएम
Project/Patient_1/Pre_TACE_MRI_Arterial. डीसीएम
Project/Patient_1/Post_TACE_MRI_Pre-Constrast. डीसीएम
Project/Patient_1/Post_TACE_MRI_Arterial. डीसीएम - dcm2niix प्रोग्राम का उपयोग करके DICOM छवियों को NIfTI स्वरूप में कनवर्ट करें । निंन आदेश निर्दिष्ट फ़ोल्डर में सभी. डीसीएम छवियां कनवर्ट करता है । सभी रोगियों के लिए दोहराएँ ।
dcm2niix Project/Patient_1/
dcm2niix Project/Patient_2/ - अजगर में प्रत्येक NIfTI फ़ाइल लोड ।
आयात nibabel
image = nibabel. लोड (' Project/Patient_1/Pre_TACE_MRI_Pre-Contrast. डीसीएम ')- प्रत्येक छवि का ओरिएंटेशन Canonicalize । यह सुनिश्चित करता है कि एक्स, वाई, और जेड अक्ष समान हैं, छवियों को प्राप्त करने के लिए इस्तेमाल मशीन की परवाह किए बिना ।
cImage = nibabel. as _closest_canonical (image)
- प्रत्येक छवि का ओरिएंटेशन Canonicalize । यह सुनिश्चित करता है कि एक्स, वाई, और जेड अक्ष समान हैं, छवियों को प्राप्त करने के लिए इस्तेमाल मशीन की परवाह किए बिना ।
- प्रत्येक छवि के लिए बाइनरी लीवर और ट्यूमर मास्क खंड करने के लिए itk-स्नैप (या एक समकक्ष सॉफ्टवेयर पैकेज) का प्रयोग करें ।
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Liver_Mask. bin
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Tumor_Mask. bin - अजगर में जिगर और ट्यूमर मास्क पढ़ें । नीचे दिए गए कोड को दर्शाता है कैसे अभिविन्यास मुद्दों को सही करने के लिए श्री छवियों के रूप में एक ही विहित कुल्हाड़ियों के साथ मुखौटे ओरिएंट ।
np के रूप में आयात numpy
ओपन के साथ (liver_mask_file, ' आरबी ') के रूप में एफ:
liver_mask = f. read ()
liver_mask = np. fromstring (liver_mask, dtype = ' uint8 ')
liver_mask = np. reshape (liver_mask, रचनाकार. आकृति, क्रम = ' F ')
liver_mask = liver_mask [:,::-1,:]
liver_mask [liver_mask > 0] = 1- यकृत और ट्यूमर युक्त voxels को अलग करने के लिए जिगर और ट्यूमर मास्क का प्रयोग करें ।
यकृत = np. copy (cImage)
जिगर [liver_mask < = 0] = 0
- यकृत और ट्यूमर युक्त voxels को अलग करने के लिए जिगर और ट्यूमर मास्क का प्रयोग करें ।
- मतलब जिगर वृद्धि की गणना की सुविधा ।
mean_liver_enhancement = meaning (जिगर)- जिगर की मात्रा सुविधा की गणना.
pixdim = cImage. header [' pixdim ']
इकाइयों = पूर्व शीर्षक [' xyzt_units ']
dx, उपसंचालक, dz = pre_pixdim [१:४]
liver_volume = लंबाई (जिगर) * dx * dx * dz - वैकल्पिक वांछित के रूप में अतिरिक्त सुविधाओं की गणना ।
- जिगर की मात्रा सुविधा की गणना.
- छवि सुविधाओं के साथ रोगी-विशिष्ट सुविधाओं फ़ाइल का अद्यतन करें ।
Project/Patient_1/features. txt:
आयु ६७
सेक्स पुरुष
एल्ब्युमिन ३.१
cirrhotic कोई
hepatitis_c कोई
pre_tace_mean_liver_enhancement ७८
pre_tace_liver_volume १००००- प्रत्येक इमेजिंग सुविधा के लिए माध्य मानों की गणना और चरण -8 में के रूप में binarize.
Project/Patient_1/Binary_Features. txt:
age_over_60 0
male_sex १
albumin_less_than_ 3.5 1
presence_of_cirrhosis 0
hepatitis_c 0
pre_tace_mean_liver_enhancement १
pre_tace_liver_volume 0
- प्रत्येक इमेजिंग सुविधा के लिए माध्य मानों की गणना और चरण -8 में के रूप में binarize.
4. सुविधा एकत्रीकरण और कमी
नोट: कोड उदाहरण के लिए चरण 4 अनुपूरक सामग्री देखें ।
- प्रत्येक रोगी के लिए y-अक्ष और x-अक्ष पर सुविधाओं पर रोगियों के साथ एक स्प्रेडशीट में Binary_Features. txt फ़ाइलों का मिश्रण ।
रोगी आयु > ६० पुरुष सेक्स एल्ब्युमिन < ३.५ सिरोसिस की उपस्थिति हेपेटाइटिस सी मौजूद जिगर की वृद्धि का मतलब > ५० जिगर की मात्रा > २०००० 1 0 1 1 0 0 1 0 2 1 1 1 0 0 0 0 3 0 1 1 0 1 0 0 - अंतिम स्तंभ के रूप में qEASL परिणाम प्रतिसाद लेबल्स जोड़ें ।
रोगी आयु > ६० पुरुष सेक्स एल्ब्युमिन < ३.५ सिरोसिस की उपस्थिति हेपेटाइटिस सी मौजूद जिगर की वृद्धि का मतलब > ५० जिगर की मात्रा > २०००० qEASL उत्तरदाता 1 0 1 1 0 0 1 0 1 2 1 1 1 0 0 0 0 1 3 0 1 1 0 1 0 0 0 - स्प्रेडशीट टैब-सीमांकित फ़ाइल के रूप में निर्यात करें ।
Project/ML_Matrix. tsv:
रोगी > ६० पुरुष सेक्स एल्ब्युमिन < ३.५ की उपस्थिति सिरोसिस हेपेटाइटिस सी वर्तमान मतलब जिगर वृद्धि > ५० जिगर की मात्रा > २०००० qEASL उत्तरदाता
१ ० १ १ ० ० १ ० १
२ १ १ १ ० ० ० ० १
३ ० १ १ ० १ ० ० ०
- अंतिम स्तंभ के रूप में qEASL परिणाम प्रतिसाद लेबल्स जोड़ें ।
- विचार से कम-प्रसरण सुविधाओं को निकालें ।
np के रूप में आयात numpy
से sklearn. feature_selection आयात VarianceThreshold
# बाइनरी मैट्रिक्स में पढ़ें ।
विशेषताएं = []
labels = []
के लिए मैं, गणना में एल (sys. stdin):
अगर मैं = = 0
जारी
n_fs_L = L. strip (). बखर (' \t ')
features. के पीछे ([नाव (_) के लिए _ n_fs_L में [1:-1]])
labels. पीछे (n_fs_L [-1])
X = np. सरणी (विशेषताएं)
y = np. सरणी (लेबल)
# दोनों प्रतिक्रिया और गैर respnders के कम से 20% में प्रदर्शित होने सुविधाओं की गणना ।
मॉडल = VarianceThreshold (थ्रेशोल्ड = 0.8 * (1-०.८))
X_new = model. fit _transform (X, y)
पुरुष सेक्स, एल्ब्युमिन < ३.५, सिरोसिस की मौजूदगी और लिवर की मात्रा > २००० फीचर्स निकाले गए हैं ।रोगी आयु > ६० हेपेटाइटिस सी मौजूद जिगर की वृद्धि का मतलब > ५० qEASL उत्तरदाता 1 0 0 1 1 2 1 0 0 1 3 0 1 0 0 - परिणाम के साथ कम univariate-संबद्धता के साथ सुविधाओं को निकालें । फ़िल्टर केवल उन सुविधाओं है कि ४.२ पारित कर दिया । ceil बरकरार रखें (लॉग2(एन)) विशेषताएं, जहां N संख्या रोगियों है । Ceil (लॉग2(3)) = 2.
गणित आयात करें
से sklearn. feature_selection आयात SelectKBest
से sklearn. feature_selection आयात chi2
# 4.2.1 में के रूप में बाइनरी मैट्रिक्स में पढ़ें
...
# गणना शीर्ष ceil (log2 (एन)) univariate एसोसिएशन द्वारा सुविधाएं ।
k = मठ. ceil (log2 (लंबाई (y)))
मॉडल = SelectKBest (chi2, कश्मीर = कश्मीर)
X_new = model. fit _transform (X, y)
पुरुष सेक्स आयु > ६० सुविधा 4.2.1 से शेष सुविधाओं से हटा दिया गया है ।
रोगी | हेपेटाइटिस सी मौजूद | जिगर की वृद्धि का मतलब > ५० | qEASL उत्तरदाता |
1 | 0 | 1 | 1 |
2 | 0 | 0 | 1 |
3 | 1 | 0 | 0 |
5. मॉडल प्रशिक्षण और परीक्षण
कोड उदाहरण के लिए चरण 5 अनुपूरक सामग्री देखें
- ४.३ से बाइनरी सुविधाएँ मैट्रिक्स का उपयोग कर एक रसद प्रतिगमन मॉडल को प्रशिक्षित.
गणित आयात करें
से sklearn. linear_model आयात LogisticRegression
# ४.२ और ४.३ में के रूप में बाइनरी मैट्रिक्स में पढ़ें ।
...
# प्रत्येक रोगी के लिए, अंय सभी रोगियों पर एक मॉडल को प्रशिक्षित ।
स्कोर = ०.०
मॉडल = []
लेन (एक्स) में रोगी के लिए:
# सभी लेकिन मरीजों में से एक पर ट्रेन मॉडल ।
train_x = np. सरणी ([_ for i, _ में गणना (x) यदि i! = रोगी])
train_y = np. सरणी ([_ for i, _ में गणना (y) यदि i! = रोगी])
model = LogisticRegression (C = 1e15)
मॉडल. fit (train_x, train_y)
# परीक्षण पर छोड़ दिया रोगी ।
y_prediction = model. भविष्यवाणी (एक्स [रोगी])
यदि y_prediction = = y [रोगी]:
स्कोर + = 1
मॉडल. पीछे जोड़ें (मॉडल) - 4.2.2 से द्विआधारी सुविधाओं मैट्रिक्स का उपयोग कर एक यादृच्छिक वन मॉडल ट्रेन । चरण 5.2.1 करने के लिए समान हैं, सिवाय मॉडल प्रारंभ निम्नानुसार अद्यतन किया जाना चाहिए:
से sklearn. पहनावा आयात RandomForestClassifier
...
मॉडल = RandomForestClassifier (n_estimators = 100)
... - ५.१ और ५.२ के लिए स्कोर/लेन (एक्स) बाहर प्रिंट । यह सभी रसद प्रतिगमन मॉडल और सभी यादृच्छिक वन मॉडल, क्रमशः की औसत सटीकता का प्रतिनिधित्व करता है । सभी N मॉडल औसत भविष्यवाणी परिणाम के रूप में लिया वर्गीकरण के साथ नए रोगियों को लागू किया जाना चाहिए
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
प्रस्तावित विधि ३६ रोगियों जो ट्रांस hepatocellular कार्सिनोमा के लिए धमनी चिकित्सा आया था करने के लिए लागू किया गया था । पच्चीस सुविधाओं की पहचान की गई थी और 1-5 चरणों का उपयोग कर बायनेरिज़ । पाँच सुविधाएँ प्रसरण और univariate संबद्धता फ़िल्टर्स संतुष्ट (चरण ५.१ और ५.२ देखें) और मॉडल प्रशिक्षण के लिए उपयोग किए गए थे । प्रत्येक रोगी qEASL प्रतिक्रिया मापदंड के अंतर्गत या तो एक उत्तरदाता या गैर-उत्तरदाता के रूप में लेबल किया गया था । मैट्रिक्स विशेषताएं इस प्रकार एक ३६ x 5 सरणी था, जबकि लक्ष्य लेबल वेक्टर ३६ x 1 था ।
उपस्कर प्रतिगमन और यादृच्छिक वन classifiers मॉडल फिटिंग के लिए इस्तेमाल किया गया । छोड़ो-एक-से-बाहर क्रॉस-सत्यापन परिणामी मॉडल्स के प्रदर्शन का आकलन करने के लिए किया गया था । दो अतिरिक्त मॉडल सिर्फ शीर्ष-दो सुविधाओं (सिरोसिस और पूर्व TACE ट्यूमर संकेत तीव्रता २७.० से अधिक की उपस्थिति) का उपयोग कर प्रशिक्षित किया गया । चित्र 1 सुविधाओं के रूप में जोड़ा गया मॉडल का प्रदर्शन दिखाता है । दोनों उपस्कर प्रतिगमन और यादृच्छिक वन मॉडल ७८% की एक समग्र सटीकता के साथ ट्रांस धमनी chemoembolization उपचार प्रतिक्रिया की भविष्यवाणी की (संवेदनशीलता ६२.५%, विशिष्टता ८२.१%, सकारात्मक भविष्यवाणी मूल्य ५०.०%, नकारात्मक पूर्वानुमान मूल्य ८८.५%) ।
चित्रा 1 : मशीन लर्निंग एल्गोरिदम का प्रदर्शन. (a, b) उपस्कर प्रतिगमन और (ग, घ) यादृच्छिक वन वर्गीकारक accuracies के रूप में सुविधाओं को जोड़ रहे हैं. विशेषताएं निंनलिखित क्रम में जोड़ा गया: 1) ethiodized तेल, 2) sorafenib, 3) सिरोसिस, 4) पूर्व transarterial chemo-embolization सापेक्ष ट्यूमर संकेत तीव्रता > 27.0, और 5) ट्यूमर की संख्या > 2 । आंकड़ा संवहनी और हस्तक्षेप रेडियोलॉजी 14 के जर्नलसे unmodified रूप में अनुमति के साथ प्रयोग किया जाता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।
Subscription Required. Please recommend JoVE to your librarian.
Discussion
hepatocellular कार्सिनोमा के साथ रोगियों जो सर्जिकल लकीर के लिए उंमीदवार नहीं है अंतर धमनी चिकित्सा की पेशकश कर रहे हैं । कुछ तरीकों को निर्धारित अगर एक मरीज को पूर्वउपचार जवाब होगा मौजूद हैं । बाद उपचार मूल्यांकन तकनीक ट्यूमर आकार या ट्यूमर विपरीत में परिवर्तन पर भरोसा करते हैं । इन प्रतिक्रिया मापदंड कहा जाता है, सबसे सटीक जिगर (qEASL) कसौटी के अध्ययन के लिए मात्रात्मक यूरोपीय संघ जा रहा है के साथ । qEASL दोनों volumetric और वृद्धि के बाद चिकित्सा परिवर्तन पर निर्भर करता है प्रतिक्रिया की संभावना की भविष्यवाणी । qEASL की ताकत के बावजूद, यह फिर भी एक के बाद उपचार मूल्यांकन मानदंड है, और उपचार योजना में सहायता नहीं कर सकता ।
इस बात का आकलन करने की जरूरत है कि हस्तक्षेप करने से पहले किन रोगियों को इंट्रा-धमनी उपचारों का जवाब देने की संभावना है । इस प्रोटोकॉल में प्रदर्शित विधि नैदानिक, प्रयोगशाला और इमेजिंग सुविधाओं को शामिल किया गया एक पूर्वानुमान मॉडल में कंप्यूटर विज्ञान और सांख्यिकी के क्षेत्रों से तकनीक का उपयोग कर । एक मशीन सीखने मॉडल प्रशिक्षित किया जाता है कि नक्शे रोगियों जो अपने qEASL परिणामों के लिए इंट्रा धमनी चिकित्सा आया है से इन सुविधाओं । मॉडल तो नए रोगियों को जो इलाज से गुजरना होगा उनके qEASL केवल उनके पूर्व उपचार सुविधाओं का उपयोग कर प्रतिक्रिया की भविष्यवाणी करने के लिए लागू किया जा सकता है ।
चरण 1 मशीन लर्निंग के लिए कार्यस्थान सेटअप का वर्णन करता है । यह कैसे सेटअप करने के लिए आवश्यक टूलींग के साथ एक कार्य केंद्र पर संक्षिप्त निर्देश प्रदान करता है । चरण 2-4 कैसे नैदानिक और इमेजिंग डेटा ब्याज की सुविधाओं को प्राप्त करने के लिए पार्स किया जा सकता है के बारे में तकनीकी विवरण में जाओ । इन चरणों उपयुक्त सुविधाओं के चयन के रूप में महत्वपूर्ण है मॉडल की प्रभावशीलता का निर्धारण करेगा । सुविधा निष्कर्षण को सुगम बनाने के लिए कुछ उपचरण चुने गए । उदाहरण के लिए, रेडियोग्राफिक छवियां आमतौर पर DICOM स्वरूप में संग्रहित होती है जो छवि विश्लेषण के लिए आदर्श नहीं है । राष्ट्रीय स्वास्थ्य संस्थान (NIH) Neuroimaging शाखा Neuroimaging सूचना प्रौद्योगिकी पहल (NIfTI) मानक विकसित करने के लिए अनुसंधान के वातावरण में छवि हेरफेर की सुविधा । चरण ३.२ सुविधा निष्कर्षण की प्रक्रिया को कम करने के लिए NIfTI प्रारूप करने के लिए DICOM से रूपांतरण जरूरत पर जोर देता । जिगर और ट्यूमर मास्क NIfTI प्रारूप से निकाला जा सकता है जैसे itk-स्नैप या इसी तरह के विभाजन सॉफ्टवेयर के रूप में एक कार्यक्रम का उपयोग कर ।
प्रत्येक सुविधा, चाहे नैदानिक नोट्स या इमेजिंग डेटा से प्राप्त की गई हो, सही-गलत मानों के रूप में बायनेरिज़ की जानी चाहिए । उदाहरण के लिए, 0 से 10 तक एक सतत छवि वृद्धि ग्रैडिएंट को एक से अधिक या 5 से कम वृद्धि का प्रतिनिधित्व करने वाली किसी एकल सुविधा के लिए बायनेरिज़ किया जा सकता है । वैकल्पिक रूप से, सुविधा एकाधिक बाइनरी सुविधाओं में विभाजित किया जा सकता है: x < 3; 3 < = x < 7; 7 < = x. मशीन सीखने मॉडल है कि बाइनरी सुविधाओं पर संचालित करने के लिए ट्रेन आसान कर रहे हैं ।
चरण 2-4 के अंतिम-परिणाम y-अक्ष पर रोगियों के साथ एक बाइनरी मैट्रिक्स है, x-अक्ष पर सुविधाएँ, और qEASL प्रतिक्रिया मापदंड के तहत उस रोगी के लिए निर्धारित के रूप में परिणाम (उत्तरदाता या गैर-उत्तरदाता) का प्रतिनिधित्व करने वाले अंतिम स्तंभ । कुछ सुविधाओं के तहत प्रतिनिधित्व या अधिक एक परिणाम जनसंख्या में प्रतिनिधित्व हो सकता है । उदाहरण के लिए, यदि सभी उपचार प्रतिक्रियाएं पुरुष थे, यह गलत तरीके से निष्कर्ष निकाला जा सकता है कि पुरुष लिंग प्रतिक्रिया का तात्पर्य है । एक तरह से इस भ्रम से निपटने के लिए सभी सुविधाओं है कि दोनों प्रतिक्रिया और गैर में पाया नहीं कर रहे है हटाने के लिए है कुछ दहलीज के ऊपर ऐसे 20% के रूप में जवाब ।
अंय सुविधाओं के अध्ययन के तहत परिणाम निर्धारित करने में सीमित महत्व हो सकता है । उदाहरण के लिए, आंख का रंग संभावना है कि अंतर-धमनी चिकित्सा के बाद परिणामों के लिए अप्रासंगिक है । इस तरह की सुविधाओं के परिणाम के साथ एक कम univariate संघ होगा । परिणाम के साथ एक महत्वपूर्ण (p < ०.०५) संबद्धता है करने के लिए कोई एकल सुविधा अपेक्षित है, यद्यपि एक परिभाषित थ्रेशोल्ड के ऊपर कुछ न्यूनतम univariate सहसंबंध सुविधाओं की आवश्यकता है कि एक प्रभावी रणनीति है ।
चरण 5 प्रशिक्षण की प्रक्रिया को शामिल किया गया है और एक मशीन सीखने मॉडल लागू । यह कड़ाई से वर्णित फैशन में आगे बढ़ना आवश्यक नहीं है, जब तक कि अंत-परिणाम एक ही है । प्रशिक्षण प्रक्रिया का उपयोग करता है छोड़ एक बाहर पार मांयता जिससे n मॉडल n रोगियों में से प्रत्येक के लिए प्रशिक्षित किया जाता है । N से उत्पंन मॉडल के परिणामस्वरूप छोड़ एक बाहर पार मांयता एक अंतिम मॉडल का उत्पादन करने के लिए औसत हो सकता है ।
तकनीक भी इमेजिंग के तहत किया अंय प्रक्रियाओं के लिए लागू है । मशीन लर्निंग प्रशिक्षण रोगियों का एक सेट से सुविधाओं लेता है और उंहें एक लक्ष्य परिणाम के लिए अपने रिश्तेदार के योगदान के अनुसार वजन । भार प्रक्रिया चुना मॉडल पर निर्भर करता है; रसद प्रतिगमन मॉडल एक exponentiated रैखिक संयोजन की गणना करते हुए यादृच्छिक वन मॉडल भारित निर्णय पेड़ों का एक सेट को रोजगार । इस प्रोटोकॉल में इस्तेमाल लक्ष्य qEASL कसौटी के तहत प्रतिक्रिया थी । अन्य लक्ष्य, जैसे रोग-मुक्त अस्तित्व या जीवन वर्ष की गुणवत्ता के वर्षों के रूप में, प्रश्न के अंतर्गत वांछित परिणाम के आधार पर चुना जा सकता है.
प्रोटोकॉल की मुख्य सीमा को मैंयुअल रूप से परिभाषित करने और विचार के तहत सुविधाओं को प्राप्त करने की आवश्यकता है । यह इस तरह के नैदानिक नोट्स पार्स करने के रूप में मैन्युअल काम की एक महत्वपूर्ण राशि पर जोर देता है, ट्यूमर वॉल्यूम सेगमेंट और घावों की संख्या गिनती. डीप मशीन लर्निंग स्वचालित रूप से अपुष्ट स्रोत डेटा से सुविधाएँ प्राप्त करने का प्रयास करता है, लेकिन काफी अधिक प्रशिक्षण डेटा की आवश्यकता होती है. इस बढ़ती प्रौद्योगिकी के संदर्भों की एक किस्म में पर्यवेक्षण सीखने के लिए बेहतर होना दिखाया गया है, और संभावना छवि के दौर से गुजर रोगियों के लिए पूर्वानुमान मॉडल के अगले विकास होगा निर्देशित प्रक्रियाओं ।
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
A.A. एक सॉफ्टवेयर स्वास्थ्य निष्ठा, Inc के लिए परामर्श के रूप में काम करता है कि चिकित्सा प्रतिपूर्ति के अनुकूलन के लिए नैदानिक नोटों पर इसी तरह की मशीन सीखने तकनीक कार्यरत हैं ।
J.F.G. Guerbet हेल्थकेयर, BTG, दहलीज फार्मास्यूटिकल्स (सैन फ्रांसिस्को, कैलिफोर्निया), बोस्टन वैज्ञानिक, और Terumo (Elkton, मैरीलैंड) से व्यक्तिगत शुल्क प्राप्त करता है; और (वेस्टपोर्ट, कनेक्टिकट) विज्ञान प्रयोगशालाओं के लिए एक भुगतान परामर्श दिया है ।
दूसरे लेखकों में से किसी ने भी हितों के टकराव की पहचान नहीं की है ।
Acknowledgments
A.A. छात्र अनुसंधान, येल स्कूल ऑफ मेडिसिन के कार्यालय से धन समर्थन प्राप्त किया ।
L.J.S. स्वास्थ्य के राष्ट्रीय संस्थानों से अनुदान प्राप्त करता है (NIH/NCI R01CA206180), Leopoldina Postdoctoral फैलोशिप, और रॉल्फ Guenther (रेडियोलॉजिकल, जर्मनी) विज्ञान फाउंडेशन ।
J.C. स्वास्थ्य के राष्ट्रीय संस्थानों से अनुदान प्राप्त करता है (NIH/NCI R01CA206180), फिलिप्स हेल्थकेयर, और वैज्ञानिक अनुसंधान और विकास के लिए जर्मन-इजरायल फाउंडेशन (यरूशलेम, इजराइल और Neuherberg, जर्मनी); और रेडियोलॉजिकल विज्ञान के रॉल्फ डब्ल्यू Guenther फाउंडेशन और चैरिटेबल बर्लिन स्वास्थ्य नैदानिक वैज्ञानिक कार्यक्रम (बर्लिन, जर्मनी) संस्थान से छात्रवृत्ति ।
J.S.D. और एमएल स्वास्थ्य के राष्ट्रीय संस्थानों (NIH/NCI R01CA206180) और फिलिप्स हेल्थकेयर (सर्वश्रेष्ठ, नीदरलैंड) से अनुदान प्राप्त करते हैं ।
J.F.G. स्वास्थ्य के राष्ट्रीय संस्थानों से अनुदान प्राप्त करता है (NIH/NCI R01CA206180), फिलिप्स हेल्थकेयर, BTG (लंदन, यूनाइटेड किंगडम), बोस्टन वैज्ञानिक (मार्लबोरो, मैसाचुसेट्स), और Guerbet हेल्थकेयर (Villepinte, फ्रांस)
Materials
Name | Company | Catalog Number | Comments |
Computer workstation | N/A | N/A | Intel Core 2 Duo or higher CPU at 2.0 GHz; 4 GB or more system memory; POSIX-compliant operating system (Linux or Mac OS) or Microsoft Windows 7; User permissions for executing programs and saving files |
Anaconda Python 3 | Anaconda, Inc. | Version 3.6 | Python 3 system and libraries packaged for scientists and researchers |
DICOM to NIfTI | NeuroImaging Tools & Resources Collaboratory | Version 1.0 (4/4/2018 release) | Standalone program for converting DICOM imaging files to NIfTI format |
Sublime Text Editor | Sublime HQ Pty Ltd | Version 3 (Build 3143) | Text-editor for writing Python code |
Required Python Libraries | N/A | Version 3.2.25 (nltk) Version 0.19.1 (scikit-learn) |
Natural Language Toolkit (nltk) Scikit-learn |
ITK-SNAP | N/A | Version 3.6.0 | Optional toolkit for performing segmentation of organ systems in medical images. |
References
- Benson, A., et al. NCCN clinical practice guidelines in oncology: hepatobiliary cancers. J National Comprehensive Cancer Network. 7 (4), 350-391 (2009).
- Siegel, R., Miller, K., Jemal, A. Cancer statistics, 2016. CA Cancer J Clin. 66 (1), 7-30 (2016).
- Bruix, J., et al. Clinical management of hepatocellular carcinoma. Conclusions of the Barcelona-2000 European Association for the Study of the Liver conference. Journal of Hepatology. 35 (3), 421-430 (2001).
- Eisenhauer, E., et al. New response evaluation criteria in solid tumours: revised RECIST guideline (version 1.1). European Journal of Cancer. 45 (2), 228-247 (2009).
- Gillmore, R., et al. EASL and mRECIST responses are independent prognostic factors for survival in hepatocellular cancer patients treated with transarterial embolization. Journal of Hepatology. 55 (6), 1309-1316 (2011).
- Lin, M., et al. Quantitative and volumetric European Association for the Study of the Liver and Response Evaluation Criteria in Solid Tumors measurements: feasibility of a semiautomated software method to assess tumor response after transcatheter arterial chemoembolization. Journal of Vascular and Interventional Radiology. 23 (12), 1629-1637 (2012).
- Tacher, V., et al. Comparison of Existing Response Criteria in Patients with Hepatocellular Carcinoma Treated with Transarterial Chemoembolization Using a 3D Quantitative Approach. Radiology. 278 (1), 275-284 (2016).
- Pedregosa, F., et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 12, 2825-2830 (2011).
- Bishop, C. Pattern recognition and machine learning. , Springer. New York. 738 (2006).
- Alpaydin, E. Introduction to machine learning. Third edition. , The MIT Press. Cambridge, Massachusetts. 613 (2014).
- Kim, S., Cho, K., Oh, S. Development of machine learning models for diagnosis of glaucoma. PLoS One. 12 (5), (2017).
- Son, Y., Kim, H., Kim, E., Choi, S., Lee, S. Application of support vector machine for prediction of medication adherence in heart failure patients. Healthcare Informatics Research. 16 (4), 253-259 (2010).
- Wang, S., Summers, R. Machine learning and radiology. Medical Image Analysis. 16 (5), 933-951 (2012).
- Abajian, A., et al. Predicting Treatment Response to Intra-arterial Therapies for Hepatocellular Carcinoma with the Use of Supervised Machine Learning-An Artificial Intelligence Concept. Journal of Vascular and Interventional Radiology. , (2018).