Waiting
Login-Verarbeitung ...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

कई सार्वजनिक रूप से सुलभ डेटाबेस का उपयोग कर स्तन कैंसर में Biomarker के डेटा खनन और एकीकृत विश्लेषण प्रदर्शन

Published: May 17, 2019 doi: 10.3791/59238

Summary

यहां, हम एक प्रोटोकॉल प्रस्तुत करने के लिए सार्वजनिक रूप से सुलभ डेटाबेस की एक किस्म से व्युत्पंन पूल्ड नैदानिक डेटासेट के व्यापक विश्लेषण के आधार पर स्तन कैंसर के biomarker और उत्तरजीविता कारक का पता लगाने, अभिव्यक्ति की रणनीति का उपयोग, सहसंबंध और जीवन रक्षा विश्लेषण कदम से कदम ।

Abstract

हाल के वर्षों में, उभरते डेटाबेस के लिए जटिल कैंसर जीनोमिक डेटासेट, जिससे जांचकर्ताओं का विश्लेषण करने और जीन, नमूनों और कैंसर के विभिंन प्रकारों में नैदानिक डेटा की व्याख्या करने के लिए बाधाओं को कम डिजाइन किए गए थे । इस के साथ साथ, हम एक व्यावहारिक संचालन प्रक्रिया का वर्णन, ID1 लेने (डीएनए बाध्यकारी प्रोटीन के निरोधक 1) एक उदाहरण के रूप में, के लिए biomarker और स्तन कैंसर के अस्तित्व predictors से व्युत्पंन के आधार पर पूल्ड नैदानिक डेटासेट के अभिव्यक्ति पैटर्न विशेषताएं ऑनलाइन सुलभ डेटाबेस, सहित ONCOMINE, bcGenExMiner v 4.0 (स्तन कैंसर जीन-अभिव्यक्ति खान में काम करनेवाला v 40), GOBO (जीन अभिव्यक्ति-स्तन कैंसर ऑनलाइन के लिए आधारित परिणाम), HPA (मानव प्रोटीन एटलस), और Kaplan-Meier प्लॉटर । विश्लेषण के लिए रुचि के जीन के अभिव्यक्ति पैटर्न क्वेरी के साथ शुरू हुआ (जैसे, ID1) सामांय नमूनों बनाम कैंसर के नमूनों में । फिर, स्तन कैंसर में ID1 और clinicopathological विशेषताओं के बीच सहसंबंध विश्लेषण किया गया । इसके बाद, ID1 की अभिव्यक्ति प्रोफ़ाइल विभिंन उपसमूहों के अनुसार स्तरीकृत किया गया था । अंत में, ID1 अभिव्यक्ति और अस्तित्व के परिणाम के बीच एसोसिएशन का विश्लेषण किया गया । आपरेशन प्रक्रिया को अलग डेटाबेस से जीन स्तर पर बहुआयामी डेटा प्रकार के एकीकृत और पुनरावृत्ति और स्तन कैंसर में जीन परिवर्तन की घटनाओं के जीनोमिक संदर्भ के बारे में परीक्षण hypotheses की अवधारणा को सरल करता है । इस पद्धति की विश्वसनीयता और निष्कर्षों के प्रतिनिधिकारिता में सुधार कर सकते हैं, इस तरह, ब्याज की एक जीन पर जानकारीपूर्ण परिप्रेक्ष्य वर्तमान ।

Introduction

स्तन कैंसर विभिन्न आणविक उपप्रकारों में विविध रोग का निदान और उपचार रणनीतियों के साथ एक विषम बीमारी है, जिसमें रोगजनन और विकास संभवतः असमान आणविक तंत्र के साथ जुड़े हुए हैं1,2 , 3. हालांकि, एक चिकित्सीय लक्ष्य की पहचान आमतौर पर साल लेता है, या यहां तक कि दशकों, बुनियादी अनुसंधान में प्रारंभिक खोज से नैदानिक उपयोग4। कैंसर जीनोम के लिए उच्च throughput अनुक्रमण प्रौद्योगिकी के जीनोम वाइड आवेदन बहुत मूल्यवान biomarkers या चिकित्सकीय लक्ष्य 5के लिए खोज की प्रक्रिया को उंनत किया है ।

कैंसर जीनोमिक्स के भारी मात्रा में बड़े पैमाने पर कैंसर जीनोमिक्स प्लेटफार्मों, जैसे आईसीजीसी (इंटरनेशनल कैंसर जीनोम कंसोर्टियम) और टीसीजीए (कैंसर जीनोम एटलस), शोधकर्ताओं के लिए डेटा प्रदर्शन के लिए एक बड़ी चुनौती प्रस्तुत कर रहा है के रूप में से उत्पंन डेटा अंवेषण, एकीकरण, और विश्लेषिकी, विशेष रूप से उपयोगकर्ताओं के लिए सूचना और गणना में गहन प्रशिक्षण6,7,8,9,10कमी । हाल के वर्षों में, उभरते डेटाबेस, (जैसे, ONCOMINE, bcGenExMiner v 4.0, और Kaplan-Meier प्लॉटर, आदि) डिजाइन और जटिल कैंसर जीनोमिक datasets आ के लिए बार कम विकसित किया गया है, जिससे जांचकर्ताओं की सुविधा के लिए विश्लेषण और 11कैंसर के विभिंन प्रकारों में जीन, नमूनों और नैदानिक डेटा की व्याख्या करना । इस प्रोटोकॉल के लक्ष्य के लिए एक अनुसंधान रणनीति है कि खुले access डेटाबेस है, जो व्यापक रूप से शोधकर्ताओं की एक बड़ी संख्या के द्वारा मांयता प्राप्त किया गया है की एक श्रृंखला से जीन जानकारी के कई स्तरों के साथ एकीकृत का वर्णन है, के लिए संभावित biomarkers की पहचान और स्तन कैंसर के लिए शकुन कारक ।

ONCOMINE डाटाबेस एक वेब आधारित डेटा कैंसर microarray जानकारी के साथ खनन मंच है और उपंयास biomarkers और चिकित्सकीय लक्ष्य11की खोज की सुविधा के लिए बनाया गया है । वर्तमान में, इस डेटाबेस11,12में ६५ जीन अभिव्यक्ति डेटासेट से ४८,०००,००० से अधिक जीन अभिव्यक्ति मापन हैं । BcGenExMiner v 4.0 (गैर के लिए एक नि: शुल्क उपकरण लाभ संस्था), भी कहा जाता स्तन कैंसर जीन अभिव्यक्ति खान में काम करनेवाला, एक उपयोगकर्ता के अनुकूल वेब आधारित आवेदन डीएनए microarrays के परिणाम शामिल है ३,४१४ बरामद स्तन कैंसर के रोगियों और १,२०९ अनुभव एक अपमानजनक घटना13। यह R सांख्यिकीय सॉफ्टवेयर और संकुल के साथ जीन शकुन विश्लेषण के प्रदर्शन में सुधार करने के लिए बनाया गया है ।

GOBO एक multifunctional प्रयोक्ता microarrays जानकारी के साथ दोस्ताना ऑनलाइन उपकरण है (जैसे, Affymetrix U133A) से एक ५१-नमूना स्तन कैंसर सेल लाइन सेट और एक १८८१-नमूना स्तन ट्यूमर डेटा सेट, कि14विश्लेषण की एक विस्तृत सरणी की अनुमति देता है । गोबो डाटाबेस में कई प्रकार के आवेदन उपलब्ध हैं, जिनमें स्तन ट्यूमर और कोशिका रेखाओं के विभिन्न आण्विक उपप्रकारों में जीन अभिव्यक्ति प्रोफाइल का तेजी से विश्लेषण, संभावित मेटागेन्स के निर्माण के लिए सह-अभिव्यक्त जीन की स्क्रीनिंग और एक जीन के परिणाम और जीन अभिव्यक्ति के स्तर के बीच सहसंबंध विश्लेषण, जीन के सेट, या स्तन कैंसर डेटा में जीन हस्ताक्षर सेट15

मानव प्रोटीन एटलस एक खुली पहुंच के लिए वैज्ञानिकों के लिए मानव proteome है, जो पहले से ही मानव जीव विज्ञान और रोग के क्षेत्र में प्रकाशनों की एक बड़ी संख्या में योगदान दिया है तलाशने के लिए तैयार कार्यक्रम है । मानव प्रोटीन एटलस जीवन विज्ञान समुदाय16,17के लिए एक यूरोपीय कोर संसाधन के रूप में मांयता प्राप्त है ।

Kaplan Meier प्लॉटर एक ऑनलाइन जीन अभिव्यक्ति और नैदानिक डेटा को एकीकृत करने के साथ ही कि १०,४६१ कैंसर के नमूनों, जो १,०६५ गैस्ट्रिक, २,४३७ फेफड़ों, १,८१६ डिम्बग्रंथि और ५,१४३ शामिल है के आधार पर ५४,६७५ जीन के शकुन प्रभाव का आकलन करने की अनुमति देता उपकरण है 33/49/40/69 महीने18के एक मतलब अनुवर्ती के साथ स्तन कैंसर के रोगियों । जीन अभिव्यक्ति की जानकारी, relapse-मुक्त जीवन रक्षा (rfs) और समग्र अस्तित्व (ओएस) इस डाटाबेस से डाउनलोड कर रहे है19,20

यहां, हम एकाधिक सार्वजनिक रूप से सुलभ डेटाबेस का उपयोग करने की तुलना, विश्लेषण और एकाधिक कैंसर के अध्ययन में रुचि के जीन की अभिव्यक्ति में परिवर्तन के पैटर्न कल्पना का एक व्यावहारिक संचालन प्रक्रिया का वर्णन, सारांश के लक्ष्य के साथ अभिव्यक्ति प्रोफाइल, स्तन कैंसर में पूर्वानुमान मूल्यों और संभावित जैविक कार्यों । उदाहरण के लिए, हाल के अध्ययनों से ट्यूमर में आईडी प्रोटीन के अर्बुदीय गुण संकेत दिया है और घातक सुविधाओं के साथ जुड़े थे, सेलुलर परिवर्तन सहित, अमर, बढ़ाया प्रसार और मेटास्टेसिस21, 22,23. हालांकि, आईडी परिवार के प्रत्येक सदस्य ठोस ट्यूमर के विभिंन प्रकार में अलग भूमिका निभाता है, और स्तन कैंसर में उनकी भूमिका24अस्पष्ट बनी हुई है । पिछले अध्ययनों में, इस विधि के माध्यम से पता लगाया, हमने पाया है कि ID1 स्तन कैंसर में एक सार्थक पूर्वानुमान संकेतक25था । इसलिए, प्रोटोकॉल ID1 एक उदाहरण के रूप में डेटा खनन विधियों को लागू करने के लिए ले जाएगा ।

विश्लेषण oncomine में सामांय नमूनों बनाम कैंसर के नमूनों में रुचि के जीन की अभिव्यक्ति पैटर्न क्वेरी से शुरू होता है । फिर, स्तन कैंसर में रुचि के जीन के अभिव्यक्ति सहसंबंध बीसी-GenExMiner वी 4.0, GOBO, और ONCOMINE का उपयोग कर प्रदर्शन किया गया । अगला, अभिव्यक्ति प्रोफ़ाइल ID1 के ऊपर तीन डेटाबेस का उपयोग करते हुए विभिन्न उपसमूहों के अनुसार स्तरीकृत किया गया था । अंत में, ID1 अभिव्यक्ति और अस्तित्व से बाहर के बीच संघ बीसी-GenExMiner v 4.0 का उपयोग कर विश्लेषण किया गया था, मानव प्रोटीन एटलस, और Kaplan-Meier प्लॉटर । कार्रवाई प्रक्रिया आरेख 1में फ़्लोचार्ट के रूप में दिखाया गया था ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. अभिव्यक्ति पैटर्न विश्लेषण

  1. ONCOMINE वेब अंतरफलक26पर जाएं ।
  2. खोज बॉक्समें ID1 टाइप करके विभिन्न प्रकार की दुर्भिन्ताओं में जीन ID1 के सापेक्ष व्यंजक स्तर प्राप्त करें ।
  3. प्राथमिक फ़िल्टर्स मेनू से विश्लेषण प्रकार का चयन करें । फिर, का चयन करें कैंसर बनाम सामांय विश्लेषण, स्तन कैंसर बनाम सामांय विश्लेषण
  4. अंय दृश्य मेनू से जीन सारांश दृश्य का चयन करें । ०.०१ पर P-मान की थ्रेशोल्ड सेट करें । आंकड़े डाउनलोड करें ।
    नोट: गुना परिवर्तन की दहलीज है 2, के रूप में पिछले अध्ययन में वर्णित27.

2. अभिव्यक्ति सहसंबंध विश्लेषण

  1. Bc-GenExMiner v 4.0 वेब इंटरफ़ेस28पर जाएँ ।
  2. विश्लेषण मेनू से सहसंबंध का चयन करें, संपूर्ण बटन दबाएं । खोज बॉक्स में ID1 लिखें । सबमिट बटन और विश्लेषण प्रारंभ करें बटन दबाएं ।
    नोट: डिफ़ॉल्ट सेटिंग सभी रोगियों के अभिव्यक्ति सहसंबंध विश्लेषण दिखाएं, जो अणु उप प्रकार फिल्टर दबाकर स्तन कैंसर के विभिंन उपप्रकार में और अधिक सटीक हो सकता है ।

3. उपसमूह विश्लेषण

  1. उपसमूह विश्लेषण में बीसी-GenExMiner v 4.0
    1. Bc-GenExMiner v 4.0 वेब इंटरफ़ेस28पर जाएँ ।
    2. विश्लेषण मेनू से व्यंजक का चयन करें, संपूर्ण बटन दबाएं । खोज बॉक्स में ID1 लिखें और सबमिट बटन और विश्लेषण प्रारंभ करें बटन दबाएं ।
    3. क्लिक करें नोडल स्थिति (LN) और Scarff ब्लूम & रिचर्डसन ग्रेड स्थिति (sbr) थंबनेल पूर्ण छवियों को देखने के लिए । SBR छवियों में, चित्र के P-मानों को विज़ुअलाइज़ करने के लिए नीचे बटन दबाएं । आंकड़े डाउनलोड करें ।
  2. जीन अभिव्यक्ति में उपसमूह विश्लेषण-स्तन कैंसर ऑनलाइन (GOBO) के लिए आधारित परिणाम
    1. GOBO वेब अंतरफलक के लिए14जाओ ।
    2. स्क्रीन करने के लिए ब्याज ID1 के जीन प्रतीक टाइप जीन सेट अपलोडकरें ।
    3. जीन प्रतीकको परिभाषित करने की खोज सीमा निर्धारित करें । ट्यूमर के चयनमें सभी सेट करें । बहुचर मापदंडोंमें नोड स्थिति और ग्रेड स्तरीकृत का चयन करें । अंय आइटंस डिफ़ॉल्ट रहते हैं । जांच जमा कर आंकड़े डाउनलोड करें ।

4. जीवन रक्षा विश्लेषण

  1. बीसी में जीवन रक्षा विश्लेषण-GenExMiner v 4.0
    1. Bc-GenExMiner v 4.0 वेब इंटरफ़ेस28पर जाएँ ।
    2. विश्लेषण मेनू से शकुन का चयन करें, संपूर्ण बटन दबाएं । खोज बॉक्स में ID1 लिखें और सबमिट बटन और विश्लेषण प्रारंभ करें बटन दबाएं ।
    3. विस्तृत शकुन विश्लेषण में, एनएम, एर्म, श्री का चयन करें जनसंख्या और घटना के मापदंड में और अधिक जानकारी प्राप्त करने के लिए सबमिट बटन दबाएँ । पूरा रेखांकन निर्यात करने के लिए Kaplan-Meier वक्र थंबनेल दबाएँ ।
      ध्यान दें: N (+,-, m): नोडल स्थिति (+: सकारात्मक,-: नकारात्मक, एम: मिश्रित); ईआर (+,-, एम): एस्ट्रोजन रिसेप्टर स्थिति (+: सकारात्मक,-: नकारात्मक, एम: मिश्रित); श्री: मेटास्टेटिक पतन
  2. मानव प्रोटीन एटलस (HPA) में जीवन रक्षा विश्लेषण
    1. मानव प्रोटीन एटलस वेब इंटरफेस29पर जाएं ।
    2. खोज बॉक्स में ID1 लिखें और खोज बटन क्लिक करें । पैथोलॉजी सब-एटलस का चयन करें ।
      नोट: 17 कैंसर प्रकार में mRNA अभिव्यक्ति स्तर आरएनए अभिव्यक्ति अवलोकन अनुभाग में दिखाए जाते हैं । बॉक्स प्लॉट के हर कैंसर ऊतक लेबल अस्तित्व विश्लेषण डेटा और आरएनए अभिव्यक्ति का स्तर प्रदान करने के लिए एक विस्तृत पृष्ठ का उपयोग करने के लिए क्लिक करने योग्य है ।
    3. स्तन कैंसरके लेबल पर क्लिक करें, तो विस्तृत पृष्ठ इंटरैक्टिव अस्तित्व तितर बितर साजिश और अस्तित्व विश्लेषण दिखाने के लिए । आंकड़े डाउनलोड करें ।
  3. Kaplan-Meier प्लॉटर अस्तित्व में जीवन रक्षा विश्लेषण
    1. कयोजना-मेनियर प्लॉटर वेब इंटरफेस30पर जाएं । एमआरएनए जीन चिप जोन में ब्रेस्ट कैंसर के लिए स्टार्ट केएम प्लॉटर पर क्लिक करें ।
    2. प्रकार ID1 खोज पट्टी करने के लिए और का चयन करें हरे आइटम में प्रत्याशी मेनू ।
    3. उत्तरजीविता प्रकार के रूप में Rfs का चयन करें और अन्य आइटम डिफ़ॉल्ट रहते हैं. Kaplan-Meier प्लॉट ड्रा पर क्लिक करें और आंकड़े डाउनलोड.
      नोट: उत्तरजीविता प्रकार, कटऑफ प्रकार, और अनुवर्ती सीमा, साथ ही जांच सेट विकल्प की सेटिंग, आवश्यकतानुसार बदला जा सकता है । ईआर, पीआर, उसके-2, लिंफ नोड्स, ग्रेड, Tp53 स्थिति, और आणविक subgroup सहित उपसमूह पूर्वानुमान विश्लेषण को प्रतिबंधित विश्लेषण में सेटिंग को बदलने के माध्यम से प्राप्त किया जा सकता है subgroup बॉक्स1। इसी तरह, उपचार के फ़िल्टर सीमा विश्लेषण सीमित करने के लिए चयनित समानता रखने वालों ' बॉक्स में सेट किया जा सकता है ।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

डेटा खनन और स्तन कैंसर biomarker के एकीकृत विश्लेषण के एक प्रतिनिधि परिणाम ID1 का उपयोग कर किया गया था, डीएनए बाध्यकारी परिवार के सदस्यों, जो पिछले अध्ययन में सूचित किया गया है की inhibitors में से एक 25.

के रूप में चित्रा 2में प्रदर्शन, कैंसर के कई प्रकार में ट्यूमर और सामांय ऊतकों के बीच ID1 mrna अभिव्यक्ति के मतभेदों को ONCOMINE डाटाबेस है, जो ४४५ अद्वितीय विश्लेषण की कुल निहित का उपयोग कर विश्लेषण किया गया । 5 अध्ययनों से पता चला है कि ID1 के mRNA अभिव्यक्ति स्तर स्तन कैंसर के ऊतकों की तुलना में सामान्य ऊतकों में काफी अधिक था. इन आंकड़ों ने स्तन कैंसर में ID1 के अभिव्यक्ति डिस्रेग्युलेशन का संकेत दिया । चित्रा 3 बीसी-genexminer v 4.0 में प्रदर्शन किया विश्लेषण से ID1 का सबसे अच्छा सकारात्मक और नकारात्मक सहसंबंधी जीन दिखाया । ID1 की mRNA अभिव्यक्ति और BC रोगियों के clinicopathological मापदंडों के बीच सहसंबंध की पहचान करने के लिए, बीसी-GenExMiner v 4.0 डेटाबेस विश्लेषण किया गया था । के रूप में 4 चित्रामें दिखाया गया है, काफी ID1 के mrna स्तर वृद्धि लिम्फ नोड मेटास्टेसिस बिना स्तन कैंसर के रोगियों में पाया गया था, के रूप में लिम्फ नोड मेटास्टेसिस (पी= ०.०००५) के साथ उन लोगों की तुलना में । इसके अलावा, GOBO में विश्लेषण का प्रदर्शन किया है कि ID1 के mRNA स्तर को कम ट्यूमर ग्रेड के लिए सहसंबद्ध थे (चित्रा 5, पी< 0.00001) । इन परिणामों में निहित है कि ID1 की अभिव्यक्ति बढ़ी कम मेटास्टेटिक क्षमता से जुड़ा हुआ था और कम ईसा पूर्व में रोग ग्रेड । बीसी से विश्लेषण-GenExMiner v 4.0 डाटाबेस से पता चलता है कि ID1 के उच्च mRNA स्तर स्तन कैंसर के रोगियों में अब दूर मेटास्टेसिस मुक्त अस्तित्व (DMFS) के लिए सहसंबद्ध था (चित्रा 6, HR = 082, ९५% CI: 073-0.92, पी= ०.००१) । लगातार, मानव प्रोटीन एटलस से विश्लेषण का सुझाव दिया है कि ID1 के ऊंचा प्रोटीन स्तर स्तन कैंसर के रोगियों में बेहतर अस्तित्व के परिणाम के साथ जुड़ा हुआ था (चित्रा 7, पी= ०.०३८९) । Kaplan-Meier प्लॉटर से जीवन रक्षा विश्लेषण भी पता चला है कि उच्च ID1 अभिव्यक्ति की mRNA स्तर की भविष्यवाणी की बेहतर पुनरावृत्ति-मुक्त अस्तित्व (RFS) स्तन कैंसर के रोगियों में (चित्रा 8, HR = 081, P= ०.०००२३).

Figure 1
चित्रा 1 । अभिव्यक्ति पैटर्न और विशिष्ट स्तन कैंसर biomarkers और ऑनलाइन डेटाबेस चयन के पूर्वानुमान मूल्यों की खोज का अवलोकन. अलग स्तन कैंसर biomarkers के व्यवस्थित विश्लेषण डेटाबेस की एक किस्म में कदम से कदम किया गया था. सबसे पहले, सामांय नमूनों बनाम कैंसर के नमूनों में रुचि के जीन के अभिव्यक्ति पैटर्न । फिर, स्तन कैंसर में रुचि के जीन का अभिव्यक्ति सहसंबंध किया गया । इसके बाद, ID1 के एक्सप्रेशन प्रोफाइल्स अलग के हिसाब से स्तरीकृत हो गए थे । अंत में, ID1 अभिव्यक्ति और अस्तित्व से बाहर के बीच एसोसिएशन का विश्लेषण किया गया । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 2
चित्रा 2 । मानव कैंसर के विभिंन प्रकारों में ID1 का एमआरएनए अभिव्यक्ति पैटर्न । ID1 की mRNA अभिव्यक्ति ONCOMINE डेटाबेस के साथ विश्लेषण किया । ग्राफिक में सांख्यिकीय रूप से महत्वपूर्ण एमआरएनए ओवरएक्सप्रेशन (लाल) या लक्षित जीन की अनियंत्रित अभिव्यक्ति (नीला) के साथ डेटासेट की संख्या का प्रदर्शन किया गया । प्रत्येक सेल में संख्या विश्लेषण है कि उन विश्लेषण और कैंसर के प्रकार के भीतर दहलीज को पूरा की संख्या का प्रतिनिधित्व किया । जीन रैंक प्रत्येक अनुसंधान में मापा सभी जीन के शीर्ष में लक्ष्य जीन के शतमक द्वारा विश्लेषण किया गया था. सेल के भीतर विश्लेषण के लिए कोशिका का रंग सर्वश्रेष्ठ जीन रैंक शतमक द्वारा निर्धारित किया गया था । P-मान ०.०१ पर सेट किया गया था और फ़ोल्ड-परिवर्तन को 2 के रूप में परिभाषित किया गया था, जैसा कि लाल फ़्रेम में दिखाया गया है । यह आंकड़ा पिछले अध्ययन25से संशोधित किया गया है । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 3
चित्रा 3 । ईसा पूर्व-GenExMiner v 4.0 में ID1 के जीन सहसंबंध विश्लेषण । ID1 अध्ययन ३६ के भीतर 5, ६९६ स्तन कैंसर रोगियों में और प्रासंगिक जीन के mrna अभिव्यक्ति सहसंबंध bcgenexminer v 4.0 में विश्लेषण किया । यह आंकड़ा पिछले अध्ययन25से संशोधित किया गया है । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 4
चित्रा 4 । ID1 अभिव्यक्ति और लिम्फ नोड मेटास्टेसिस स्थिति के बीच संबंध । ID1 के mRNA अभिव्यक्ति स्तर 4, ३०७ स्तन कैंसर के रोगियों में अलग लिम्फ नोड के साथ (LN) स्थिति bcGenExMiner v 4.0 में विश्लेषण किया । यह आंकड़ा पिछले अध्ययन25से संशोधित किया गया है । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 5
चित्रा 5 । ID1 और ट्यूमर ग्रेड के जीन अभिव्यक्ति के स्तर के बीच संबंध विभिंन रोग ग्रेड के साथ स्तन कैंसर के रोगियों में ID1 के mRNA अभिव्यक्ति स्तर GOBO में विश्लेषण किया गया । समूह के बीच वैश्विक महत्वपूर्ण अंतर को पी-मान उत्पन्न करने का मूल्यांकन किया गया था और पी< 005 को सांख्यिकीय रूप से महत्वपूर्ण अंतर दर्शाने के लिए माना गया था । 1, 2, 3 एक्स अक्ष में अलग रोग ग्रेड 1, ग्रेड 2, 3 ग्रेड में रोगियों के उप समूहों के लिए खड़े हो जाओ । यह आंकड़ा पिछले अध्ययन 25से संशोधित किया गया है । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 6
चित्रा 6 । स्तन कैंसर के रोगियों में मुक्त उत्तरजीविता-दूर मेटास्टेसिस के लिए ID1 के शकुन मूल्यों । ID1 mRNA स्तर और दूर मेटास्टेसिस-मुक्त उत्तरजीविता अनुमानों के बीच संबद्धता bcGenExMiner v 4.0 में विश्लेषण किया गया था । यह आंकड़ा पिछले अध्ययन25से संशोधित किया गया है । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 7
चित्रा 7 । स्तन कैंसर के रोगियों में ID1 के अस्तित्व की संभावना ।  ID1 प्रोटीन स्तर के स्तन कैंसर के साथ रोगियों के अस्तित्व के लिए प्रभाव मानव प्रोटीन एटलस (HPA) में विश्लेषण किया गया था । यह आंकड़ा पिछले अध्ययन25से संशोधित किया गया है । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 8
अंक 8 । आवर्ती मुक्त जीवन रक्षा (RFS) के अनुसार स्तन कैंसर में ID1 के शकुन मूल्यों । सभी 3, ९५१ स्तन कैंसर के रोगियों में अलग ID1 mRNA स्तर Kaplan-Meier प्लॉटर में विश्लेषण किया । यह आंकड़ा पिछले अध्ययन25से संशोधित किया गया है । इस आंकड़े का बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

सार्वजनिक डेटाबेस का व्यापक विश्लेषण ब्याज के जीन के अंतर्निहित कार्य का संकेत हो सकता है और विशिष्ट कैंसर27,31में इस जीन और clinicopathological मापदंडों के बीच संभावित लिंक का पता चलता है । खोज और विश्लेषण एक एकल डेटाबेस पर आधारित संभावित चयन पूर्वाग्रह के कारण सीमित या अलग दृष्टिकोण प्रदान कर सकते हैं, या एक निश्चित सीमा में, डेटा संग्रह और विश्लेषणात्मक एल्गोरिथ्म सहित डेटा की गुणवत्ता की विविधता के कारण संभवतः डेटाबेस का19। इस प्रोटोकॉल का सबसे महत्वपूर्ण कदम के लिए उपयुक्त डेटाबेस है, जो व्यापक रूप से पर्याप्त प्रतिनिधिकारिता के साथ वैज्ञानिकों की एक बड़ी संख्या द्वारा मांयता प्राप्त होना चाहिए का चयन है । जांचकर्ता को परिकल्पना का परीक्षण करने के लिए एकाधिक डेटाबेसेज़ का उपयोग करना चाहिए और किसी एकल डेटाबेस का उपयोग करने के बजाय विभिंन डेटाबेसेज़ से प्राप्त परिणामों की पुष्टि करना चाहिए ।

यहां वर्णित प्रोटोकॉल एक अन्वेषक अनुकूल संचालन प्रक्रिया है । इस विधि का लाभ यह है कि यह तेजी से दृश्य और स्तन कैंसर में एक जीन की संभावित भूमिका की व्याख्या के लिए अनुमति देता है । इसके अलावा, सभी परिणाम इस प्रक्रिया के माध्यम से प्राप्त तुरंत परीक्षण किया जा सकता है और बस इसी वेबसाइट क्वेरी द्वारा दोहराया । इस विधि की सीमा है कि निष्कर्ष जो डेटाबेस के व्यापक विश्लेषण से आ वास्तव में वास्तविक समारोह या नैदानिक सेटिंग में संबंध को प्रतिबिंबित नहीं कर सकते हैं । यह डेटाबेस के systematical पूर्वाग्रह से स्टेम सकता है, और कुछ मामले में, संभवतः अपर्याप्त नमूना आकार३२,३३के कारण । एक से अधिक डेटाबेस का उपयोग करने के लिए एक ही शोध प्रश्न क्वेरी पारस्परिक रूप से परिणामों की पुष्टि और३४निष्कर्ष की विश्वसनीयता बढ़ा सकता है । परिणामों का परीक्षण करने के लिए संबंधित मूलभूत प्रयोगों को निष्पादित करने के लिए, जांचकर्ता की संस्था से नमूनों का उपयोग परिणामों को सत्यापित करने, या यदि संभव हो, करने की पुरजोर अनुशंसा की जाती है ।

अधिक से अधिक ऑनलाइन कैंसर जीनोमिक्स या प्रोटियोमिक् डेटाबेस उपलब्ध है और शोधकर्ताओं के लिए सुलभ हो जाएगा३५,३६। प्रोटोकॉल शोधकर्ता के लिए एक कुशल और किफायती तरीका प्रदान करने के लिए एक संभावित लक्ष्य जीन और संबंधित संकेतन मार्ग की पहचान के माध्यम से ऑनलाइन डेटाबेस का गहराई से विश्लेषण और जीनोमिक्स, transcriptomics, और epigenomics का उपयोग कर सकता है दृष्टिकोण.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों को प्रकट करने के लिए कुछ भी नहीं है

Acknowledgments

यह काम आंशिक रूप से गुआंग्डोंग प्रांत, चीन (No. 2018A030313562) के प्राकृतिक विज्ञान फाउंडेशन द्वारा समर्थित किया गया था, गुआंग्डोंग नैदानिक शिक्षण आधार के शिक्षण सुधार परियोजना (NO ।  2016JDB092), राष्ट्रीय प्राकृतिक चीन के विज्ञान फाउंडेशन (८१६००३५८), और युवा अभिनव प्रतिभा परियोजना के कॉलेजों और विश्वविद्यालयों के गुआंग्डोंग प्रांत, चीन में (सं 2017KQNCX073)

Materials

Name Company Catalog Number Comments
A personal computer or computing device with an Internet browser with Javascript
enabled
Microsoft 051690762553 We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above
Adobe Flash player Adobe Systems Inc. It can be freely downloaded from http://get.adobe.com/flashplayer/. This browser plug-in is required for visualizing networks on the network
analysis tab.
Chrome Broswer Google Inc. It can be freely downloaded from https://www.google.cn/chrome/ This is necessary for viewing PDF files including the Pathology Reports and many of
the downloadable files.
Java Runtime Environment Oracle Corporation It can be downloaded from http://www.java.com/getjava/.
Office 365 ProPlus for Faculty Microsoft 2003BFFD8117EA68 This is necessary for viewing the Pathology Reports and for viewing many of
the downloadable files.
Vectr Online Vectr Labs Inc. It can be freely used from https://vectr.com/new This is necessary for visualizing and editing many of
the downloadable files and pictures.

DOWNLOAD MATERIALS LIST

References

  1. van 't Veer, L. J., et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 415 (6871), 530-536 (2002).
  2. Loi, S., et al. Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade. Journal of Clinical Oncology. 25 (10), 1239-1246 (2007).
  3. Cancer Genome Atlas, N. Comprehensive molecular portraits of human breast tumours. Nature. 490 (7418), 61-70 (2012).
  4. Emerson, J. W., Dolled-Filhart, M., Harris, L., Rimm, D. L., Tuck, D. P. Quantitative assessment of tissue biomarkers and construction of a model to predict outcome in breast cancer using multiple imputation. Cancer Informatics. 7, 29-40 (2009).
  5. Yu, H., et al. Integrative genomic and transcriptomic analysis for pinpointing recurrent alterations of plant homeodomain genes and their clinical significance in breast cancer. Oncotarget. 8 (8), 13099-13115 (2017).
  6. He, W., et al. TCGA datasetbased construction and integrated analysis of aberrantly expressed long noncoding RNA mediated competing endogenous RNA network in gastric cancer. Oncology Reports. , (2018).
  7. Liu, J., et al. An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics. Cell. 173 (2), e411 400-416 (2018).
  8. Esgueva, R., et al. Next-generation prostate cancer biobanking: toward a processing protocol amenable for the International Cancer Genome Consortium. Diagnostic Molecular Pathology. 21 (2), 61-68 (2012).
  9. Joly, Y., Dove, E. S., Knoppers, B. M., Bobrow, M., Chalmers, D. Data sharing in the post-genomic world: the experience of the International Cancer Genome Consortium (ICGC) Data Access Compliance Office (DACO). PLoS Computational Biology. 8 (7), e1002549 (2012).
  10. Zhang, J., et al. International Cancer Genome Consortium Data Portal--a one-stop shop for cancer genomics data. Database (Oxford). 2011, bar026 (2011).
  11. Rhodes, D. R., et al. ONCOMINE: a cancer microarray database and integrated data-mining platform. Neoplasia. 6 (1), 1-6 (2004).
  12. Rhodes, D. R., et al. Oncomine 3.0: genes, pathways, and networks in a collection of 18,000 cancer gene expression profiles. Neoplasia. 9 (2), 166-180 (2007).
  13. Jezequel, P., et al. bc-GenExMiner: an easy-to-use online platform for gene prognostic analyses in breast cancer. Breast Cancer Research and Treatment. 131 (3), 765-775 (2012).
  14. , Available from: http://co.bmc.lu.se/gobo/gsa.plb (2018).
  15. Ringner, M., Fredlund, E., Hakkinen, J., Borg, A., Staaf, J. GOBO: gene expression-based outcome for breast cancer online. PLoS One. 6 (3), e17911 (2011).
  16. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  17. Ponten, F., Schwenk, J. M., Asplund, A., Edqvist, P. H. The Human Protein Atlas as a proteomic resource for biomarker discovery. Journal of Internal Medicine. 270 (5), 428-446 (2011).
  18. Gyorffy, B., et al. An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients. Breast Cancer Research and Treatment. 123 (3), 725-731 (2010).
  19. Stevinson, C., Lawlor, D. A. Searching multiple databases for systematic reviews: added value or diminishing returns? Complementary Therapies in Medicine. 12 (4), 228-232 (2004).
  20. Yin, J., et al. Integrating multiple genome annotation databases improves the interpretation of microarray gene expression data. BMC Genomics. 11, 50 (2010).
  21. Patel, D., Morton, D. J., Carey, J., Havrda, M. C., Chaudhary, J. Inhibitor of differentiation 4 (ID4): From development to cancer. Biochimica et Biophysica Acta. 1855 (1), 92-103 (2015).
  22. Kamalian, L., et al. Increased expression of Id family proteins in small cell lung cancer and its prognostic significance. Clinical Cancer Research. 14 (8), 2318-2325 (2008).
  23. Cruz-Rodriguez, N., et al. High expression of ID family and IGJ genes signature as predictor of low induction treatment response and worst survival in adult Hispanic patients with B-acute lymphoblastic leukemia. Journal of Experimental and Clinical Cancer Research. 35, 64 (2016).
  24. Yang, H. Y., et al. Expression and prognostic value of Id protein family in human breast carcinoma. Oncology Reports. 23 (2), 321-328 (2010).
  25. Zhou, X. L., et al. Prognostic values of the inhibitor of DNAbinding family members in breast cancer. Oncology Reports. 40 (4), 1897-1906 (2018).
  26. , Available from: https://www.oncomine.org (2018).
  27. Lin, H. Y., Zeng, L., iang, Y. K., Wei, X. L., Chen, C. F. GATA3 and TRPS1 are distinct biomarkers and prognostic factors in breast cancer: database mining for GATA family members in malignancies. Oncotarget. 8 (21), 34750-34761 (2017).
  28. , Available from: http://bcgenex.centregauducheau.fr/BCGEM/GEM-requete.php (2018).
  29. , Available from: https://www.proteinatlas.org (2018).
  30. , Available from: http://kmplot.com/analysis (2018).
  31. Zhu, Y. F., Dong, M. Expression of TUSC3 and its prognostic significance in colorectal cancer. Pathology-Research and Practice. 214 (9), 1497-1503 (2018).
  32. Nelson, J. C., et al. Validation sampling can reduce bias in health care database studies: an illustration using influenza vaccination effectiveness. Journal of Clinical Epidemiology. 66 (8 Suppl), S110-S121 (2013).
  33. Haibe-Kains, B., Desmedt, C., Sotiriou, C., Bontempi, G. A comparative study of survival models for breast cancer prognostication based on microarray data: does a single gene beat them all? Bioinformatics. 24 (19), 2200-2208 (2008).
  34. Yang, C., et al. Understanding genetic toxicity through data mining: the process of building knowledge by integrating multiple genetic toxicity databases. Toxicology Mechanisms and Methods. 18 (2-3), 277-295 (2008).
  35. Cannata, N., Merelli, E., Altman, R. B. Time to organize the bioinformatics resourceome. PLoS Computational Biology. 1 (7), e76 (2005).
  36. Wren, J. D., Bateman, A. Databases, data tombs and dust in the wind. Bioinformatics. 24 (19), 2127-2128 (2008).

Tags

कैंसर अनुसंधान १४७ अंक स्तन कैंसर Biomarker डाटाबेस डेटा खनन रोग का निदान Bioinformation
कई सार्वजनिक रूप से सुलभ डेटाबेस का उपयोग कर स्तन कैंसर में Biomarker के डेटा खनन और एकीकृत विश्लेषण प्रदर्शन
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Chen, M. n., Zeng, D., Zheng, Z. q., More

Chen, M. n., Zeng, D., Zheng, Z. q., Li, Z., Wu, J. l., Jin, J. y., Wang, H. j., Huang, C. z., Lin, H. y. Performing Data Mining And Integrative Analysis Of Biomarker in Breast Cancer Using Multiple Publicly Accessible Databases. J. Vis. Exp. (147), e59238, doi:10.3791/59238 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter