Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

मेटाबोलिक पाथवे जानकारी के GWAS विश्लेषण के लिए एक पाथवे एसोसिएशन अध्ययन उपकरण

Published: July 1, 2020 doi: 10.3791/61268

ERRATUM NOTICE

Summary

पाथवे एसोसिएशन अध्ययन उपकरण (अतीत) चलाकर, या तो चमकदार आवेदन के माध्यम से या आर कंसोल के माध्यम से, शोधकर्ताओं ने मेटाबोलिक रास्ते शामिल की जांच करके अपने जीनोम-वाइड एसोसिएशन अध्ययन (GWAS) परिणामों के जैविक अर्थ की गहरी समझ हासिल कर सकते हैं ।

Abstract

हाल ही में, मेटाबोलिक पाथवे विश्लेषण का उपयोग करके जीनोम-वाइड एसोसिएशन अध्ययन (जीडब्ल्यूएएस) डेटा की व्याख्या करने के लिए पहले वर्णित विधि का एक नया कार्यान्वयन विकसित और जारी किया गया है। पाथवे एसोसिएशन स्टडी टूल (अतीत) उपयोगकर्ता-मित्रता और धीमी गति से चलने वाले विश्लेषणों के साथ चिंताओं को दूर करने के लिए विकसित किया गया था। यह नया यूजर फ्रेंडली टूल बायोकंडक्टर और गिथब पर जारी किया गया है । परीक्षण में, अतीत एक घंटे से भी कम समय में विश्लेषण किया है कि पहले चौबीस या अधिक घंटे की आवश्यकता है । इस लेख में, हम अतीत को चलाने के लिए या तो चमकदार आवेदन या आर कंसोल का उपयोग करने के लिए प्रोटोकॉल प्रस्तुत करते हैं।

Introduction

जीनोम-वाइड एसोसिएशन अध्ययन (जीडब्ल्यूएएस) जटिल लक्षणों और उनके साथ जुड़े जीनोमिक क्षेत्रों का अध्ययन करने की एक लोकप्रिय विधि है1,2,3। इस प्रकार के अध्ययन में, सैकड़ों हजारों एकल न्यूक्लियोटाइड बहुरूपता (एसएनपी) मार्कर का परीक्षण विशेषता के साथ उनके सहयोग के लिए किया जाता है, और संघों के महत्व का आकलन किया जाता है । मार्कर-विशेषता संघ जो झूठी खोज दर (एफडीआर) सीमा (या किसी अन्य प्रकार की महत्व सीमा) को पूरा करते हैं, अध्ययन के लिए बनाए रखे जाते हैं, लेकिन सच्चे संघों को फ़िल्टर किया जा सकता है। जटिल, पॉलीजेनिक लक्षणों के लिए, प्रत्येक जीन का प्रभाव छोटा हो सकता है (और इस प्रकार फ़िल्टर किया जाता है), और कुछ एलील्स केवल विशिष्ट परिस्थितियों में व्यक्त किए जाते हैं जो अध्ययन3में मौजूद नहीं हो सकते हैं। इस प्रकार, जबकि कई SNPs विशेषता के साथ जुड़े के रूप में बनाए रखा जा सकता है, प्रत्येक एक बहुत छोटा प्रभाव हो सकता है । बहुत सारे SNP कॉल याद आ रही होगी, और जैविक अर्थ और विशेषता के आनुवंशिक वास्तुकला की एक व्याख्या अधूरी और भ्रामक हो सकता है । मेटाबोलिक पाथवे विश्लेषण 4 , 5,6 के अनुसार समूहित जीन के संयुक्त प्रभावों पर ध्यान केंद्रित करकेइनमेंसे कुछ मुद्दों को हल करने में मदद करसकताहै।

इस लेख में वर्णित विधि के पिछले कार्यान्वयन का उपयोग करके कई अध्ययन पूरे किए गए थे। एफ्लाटॉक्सिन संचय7,मकई कान के कीड़ा प्रतिरोध8,और तेल बायोसिंथेसिस9 सभी पिछले कार्यान्वयन के साथ अध्ययन किया गया था। हालांकि ये विश्लेषण सफल रहे, विश्लेषण की प्रक्रिया जटिल, समय लेने वाली और बोझिल थी, क्योंकि विश्लेषण उपकरण आर, पर्ल और बैश के संयोजन में लिखे गए थे, और पाइपलाइन स्वचालित नहीं थी। प्रत्येक विश्लेषण के लिए इस विधि को संशोधित करने के लिए आवश्यक विशेष ज्ञान के कारण, अब एक नई विधि विकसित की गई है जिसे अन्य शोधकर्ताओं के साथ साझा किया जा सकता है।

पाथवे एसोसिएशन स्टडी टूल (अतीत)10 प्रोग्रामिंग भाषाओं के कम ज्ञान की आवश्यकता के द्वारा और एक छोटी अवधि में विश्लेषण चलाकर पिछली विधि की कमियों को दूर करने के लिए डिजाइन किया गया था । जबकि विधि मक्का के साथ परीक्षण किया गया था, अतीत कोई प्रजाति विशिष्ट मांयताओं बनाता है । अतीत को एक चमकदार ऐप के रूप में आर कंसोल के माध्यम से चलाया जा सकता है, और एक ऑनलाइन संस्करण जल्द ही MaizeGDB पर उपलब्ध होने की उम्मीद है।

Protocol

1. सेटअप

  1. आर स्थापित करें, अगर यह पहले से ही स्थापित नहीं है।
    नोट: अतीत आर में लिखा है और इसलिए, की आवश्यकता है कि इसके उपयोगकर्ताओं को आर स्थापित किया है । इस लेखन के समय, बायोकंडक्टर से सीधे अतीत स्थापित करने के लिए R4.0 की आवश्यकता होती है।  अतीत के पुराने संस्करण R3.6 के लिए बायोकंडक्टर से स्थापित किए जा सकते हैं, और आर 3.5 वाले उपयोगकर्ताओं के लिए गिथब से अतीत स्थापित किया जा सकता है। आर स्थापना निर्देश निम्नलिखित लिंक से डाउनलोड किया जा सकता है: https://www.r-project.org/।
  2. RStudio डेस्कटॉप का नवीनतम संस्करण स्थापित करें या RStudio (वैकल्पिक) को अपडेट करें।
    नोट: RStudio आर भाषा के साथ काम करने के लिए एक उपयोगी वातावरण है । इसकी स्थापना की सिफारिश की जाती है, विशेष रूप से उन लोगों के लिए जो चमकदार जीयूआई आवेदन के माध्यम से कमांड लाइन में अतीत को चलाने के लिए चुनते हैं। RStudio और इसकी स्थापना के निर्देश निम्नलिखित लिंक पर पाया जा सकता है: https://rstudio.com/products/rstudio/।
  3. बायोकंडक्टर पर निर्देशों का पालन करके बायोकंडक्टर11 से अतीत स्थापित करें।
    नोट: बायोकंडक्टर के माध्यम से स्थापना अतीत की निर्भरता की स्थापना को संभालना चाहिए। इसके अतिरिक्त, अतीत गिथुब12से स्थापित किया जा सकता है, लेकिन गिथब से स्थापित करने से स्वचालित रूप से निर्भरता स्थापित नहीं होगी।
  4. पिछले चमकदार (वैकल्पिक) स्थापित करें। फाइल "ऐप डाउनलोड करें। Github भंडार के रिलीज पृष्ठ से आर": https://github.com/IGBB/PAST/releases/, और याद रखें कि डाउनलोड की गई फ़ाइल कहां स्थित है।
    नोट: अतीत का उपयोग सीधे आर के साथ अपने तरीकों को कॉल करके किया जा सकता है, लेकिन जो उपयोगकर्ता आर से कम परिचित हैं, वे पिछले चमकदार एप्लिकेशन को चला सकते हैं, जो एक निर्देशित उपयोगकर्ता इंटरफेस प्रदान करता है। पिछले चमकदार एक आर स्क्रिप्ट अतीत Github भंडार की shiny_app शाखा में उपलब्ध है । पिछले चमकदार पहले रन के दौरान अपनी निर्भरता स्थापित करने का प्रयास करेंगे ।
  5. नीचे वर्णित तीन तरीकों में से एक में आवेदन शुरू करके विश्लेषण शुरू करें।
    1. ̈स्टूडियो के साथ पिछला चमकदार
      1. RStudio का उपयोग करके, फ़ोल्डर में एक नई परियोजना बनाएं जहां ऐप। आर स्थित है। क्लिक करें फाइल | नई परियोजना और उस फ़ोल्डर का चयन करें।
      2. एक बार नया प्रोजेक्ट बन जाने के बाद एप खोल लें। आर फाइल पहले डाउनलोड की गई। RStudio उस ऐप को पहचानता है। आर एक चमकदार ऐप है और प्रदर्शित स्रोत कोड के ऊपर बार पर एक रन ऐप बटन बनाता है। रन ऐप परक्लिक करें । RStudio तो एक खिड़की है कि पिछले चमकदार आवेदन प्रदर्शित करता है शुरू करेंगे ।
    2. आर कंसोल के साथ पिछले चमकदार
      1. आर लॉन्च करें और पिछले चमकदार एप्लिकेशन को शुरू करने के लिए निम्नलिखित कोड चलाएं: चमकदार::runApp ('path/to/folder/with/shiny/app। आर'। कोट्स में टेक्स्ट को फोल्डर के साथ बदलें कि कौन सा ऐप है। आर डाउनलोड किया गया था, और उद्धरण रखो।
    3. आर चमकदार के बिना अतीत
      1. अतीत लोड करने के लिए एक आर कंसोल में पुस्तकालय (अतीत) चलाएं।

2. चमकदार विश्लेषण को अनुकूलित करें (वैकल्पिक)

  1. विश्लेषण शीर्षक को "न्यू एनालिसिस" से कुछ ऐसा में बदलें जो बेहतर तरीके से चलाए जा रहे विश्लेषण के प्रकार को दर्शाता है जो कई विश्लेषणों का ट्रैक रखने में मदद करता है (चित्र 1देखें)।

Figure 1
चित्रा 1. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

  1. कोर और मोड की संख्या को संशोधित करें। 1 और मशीन पर कुल संख्या के बीच किसी भी संख्या के लिए कोर की संख्या निर्धारित करें, लेकिन पता है कि अतीत के लिए और अधिक संसाधनों समर्पित मशीन पर अंय आपरेशनों धीमा हो सकता है । धारा 6 में विवरण के आधार पर मोड सेट करें।

3. लोड GWAS डेटा

नोट: सत्यापित करें कि GWAS डेटा टैब डीलिमित है। सुनिश्चित करें कि एसोसिएशन फ़ाइल में निम्नलिखित कॉलम शामिल हैं: विशेषता, मार्कर नाम, लोकस या गुणसूत्र, गुणसूत्र पर स्थिति, पी-वैल्यू, और मार्कर के लिए आर2 मूल्य। सुनिश्चित करें कि प्रभाव फ़ाइल में निम्नलिखित कॉलम शामिल हैं: विशेषता, मार्कर नाम, लोकस या गुणसूत्र, गुणसूत्र पर स्थिति, और प्रभाव। इन स्तंभों का क्रम महत्वपूर्ण नहीं है, क्योंकि उपयोगकर्ता डेटा लोड करते समय कॉलम के नाम निर्दिष्ट कर सकता है। किसी भी अतिरिक्त कॉलम की अनदेखी की जाती है। TASSEL13 इन फ़ाइलों का उत्पादन करने के लिए इस्तेमाल किया जा सकता है।

  1. पिछले चमकदार के साथ GWAS डेटा लोड करें।
    1. एसोसिएशन फ़ाइल और प्रभाव फ़ाइल चयन बक्से का उपयोग करके एक एसोसिएशन फ़ाइल और एक प्रभाव फ़ाइल का चयन करें। डेटा में कॉलम नामों को प्रतिबिंबित करने के लिए फ़ाइल चयन बक्से के नीचे एसोसिएशन कॉलम नाम और प्रभाव कॉलम नाम इनपुट बॉक्स में कॉलम नाम बदलें।

Figure 2
चित्रा 2. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

  1. आर कंसोल में अतीत के साथ जीडब्ल्यूए डेटा लोड करें।
    1. निम्नलिखित कोड को संशोधित करें और चलाएं:
      gwas_data = load_GWAS_data ("पथ/association_file.tsv", "path/to/effects_file.tsv", association_columns = सी ("विशेषता", "मार्कर", "लोकस", "साइट", "पी", "marker_R2"), effects_columns = c ("विशेषता", "मार्कर", "लोकस", "साइट", "प्रभाव")
  2. नोट: जीडब्ल्यूएएस फ़ाइलों के वास्तविक स्थान पर रास्तों को बदलें। association_columns और effects_columns के लिए प्रदान किए गए मान डिफ़ॉल्ट मान हैं। अगर नाम तयशुदा मानों से मेल नहीं खाते हैं, तो कॉलम के नाम निर्दिष्ट करें. अन्यथा, इन्हें छोड़ा जा सकता है।

4. लोड लिंकेज डिस्लिबिब्रियम (एलडी) डेटा

नोट: सत्यापित करें कि लिंकेज डिस्क्विलिब्रियम (एलडी) डेटा टैब डी सीमित है और इसमें निम्नलिखित प्रकार के डेटा शामिल हैं: लोकस, स्थिति1, साइट 1, स्थिति2, साइट2, स्थिति 1 और स्थिति 2 के बीच आधार जोड़े में दूरी, और आर2 मूल्य।

  1. पिछले चमकदार के साथ एलडी डेटा लोड करें।
    1. एलडी डेटा वाली फाइल का चयन करें। एलडी कॉलम में कॉलम के नाम बदलें फाइल सेलेक्शन बॉक्स के नीचे इनपुट बॉक्स में एलडी डेटा में कॉलम के नामों का मिलान करने के लिए यदि आवश्यक हो ।

Figure 3
चित्रा 3. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

  1. आर कंसोल में अतीत के साथ एलडी डेटा लोड करें।
    1. एलडी डेटा लोड करने के लिए निम्नलिखित कोड को संशोधित और चलाएं:
      एलडी = load_LD ("पाथ/टू/एलडी.टीएसवी", LD_columns = सी ("लोकस1", "स्थिति1", "साइट1", "स्थिति2", "साइट2", "Dist_bp", "आर.2")
      नोट: एलडी फ़ाइल के वास्तविक स्थान पर रास्ता बदलें। LD_columns के लिए प्रदान किए गए मान डिफ़ॉल्ट मान हैं। यदि नाम इन चूकों से मेल नहीं खाते हैं, तो स्तंभों के सही नाम निर्दिष्ट करें; अन्यथा, इन्हें छोड़ा जा सकता है।

5. जीन को एसएनपी असाइन करें

नोट: GFF प्रारूप में एनोटेशन डाउनलोड करें या अन्यथा ढूंढें। ये एनोटेशन अक्सर विशिष्ट जीवों के लिए ऑनलाइन डेटाबेस में पाए जा सकते हैं। कम गुणवत्ता वाले एनोटेशन के बारे में सतर्क रहें, क्योंकि एनोटेशन डेटा की गुणवत्ता मार्ग विश्लेषण की गुणवत्ता को प्रभावित करेगी। पुष्टि करें कि इन एनोटेशन (गुणसूत्र) का पहला कॉलम एसोसिएशन, प्रभाव और एलडी डेटा में लोकस/गुणसूत्र के प्रारूप से मेल खाता है। उदाहरण के लिए, एनोटेशन को पहले गुणसूत्र "chr1" नहीं कहना चाहिए यदि जीडब्ल्यूएएस और एलडी डेटा फ़ाइलें पहले गुणसूत्र "1" को कॉल करती हैं।

  1. अतीत चमकदार के साथ जीन के लिए SNPs असाइन करें।
    नोट: एक उपयुक्त आर2 कटऑफ का निर्धारण करने के बारे में अधिक जानकारी तांग एट अल6में पाया जा सकता है, "मार्ग विश्लेषण के लिए जीन एल्गोरिथ्म के लिए SNP" नामक खंड में ।
    1. GFF एनोटेशन युक्त फ़ाइल का चयन करें। विचार करें कियदि चूक अपलोड किए गए डेटा के अनुरूप नहीं है तो प्रजातियों पर विचार और संशोधन के लिए कौन सी विंडो आकार और आर 2 कटऑफ सबसे उपयुक्त हैं।
      नोट: अतीत में डिफ़ॉल्ट मान मुख्य रूप से मक्का के लिए उपयुक्त मूल्यों को प्रतिबिंबित करते हैं । पिछले चमकदार विश्लेषण (चरण 2.2) की शुरुआत में सेट कोर की संख्या इस चरण में उपयोग की जाती है।

Figure 4
चित्रा 4. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

  1. आर कंसोल में अतीत के साथ जीन के लिए SNPs असाइन करें ।
    1. जीन को एसएनपी असाइन करने के लिए निम्नलिखित कोड को संशोधित करें और चलाएं:
      जीन = assign_SNPs_to_genes (gwas_data, एलडी, "path/to/annotations.gff", सी ("जीन"), १०००, ०.८, 2)
      नोट: इस नमूना कोड में, कई डिफ़ॉल्ट सुझाव प्रदान किए जाते हैं: 1000 जीन की खोज करने के लिए एसएनपी के चारों ओर खिड़की का आकार है; 0.8 आर2के लिए कटऑफ मूल्य है । 2 समानांतर प्रसंस्करण के लिए उपयोग किए जाने वाले कोर की संख्या है। एनोटेशन फाइल के वास्तविक स्थान पर एनोटेशन का रास्ता भी बदला जाना चाहिए।

6. महत्वपूर्ण रास्तों की खोज करें

नोट: सत्यापित करें कि पाथवे फ़ाइल में टैब डी सीमित प्रारूप में निम्नलिखित डेटा होता है, जिसमें प्रत्येक मार्ग में हर जीन के लिए एक पंक्ति होती है: पाथवे आईडी - "PWY-6475-1" जैसे पहचानकर्ता; मार्ग विवरण - रास्ते क्या करते हैं जैसे "ट्रांस-लाइकोपीन बायोसिंथेसिस" का एक लंबा विवरण; जीन - मार्ग में एक जीन, जो एनोटेशन में प्रदान किए गए नामों से मेल ना चाहिए। पाथवे जानकारी की संभावना मक्काजीडीबी जैसे विशिष्ट जीवों के लिए ऑनलाइन डेटाबेस में पाई जा सकती है। दूसरा उपयोगकर्ता-निर्दिष्ट विकल्प मोड है। "बढ़ती" फेनोटाइप को संदर्भित करती है जो तब प्रतिबिंबित होती है जब मापा विशेषता का बढ़ता मूल्य वांछनीय होता है, जैसे उपज, जबकि "कम" एक विशेषता को संदर्भित करता है जहां मापा मूल्यों में कमी फायदेमंद है, जैसे कीट क्षति रेटिंग। रास्ते के महत्व को पहले वर्णित तरीकों का उपयोग करके परखाजाताहै 4,6,14.

  1. पिछले चमकदार के साथ महत्वपूर्ण रास्तों की खोज करें।
    1. पाथवे डेटा वाली फ़ाइल का चयन करें और सुनिश्चित करें कि विश्लेषण विकल्पों में मोड का चयन किया गया है। यदि आवश्यक हो, तो उन जीनों की संख्या को बदलें जो विश्लेषण के लिए इसे बनाए रखने के लिए एक मार्ग में होना चाहिए और प्रभाव के महत्व का परीक्षण करने के लिए शून्य वितरण बनाने के लिए उपयोग किए जाने वाले क्रमपरिवर्तनों की संख्या।

Figure 5
चित्रा 5 कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

नोट: पिछले चमकदार विश्लेषण (चरण 2.2) की शुरुआत में सेट कोर और मोड की संख्या का उपयोग इस चरण में किया जाता है। जीन की डिफ़ॉल्ट संख्या वर्तमान में 5 जीन पर सेट है, तो कम ज्ञात जीन के साथ रास्ते हटा दिया जाएगा । उपयोगकर्ता छोटे रास्ते शामिल करने के लिए इस मूल्य को 4 या 3 तक कम कर सकता है, लेकिन ऐसा करने से झूठे सकारात्मक परिणामों का जोखिम होगा। इस मूल्य को बढ़ाने से विश्लेषण की शक्ति बढ़ सकती है लेकिन विश्लेषण से अधिक रास्ते दूर हो जाएंगे। उपयोग किए गए क्रमपरिवर्तनों की संख्या बदलने से परीक्षण की शक्ति कम हो जाती है।

  1. आर कंसोल में अतीत के साथ महत्वपूर्ण रास्तों की खोज करें।
    1. महत्वपूर्ण रास्तों की खोज करने के लिए निम्नलिखित कोड को संशोधित करें और चलाएं:
      rugplots_data <-find_pathway_significance (जीन, "पाथ/टू/पाथवे.टीएसवी", 5, "बढ़ती", १०००, 2)
      नोट: इस नमूना कोड में, कई सुझाए गए चूक प्रदान किए जाते हैं। 5 जीन की न्यूनतम संख्या है कि एक मार्ग में होना चाहिए क्रम में विश्लेषण में मार्ग रखने के लिए, वृद्धि मापा विशेषता की बढ़ती मात्रा को संदर्भित करता है (यह सिफारिश की है कि उपयोगकर्ता दोनों बढ़ रही है और कम चलाने के लिए, विशेषता की परवाह किए बिना; डेटा व्याख्या दोनों के लिए अलग होगा, तथापि), १००० समय की संख्या के लिए नमूना प्रभाव नल वितरण निर्धारित करने के लिए है, और 2 समानांतर प्रसंस्करण के लिए उपयोग किए जाने वाले कोर की संख्या है। रास्ते फ़ाइल के वास्तविक स्थान के लिए रास्ता बदलें।

7. देखें रगप्लॉट्स

  1. पिछले चमकदार के साथ Rugplots देखें।
    1. एक बार जब सभी इनपुट अपलोड और सेट हो जाते हैं, तो शुरू विश्लेषणपर क्लिक करें। एक प्रगति बार दिखाई देगा और इंगित करेगा कि विश्लेषण का कौन सा कदम अंतिम रूप से पूरा किया गया था। जब विश्लेषण पूरा हो जाता है, तो पिछले चमकदार परिणाम टैब पर स्विच करेंगे। परिणामों की एक तालिका बाएं कॉलम (लेबल "रास्ते") में प्रदर्शित की जाएगी और रगप्लॉट्स को सही कॉलम (लेबल "भूखंड" में प्रदर्शित किया जाएगा)।
    2. फ़िल्टरिंग मापदंडों को नियंत्रित करने के लिए स्लाइडर का उपयोग करें। जब फ़िल्टरिंग स्तर संतोषजनक हो, तो सभी छवियों और तालिकाओं को व्यक्तिगत रूप से एक ज़िप फ़ाइल में डाउनलोड करने के लिए नीचे नीचे डाउनलोड परिणाम बटन पर क्लिक करें जिसका नाम विश्लेषण शीर्षक के साथ रखा गया है। इस ज़िप फ़ाइल फ़िल्टर की मेज, अनफ़िल्टर्ड टेबल, और फ़िल्टर की गई तालिका में प्रति मार्ग एक छवि शामिल है।

Figure 6
चित्रा 6. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

Figure 7
चित्रा 7. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

  1. आर कंसोल में अतीत के साथ Rugplots देखें
    1. परिणामों को सहेजने के लिए निम्नलिखित कोड को संशोधित करें और चलाएं:
      plot_pathways (rugplots_data, "pvalue", 0.02, "बढ़ती", "output_folder")
      नोट: इस नमूना कोड में, कई सुझाए गए चूक प्रदान किए जाते हैं। pvalue डेटा प्रदान करता है जिसका उपयोग उपयोगकर्ता द्वारा महत्व सीमा चुने जाने के बाद महत्व वाले रास्तों को फ़िल्टर करने के लिए किया जा सकता है; 0.02 फ़िल्टरिंग में उपयोग किया जाने वाला डिफ़ॉल्ट मूल्य है, और बढ़ती मात्रा मापी गई विशेषता की बढ़ती मात्रा को संदर्भित करती है (यह सिफारिश की जाती है कि उपयोगकर्ता विशेषता की परवाह किए बिना बढ़ते और कम दोनों को चलाता है; डेटा व्याख्या दोनों के लिए अलग होगी, हालांकि); output_folder फ़ोल्डर है जहां छवियों और तालिकाओं लिखा जाएगा (इस फ़ोल्डर समारोह चलाने से पहले मौजूद होना चाहिए) । फ़िल्टर किए गए परिणामों की एक तालिका, अनफ़िल्टर्ड परिणाम, और फ़िल्टर किए गए परिणामों में हर मार्ग के लिए व्यक्तिगत छवियां इस फ़ोल्डर को लिखी जाती हैं।

Representative Results

यदि पिछले सॉफ्टवेयर टूल के एक रन के बाद परिणाम तैयार नहीं किए जाते हैं, तो यह सुनिश्चित करने के लिए जांचें कि सभी इनपुट फाइलें सही ढंग से स्वरूपित हैं। पिछले पैकेज में उदाहरण डेटा का उपयोग करके एक सफल रन, जो अनाज के रंग के मक्का जीडब्ल्यूए पर आधारित हैं, चित्र 8में दिखाया गया है। इस टेबल और परिणामस्वरूप छवि डाउनलोड परिणाम बटन का उपयोग कर डाउनलोड किया जा सकता है। डाउनलोड की गई छवि का एक उदाहरण चित्र 210में दिखाया गया है। गलत सेटिंग्स परिणाम है कि जैविक समझ नहीं है के लिए नेतृत्व कर सकते हैं, लेकिन अशुद्धता का निर्धारण शोधकर्ता, जो डबल चुना सेटिंग्स की वैधता की जांच करनी चाहिए और ब्याज की विशेषता के बारे में सभी ज्ञात सबूत पर विचार करने के लिए होना चाहिए ।

चित्रा 910 288 इनस्ल लाइनों के मक्का पैनल के साथ बनाए गए जीडब्ल्यूएएस परिणामों के मार्ग विश्लेषण से उत्पादित रगप्लाट को दिखाता है जो अनाज के रंग के लिए फेनोटाइप किया गया था। यह सरलीकृत उदाहरण, जहां फेनोटाइप या तो "सफेद" या "पीला" थे, का उपयोग किया गया था क्योंकि उज्ज्वल पीले कैरोटीनॉइड पिगमेंट बनाने के लिए जिम्मेदार मार्ग ज्ञात है और अधिकांश फेनोटाइप के लिए जिम्मेदार होना चाहिए। इस प्रकार, हमें ट्रांस-लाइकोपीन बायोसिंथेसिस मार्ग (जो कैरोटेनॉइड का उत्पादन करता है) को अनाज के रंग से काफी जुड़ा होने की उम्मीद थी, जो यह है। पाथवे आईडी और नाम ग्राफ के शीर्ष पर सूचीबद्ध हैं। ग्राफ की क्षैतिज धुरी उन सभी जीनों को रैंक करता है जिन्हें विश्लेषण में शामिल किया गया था, जो विशेषता पर सबसे बड़े प्रभाव के क्रम में बाएं से दाएं व्यवस्थित होते हैं। हालांकि, केवल ट्रांस-लाइकोपीन बायोसिंथेसिस मार्ग में जीन चिह्नित किए जाते हैं (ग्राफ के शीर्ष पर, हैच मार्क्स के रूप में, विश्लेषण में अन्य सभी जीनों की तुलना में उनके प्रभाव के जीन रैंक में दिखाई देते हैं)। इस पाथवे में 7 जीन हैं। रनिंग एनरिचमेंट स्कोर (ईएस) को वर्टिकल एक्सिस के साथ प्लॉट किया जाता है। प्रत्येक जीन के लिए ES प्रभाव के क्रम में चल कुल में जोड़ा जाता है और कुल जीन की संख्या का विश्लेषण करने के लिए समायोजित किया जाता है । इस प्रकार, स्कोर के रूप में एक क्षैतिज धुरी के साथ सही चलता है और बड़ा प्रभाव जीन शामिल कर रहे है के रूप में वृद्धि की आदत है, लेकिन कुछ बिंदु पर, प्रभाव में वृद्धि एक और जीन जोड़ने के लिए समायोजन से छोटा है, और पूरे स्कोर को कम करने के लिए शुरू होता है । रनिंग ईएस लाइन के शीर्ष को एक बिंदीदार ऊर्ध्वाधर रेखा के साथ चिह्नित किया गया है; यह पूरे मार्ग के लिए ES है और कार्यक्रम द्वारा यह निर्धारित करने के लिए उपयोग किया जाता है कि मार्ग को चुना जाता है और एक रगप्लाट के रूप में प्रस्तुत किया जाता है।

Figure 8
चित्रा 8:पिछले चमकदार का पूरा रन । कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

Figure 9
चित्रा 9:अतीत के पूर्ण रन से पाथवे छवि (या चमकदार से डाउनलोड) । यह आंकड़ा पिटाई एट अल से उद्धृत किया गयाहैकृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

Discussion

अतीत का एक प्राथमिक लक्ष्य विशेष रूप से गैर-मानव और गैर-पशु जीवों के लिए जीडब्ल्यूए डेटा के मेटाबॉलिक पाथवे विश्लेषणों को व्यापक दर्शकों के लिए लाना है । अतीत के लिए वैकल्पिक तरीके अक्सर कमांड-लाइन प्रोग्राम होते हैं जो मनुष्यों या जानवरों पर ध्यान केंद्रित करते हैं। उपयोगकर्ता-मित्रता अतीत के विकास में एक प्राथमिक लक्ष्य था, दोनों एक चमकदार आवेदन विकसित करने के लिए चुनने में और आवेदन जारी करने के लिए आर और बायोकंडक्टर का उपयोग करने के लिए चुनने में। उपयोगकर्ताओं को अतीत का उपयोग करने के लिए कार्यक्रमों को संकलित करने का तरीका सीखने की आवश्यकता नहीं है।

अधिकांश प्रकार के विश्लेषण सॉफ़्टवेयर के साथ, अतीत के परिणाम केवल इनपुट डेटा के रूप में अच्छे हैं; यदि इनपुट डेटा में त्रुटियां हैं या गलत तरीके से स्वरूपित किया गया है, तो अतीत असैन्चनीय परिणाम चलाने या उत्पन्न करने में विफल रहेगा। यह सुनिश्चित करना कि जीडब्ल्यूए डेटा, एलडी डेटा, एनोटेशन और पाथवे फ़ाइलों को सही ढंग से स्वरूपित किया गया है, अतीत से सही आउटपुट प्राप्त करने के लिए महत्वपूर्ण है। अतीत केवल द्वि-एलेलिक मार्कर का विश्लेषण करता है और इनपुट डेटा के प्रत्येक सेट के लिए केवल एक विशेषता चला सकता है। इसके अलावा, खराब जेनोटीपिंग या गलत या गलत फेनोटाइपिंग द्वारा उत्पादित जीडब्ल्यूएएस डेटा स्पष्ट या दोहराने योग्य परिणाम देने की संभावना नहीं है। अतीत GWAS परिणामों की जैविक व्याख्या में सहायता कर सकते हैं, लेकिन अगर पर्यावरण भिन्नता, प्रयोगात्मक त्रुटि, या जनसंख्या संरचना ठीक से हिसाब नहीं था अराजक डेटा सेट स्पष्ट करने की संभावना नहीं है ।

उपयोगकर्ता विश्लेषण के कुछ मापदंडों को बदलने के लिए चुन सकते हैं, दोनों चमकदार आवेदन में और आर कंसोल में अतीत के कार्यों के लिए उन मापदंडों को पारित करके । ये पैरामीटर अतीत द्वारा सूचित परिणामों को बदल सकते हैं, और उपयोगकर्ताओं को चूक से इन्हें संशोधित करते समय ध्यान रखना चाहिए। क्योंकि एलडी उपयोगकर्ताओं द्वारा मापा जाता है, आम तौर पर एक ही मार्कर डेटा सेट का उपयोग करके जो जीडब्ल्यूएएस में भी उपयोग किया जाता था, एलडी माप जनसंख्या के लिए विशिष्ट होते हैं। सभी अध्ययनों के लिए, विशेष रूप से मक्का के अलावा अन्य प्रजातियों के लिए, (विशेष रूप से स्व-परागण, पॉलीप्लाइड, या अत्यधिक विषम प्रजातियों), चूक में परिवर्तन की आवश्यकता हो सकती है।

Disclosures

लेखकों के पास खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

कोई नहीं।

Materials

Name Company Catalog Number Comments
Computer NA NA Any computer with 8GB RAM should be sufficient
R R Project NA R 4.0 or greater is required to install from Bioconductor 3.11

DOWNLOAD MATERIALS LIST

References

  1. Rafalski, J. Association genetics in crop improvement. Current Opinion in Plant Biology. 13 (2), 174-180 (2010).
  2. Yan, J., Warburton, M., Crouch, J. Association Mapping for Enhancing Maize (Zea mays L.) Genetic Improvement. Crop Science. 51 (2), 433-449 (2011).
  3. Xiao, Y., Liu, H., Wu, L., Warburton, M., Yan, J. Genome-wide Association Studies in Maize: Praise and Stargaze. Molecular Plant. 10 (3), 359-374 (2017).
  4. Wang, K., Li, M., Bucan, M. Pathway-Based Approaches for Analysis of Genomewide Association Studies. The American Journal of Human Genetics. 81 (6), 1278-1283 (2007).
  5. Weng, L., et al. SNP-based pathway enrichment analysis for genome-wide association studies. BMC Bioinformatics. 12 (1), 99 (2011).
  6. Tang, J., Perkins, A., Williams, W., Warburton, M. Using genome-wide associations to identify metabolic pathways involved in maize aflatoxin accumulation resistance. BMC Genomics. 16 (1), 673 (2015).
  7. Warburton, M., et al. Genome-Wide Association Mapping of Aspergillus flavus and Aflatoxin Accumulation Resistance in Maize. Crop Science. 55 (5), 1857-1867 (2015).
  8. Warburton, M., et al. Genome-Wide Association and Metabolic Pathway Analysis of Corn Earworm Resistance in Maize. The Plant Genome. 11 (1), 170069 (2018).
  9. Li, H., Thrash, A., Tang, J., He, L., Yan, J., Warburton, M. Leveraging GWAS data to identify metabolic pathways and networks involved in maize lipid biosynthesis. The Plant Journal. 98 (5), 853-863 (2019).
  10. Thrash, A., Tang, J., DeOrnellis, M., Peterson, D., Warburton, M. PAST: The Pathway Association Studies Tool to Infer Biological Meaning from GWAS Datasets. Plants. 9 (1), 58 (2020).
  11. Adam, T., Mason, D. PAST: Pathway Association Study Tool (PAST). Bioconductor version: Release (3.10). , (2020).
  12. Thrash, A., DeOrnellis, M. IGBB/PAST. , at https://github.com/IGBB/PAST (2019).
  13. Bradbury, P., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  14. Subramanian, A., et al. Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences U.S.A. 102, 15545-15550 (2005).

Tags

जेनेटिक्स अंक 161 जीनोम-वाइड एसोसिएशन विश्लेषण जीवाएसी मेटाबोलिक पाथवे विश्लेषण डेटा व्याख्या सॉफ्टवेयर आर बायोकंडक्टर

Erratum

Formal Correction: Erratum: A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information
Posted by JoVE Editors on 10/08/2021. Citeable Link.

An erratum was issued for: A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information. One of the affiliations was updated.

The second affiliation was updated from:

USDA-ARS Corn Host Plant Resistance Research Unit, Mississippi State University

to:

Corn Host Plant Resistance Research Unit, USDA-ARS

मेटाबोलिक पाथवे जानकारी के GWAS विश्लेषण के लिए एक पाथवे एसोसिएशन अध्ययन उपकरण
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Thrash, A., Warburton, M. L. AMore

Thrash, A., Warburton, M. L. A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information. J. Vis. Exp. (161), e61268, doi:10.3791/61268 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter