Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

जीन सेट संवर्धन विश्लेषण का उपयोग करने के लिए अनुवाद अनुसंधान के लिए उपयुक्त पशु मॉडल की पहचान के लिए एक प्रोटोकॉल

Published: August 16, 2017 doi: 10.3791/55768

Summary

हम transcriptomic डेटा के जीन सेट संवर्धन विश्लेषण के उपयोग के लिए एक मानकीकृत प्रोटोकॉल प्रदान करने के लिए अनुवाद अनुसंधान के लिए एक आदर्श माउस मॉडल की पहचान ।
इस प्रोटोकॉल डीएनए microarray और आरएनए अनुक्रमण डेटा के साथ इस्तेमाल किया जा सकता है और डेटा उपलब्ध हैं, तो आगे अन्य ओमिक्स डेटा के लिए बढ़ाया जा सकता है.

Abstract

हाल ही में अध्ययन है कि तुलना में माउस के साथ मानव रोगों के transcriptomic डेटासेट पारंपरिक जीन का उपयोग कर मॉडल से जीन तुलना तकनीक के लिए अनुवाद के लिए पशु मॉडलों की प्रासंगिकता के बारे में विरोधाभासी निष्कर्ष में परिणाम अनुसंधान. विभिंन जीन अभिव्यक्ति विश्लेषण के बीच विसंगतियों के लिए एक प्रमुख कारण अंतर व्यक्त जीन की मनमानी फ़िल्टरिंग है । इसके अलावा, विभिंन प्रजातियों और प्लेटफार्मों के बीच एकल जीन की तुलना अक्सर तकनीकी विचरण द्वारा सीमित है, और मानव और पशु मॉडल से डेटा के बीच कांग्रेस/कलह की अशुद्धता के लिए अग्रणी । इस प्रकार, व्यवस्थित डेटा विश्लेषण के लिए मानकीकृत दृष्टिकोण की जरूरत है । व्यक्तिपरक जीन फ़िल्टरिंग और अप्रभावी जीन को दूर करने वाली जीन तुलना, हम हाल ही में दिखा दिया है कि जीन सेट संवर्धन विश्लेषण (GSEA) के लिए इन समस्याओं से बचने की क्षमता है । इसलिए, हम GSEA के उपयोग के लिए एक मानकीकृत प्रोटोकॉल विकसित करने के लिए उपयुक्त और अनुचित अनुवाद अनुसंधान के लिए पशु मॉडलों के बीच अंतर । इस प्रोटोकॉल के लिए कैसे नए मॉडल सिस्टम एक-प्राथमिकताओं डिजाइन करने के लिए भविष्यवाणी करने के लिए उपयुक्त नहीं है, क्योंकि यह मौजूदा प्रयोगात्मक ओमिक्स डेटा की आवश्यकता है । हालांकि, प्रोटोकॉल का वर्णन कैसे एक मानकीकृत तरीके से मौजूदा आंकड़ों की व्याख्या के लिए सबसे उपयुक्त पशु मॉडल का चयन करने के लिए, इस प्रकार अनावश्यक पशु प्रयोगों और भ्रामक अनुवाद अध्ययन से परहेज ।

Introduction

पशु मॉडल व्यापक रूप से मानव रोगों का अध्ययन करने के लिए इस्तेमाल कर रहे हैं, आनुवंशिकी के मामले में मनुष्यों के लिए उनके ग्रहण समानता की वजह से, शरीर रचना विज्ञान, और फिजियोलॉजी. इसके अलावा, पशु मॉडल अक्सर नैदानिक उपचार के लिए द्वारपाल के रूप में सेवा और शोधों के अनुसंधान की सफलता पर एक बड़ा प्रभाव हो सकता है । इष्टतम पशु मॉडल के सावधान चयन भ्रामक पशु अध्ययन की संख्या को कम कर सकते हैं । हाल ही में, शोधों के शोध के लिए पशु मॉडलों की प्रासंगिकता पर विवादास्पद रूप से चर्चा की गई है, विशेष रूप से मानव भड़काऊ रोगों और संबंधित माउस मॉडल से प्राप्त एक ही डेटासेट का विश्लेषण विरोधाभासी निष्कर्ष के लिए नेतृत्व किया 1,2. यह चर्चा ओमिक्स डेटा का विश्लेषण करने के दौरान एक मौलिक समस्या का पता चला: व्यवस्थित डेटा विश्लेषण के लिए मानकीकृत दृष्टिकोण की जरूरत है ताकि पक्षपातपूर्ण जीन चयन को कम करने के लिए और प्रजाति की तुलना की मजबूती को बढ़ाने के लिए 3

परंपरागत रूप से, transcriptomics डेटा का विश्लेषण (और अन्य ओमिक्स डेटा) एकल-जीन स्तर पर किया जाता है और कड़े कट-ऑफ पैरामीटर्स के आधार पर जीन चयन का एक आरंभिक चरण शामिल होता है (उदा., फ़ोल्ड चेंज & #62; २.०, p value & #60; ०.०५). हालांकि, प्रारंभिक कट-ऑफ पैरामीटर्स की सेटिंग अक्सर व्यक्तिपरक, मनमाना और नहीं तार्किक रूप से उचित है, और भी विपरीत निष्कर्ष1,2के लिए नेतृत्व कर सकते हैं । इसके अलावा, प्रारंभिक जीन चयन आम तौर पर कुछ अत्यधिक ऊपर और downregulated जीन के विश्लेषण को प्रतिबंधित करता है और इस प्रकार पर्याप्त संवेदनशील जीन है कि अंतर एक हद तक कम करने के लिए व्यक्त किया गया के बहुमत शामिल नहीं है ।

प्रारंभिक-2000 में जीनोमिक्स युग की वृद्धि और जैविक रास्ते और संदर्भों के बढ़ते ज्ञान के साथ, वैकल्पिक सांख्यिकीय दृष्टिकोण विकसित किया गया है कि एकल जीन स्तर विश्लेषण की सीमाओं को दरकिनार करने की अनुमति दी । जीन सेट संवर्धन विश्लेषण (GSEA)4, जो transcriptomics डेटा के विश्लेषण के लिए व्यापक रूप से स्वीकार किए जाते है तरीकों में से एक है, जीन के एक प्राथमिकताओं परिभाषित समूहों का उपयोग करता है (जैसे, संकेत रास्ते, समीपस्थ स्थान पर एक गुणसूत्र आदि) । GSEA पहले नक्शे सभी का इरादा जीन सेट करने के लिए फ़िल्टर्ड जीन का पता चला (उदा., मार्ग), अभिव्यक्ति में उनके व्यक्तिगत परिवर्तन की परवाह किए बिना । इस दृष्टिकोण इस प्रकार भी मामूली विनियमित जीन है कि अंयथा एकल जीन स्तर विश्लेषण के साथ खो जाएगा शामिल हैं । जीन सेट के भीतर अभिव्यक्ति में additive परिवर्तन बाद में चल रहे राशि के आंकड़े का उपयोग किया जाता है ।

चिकित्सा अनुसंधान में अपने व्यापक उपयोग के बावजूद, GSEA और संबंधित सेट संवर्धन दृष्टिकोण स्वयं स्पष्ट नहीं कर रहे है जटिल ओमिक्स डेटा के विश्लेषण के लिए ध्यान में रखा । यहां, हम माउस मॉडल से उन लोगों के साथ मानव नमूनों से ओमिक्स डेटा की तुलना के लिए एक प्रोटोकॉल का वर्णन करने के लिए अनुवाद अध्ययन के लिए आदर्श मॉडल की पहचान । हम माउस मॉडल है कि मानव भड़काऊ विकारों नकल उतार के लिए उपयोग किया जाता है के एक संग्रह पर आधारित प्रोटोकॉल की प्रयोज्यता प्रदर्शित करता है । हालांकि, इस विश्लेषण पाइपलाइन मानव माउस तुलना करने के लिए प्रतिबंधित नहीं है और आगे अनुसंधान के सवालों के लिए संशोधन करने के लिए है ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

< p class = "jove_title" > 1. GSEA सॉफ्टवेयर और आणविक हस्ताक्षर डाटाबेस के डाउनलोड

  1. सरकारी GSEA व्यापक संस्थान वेबसाइट (http://software.broadinstitute.org/gsea/index.jsp) के पास जाओ और रजिस्टर GSEA सॉफ्टवेयर तक पहुंच पाने के लिए उपकरण और आणविक हस्ताक्षर डेटाबेस (MSigDB).
  2. डाउनलोड javaGSEA डेस्कटॉप अनुप्रयोग या एक वैकल्पिक सॉफ्टवेयर विकल्प ( उदा , आर स्क्रिप्ट) ।
    नोट: सभी विकल्प बिल्कुल एक ही एल्गोरिथ्म लागू । GSEA सॉफ्टवेयर आंतरिक अनुसंधान प्रयोजनों के लिए स्वतंत्र रूप से शिक्षा और उद्योग में व्यक्तियों के लिए उपलब्ध है ।
  3. GSEA सॉफ़्टवेयर पर अधिक विवरण के लिए
  4. दस्तावेज़ीकरण वेबसाइट (http://software.broadinstitute.org/cancer/software/gsea/wiki/index.php/Main_Page) और GSEA उपयोगकर्ता मार्गदर्शिका पर जाएं (http://software.broadinstitute.org/gsea/doc/ GSEAUserGuideFrame. html).
  5. आणविक हस्ताक्षर डेटाबेस (MSigDB) GSEA वेबसाइट से डाउनलोड करने के लिए व्यक्तिगत जीन सेट संग्रह तक पहुंच पाने के लिए ।
    नोट: MSigDB GSEA सॉफ्टवेयर या अन्य प्रयोजनों के साथ उपयोग के लिए व्याख्या की जीन सेट का एक संग्रह है. जीन सेट संकेत रास्ते, जीन आंटलजी शर्तों, सीआईएस-विनियामक रूपांकनों, प्रयोगात्मक हस्ताक्षर और दूसरों के अनुसार विभाजित किया जा सकता है । MSigDB से जीन हमेशा उनके आधिकारिक ह्यूगो (मानव जीनोम संगठन) जीन प्रतीक द्वारा नामित कर रहे हैं । एक दिया मानव विकार और अलग माउस मॉडल के बीच मार्ग विनियमन की तुलना के लिए यह & #39 डाउनलोड करने के लिए सिफारिश की है; सभी विहित मार्ग, जीन प्रतीकों & #39; फ़ाइल ( c2. cp. v 5.2. सम्मिलत. gmt ). यह फ़ाइल जीन सेट है कि व्याख्या और KEGG द्वारा रास्ते संकेत में आयोजित किया गया शामिल < सुप वर्ग = "xref" > ५ , < सुप class = "xref" > 6 , Reactome < सुप class = "xref" > 7 , < सुप class = "xref" > 8 और BioCarta < सुप वर्ग = "xref" > 9 . तार & #39; v 5.2 & #39; संग्रह की संस्करण जानकारी का प्रतिनिधित्व करता है । फ़ाइलों का नवीनतम संस्करण डाउनलोड करने के लिए सुनिश्चित करें । MSigDB आंतरिक अनुसंधान प्रयोजनों के लिए स्वतंत्र रूप से शिक्षा और उद्योग में व्यक्तियों के लिए उपलब्ध है । यह MSigDB डाउनलोड करने की जरूरत नहीं है, अगर इंटरनेट कनेक्शन विश्लेषण के दौरान प्रदान की जाती है । इस मामले में MSigDB सीधे GSEA यूजर इंटरफेस के भीतर चुना जा सकता है.
  6. डाउनलोड डीएनए चिप (ऐरे) GSEA वेबसाइट से एनोटेशन फ़ाइलें जनरल ह्यूगो जीन प्रतीकों ( जैसे , Mouse430_2. चिप ) के लिए सरणी विशिष्ट जांच पहचानकर्ता अनुवाद करने के लिए ।
    नोट: यह डीएनए चिप एनोटेशन डाउनलोड करने की जरूरत नहीं है, अगर इंटरनेट कनेक्शन विश्लेषण के दौरान प्रदान की जाती है । इस मामले में डीएनए चिप एनोटेशन सीधे GSEA उपयोगकर्ता इंटरफ़ेस के भीतर चुना जा सकता है । प्रोटोकॉल भी आरएनए अनुक्रमण डेटा के साथ इस्तेमाल किया जा सकता है । इस स्थिति में, यह एनोटेशन फ़ाइलों को डाउनलोड करने के लिए आवश्यक नहीं है । इसके बजाय, जीन अभिव्यक्ति डेटा (४.१२ कदम देखें) का विश्लेषण करने के लिए GSEAd उपकरण का उपयोग करें ।
< p class = "jove_title" > 2. मानव विकार और उपयुक्त पशु मॉडल के लिए प्रयोगात्मक जीन अभिव्यक्ति डेटा डाउनलोड करें

  1. पसंद के मानव विकार के लिए प्रयोगात्मक जीन अभिव्यक्ति (transcriptomics) अध्ययन की पहचान ( जैसे , जीन अभिव्यक्ति प्रोफाइल सेप्टिक विकार के साथ रोगियों से व्युत्पंन ल्यूकोसाइट्स, GSE9960).
  2. इसी तरह, कई पशु मॉडल है कि मानव अध्ययन ( जैसे , Staphylococcus स्ताफ्य्लोकोच्चुस (एस स्ताफ्य्लोकोच्चुस), GSE20524) के इंजेक्शन के बाद चूहों से व्युत्पंन रक्त कोशिकाओं के जीन अभिव्यक्ति प्रोफाइल के साथ तुलना में होना चाहिए रहे है के लिए खोज । इस कदम पर पशु मॉडल है कि मानव स्थिति नकल उतार के लिए उपयुक्त हो सकता है के चयन के लिए पूर्व ज्ञान का उपयोग करें ।
  3. इस प्रयोजन के लिए
  4. का उल्लेख साहित्य और डेटाबेस जैसे जीन एक्सप्रेशन सर्वग्राही (भू) डाटाबेस < सुप वर्ग = "xref" > 10 या ArrayExpress < सुप क्लास = "xref" > 11 और ब्याज की सामान्यीकृत transcriptomics डेटा डाउनलोड करें । डेटा को स्थानीय हार्ड डिस्क पर पाठ फ़ाइलों के रूप में सहेजें । भू डाटाबेस के लिए, टैब के डाउनलोड-सीमांकित श्रृंखला मैट्रिक्स पाठ फ़ाइलों की सिफारिश की है । इसके अलावा मंच का ध्यान रखना (सरणी प्रकार) है कि अध्ययन के लिए इस्तेमाल किया, क्योंकि यह जानकारी सामांय ह्यूगो जीन प्रतीकों को सरणी विशिष्ट जांच पहचानकर्ता अनुवाद के लिए आवश्यक है ।
    नोट: डेटा भंडारण के लिए पर्याप्त स्मृति सुनिश्चित करें, transcriptomics डेटा सेट के रूप में आमतौर पर कई सौ एमबी शामिल हैं.
< p class = "jove_title" > 3. डेटा हैंडलिंग और स्वरूपण

  1. प्रयोगात्मक जीन अभिव्यक्ति डेटा GSEA सॉफ़्टवेयर उपकरण में आयात करने से पहले, आवश्यक डेटा संरचना पर विचार करें । प्रत्येक अध्ययन के लिए मैंयुअल रूप से दो अलग फ़ाइलें बनाने के लिए: 1) एक जीन अभिव्यक्ति डेटा फ़ाइल विभिंन जीन और नमूनों के लिए माप मूल्यों से युक्त है, और 2) एक phenotype फ़ाइल नमूना लेबल युक्त समूह के लिए व्यक्तिगत नमूने ( जैसे , उपचार समूहों के लिए) ।
    अधिक जानकारी और डेटा संरचना विकल्प के लिए GSEA डेटा स्वरूप पृष्ठ (http://software.broadinstitute.org/cancer/software/gsea/wiki/index.php/Data_formats) पर जाएं ।
    नोट: आम तौर पर, transcriptomics डेटा के सभी रूपों डीएनए microarray प्रयोगों, आरएनए-seq या चिप seq अध्ययन सहित प्रोटोकॉल के साथ संगत कर रहे हैं. डीएनए microarray प्रयोगों का उपयोग करने के मामले में, जीन अभिव्यक्ति डेटा फ़ाइल प्रत्येक जीन के लिए सरणी विशिष्ट जांच पहचानकर्ता या ह्यूगो जीन प्रतीकों को शामिल करना चाहिए (जांच पहचानकर्ता विश्लेषण के दौरान ह्यूगो जीन प्रतीकों के लिए अनुवाद किया जाएगा, कदम १.५ और ४.१० देखें) । आरएनए-seq या चिप-seq डेटा का उपयोग करने के मामले में, जीन अभिव्यक्ति डेटा के लिए मैन्युअल रूप से परिकलित समूह मीट्रिक (उदा., समूह माध्य अनुपात) का उपयोग व्यक्तिगत नमूना डेटा के बजाय किया जाना चाहिए. ये समूह मेट्रिक्स तब GSEA (चरण ४.१२ देखें) उपकरण के साथ विश्लेषण किया जाना चाहिए । जीन अभिव्यक्ति डेटा GSEA सॉफ्टवेयर में आयात करने से पहले हमेशा की तरह सामान्यीकृत किया जाना है । सामान्यता का प्रकार ( जैसे , चतुर्थक या घन पट्टी) सामान्यतः शोधकर्ता को छोड़ दिया जाता है.
  2. जीन अभिव्यक्ति डेटा फ़ाइल: किसी व्यंजक dataset का वर्णन करने के लिए टैब-सीमांकित पाठ फ़ाइल (*. txt) स्वरूप का उपयोग करें < सशक्त वर्ग = "xfig" > चित्र 1a . समर्थित उदाहरण फ़ाइल भी देखें GSE20524_expression. txt.
    नोट: जीन अभिव्यक्ति डेटा फ़ाइल सभी detectable जीन (या जांच), भी जीन है कि विभेदक व्यक्त नहीं किया जा सकता है के लिए अभिव्यक्ति मान शामिल हैं । फ़ाइल इसलिए आम तौर पर जीन के कई हजारों शामिल हैं । इसका आयोजन < सबल वर्ग = "xfig" > चित्रा 1a में दर्शाया गया है । पहली पंक्ति में लेबल का नाम ( जैसे , जीन प्रतीक या जांच आईडी) डेटासेट ( उदा , नमूना 1, नमूना 2 आदि ) में प्रत्येक नमूने के लिए पहचानकर्ता के बाद शामिल हैं । फ़ाइल के शेष प्रत्येक जीन के लिए अभिव्यक्ति मान और डेटासेट में प्रत्येक नमूने के लिए होता है । GSEA सॉफ्टवेयर उपकरण समूह मैट्रिक्स के लिए गणना करता है ( जैसे , समूह मतलब अनुपात या सिग्नल के लिए शोर-अनुपात), इसलिए यह प्रत्येक व्यक्ति के नमूने के लिए डेटा को शामिल करने के लिए सिफारिश की है. वैकल्पिक रूप से, यह जीन अभिव्यक्ति डेटा के लिए बाह्य परिकलित समूह मैट्रिक्स का उपयोग करने के लिए संभव है (< मजबूत वर्ग देखें = "xfig" > चित्र 1b ).
  3. Phenotype फ़ाइल: ऐसे समूहों को परिभाषित और लेबल करने के लिए एक अलग फ़ाइल बनाएं, जिनमें < सशक्त वर्ग में दर्शाए गए व्यक्तिगत नमूने शामिल हों= "xfig" > चित्रा 2 . फ़ील्ड्स को अलग करने के लिए रिक्तियों या टैब्स का उपयोग करें । इसे एक CLS (C++ वर्ग परिभाषा) फ़ाइल स्वरूप में सहेजें । समर्थित उदाहरण फ़ाइल भी देखें GSE20524_pheno_infection. cls.
    नोट: पहली पंक्ति में नमूनों की कुल संख्या है और आगे समूहों की संख्या (< सशक्त वर्ग = "xfig" > चित्रा 2 ). जबकि नमूनों की संख्या जीन अभिव्यक्ति डेटा फ़ाइल के अनुरूप होना चाहिए (३.२ देखें), समूहों की संख्या अध्ययन डिजाइन पर निर्भर करता है । पहली पंक्ति का तीसरा मैदान हमेशा & #39; 1 & #39;.
    CLS फ़ाइल में दूसरी पंक्ति में प्रत्येक समूह के लिए नाम है । लाइन एक पाउंड चिह्न (#) के बाद एक रिक्ति के साथ शुरू करना चाहिए (< मजबूत वर्ग = "xfig" > चित्रा 2 ).
    तीसरी पंक्ति में प्रत्येक नमूने के लिए एक समूह लेबल है । समूह लेबल एक मनमाना संख्या या पाठ हो सकता है । यह केवल उन लेबल्स का क्रम है जो समूहों को प्रत्येक नमूने का संबद्धता निर्धारित करता है: प्रयुक्त पहला लेबल दूसरी पंक्ति पर पहले समूह को असाइन किया गया है; दूसरा अद्वितीय लेबल दूसरे समूह के लिए और इतने पर सौंपा गया है । सुनिश्चित करें कि एक ही समूह के प्रत्येक नमूने में इस चरण पर एक ही लेबल है, और यह कि लेबल्स की संख्या पहली पंक्ति में निर्दिष्ट नमूनों की संख्या के समान है । अंत में, फ़ाइल टैब-सीमांकित पाठ फ़ाइल (*. txt) के रूप में सहेजें और मैंयुअल रूप से फ़ाइल नाम एक्सटेंशन को बदलने के लिए (*. cls) ।
  4. (वैकल्पिक) जीन सेट डेटाबेस फ़ाइलें: कस्टम जीन सेट को परिभाषित करें । टैब-सीमांकित GMT का उपयोग करें (जीन मैट्रिक्स स्थानांतरित) के रूप में जीन सेट के लिए फ़ाइल स्वरूप < सशक्त वर्ग = "xfig" > चित्रा 3 में दर्शाया गया है. इसके अलावा समर्थित उदाहरण फ़ाइल देखें Gene_sets_Inflammation_BIOCARTA_KEGG_REACTOME. gmt.
    नोट: कस्टम जीन सेट परिभाषित उदाहरण के लिए विशेष ब्याज के रास्ते के लिए जीन सेट संवर्धन विश्लेषण सीमित करने के लिए उपयोगी हो सकता है ( जैसे , इम्यूनोलॉजी पूति अध्ययन के लिए संकेतन), या डी नोवो के लिए अपने जीन सेट परिभाषित ( जैसे , सक्रिय और पढ़ाई में बाधा जीन है कि तुलना में होना है) । फ़ाइल का आयोजन < सबल वर्ग = "xfig" > चित्रा 3 में दर्शाया गया है । GMT प्रारूप में, प्रत्येक पंक्ति एक जीन सेट का प्रतिनिधित्व करती है (< सबल वर्ग = "xfig" > चित्रा ३ ). प्रत्येक जीन सेट एक नाम, एक वर्णन द्वारा वर्णित है, और जीन सेट में जीन । प्रथम स्तंभ में अद्वितीय जीन सेट नाम हैं. दूसरी पंक्ति में वैकल्पिक रूप से जीन सेट का विवरण शामिल हो सकता है. निंनलिखित कॉलम जीन नाम (आधिकारिक ह्यूगो जीन प्रतीकों) इसी जीन सेट के होते हैं । अंत में, फ़ाइल को टैब सीमांकित पाठ फ़ाइल (*. txt) के रूप में सहेजें और फ़ाइल नाम एक्सटेंशन को मैंयुअल रूप से परिवर्तित करें (*. gmt) ।
< p class = "jove_title" > 4. प्रदर्शन GSEA

  1. GSEA सॉफ़्टवेयर उपकरण खोलें (१.२ देखें) ।
  2. क्लिक & #39; लोड डाटा & #39; मुख्य विंडो के बायीं ओर बटन (< सुदृढ वर्ग = "xfig" > फिगर 4a ). आवश्यक डेटा फ़ाइलों को आयात करने के लिए एक नया टैब खुलेगा (< सशक्त वर्ग = "xfig" > चित्र 4B ). जीन अभिव्यक्ति डेटा के लिए नए टैब में ब्राउज़ करें (* । txt) फ़ाइल (३.२ देखें), phenotype (*. cls) फ़ाइल (३.३ देखें) और, वैकल्पिक रूप से, कस्टम जीन सेट करने के लिए (*. gmt) फ़ाइल (< मजबूत वर्ग = "xfig" > चित्र 4B ).
    1. मामले GSEA इंटरनेट से कनेक्ट नहीं कर सकता, भी डाउनलोड MSigDB लोड (* । gmt) फाइलें ( उदा. , c2. cp. v 5.2. प्रतीकों. gmt रास्ते के लिए, १.४ देखें) और डीएनए चिप (सरणी) एनोटेशन (*. चिप) फ़ाइलें (जैसे, Mouse430_2. चिप , १.५ देखें) । सफलतापूर्वक आयातित डेटा & #39; लोड डेटा & #39; खंड (< सुदृढ वर्ग = "xfig" > आरेख 4c ) में प्रकट होता है.
      नोट: प्रत्येक जीन अभिव्यक्ति अध्ययन GSEA के साथ व्यक्तिगत रूप से विश्लेषण किया जाना चाहिए । दो अध्ययनों के बीच तुलना ( उदा मानव विकार बनाम माउस मॉडल) कदम पर प्रदर्शन किया जाएगा 5.
  3. क्लिक करें & #39; ्न GSEA & #39; मुख्य विंडो के बाईं ओर बटन । विश्लेषण के लिए पैरामीटर्स सेट करने के लिए एक नया टैब खुलेगा (< सशक्त वर्ग = "xfig" > चित्रा 4d ). टैब को तीन भागों में उपविभाजित है: आवश्यक फ़ील्ड्स, मूल फ़ील्ड्स और उन्नत फ़ील्ड्स .
  4. आवश्यक फ़ील्ड्स में, पहले व्यंजक dataset चरण ४.२ (< सशक्त वर्ग = "xfig" > आरेख 4d ) में लोड का चयन करें ।
  5. चुनें जीन सेट डेटाबेस , या तो कनेक्टेड वेबसाइट से या मैन्युअल रूप से आयातित जीन सेट फ़ाइल से (< मजबूत वर्ग = "xfig" > चित्रा 4d ).
  6. संपादित करें phenotype लेबल्स नमूनों के समूहों का चयन करने के लिए जो एक-दूसरे से तुलना की जा सके ( उदा. , S. स्ताफ्य्लोकोच्चुस treatment बनाम स्वस्थ नियंत्रण) (< सुदृढ वर्ग = "xfig" > चित्रा 4d ).
  7. पतन डेटासेट जीन प्रतीकों (= सच ) के लिए अभिव्यक्ति डेटासेट में जांच पहचानकर्ता का अनुवाद करने के लिए सरकारी ह्यूगो जीन प्रतीकों जीन सेट डेटाबेस में इस्तेमाल किया । false का चयन करें, यदि व्यंजक डेटासेट में पहले से ही ह्यूगो जीन प्रतीक हैं (< मज़बूत वर्ग = "xfig" > फिगर 4d ).
  8. १,००० पर डिफ़ॉल्ट सेटिंग में परिवर्तन की संख्या सेट करें (< सशक्त वर्ग = "xfig" > चित्रा 4d ).
    नोट: उच्च संख्या के लिए कंप्यूटिंग समय काफी वृद्धि होगी ।
  9. बदल परिवर्तन & #39; जीन सेट & #39;, चूंकि phenotype परिवर्तन केवल सिफारिश की है जब हर phenotype में सात से अधिक नमूने हैं (< सशक्त वर्ग = "xfig" > चित्रा 4d ).
  10. अंत में, जीन अभिव्यक्ति डेटा पैदा करने के लिए इस्तेमाल चिप मंच का चयन करें, या तो कनेक्टेड वेबसाइट से या मैन्युअल रूप से आयातित डीएनए चिप (सरणी) एनोटेशन फ़ाइल से (< मजबूत वर्ग = "xfig" > चित्रा 4d ).
    नोट: यह चरण केवल आवश्यक है, यदि जांच पहचानकर्ता अपलोड किए गए व्यंजक dataset में उपयोग किए जाते हैं ।
  11. में मूल फ़ील्ड्स संपादित करें विश्लेषण नाम और परिणाम फ़ाइल को फिर से ढूँढने के लिए इस फ़ोल्डर अनुभाग में परिणामों को सहेजने के लिए (< सशक्त वर्ग = "xfig" > आरेख 4d ) । इसके अलावा, आगे सांख्यिकीय मापदंडों को बदला जा सकता है । पैरामीटर और उंनत फ़ील्ड अनुभाग पर अधिक विवरण के लिए कृपया GSEA उपयोगकर्ता मार्गदर्शिका (http://software.broadinstitute.org/gsea/doc/GSEAUserGuideFrame.html) पर जाएं ।
  12. (वैकल्पिक): मामले में बाहरी रूप से परिकलित समूह मैट्रिक्स जीन अभिव्यक्ति डेटा के लिए ( जैसे , समूह माध्य अनुपात) व्यक्तिगत नमूना डेटा के बजाय उपयोग किया जा करने के लिए है, GSEAed उपकरण का उपयोग करें । विश्लेषण तो पूर्व गणना समूह मैट्रिक्स है कि जीन रैंक के लिए उपयोग किया जाता है के साथ सौंपा जीन की एक साधारण सूची के आधार पर आयोजित किया जाएगा । वैकल्पिक जीन अभिव्यक्ति फ़ाइल लोड करने के बाद मुख्य नेविगेशन पट्टी पर जाएं और उपकरण पर क्लिक करें/GseaPreranked । इसी प्रकार, विश्लेषण के लिए पैरामीटर्स सेट करने के लिए एक नया टैब खुलेगा (< सशक्त वर्ग = "xfig" > आरेख 4E ).
    नोट: GSEA प्री-रैंक उपकरण का उपयोग अध्ययन के लिए सिफारिश की है कि व्यक्तिगत नमूना विशिष्ट जीन अभिव्यक्ति डेटा नहीं है । यदि विशेष आँकड़े या सामान्यीकरण कार्यविधि व्यक्तिगत नमूना डेटा के बजाय समूह माध्य मान के लिए अग्रणी डेटा पर किया गया था कि मामला हो सकता है । GSEA उपक्रमीय उपकरण का उपयोग आरएनए अनुक्रमण डेटा के लिए सिफारिश की है. आरएनए अनुक्रमण अभिव्यक्ति डेटा को सामान्य और नमूनों के लिए समूह मैट्रिक्स की गणना ( जैसे , गुना परिवर्तन के प्रवेश), कि उनकी अभिव्यक्ति के अनुसार जीन रैंक करने के लिए इस्तेमाल किया जा सकता.
  13. पर क्लिक करें & #39; ्न & #39; विंडो के ठीक नीचे पर बटन.
    नोट: विश्लेषण तो कंप्यूटिंग गति के आधार पर कई मिनट लग सकते हैं । विंडो के बाएँ तल पर GSEA रिपोर्ट अनुभाग में विश्लेषण की प्रगति का पालन करें । विश्लेषण समाप्त करने के बाद, स्थिति & #39; success & #39; GSEA रिपोर्ट अनुभाग में प्रकट होता है.
  14. GSEA रिपोर्ट विश्लेषण परिणामों को खोलने के लिए अनुभाग में सफल विश्लेषण पर क्लिक करें ।
    नोट: एक नया नेविगेशन मेनू एक ब्राउज़र विंडो में खुलेगा जो सभी परिणाम और पैरामीटर सेटिंग को सारांशित करता है (< मज़बूत वर्ग = "xfig" > चित्रा 5 ). नेविगेशन मेनू के ऊपरी दो वर्गों में शामिल जीन निर्धारित समूहों के लिए संवर्धन परिणाम (जैसे, एस स्ताफ्य्लोकोच्चुस में संवर्धन नमूनों या स्वस्थ नियंत्रण के नमूनों का इलाज) । दोनों अनुभागों की पहली पंक्तियाँ सांख्यिकीय परिणामों का सारांश दिखाती हैं. जीन सेट है कि काफी एक झूठी खोज दर (एफडीआर) 25% से नीचे समृद्ध कर रहे है निंनलिखित व्याख्या में समृद्ध माना जाता है । विश्लेषण की व्याख्या पर अधिक जानकारी GSEA उपयोगकर्ता गाइड (http://software.broadinstitute.org/gsea/doc/GSEAUserGuideFrame.html) में पाया जा सकता है ।
  15. एक्सेल प्रारूप में विस्तृत संवर्धन परिणाम पर क्लिक करें एक स्प्रेडशीट के लिए विश्लेषण परिणाम निर्यात करने के लिए (< मजबूत वर्ग = "xfig" > चित्रा 6A ). विस्तृत संवर्धन परिणाम एक्सेल में दोनों phenotypes के लिए अलग से निर्यात (< मजबूत वर्ग = "xfig" > चित्रा 5 ) और एक स्प्रेडशीट फ़ाइल में परिणाम डेटा में शामिल हो । कई अध्ययनों की जीन अभिव्यक्ति डेटा के बीच बाद की तुलना के लिए, बनाए रखने के लिए जीन सेट (कॉलम ए), अपने सामान्यीकृत संवर्धन स्कोर (NES) (कॉलम एफ) और इसके एफडीआर (झूठी डिस्कवरी दर) मूल्य (कॉलम एच) (< मजबूत वर्ग = "xfig" > चित्रा घमण्ड का नाम ).
    नोट: स्प्रेडशीट फ़ाइल विश्लेषण जीन सेट में से प्रत्येक के लिए विशाल डेटा शामिल है, जीन सेट के नाम (कॉलम ए), इसके आकार सहित (है कि, जीन अभिव्यक्ति डेटा में पाया जीन की संख्या, कॉलम घ), अपनी NES (दिशा का एक मात्रात्मक उपाय और संवर्धन की सीमा, कॉलम एफ), अपनी नाममात्र पी मूल्य (सुधार, कॉलम जी) और उसके एफडीआर मूल्य (कई परिकल्पना परीक्षण, कॉलम एच के लिए सही) । व्याख्या पर अधिक जानकारी के लिए कृपया GSEA यूज़र गाइड (http://software.broadinstitute.org/gsea/doc/GSEAUserGuideFrame.html) को देखें ।
  16. दोहराएं जीन सेट संवर्धन विश्लेषण (४.१ के लिए कदम ४.१५) दूसरे अध्ययन के लिए ( जैसे , एस स्ताफ्य्लोकोच्चुस GSE9960) और सभी आगे की पढ़ाई के लिए है कि एक दूसरे की तुलना में होना चाहिए रहे हैं । के रूप में कई मानव नैदानिक अध्ययन और विभिंन माउस मॉडल के लिए अनुवाद अनुसंधान प्रश्न के लिए इष्टतम माउस मॉडल की पहचान के रूप में शामिल करें ।
< p class = "jove_title" > 5. GSEA परिणामों की तुलना

  1. मानव स्थिति नकल उतार के लिए इष्टतम पशु मॉडल की पहचान करने के लिए एक दूसरे के लिए सभी अध्ययनों के GSEA परिणामों की तुलना करें । मार्ग (जीन सेट) के रूप में सक्रिय (NES & #62 को वर्गीकृत करने के लिए संवर्धन स्कोर और एफडीआर मूल्यों का प्रयोग करें; 0, एफडीआर & #60; 25%), हिचक (NES & #60; 0, एफडीआर & #60; 25%) या दोनों में से कोई नहीं (एफडीआर & #62; 25%) । दो अध्ययनों की प्रत्येक तुलना के लिए, मार्ग विनियमन के नौ संभव संयोजनों की प्राप्ति की संख्या गिनती के रूप में एक 3x3 आकस्मिक तालिका द्वारा संकेत (< मजबूत वर्ग = "xfig" > चित्रा 7A ).
  2. सकारात्मक पूर्वानुमान मूल्य (ppv) और नकारात्मक भविष्यवाणी मूल्य (npv) है, जो परिभाषा द्वारा मार्ग का हिस्सा है कि एक ही विनियमन दिखाने के द्वारा दो अध्ययनों के बीच सहसंबंध का आकलन (सक्रिय या बाधित) दो अध्ययनों में .
    1. की गणना ppv और npv के अनुसार निम्न सूत्र (1) और (2):
      (1) < img alt = "समीकरण 1" src = "//cloudfront.jove.com/files/ftp_upload/55768/55768eq1.jpg"/>
      (2) < img alt = "समीकरण 2" src = "//cloudfront.jove.com/files/ftp_upload/55768/55768eq2.jpg"/>
      नोट: के बाद से ओवरलैप विशुद्ध रूप से अनुकूल हो सकता है, ppv और npv संभावना से उम्मीद मूल्यों की तुलना में आगे होना है. यह दृष्टिकोण जानकारी है कि एक और अध्ययन में प्रभाव की भविष्यवाणी के लिए एक अध्ययन से प्राप्त किया जा सकता है की राशि के आकलन की अनुमति देता है । उदाहरण के लिए, यदि दो मॉडलों में विनियमन प्रक्रियाओं एक दूसरे से स्वतंत्र थे (और केवल संयोग से ओवरलैप), और अगर पहले मॉडल में रास्ते के 10% से ऊपर थे, दूसरे मॉडल को ppv भी 10% होगा और वहां inf का कोई अतिरिक्त लाभ था ormation. दूसरी तरफ, अगर दोनों मॉडल आम विनियमन तंत्र से जुड़े हुए थे, तो ppv (और npv) काफी संभावना से उंमीद से अधिक होगा । उदाहरण के लिए, एक murine एस में प्रभाव से मानव पूति (GSE9960) के दौरान जीन अभिव्यक्ति परिवर्तन की भविष्यवाणी के लिए । स्ताफ्य्लोकोच्चुस इंजेक्शन मॉडल (GSE20524), ppv ४३% (6/(6 + 8 + 0)) है और npv ६१% है (11/(0 + 7 + 11)) । दूसरे शब्दों में, murine एस स्ताफ्य्लोकोच्चुस इंजेक्शन मॉडल (GSE20524) में सक्रिय रास्ते के ४३% भी मानव पूति (GSE9960) के दौरान सक्रिय कर रहे हैं । इसी प्रकार murine एस स्ताफ्य्लोकोच्चुस इंजेक्शन मॉडल (GSE20524) में बाधित मार्ग के ६१% मानव पूति (GSE9960) (< सुदृढ वर्ग = "xfig" > चित्रा 7B ) के दौरान भी हिचकते हैं । ppv और npv भी व्युत्क्रम तारामंडल के लिए निर्धारित किया जा सकता है (है कि 1 अध्ययन से भविष्यवाणी का मतलब है 2 अध्ययन).
  3. संभावना द्वारा ओवरलैप की गणना करने के लिए 3x3 आकस्मिक तालिका का संदर्भ लें (< सुदृढ वर्ग = "xfig" > चित्रा 7 ) और निम्नलिखित सूत्र (3) और (4) के अनुसार ppvchance और npvchance की गणना करें:
    (3) < img alt = "समीकरण 3" src = "/files/ ftp_upload/55768/55768eq3. jpg "/>
    (4) < img alt =" समीकरण 4 "src ="//cloudfront.jove.com/files/ftp_upload/55768/55768eq4.jpg "/>
    नोट: उदाहरण के लिए, एक पूति S. GSE9960 में प्रभाव से मानव murine (स्ताफ्य्लोकोच्चुस) के दौरान जीन अभिव्यक्ति परिवर्तन की भविष्यवाणी के लिए इंजेक्शन मॉडल (GSE20524) ppvchance 13% (8/64) और npvchance है और 22% (14/64).
  4. ppv से ppvchance घटाकर संभावना बनाम ppv के लाभ की गणना । npv के लिए तदनुसार गणना:
    (5) < img alt = "समीकरण 5" src = "//cloudfront.jove.com/files/ftp_upload/55768/55768eq5.jpg"/>
    (6) < img alt = "समीकरण" src = "//cloudfront.jove.com/files/ftp_upload/55768/55768eq6.jpg"/>
    नोट: उदाहरण के लिए, जीन की भविष्यवाणी के लिए अभिव्यक्ति परिवर्तन के दौरान मानव पूति (GSE9960) में प्रभाव से एक murine S. स्ताफ्य्लोकोच्चुस इंजेक्शन मॉडल (GSE20524) में परिवर्तन ppv और npv बनाम मौका है + 30% (४३%-13%) और + ३९% (६१%-22%), क्रमशः.
  5. ppvgain और npvgain औसत द्वारा अध्ययन 1 के बारे में अध्ययन 2 से प्राप्त किया जा सकता है कि जानकारी के लाभ की गणना:
    (7) < img alt = "समीकरण" src = "//cloudfront.jove.com/files/ftp_upload/55768/55768eq7.jpg"/>
  6. अध्ययन की एक जोड़ी के चरण ५.१ में परिभाषित आकस्मिक तालिका का उपयोग करें (study1. मार्ग, study2. मार्ग) एक ची चुकता परीक्षण द्वारा पी मान की गणना करने के लिए.
    आकस्मिक तालिका के डेटा को किसी मैट्रिक्स X में संग्रहीत करें. ची चुकता परीक्षण, जैसे , R फ़ंक्शन का उपयोग करके chisq. test .
    नोट: उदाहरण के लिए, चयनित मानव पूति अध्ययन (GSE9960) के साथ तुलना एक murine S. स्ताफ्य्लोकोच्चुस इंजेक्शन मॉडल (GSE20524) भड़काऊ मार्ग विनियमन में एक सांख्यिकीय महत्वपूर्ण ओवरलैप से पता चलता है:
    & #62; chisq. test (X, अनुकरण. p. value = F) $ p मान
    3.82 ई-07
< p class = "jove_title" > 6. की पहचान इष्टतम पशु मॉडल

  1. विश्लेषण के लिए चयनित किए गए अध्ययनों के सभी संयोजनों के लिए GSEA परिणामों की तुलना करें ।
    नोट: यह भी (समान) की तुलना करने के लिए सिफारिश की है एक दूसरे को मानव अध्ययन के रूप में अच्छी तरह से एक दूसरे को अलग जानवर अध्ययन । इस तुलना नैदानिक अध्ययन (या विकारों) और विभिंन पशु मॉडल के intraspecies विचरण में अंतर्दृष्टि प्रदान कर सकते हैं । यह आशा की जाती है कि नैदानिक अध्ययन एक स्वीकार्य ओवरलैप और एक महत्वपूर्ण जानकारी लाभ दिखाना चाहिए, क्योंकि अंयथा नैदानिक अध्ययन भी विषम हो सकता है एक पशु मॉडल है कि मानव स्थिति की नकल कर सकते है खोजने के लिए । इस मामले में, यह केवल मानव अध्ययन है कि उपयुक्त पशु मॉडलों की पहचान के लिए एक दूसरे के समान है शामिल करने के लिए सिफारिश की है ।
  2. जानकारी के लाभ के द्वारा सभी संयोजनों तरह (५.५ कदम) । कई डेटासेट की तुलना के लिए, एक मैट्रिक्स का उपयोग करें और एक रंगीन heatmap या की तरह का उपयोग करके निष्कर्षों कल्पना (< मजबूत वर्ग = "xfig" > चित्रा 8 ).
  3. जानकारी का सबसे अधिक लाभ के साथ पशु मॉडल का चयन करें । जानकारी के लाभ के महत्व का आकलन करने के लिए, यह भी खाते में ची चुकता परीक्षण (कदम ५.६) ले.
    नोट: पशु मॉडल केवल उपयुक्त के रूप में माना जाना चाहिए अगर जानकारी का लाभ पर्याप्त है और अगर ची चुकता परीक्षण के p मूल्य महत्व स्तर से नीचे है । उपयोगकर्ता-परिभाषित थ्रेसहोल्ड आम तौर पर कई कारकों पर निर्भर करेगा: 1) मानव के लिए पशु मॉडल से परिणाम के हस्तांतरण पर पूर्व अध्ययन ज्ञान (जैसे समान फिजियोलॉजी), 2) एक माना सफलता द्वारा मनुष्य के लिए अपेक्षित लाभ, 3) व्यावहारिक कि पशु प्रयोग की प्रयोज्यता, और 4) की उंमीद दर्द, दुख, या नुकसान प्रयोगशाला पर दण्डितवक्तृत्व पशु.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

GSEA कार्यप्रवाह और अनुकरणीय डेटा के स्क्रीनशॉट का प्रदर्शन कर रहे हैं । चित्र 1 उस जीन व्यंजक डेटा फ़ाइल को दिखाता है जिसमें रुचि का transcriptomic डेटा है । प्रत्येक अध्ययन के लिए एक वर्णनात्मक phenotype फ़ाइल की आवश्यकता है जो चित्रा 2में दिखाया गया है । व्याख्या जीन सेट (उदा, मार्ग) जीन सेट डेटाबेस फ़ाइल (चित्रा 3) में परिभाषित कर रहे हैं । आरेख 4 GSEA सॉफ़्टवेयर उपकरण के उपयोग के लिए चरण-दर-चरण प्रोटोकॉल दिखाता है । एक अनुकरणीय परिणाम रिपोर्ट चित्रा 5में दी गई है । विस्तृत GSEA संवर्धन परिणाम चित्रा 6में संक्षेप हैं । अलग जीन अभिव्यक्ति अध्ययन की तुलना के लिए, विशेष रूप से मानव बनाम माउस अध्ययन में, एक आकस्मिक तालिका (चित्रा 7) की आवश्यकता है । परिणामों के दृश्य के लिए, चित्रा 8 मानव और माउस अध्ययन के बीच मार्ग तुलना के एक सहसंबंध मैट्रिक्स से पता चलता है ।

Figure 1
चित्रा 1: GSEA जीन अभिव्यक्ति डेटा फ़ाइल. फ़ाइल में सभी detectable जीन (या जांच), भी जीन है कि विभेदक व्यक्त नहीं किया जा सकता है के लिए अभिव्यक्ति मूल्यों में शामिल है । फ़ाइल इसलिए आम तौर पर जीन के कई हजारों शामिल हैं । () जीन अभिव्यक्ति डेटा फ़ाइल में प्रत्येक व्यक्ति के नमूने के लिए डेटा शामिल है. पहली पंक्ति लेबल नाम (यहां: जांच आईडी) एक वैकल्पिक विवरण और व्यक्तिगत नमूना नाम के बाद (यहां: GSM515585, GSM515586, आदिशामिल हैं) । फ़ाइल के शेष प्रत्येक जीन के लिए अभिव्यक्ति मान और डेटासेट में प्रत्येक नमूने के लिए होता है । (B) वैकल्पिक जीन व्यंजक डेटा स्वरूप । बाह्य परिकलित समूह मेट्रिक्स (यहाँ: माध्य अनुपात) व्यक्तिगत नमूना डेटा उपलब्ध नहीं हैं, तो GSEAd उपकरण के लिए उपयोग किया जा सकता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 2
चित्र 2: GSEA Phenotype फ़ाइल. फ़ाइल समूहों के लिए व्यक्तिगत नमूनों को जोड़ती है और तदनुसार समूहों लेबल । पहली पंक्ति में नमूनों की कुल संख्या और आगे समूहों की संख्या शामिल है । पहली पंक्ति का तीसरा फ़ील्ड हमेशा ' 1 ' होता है । दूसरी पंक्ति में प्रत्येक समूह के लिए नाम है । लाइन एक पाउंड चिह्न (#) के साथ एक स्थान के बाद शुरू होता है । तीसरी पंक्ति में प्रत्येक नमूने के लिए एक समूह लेबल है (यहां: 0 या 1) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 3
चित्रा 3: GSEA जीन सेट डेटाबेस फ़ाइल । फ़ाइल कुछ जैविक प्रक्रियाओं या श्रेणियों (यहां: भड़काऊ रास्ते) को सौंपा जाता है कि जीन के सेट को परिभाषित करता है । GMT प्रारूप में, प्रत्येक पंक्ति एक जीन सेट है, जो एक नाम से परिभाषित किया गया है का प्रतिनिधित्व करता है, एक विवरण, और शामिल जीन (आधिकारिक ह्यूगो जीन प्रतीकों) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 4
चित्र 4: GSEA सॉफ़्टवेयर सेटिंग. GSEA सॉफ्टवेयर उपकरण एक जावा डेस्कटॉप अनुप्रयोग के रूप में व्यापक संस्थान की वेबसाइट से डाउनलोड किया गया था । (A) प्रारंभ मेनू । बाईं ओर नेविगेशन मेनू होता है, जबकि दायां अनुभाग (मुख) GSEA कार्यप्रवाह का संक्षिप्त सारांश देता है । डेटा लोड करें बटन क्लिक करने से फ़ाइलें आयात करने के लिए एक नया टैब खुलेगा । (B) डेटा आयात से पहले डेटा लोड करें अनुभाग । आवश्यक फ़ाइलों को फ़ाइल ब्राउज़र के माध्यम से आयात किया जा सकता है । डेटा आयात के बाद (C) डेटा लोड करें अनुभाग । आयातित डेटा फ़ाइलें ऑब्जेक्ट कैश में सूचीबद्ध है और डेटासेट (अनिवार्य फाइल), phenotypes (अनिवार्य फाइल), जीन सेट डेटाबेस (वैकल्पिक, यदि इंटरनेट कनेक्शन प्रदान की) और चिप फ़ाइलें (वैकल्पिक, यदि इंटरनेट कनेक्शन प्रदान) के लिए आयोजित कर रहे हैं । GSEA चलाएं बटन पर क्लिक करने से विश्लेषण पैरामीटर्स सेट करने के लिए एक नया टैब खुलेगा । (D) GSEA चलाएं अनुभाग । विश्लेषण पैरामीटर्स सेट करने के लिए टैब को आवश्यक फ़ील्ड्स, मूल फ़ील्ड्स और उन्नत फ़ील्ड्स में विभाजित कर दिया जाता है. विंडो के ठीक नीचे पर चलाएं बटन क्लिक करने से विश्लेषण प्रारंभ हो जाएगा । विश्लेषण की प्रगति फिर विंडो के बाएँ तल पर GSEA रिपोर्ट अनुभाग में दिखाई देगा । विश्लेषण समाप्त करने के बाद, स्थिति ' सफलता ' GSEA रिपोर्ट अनुभाग में प्रकट होता है । (E) GSEA उपकरण । जीन अभिव्यक्ति डेटा फ़ाइलें व्यक्तिगत नमूना डेटा के बजाय बाह्य परिकलित समूह मेट्रिक्स युक्त मुख्य नेविगेशन पट्टी के माध्यम से विश्लेषण किया जा सकता है. कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 5
चित्र 5: GSEA रिपोर्ट. GSEA रिपोर्ट एक ब्राउज़र विंडो में खुलेगी जो सभी परिणाम और चयनित पैरामीटर्स को सारांशित करेगी । नेविगेशन मेनू के ऊपरी दो वर्गों के परिभाषित समूहों के लिए जीन सेट संवर्धन परिणाम शामिल (जैसे, संवर्धन एस. स्ताफ्य्लोकोच्चुस में इलाज के नमूनों या स्वस्थ नियंत्रण के नमूने) । उस उदाहरण में, ६५ जीन सेट (रास्ते) के ४२ चूहों का इलाज स्ताफ्य्लोकोच्चुस में सक्रिय कर रहे हैं, जबकि उनमें से 14 काफी 25% से नीचे एक एफडीआर के साथ समृद्ध कर रहे हैं. इसी तरह, ६५ जीन सेट (रास्ते) के 23 एस स्ताफ्य्लोकोच्चुस चूहों का इलाज में बाधा हैं, जबकि उनमें से 18 काफी 25% से नीचे एक एफडीआर से समृद्ध कर रहे हैं । विस्तृत संवर्धन परिणाम पर क्लिक करने से एक html या एक्सेल फ़ाइल अलग जीन अभिव्यक्ति अध्ययन की तुलना के लिए आवश्यक विश्लेषण डेटा निर्यात के लिए खुलता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 6
चित्रा 6: विस्तृत संवर्धन परिणाम. () निर्यात स्प्रेडशीट फ़ाइल जीन सेट (रास्ते) है कि स्ताफ्य्लोकोच्चुस चूहों इलाज में सक्रिय थे के लिए विस्तृत विश्लेषण परिणाम युक्त । स्प्रेडशीट फ़ाइल का विश्लेषण जीन सेट, जीन सेट, इसके आकार, अपनी सामान्यीकृत संवर्धन स्कोर, इसके नाममात्र (सुधार) पी मूल्य और उसके एफडीआर मूल्य के नाम सहित, के प्रत्येक के लिए विशाल डेटा शामिल हैं । (B) सरलीकृत स्प्रेडशीट फ़ाइल जिसेकेवल विभिंन जीन अभिव्यक्ति अध्ययन की तुलना के लिए आवश्यक जानकारी शामिल है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 7
चित्र 7:3 x 3 आकस्मिक तालिका GSEA परिणाम । () २ अध्ययनों की तुलना के लिए आम आकस्मिकता तालिका प्रारूप. () एक murine एस स्ताफ्य्लोकोच्चुस इंजेक्शन मॉडल (GSE20524) के साथ एक मानव पूति अध्ययन (GSE9960) की तुलना के लिए विनियमित रास्ते की अनुकरणीय संख्या । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 8
चित्र 8: मानव और माउस अध्ययन के बीच मार्ग तुलना के सहसंबंध मैट्रिक्स । मार्ग विनियमन के ओवरलैप जानकारी है कि एक (मानव) अध्ययन में प्रभाव की भविष्यवाणी के लिए एक (माउस) अध्ययन से प्राप्त किया जा सकता है के लाभ के रूप में दिखाया गया है (नीला, कमी, कम सहसंबंध; लाल, वृद्धि, उच्च सहसंबंध) । उस उदाहरण में, murine डेटासेट के साथ मानव की तुलना प्रयोगात्मक murine मॉडल है कि अत्यधिक मानव नैदानिक अध्ययन करने के लिए correlative थे के एक उपसमूह से पता चला (अध्ययन 10 और 11, बिंदीदार रेखा), यह दर्शाता है कि इन माउस मॉडल सबसे अच्छा नकल उतार के लिए अनुकूल हैं मानव स्थिति । इसके विपरीत, अध्ययन 7, 8 और 9 मानव रोग के अध्ययन से कोई संबंध नहीं दिखाया । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

पशु मॉडल लंबे समय रोग तंत्र की जांच और उपंयास चिकित्सीय रणनीतियों के विकास के लिए लागू किया गया है । हालांकि, संदेह पशु मॉडल के predictivity के बारे में नैदानिक परीक्षण12की विफलताओं के बाद प्रसार शुरू कर दिया । इसके अलावा, विश्लेषण और नैदानिक परीक्षणों से बड़े ओमिक्स डेटा की व्याख्या के लिए उपयुक्त रणनीतियों के बारे में विवादास्पद विचार विमर्श विपरीत डेटा विश्लेषण रणनीतियां 1 लागू करने के बाद एक ही डेटा से खींचा निष्कर्ष द्वारा उठाए गए ,2. नतीजतन, वहां जटिल ओमिक्स डेटा के विश्लेषण के लिए और अधिक मजबूत bioinformatics तकनीकों के लिए व्यवस्थित एक दिया मानव रोग के लिए इष्टतम पशु मॉडल को परिभाषित करने के लिए एक उच्च मांग है । सबसे अच्छा उपलब्ध मॉडल लागू न केवल अनुवाद अनुसंधान में सुधार, लेकिन आगे पशु प्रयोगों है कि मानव स्थिति के साथ सहसंबंधी नहीं हो सकता से परहेज द्वारा पशु कल्याण के लिए योगदान देता है ।

प्रस्तुत प्रोटोकॉल एक मानकीकृत दृष्टिकोण का वर्णन करने के लिए व्यवस्थित एक दिया मानव विकार के लिए इष्टतम पशु मॉडल और उपचार प्रोटोकॉल की पहचान के उद्देश्य के साथ विभिंन प्रजातियों के ओमिक्स डेटा की तुलना करें । GSEA के बजाय एक एकल जीन विश्लेषण के उपयोग से, इस प्रोटोकॉल जीन अभिव्यक्ति थ्रेसहोल्ड और जीन फ़िल्टरिंग की व्यक्तिपरक सेटिंग के साथ जुड़े सभी समस्याओं को दरकिनार । चयनित रास्ते पर ध्यान केंद्रित आगे विशेष रूप से (पैथो) विकार के शारीरिक प्रक्रिया (उदाहरण के लिए, सूजन) (उदा) प्रश्न में पता करने की अनुमति देता है । बेशक, GSEA परिणामों की सटीकता वर्तमान जीन सेट एनोटेशन की गुणवत्ता पर और क्या विनियमन तंत्र प्रजातियों के बीच संरक्षित कर रहे है पर निर्भर करता है । तथापि, हम परिकल्पना है कि सामांय रूप से संरक्षण में एक जीन के स्तर पर की तुलना में मार्ग स्तर पर अधिक है । इसके अलावा, सेट संवर्धन दृष्टिकोण अलग प्लेटफार्मों और प्रयोगात्मक मॉडल या एकल जीन विश्लेषण से नैदानिक साथियों के बीच transcriptomic डेटा की तुलना के लिए और अधिक मजबूत कर रहे हैं13.

इस तरह के रास्ते के रूप में पूर्व परिभाषित जीन सेट का उपयोग कर के बजाय, प्रस्तुत दृष्टिकोण भी कस्टम जीन सेट को परिभाषित करने की अनुमति देता है । विशेष रूप से, प्रयोगात्मक अभिव्यक्ति डेटा के लिए प्रासंगिक जीन है कि सक्रिय या एक शर्त में बाधा (जैसे, नैदानिक साथियों में विनियमित मानव जीन के ओवरलैप) की पहचान करने के लिए इस्तेमाल किया जा सकता है । de नोवो परिभाषित जीन सेट तो विभिंन पशु मॉडलों से डेटा के संवर्धन के लिए परीक्षण किया जा सकता है । इस वैकल्पिक दृष्टिकोण व्याख्या रास्ते का उपयोग कर के ' चक्कर ' से बचा जाता है । इसके अलावा, प्रोटोकॉल transcriptomic डेटा की तुलना करने के लिए सीमित नहीं है, लेकिन प्रोटियोमिक् और metabolomics सहित किसी भी ओमिक्स डेटा के लिए हस्तांतरणीय है. फिर भी, एक को ध्यान में रखना है कि इस दृष्टिकोण माउस मॉडल और मनुष्यों से मौजूदा ओमिक्स डेटा तक ही सीमित है, और यह संकेत नहीं है कि कैसे नए जानवर मॉडल विकसित करने के लिए । हालांकि, यह मौजूदा डेटा के मानकीकृत व्याख्या के लिए एक प्रभावी दृष्टिकोण है, जो इष्टतम पशु मॉडल के सावधान चयन की सुविधा और इस तरह अनावश्यक और भ्रामक अनुवाद अध्ययन से बचने के लिए कर सकते है का प्रतिनिधित्व करता है ।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों की घोषणा है कि वे कोई प्रतिस्पर्धा वित्तीय हितों की है ।

Acknowledgments

यह काम जर्मन फेडरल इंस्टिट्यूट फॉर रिस्क असेसमेंट (बीएफआर) द्वारा वित्तपोषित था ।

Materials

Name Company Catalog Number Comments
Excel Microsoft Corporation

DOWNLOAD MATERIALS LIST

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update--simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Tags

बुनियादी प्रोटोकॉल अंक १२६ पशु मॉडल माउस मॉडल शोधों अनुसंधान सिस्टंस जीवविज्ञान Transcriptomics GSEA
जीन सेट संवर्धन विश्लेषण का उपयोग करने के लिए अनुवाद अनुसंधान के लिए उपयुक्त पशु मॉडल की पहचान के लिए एक प्रोटोकॉल
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Weidner, C., Steinfath, M., Wistorf, More

Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video
Waiting X
Simple Hit Counter