यहाँ, हम कई मानव और मॉडल जीव डेटाबेस को कुशलता से एक्सेस करने और उनका विश्लेषण करने के लिए एक प्रोटोकॉल प्रस्तुत करते हैं। यह प्रोटोकॉल अगली पीढ़ी के अनुक्रमण प्रयासों से पहचाने गए उम्मीदवार रोग-कारण भिन्न रूपों का विश्लेषण करने के लिए MARRVEL के उपयोग को दर्शाता है।
पूरे-एक्सोम/जीनोम अनुक्रमण के माध्यम से, मानव आनुवंशिकीविद दुर्लभ रूपों की पहचान करते हैं जो रोग फीनोटाइप्स के साथ अलग होते हैं। यह आकलन करने के लिए कि क्या कोई विशिष्ट संस्करण रोगजनक है, यह निर्धारित करने के लिए कई डेटाबेस ों को क्वेरी करना चाहिए कि क्या ब्याज का जीन आनुवंशिक बीमारी से जुड़ा हुआ है, क्या विशिष्ट संस्करण को पहले सूचित किया गया है, और मॉडल जीव में कौन सा कार्यात्मक डेटा उपलब्ध है डेटाबेस है कि मानव में जीन समारोह के बारे में सुराग प्रदान कर सकते हैं. MARRVEL (मॉडल जीव दुर्लभ संस्करण विस्तार के लिए सकल संसाधन) मानव जीन और वेरिएंट और माउस, चूहे, ज़ेब्राफ़िश, फल मक्खी, सूत्रकृमि कृमि, विखंडन में सहित सात मॉडल जीवों में उनके orthologous जीन के लिए एक बंद डेटा संग्रह उपकरण है खमीर, और नवोदित खमीर. इस प्रोटोकॉल में, हम क्या MARRVEL के लिए इस्तेमाल किया जा सकता है की एक सिंहावलोकन प्रदान करते हैं और चर्चा कैसे विभिन्न डेटासेट का आकलन करने के लिए इस्तेमाल किया जा सकता है कि क्या एक ज्ञात रोग पैदा करने वाले जीन में अज्ञात महत्व (VUS) का एक संस्करण या अनिश्चित महत्व के एक जीन में एक संस्करण (GUS) हो सकता है रोगजनक. इस प्रोटोकॉल के साथ या ब्याज का एक संस्करण के बिना एक मानव जीन के साथ शुरू एक साथ कई मानव डेटाबेस खोज के माध्यम से एक उपयोगकर्ता मार्गदर्शन करेंगे. हम भी OMIM, ExAC/gnomAD, ClinVar, जेनो2सांसद, DGV और DECHIPHER से डेटा का उपयोग करने के लिए कैसे चर्चा. इसके अलावा, हम उदाहरण के लिए कैसे प्रत्येक मानव जीन के साथ जुड़े मॉडल जीवों में ortholog उम्मीदवार जीन, अभिव्यक्ति पैटर्न, और जाओ शब्दों की एक सूची की व्याख्या करने के लिए. इसके अलावा, हम मूल्य प्रोटीन संरचनात्मक डोमेन एनोटेशन प्रदान की चर्चा और समझा कैसे कई प्रजातियों प्रोटीन संरेखण सुविधा का उपयोग करने के लिए आकलन है कि ब्याज का एक प्रकार एक developmentally संरक्षित डोमेन या एमिनो एसिड को प्रभावित करता है. अंत में, हम इस वेबसाइट के तीन अलग अलग उपयोग के मामलों पर चर्चा करेंगे. MARRVEL एक आसानी से सुलभ खुला उपयोग दोनों नैदानिक और बुनियादी शोधकर्ताओं के लिए बनाया गया वेबसाइट है और कार्यात्मक अध्ययन के लिए प्रयोगों डिजाइन करने के लिए एक प्रारंभिक बिंदु के रूप में कार्य करता है.
अनुसंधान और नैदानिक आनुवंशिक प्रयोगशालाओं, दोनों में अगली पीढ़ीकी अनुक्रमण प्रौद्योगिकी का उपयोग 1 . पूरे-exome (WES) और पूरे जीनोम अनुक्रमण (WGS) विश्लेषण ज्ञात रोग पैदा करने वाले जीन में अज्ञात महत्व के कई दुर्लभ वेरिएंट (VUS) के रूप में के रूप में अच्छी तरह से जीन में वेरिएंट है कि अभी तक एक मेंडेली बीमारी के साथ जुड़े होने के लिए पता चलता है (जीयूएस: अनिश्चित के जीन महत्व)। एक नैदानिक अनुक्रम रिपोर्ट में जीन और वेरिएंट की एक सूची के साथ प्रस्तुत, चिकित्सा आनुवंशिकीविदों मैन्युअल रूप से कई ऑनलाइन संसाधनों का आकलन करने के लिए जो संस्करण ब्याज के रोगी में देखा एक निश्चित phenotype के लिए जिम्मेदार हो सकता है प्राप्त करने के लिए यात्रा करनी चाहिए . इस प्रक्रिया में समय लेने वाली है, और इसकी प्रभावकारिता व्यक्ति की विशेषज्ञता पर अत्यधिक निर्भर है. हालांकि कई दिशानिर्देश पत्र प्रकाशित किया गया है2,3, WES और WGS की व्याख्या मैनुअल curation की आवश्यकता है क्योंकि वहाँ अभी तक संस्करण विश्लेषण के लिए एक मानकीकृत पद्धति है. VUS की व्याख्या के लिए, पहले की सूचना दी जीनोटाइप-phenotype संबंध पर ज्ञान, विरासत की विधा, और आम जनता में allele आवृत्तियों मूल्यवान हो जाते हैं. इसके अलावा, इस बारे में ज्ञान कि क्या संस्करण एक महत्वपूर्ण प्रोटीन डोमेन को प्रभावित करता है, या एक विकासवादी संरक्षित अवशेषों में वृद्धि हो सकती है या रोगजनकता की संभावना कम हो सकती है। इस जानकारी के सभी इकट्ठा करने के लिए, एक आम तौर पर 10-20 मानव और मॉडल जीव डेटाबेस के माध्यम से नेविगेट करने की जरूरत है क्योंकि जानकारी वर्ल्ड वाइड वेब के माध्यम से बिखरे हुए है.
इसी प्रकार, विशिष्ट जीनों और मार्गों पर कार्य करने वाले मॉडल जीव वैज्ञानिक अक्सर अपने निष्कर्षों को मानव रोग तंत्र से जोड़ने में रुचि रखते हैं और मानव जीनोमिक्स क्षेत्र में उत्पन्न होने वाले ज्ञान का लाभ उठाना चाहते हैं। हालांकि, मानव जीनोम के बारे में डेटा सेट के तेजी से विस्तार और विकास के कारण, उपयोगी जानकारी प्रदान करने वाले डेटाबेस की पहचान करना चुनौतीपूर्ण रहा है। इसके अलावा, के बाद से सबसे मॉडल जीव डेटाबेस शोधकर्ताओं, जो एक दैनिक आधार पर विशिष्ट जीव के साथ काम करने के लिए डिज़ाइन कर रहे हैं, यह बहुत मुश्किल है, उदाहरण के लिए, एक माउस शोधकर्ता के लिए एक Drosophila डेटाबेस में विशिष्ट जानकारी के लिए खोज करने के लिए और इसके विपरीत| चिकित्सा आनुवंशिकीविदों द्वारा की गई संस्करण व्याख्या खोजों के समान, उपयोगी मानव और अन्य मॉडल जीव जानकारी की पहचान करने के लिए समय लेने वाली और भारी मॉडल जीव शोधकर्ता की पृष्ठभूमि पर निर्भर है. MARRVEL (मॉडल जीव दुर्लभ संस्करण ExpLoration के लिए एकीकृत संसाधन)4 उनके कार्यप्रवाह को कारगर बनाने के लिए उपयोगकर्ताओं के दोनों समूहों के लिए डिज़ाइन किया गया एक उपकरण है।
MARRVEL (http://marrvel.org) एक केंद्रीकृत खोज इंजन है कि चिकित्सकों और शोधकर्ताओं के लिए एक कुशल और लगातार तरीके से व्यवस्थित रूप से डेटा एकत्र के रूप में डिजाइन किया गया था. 20 या अधिक सार्वजनिक रूप से उपलब्ध डेटाबेस से जानकारी के साथ, इस कार्यक्रम के उपयोगकर्ताओं को जल्दी से जानकारी इकट्ठा करने और दोहराया खोजों के बिना मानव और मॉडल जीव डेटाबेस की एक बड़ी संख्या का उपयोग करने की अनुमति देता है. खोज परिणाम पृष्ठों में जानकारी के मूल स्रोतों के हाइपरलिंक भी होते हैं, जिससे व्यक्ति अपरिष्कृत डेटा तक पहुँच सकते हैं और स्रोतों द्वारा प्रदान की गई अतिरिक्त जानकारी एकत्रित कर सकते हैं.
VCF या BAM फ़ाइलों और अक्सर स्वामित्व / वाणिज्यिक सॉफ्टवेयर के प्रतिष्ठानों के रूप में बड़े अनुक्रमण डेटा इनपुट की आवश्यकता होती है कि संस्करण प्राथमिकता उपकरण के कई के विपरीत, MARRVEL किसी भी वेब ब्राउज़र पर चल रही है। यह कोई भी कीमत पर इस्तेमाल किया जा सकता है और पोर्टेबल उपकरणों के साथ संगत (जैसे smartphones, गोलियाँ) के रूप में लंबे समय के रूप में एक इंटरनेट से जुड़ा है. हम कई चिकित्सकों और शोधकर्ताओं के बाद से इस प्रारूप चुना आम तौर पर एक समय में एक या कुछ जीन और वेरिएंट खोज की जरूरत है. ध्यान दें कि हम बैच डाउनलोड और एपीआई (अनुप्रयोग प्रोग्रामिंग इंटरफ़ेस) MARRVEL के लिए सुविधाओं को विकसित कर रहे हैं अंततः उपयोगकर्ताओं को अनुकूलित क्वेरी उपकरण के माध्यम से एक समय में जीन और वेरिएंट के सैकड़ों क्यूरेट करने के लिए यदि आवश्यक हो तो अनुमति देने के लिए.
अनुप्रयोगों की एक विस्तृत श्रृंखला के कारण, इस प्रोटोकॉल में, हम कैसे विभिन्न डेटासेट कि MARRVEL प्रदर्शित करता है के माध्यम से नेविगेट करने पर एक मोटे तौर पर शामिल दृष्टिकोण का वर्णन करेंगे. विशिष्ट उपयोगकर्ताओं की आवश्यकताओं के लिए अनुकूलित किए गए अधिक लक्षित उदाहरणों का वर्णन प्रतिनिधि परिणाम अनुभाग में किया जाएगा. यह ध्यान दें कि MARRVEL के उत्पादन अभी भी या तो मानव आनुवंशिकी या मॉडल जीवों में पृष्ठभूमि ज्ञान का एक निश्चित स्तर की आवश्यकता के लिए मूल्यवान जानकारी निकालने के लिए महत्वपूर्ण है. हम पाठकों को उस तालिका में संदर्भित करते हैं जो प्राथमिक समाचार पत्रों कोसूचीबद्ध करता है जो MARRVEL (तालिका 1) द्वारा क्यूरेट किए गए मूल डेटाबेस में से प्रत्येक के फ़ंक्शन का वर्णन करता है. निम्नलिखित प्रोटोकॉल तीन वर्गों में विभाजित है: (1) कैसे एक खोज शुरू करने के लिए, (2) कैसे MARRVEL मानव आनुवंशिकी outputs की व्याख्या करने के लिए, और (3) कैसे MARRVEL में मॉडल जीव डेटा का उपयोग करने के लिए. प्रतिनिधि परिणाम अनुभाग में, अधिक केंद्रित और विशिष्ट दृष्टिकोण ों का वर्णन किया गया है. MARRVEL सक्रिय रूप से अद्यतन किया जा रहा है तो कृपया डेटा स्रोतों के बारे में जानकारी के लिए वर्तमान वेबसाइट के अकसर किये गए सवाल पृष्ठ को देखें. हम पुरजोर अनुशंसा करते हैं MARRVEL के उपयोगकर्ताओं को अद्यतन सूचनाएँ के माध्यम से ई-मेल सबमिशन प्रपत्र के माध्यम से अद्यतन सूचनाएँ प्राप्त करने के लिए हस्ताक्षर करने के लिए MARRVEL मुख पृष्ठ के निचले भाग पर।
इस प्रोटोकॉल में महत्वपूर्ण चरणों में प्रारंभिक इनपुट (चरण 1-1-1-3) और आउटपुट की अनुवर्ती व्याख्या शामिल हैं। सबसे आम कारण खोज परिणाम नकारात्मक हैं क्योंकि कई मायनों में है कि एक जीन और / MARRVEL एक शेड्यूल किए ग…
The authors have nothing to disclose.
हम Drs. Rami अल-Ouran, Seon-Young Kim, Yanhui (क्लेयर) हू, यिंग-वूई वान, नवीन मनोहरन, Sasidhar Pasupuleti, Aram Comjean, Dongxue माओ, माइकल Wangler, Hsiao-Tuan चाओ, Stephanie Mohr, और Norbert Perrimon उनके विकास में उनके समर्थन के लिए धन्यवाद MARRVEL का रखरखाव. हम इस पांडुलिपि पर अपने इनपुट के लिए सामन्था एल डील और जे माइकल Harnish के आभारी हैं.
MARRVEL के प्रारंभिक विकास एनआईएच कॉमनफंड (U54NS093793) के माध्यम से और अनुसंधान बुनियादी ढांचा कार्यक्रम (ORIP) (R24OD022005) के NIH कार्यालय के माध्यम से Undiagnosed रोग नेटवर्क मॉडल जीव स्क्रीनिंग केंद्र द्वारा भाग में समर्थित किया गया था। JW एनआईएच यूनिस कैनेडी Shriver राष्ट्रीय बाल स्वास्थ्य और मानव विकास संस्थान (F30HD094503) और रॉबर्ट और जेनिस McNair फाउंडेशन McNair एमडी / HJB आगे सामान्य चिकित्सा विज्ञान के NIH राष्ट्रीय संस्थान (R01GM067858) द्वारा समर्थित है और हावर्ड ह्यूजेस चिकित्सा संस्थान के एक अन्वेषक है. एनआईएच राष्ट्रीय सामान्य चिकित्सा विज्ञान संस्थान (R01GM120033), नेशनल इंस्टीट्यूट ऑफ एजिंग (R01AG057339), और हफिंगटन फाउंडेशन द्वारा समर्थित है। एसवाई को बहरापन और अन्य संचार विकारों (R01DC014932), सिमंस फाउंडेशन (SFARI पुरस्कार: 368479), अल्जाइमर एसोसिएशन (नए अन्वेषक अनुसंधान अनुदान: 15-364099), नमन परिवार पर NIH राष्ट्रीय संस्थान से अतिरिक्त सहायता प्राप्त हुई आणविक चिकित्सा में अनुसंधान के लिए बुनियादी अनुसंधान और कैरोलीन Wiess कानून कोष के लिए कोष.
Human Genetics | ClinVar | PMID: 29165669 | https://www.ncbi.nlm.nih.gov/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www.ncbi.nlm.nih.gov/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |