Genetics

एक तेजी से और मात्रात्मक विधि के बाद अनुवाद संशोधन और संस्करण के लिए पेप्टाइड्स की मैपिंग जीनोम के लिए सक्षम

Published: May 22, 2018 doi: 10.3791/57633

Christoph N. Schlaffner^1,2,3, Georg J. Pirklbauer², Andreas Bender³, Judith A.J. Steen¹, Jyoti S. Choudhary^2,4

¹Department of Neurobiology, F. M. Kirby Neurobiology Center, Boston Children's Hospital, Harvard Medical School, ²Proteomic Mass Spectrometry, Wellcome Trust Sanger Institute, Wellcome Genome Campus, ³Centre for Molecular Informatics, Department of Chemistry, University of Cambridge, ⁴Functional Proteomics Group, Chester Beatty Laboratories, Institute of Cancer Research

Summary

यहां हम proteogenomic उपकरण पोगो और प्रोटोकॉल के लिए तेजी से वर्तमान, मात्रात्मक, पद अनुवाद संशोधन और संस्करण सक्षम पेप्टाइड्स के संदर्भ जीनोम पर जन स्पेक्ट्रोमेट्री के माध्यम से की पहचान की मैपिंग । इस उपकरण का उपयोग करने के लिए एकीकृत और कल्पना proteogenomic और व्यक्तिगत proteomic अध्ययन ओर्थोगोनल जीनोमिक्स डेटा के साथ सामना करना पड़ रहा है ।

Abstract

जीन, टेप के बीच क्रॉस बात करते हैं, और प्रोटीन सेलुलर प्रतिक्रियाओं की कुंजी है; इसलिए, विभिंन संस्थाओं के रूप में आणविक स्तर के विश्लेषण धीरे-एकीकृत अध्ययन करने के लिए बढ़ाया जा रहा है कोशिकाओं के भीतर आणविक गतिशीलता की समझ बढ़ाने के लिए । दृश्य और अंय ओमिक्स डेटासेट के साथ प्रोटियोमिक् के एकीकरण के लिए वर्तमान उपकरण बड़े पैमाने पर अध्ययन के लिए अपर्याप्त हैं । इसके अलावा, वे केवल बुनियादी अनुक्रम को पकड़ने की पहचान, पोस्ट अनुवाद संशोधन और quantitation खारिज । इन समस्याओं को हल करने के लिए, हमने पोगो को संबद्ध पोस्ट-शोधों संशोधनों और ठहराव जीनोम एनोटेशन के संदर्भ में मैप करने के लिए विकसित किया है । इसके अलावा, उपकरण एक एमिनो एसिड वेरिएंट को शामिल अनुकूलित अनुक्रम डेटाबेस से पहचाना पेप्टाइड्स की मैपिंग सक्षम करने के लिए विकसित किया गया था. जबकि पोगो एक कमांड लाइन उपकरण है, चित्रमय अंतरफलक PoGoGUI सक्षम बनाता है गैर bioinformatics शोधकर्ताओं को आसानी से 25 Ensembl जीनोम एनोटेशन द्वारा समर्थित प्रजातियों के लिए पेप्टाइड्स नक्शा । उत्पंन उत्पादन जीनोमिक्स क्षेत्र से फ़ाइल स्वरूपों उधार और, इसलिए, दृश्य सबसे जीनोम ब्राउज़रों में समर्थित है । बड़े पैमाने पर अध्ययन के लिए, पोगो भी proteogenomics डेटा का एक आसान साझा करने के लिए सक्षम जीनोम के लिए मैप डेटा के वेब सुलभ खजाने बनाने के लिए TrackHubGenerator द्वारा समर्थित है. छोटे प्रयास के साथ, इस उपकरण के लिए केवल कुछ ही मिनटों के भीतर जीनोम के संदर्भ में लाखों पेप्टाइड का नक्शा कर सकते हैं, अन्य उपलब्ध अनुक्रम-पहचान आधारित उपकरणों को बेहतर प्रदर्शन. यह प्रोटोकॉल proteogenomics मैपिंग के लिए पोगो के माध्यम से गुणात्मक और phosphoproteomics के सार्वजनिक रूप से उपलब्ध datasets, साथ ही बड़े पैमाने पर अध्ययन के लिए श्रेष्ठ approaches प्रदर्शित करता है ।

Introduction

कोशिकाओं, जीनोम, transcriptome, और proteome में एक दूसरे को प्रभावित करने के लिए आंतरिक और बाह्य उत्तेजनाओं के लिए एक प्रतिक्रिया मिलाना और एक दूसरे के साथ बातचीत करने के लिए विशेष स्वास्थ्य और रोग के लिए अग्रणी कार्य बाहर ले । इसलिए, निस्र्पक और बढ़ाता जीन, टेप, और प्रोटीन पूरी तरह से सेलुलर प्रक्रियाओं को समझने के लिए महत्वपूर्ण है । अगली पीढ़ी के अनुक्रमण (NGS) सबसे अधिक लागू रणनीतियों में से एक की पहचान करने के लिए और जीन और प्रतिलेखन अभिव्यक्ति बढ़ाता है । हालांकि, प्रोटीन अभिव्यक्ति सामांयतः मास स्पेक्ट्रोमेट्री (एमएस) द्वारा मूल्यांकन किया जाता है । पिछले दशक में एमएस प्रौद्योगिकी में महत्वपूर्ण प्रगति और अधिक एक पूरी पहचान और proteomes के ठहराव सक्षम है, डेटा transcriptomics¹के साथ तुलनीय बनाने । Proteogenomics और बहु-ओमिक्स NGS और एमएस डेटा एकीकृत करने के तरीके के रूप में शक्तिशाली कई आणविक स्तर भर में सेलुलर प्रक्रियाओं का आकलन करने के लिए दृष्टिकोण बन गए हैं, कैंसर के उपप्रकार की पहचान और उपंयास के लिए अग्रणी कैंसर में संभावित दवा लक्ष्य² ^, ³. यह ध्यान दें कि proteogenomics शुरू में जीन और प्रतिलिपि एनोटेशन⁴के लिए proteomic सबूत उपलब्ध कराने के लिए इस्तेमाल किया गया महत्वपूर्ण है । कई जीन पहले से गैर होने लगा कोडिंग हाल ही में बड़े पैमाने पर मानव ऊतक डेटासेट⁵^,⁶^,⁷पर विचार पुनर्मूल्यांकन किया है । इसके अलावा, proteomic डेटा सफलतापूर्वक गैर मॉडल जीवों⁸^,⁹में एनोटेशन प्रयासों का समर्थन करने के लिए उपयोग किया जाता है । हालांकि, proteogenomic डेटा एकीकरण और एक संयुक्त संदर्भ प्रणाली और तरीकों के लिए प्रदान करके जीनोमिक सुविधाओं और स्पष्ट पार-टेप और प्रोटीन के बीच बात करने के संबंध में प्रोटीन अभिव्यक्ति को उजागर करने के लिए शोषण किया जा सकता है सह दृश्यावलोकन ।

आदेश में प्रोटियोमिक्, transcriptomics, और जीनोमिक्स डेटा के लिए एक आम संदर्भ प्रदान करने के लिए, कई उपकरण के जीनोम पर एमएस के माध्यम से पहचान पेप्टाइड्स मानचित्रण के लिए लागू किया गया है निर्देशांक¹⁰^,¹¹^,¹² ^,¹³^,¹⁴^,¹⁵^,¹⁶^,¹⁷. दृष्टिकोण मानचित्रण संदर्भ, जीनोम ब्राउज़रों के समर्थन के रूप में पहलुओं में अलग है, और अंय प्रोटियोमिक् उपकरण के साथ एकीकरण की डिग्री के रूप में चित्र 1में दिखाया गया है । हालांकि कुछ उपकरण एक जीनोम¹⁶पर अनुवाद पेप्टाइड्स रिवर्स, दूसरों को एक खोज इंजन एक प्रोटीन और जीन एनोटेशन के भीतर व्याख्या की स्थिति का उपयोग करने के लिए पेप्टाइड¹⁵के न्यूक्लियोटाइड अनुक्रम पुनर्निर्माण । अभी भी दूसरों के जीनोम के एक 3 या 6 फ्रेम अनुवाद का उपयोग करने के लिए¹¹^,¹³के खिलाफ पेप्टाइड्स नक्शा । अंत में, कई उपकरण न्यूक्लियोटाइड दृश्यों को छोड़ और संबद्ध जीनोम के लिए पेप्टाइड्स नक्शा करने के लिए एक मध्यवर्ती के रूप में आरएनए-अनुक्रमण मैप्ड टेप से एमिनो एसिड अनुक्रम अनुवाद का उपयोग करें¹⁰^,¹²^, ¹⁴^,¹⁷. हालांकि, अनुवाद न्यूक्लियोटाइड अनुक्रम का एक धीमी प्रक्रिया है और कस्टम डेटाबेस पेप्टाइड मैपिंग करने के लिए प्रोपेगेट त्रुटियों के लिए प्रवण हैं । तेजी से और उच्च प्रवाह मानचित्रण के लिए, एक छोटे और व्यापक संदर्भ महत्वपूर्ण है । इसलिए, एसोसिएटेड जीनोम निर्देशांक के साथ एक मानकीकृत प्रोटीन संदर्भ जीनोम मानचित्रण के लिए सटीक पेप्टाइड के लिए आवश्यक है । proteogenomics में उपंयास पहलुओं, जैसे वेरिएंट और बाद के शोधों के संशोधन (PTMs)²^,³, हाल के अध्ययनों के माध्यम से गति प्राप्त कर रहे हैं । हालांकि, ये सामांयत: आरेख 1में दिखाए गए के रूप में वर्तमान proteogenomic मैपिंग उपकरणों द्वारा समर्थित नहीं हैं । गति और मानचित्रण की गुणवत्ता में सुधार करने के लिए, पोगो विकसित किया गया था, एक उपकरण है कि पेप्टाइड्स की तेजी से और मात्रात्मक मानचित्रण के जीनोम के लिए अनुमति देता है¹⁸. इसके अलावा, पोगो दो अनुक्रम वेरिएंट और व्याख्या पोस्ट-शोधों संशोधनों के साथ पेप्टाइड्स के मानचित्रण सक्षम बनाता है ।

पोगो मात्रात्मक उच्च संकल्प डेटासेट proteomes और वैश्विक संशोधनों पर कब्जा करने की तेजी से वृद्धि से निपटने के लिए विकसित किया गया है और व्यक्तिगत भिन्नता और परिशुद्धता दवा के रूप में बड़े पैमाने पर विश्लेषण के लिए एक केंद्रीय उपयोगिता प्रदान करता है. यह आलेख जीनोमिक सुविधाओं के संबंध में पोस्ट-शोधों के संशोधन की उपस्थिति की कल्पना करने के लिए इस टूल के अनुप्रयोग का वर्णन करता है. इसके अलावा, यह लेख मैप किए गए पेप्टाइड्स के माध्यम से वैकल्पिक ब्याह की घटनाओं की पहचान और एक संदर्भ जीनोम के लिए कस्टम वैरिएंट डेटाबेस के माध्यम से पहचान की पेप्टाइड्स की मैपिंग पर प्रकाश डाला गया । यह प्रोटोकॉल पोगो के इन कार्यक्षमताओं को प्रदर्शित करने के लिए¹⁹ गौरव संग्रह से डाउनलोड किए गए सार्वजनिक रूप से उपलब्ध डेटासेट को कार्यरत करता है । इसके अलावा, इस प्रोटोकॉल बड़े पैमाने पर proteogenomics अध्ययन के लिए जीनोम के लिए मैप पेप्टाइड्स के ऑनलाइन सुलभ हब के निर्माण के लिए TrackHubGenerator के आवेदन का वर्णन.

Protocol

1. तैयारी, डाउनलोड, और सेटअप

नोट: फ़ाइल और फ़ोल्डर पथ उदाहरण मानक उपयोगकर्ताओं के लिए पहुंच की सुगमता के लिए किसी Windows स्वरूप में दिखाए जाते हैं । पोगो और PoGoGUI भी macOS और लिनक्स ऑपरेटिंग सिस्टम के लिए उपलब्ध हैं ।

डाउनलोड पोगो और PoGoGUI से GitHub
1. एक वेब ब्राउज़र खोलें और GitHub (http://github.com/cschlaffner/PoGo/) पर पोगो नेविगेट । रिलीज़ चुनें और नवीनतम रिलीज़ ज़िप संपीड़ित फ़ाइल डाउनलोड करें । संपीडित फ़ाइल को निष्पादन योग्य फ़ोल्डर (उदा., C:\PoGo\executables\) में निकालें ।
2. GitHub (http://github.com/cschlaffner/PoGoGUI/) पर PoGoGUI करने के लिए वेब ब्राउज़र में नेविगेट । चुनें विज्ञप्ति और नवीनतम रिलीज जार फ़ाइल (उदा, "pogogui-v 1.0.2. jar") डाउनलोड करें । निष्पादन योग्य फ़ोल्डर में जार फ़ाइल संग्रहीत है ।
डाउनलोड जीनोम एनोटेशन और अनुवादित प्रोटीन-कोडिंग दृश्यों
नोट: जीनोम एनोटेशन डाउनलोड और अनुवाद प्रोटीन GENCODE से समर्थित प्रजातियों के लिए कोडिंग अनुक्रम⁷ (www.gencodegenes.org) या Ensembl²⁰ (www.ensembl.org) में सामांय स्थानांतरण प्रारूप (GTF) और प्रोटीन अनुक्रम में फसता स्वरूप ।
1. वेब ब्राउज़र में, www.gencodegenes.org पर नेविगेट करें और डेटा चुनें । मानव | वर्तमान रिलीज। डाउनलोड GTF लिंक के माध्यम से व्यापक जीन एनोटेशन और डेटा फ़ोल्डर में gz संकुचित फ़ाइल निकालने (उदा., C:\PoGo\Data\) एक unज़िपिंग कार्यक्रम (जैसे, 7-ज़िप) का उपयोग कर ।
2. फसता लिंक के माध्यम से प्रोटीन कोडिंग प्रतिलिपि अनुवाद दृश्यों को डाउनलोड करने और पिछले चरण में उत्पन्न डेटा फ़ोल्डर में gz संकुचित फ़ाइल को निकालने ।
  1. वैकल्पिक रूप से, वेब ब्राउज़र में नेविगेट करने के लिए www.ensembl.org और डाउनलोड का चयन करें FTP के माध्यम से डेटाके बाद । एक समर्थित प्रजातियों का पता लगाएं (उदा., मानव) । डाउनलोड प्रतिलिपि एनोटेशन के लिए नवीनतम रिलीज फ़ाइल जीन सेट कॉलम में GTF लिंक का उपयोग कर । नाम संरचना "प्रजातियों. release. gtf. gz" के साथ फ़ाइल चुनें और gz-संपीडित फ़ाइल को डेटा फ़ोल्डर में निकालें ।
3. नवीनतम रिलीज प्रोटीन कोडिंग प्रतिलिपि अनुवाद अनुक्रम प्रोटीन अनुक्रम (फसता) स्तंभ में फसता लिंक का उपयोग कर डाउनलोड करें । नाम संरचना "प्रजातियों. release. पेप. all. एफए. gz" के साथ फ़ाइल चुनें और डेटा फ़ोल्डर में gz-संकुचित फ़ाइल निकालें ।
पेप्टाइड पहचान फ़ाइलें तैयार
नोट: पोगो केवल एक 4-कॉलम प्रारूप का समर्थन करता है जिसमें नमूना पहचानकर्ता, पेप्टाइड अनुक्रम, पेप्टाइड-स्पेक्ट्रम-मेल (PSMs), और मात्रात्मक मान की संख्या । हालांकि, PoGoGUI मानकीकृत पहचान फ़ाइल स्वरूपों mzIdentML, mzid, और mzTab का समर्थन करता है, और उंहें पोगो के 4 कॉलम प्रारूप में धर्मांतरित सार्वजनिक रूप से उपलब्ध फ्रेमवर्क ms-डेटा कोर-एपीआई²¹का उपयोग कर । mzIdentML, mzid, या mzTab प्रारूप में फ़ाइलें गौरव पुरालेख¹⁹से डाउनलोड किया जा सकता है । वैकल्पिक रूप से, डेटा एक्सटेंशन. tsv या. पोगो के साथ टैब-पृथक फ़ाइल स्वरूप में प्रदान किया जा सकता है । स्वरूप में निंन स्तंभ शीर्षलेख के साथ 4 स्तंभ हैं: नमूना पहचानकर्ता (नमूना), पेप्टाइड अनुक्रम (पेप्टाइड), पेप्टाइड-स्पेक्ट्रम-मेल (PSMs), और पेप्टाइड quantitation (क्वांट) की संख्या । एक उदाहरण आरेख 2में दिखाया गया है ।
1. गौरव पुरालेख¹⁹ (https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files²²) से मानव वृषण पर एक प्रोटियोमिक् अध्ययन से mzTab प्रारूप में एक उदाहरण फ़ाइल डाउनलोड करें ।
2. सहेजें और चरण 1.2.1 में बनाए गए डेटा फ़ोल्डर में gz-संपीडित फ़ाइल को निकालें ।
  नोट: वैकल्पिक रूप से, मानव phosphoproteomics के लिए उदाहरण डेटा डाउनलोड गौरव संग्रह से MaxQuant के साथ खोजा (फ़ाइल "Traktman_2013_MaxQuantOutput-full. zip" से https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files²³) ।
3. सहेजें और चरण 1.2.1 में बनाया गया था जो डेटा फ़ोल्डर में ज़िप-संपीड़ित फ़ाइल को निकालें ।
4. एक रिक्त स्प्रेडशीट खोलें और फ़ोल्डर C:/पोगो/डेटा/Traktman_2013_MaxQuantOutput-full/संयुक्त/txt/विकल्प डेटा का उपयोग कर से पेप्टाइड्स. txt फ़ाइल आयात करें । पाठ/CSV से। प्रारंभिक विंडो में, संपादनक्लिक करें ।
5. "अनुक्रम", "experiment BR1", "प्रयोग BR2", "experiment BR3", "अनुपात h/l सामान्यीकृत BR1", "अनुपात h/l सामान्यीकृत BR2", और "अनुपात h/l सामान्यीकृत BR3" के अपवाद के साथ सभी स्तंभों को निकालें ।
6. स्तंभों का चयन करें "अनुपात h/l सामान्यीकृत BR1", "अनुपात h/l सामान्यीकृत BR2", और "अनुपात h/l सामान्यीकृत BR3" और क्लिक करें रूपांतर | स्तंभोंको अनपिवट करना । "प्रयोग BR1", "प्रयोग BR2", और "प्रयोग BR3" कॉलम का चयन करें और unpivot कार्रवाई को दोहराएँ.
7. परिणामी स्तंभ "विशेषता" का चयन करें और रूपांतरण का उपयोग करके सामग्री को विभाजित कर | स्तंभ विभाजित करें । सीमांकक द्वारा। ड्रॉप-डाउन मेनू में सीमांकक के रूप में रिक्ति का चयन करें । "विशेषता .1" स्तंभ के लिए कार्रवाई को दोहराएँ ।
8. परिणामी स्तंभों को "एट्रिब्यूट. 1.1", "एट्रिब्यूट .2", "एट्रिब्यूट .3", और "एट्रिब्यूट. 1.1.1" निकालें.
9. स्तंभ जोड़ें का उपयोग कर एक स्तंभ जोड़ें । कस्टम स्तंभ विकल्प । कस्टम स्तंभ सूत्र को निंन का प्रतिनिधित्व करने के लिए अनुकूलित करें: "= [एट्रिब्यूट. 4] = [एट्रिब्यूट. 1.2]" ।
10. "FALSE" वाली सभी पंक्तियों को फ़िल्टर करने के लिए जेनरेट किए गए कस्टम स्तंभ पर फ़िल्टर लागू करें; केवल "सही" युक्त पंक्तियाँ रहेंगी.
11. "विशेषता. 1.2" और "कस्टम" स्तंभों को निकालें और निंन करने के लिए शेष स्तंभों का क्रम बदलें: "विशेषता .4", "अनुक्रम", "value .1", और "मान" ।
12. स्तंभ नामों को क्रमशः "प्रयोग", "पेप्टाइड", "PSMs" और "क्वांट" में परिवर्तित करें. घर का उपयोग कर फ़ाइल लोड । लोड & बंद करें।
13. फ़ाइल को एक टैब के रूप में सहेजें-सीमांकित फ़ाइल का उपयोग कर फ़ाइल । इस रूप में सहेजें और "पाठ (टैब सीमांकित) (*. txt)" प्रकार का चयन करें । नाम बदलें करने के लिए "peptides_pogo. txt" और इसे फ़ोल्डर में सहेजें C:/पोगो/डेटा ।

2. Quantitation सहित व्याख्या के बाद अनुवाद संशोधन और दृश्य के साथ मानचित्रण पेप्टाइड्स

नोट: परिणामी आउटपुट फ़ाइल ब्राउज़र एक्सटेंसिबल डेटा (बिस्तर) स्वरूप का समर्थन करने वाले किसी भी जीनोम ब्राउज़र में लोड किया जा सकता है । ब्राउज़रों का एक चयन एकीकृत जीनोम ब्राउज़र (IGV)²⁴ है (जो निंनलिखित में प्रयोग किया जाता है), UCSC जीनोम²⁵ब्राउज़र, और Ensembl जीनोम ब्राउज़र²⁰। यह नोट करने के लिए महत्वपूर्ण है कि एनोटेशन GTF और प्रोटीन फसता संस्करणों पोगो मानचित्रण के लिए इस्तेमाल किया जीनोम ब्राउज़र में जीनोम के संस्करण मैच । मानव Ensembl विज्ञप्ति 57-75 और GENCODE संस्करण 3d-19 के लिए, GRCh37/hg19 का उपयोग करें; Ensembl संस्करणों के लिए ७६ या उच्चतर और GENCODE 20 या उच्चतर, GRCh38/hg38 का उपयोग करें । माउस Ensembl संस्करण ७४ या उच्चतर और GENCODE M2 या उच्चतर के लिए, GRCm38 का उपयोग करें ।

नक्शा PoGoGUI का उपयोग पेप्टाइड्स (चित्रा 3 देखें) ।
1. निष्पादन योग्य फ़ोल्डर में नेविगेट करें । चिह्न PoGoGUI-vX.x. x. jar पर डबल-क्लिक करके प्रोग्राम को प्रारंभ करें ।
  नोट: ग्राफिकल यूजर इंटरफेस शुरू कर देंगे और विकल्पों में से आसान और दृश्य चयन की अनुमति.
2. "पोगो निष्पादन योग्य" के बगल में चुनें बटन का उपयोग करें । फिर, निष्पादन योग्य फ़ोल्डर में प्रासंगिक आपरेटिंग सिस्टम सबफ़ोल्डर (उदा, C:\PoGo\Executables\Windows\) पर नेविगेट करें । पोगो (उदा., पोगो. exe) के निष्पादक का चयन करें और खोलें बटन क्लिक करके उसके चयन की पुष्टि कर लें ।
3. चुनेंक्लिक करके प्रोटीन अनुक्रम के लिए संदर्भ इनपुट फ़ाइल का चयन करें । डेटा फ़ोल्डर में नेविगेट और अनुवाद फसता फ़ाइल का चयन करें । खोलें बटन क्लिक करके उसके चयन की पुष्टि करें ।
4. का चयन करें प्रतिलिपि एनोटेशन फ़ाइल का चयन करें बटन का उपयोग कर । डेटा फ़ोल्डर में नेविगेट करें और एनोटेशन GTF फ़ाइल चुनें । खोलें बटन क्लिक करके चयन की पुष्टि करें ।
5. पेप्टाइड पहचान फ़ाइल जोड़ें-एकाधिक फ़ाइल चयन सक्षम है — "पेप्टाइड फ़ाइलें" के आगे जोड़ें बटन का उपयोग करके । समर्थित स्वरूप में किसी फ़ाइल का चयन करें mzTab, mzIdentML, या mzid, या टैब-पृथक 4-स्तंभ स्वरूप में डाउनलोड और चरण १.३ में तैयार ।
6. आउटपुट स्वरूप चयन में बिस्तर और GTF के बगल में चेक बॉक्स अनचेक करें । ही छोड़ PTM पलंग और GCT जाँच की.
7. ड्रॉप-डाउन चयन से डेटा के लिए उपयुक्त प्रजातियों का चयन करें । यह आवश्यक है कि फसता फ़ाइल, GTF फ़ाइल, और ड्रॉप डाउन चयन एक ही प्रजाति के लिए कर रहे हैं ।
8. प्रारंभ बटन क्लिक करके मैपिंग प्रारंभ करें ।
  नोट: यदि आवश्यक हो, PoGoGUI इनपुट फ़ाइल को पोगो स्वरूप में कनवर्ट करेगा, भविष्य की सुविधा के लिए एक ही फ़ोल्डर में पोगो फ़ाइलें प्रदान करें, और मैपिंग प्रक्रिया प्रारंभ करें । चरण 1.3.1 में डाउनलोड किए गए एक एकल mzTab फ़ाइल का रूपांतरण मैपिंग शुरू होने से पहले 10-20 मिनट के बीच चलेगा.
एकीकृत जीनोमिक्स दर्शक में visualizing
नोट: चित्र 4देखें ।
1. फ़ाइल के माध्यम से IGV में "_ptm. bed" में समाप्त पोगो आउटपुट फ़ाइल लोड । फ़ाइल से लोड और फ़ाइल का चयन करें ।
  नोट: आकार के कारण, कुछ फ़ाइलों के लिए एक अनुक्रमणिका की जनरेशन की आवश्यकता हो सकती है जीनोमिक क्षेत्रों के एक त्वरित reloading की अनुमति दें करने के लिए । IGV उपयोगकर्ता स्वचालित रूप से पीढ़ी के लिए संकेत देगा । दिए गए निर्देशों का पालन करें ।
2. "_noptm. bed" में समाप्त होने वाली फ़ाइल के लिए लोडिंग चरण दोहराएं । इस फ़ाइल में सभी पेप्टाइड्स किसी भी संशोधन के बिना पाया है ।
3. ध्यान दें कि प्रत्येक लोड फ़ाइल ट्रैक की पहचान फ़ाइल नाम के साथ अलग पटरियों के रूप में दिखाया जाएगा. खींच और सूची में वांछित स्थिति के लिए उन्हें छोड़ने के द्वारा पटरियों को फिर से क्रम में.
4. ध्यान दें कि प्रत्येक ट्रैक शुरू में एक संक्षिप्त तरीके से दिखाया गया है । उनका विस्तार करने के लिए, सही ट्रैक नाम पर क्लिक करें और या तो एक खड़ी दृश्य के लिए अनुक्रम या squished सहित पेप्टाइड्स का एक पूर्ण दृश्य के लिए विस्तारित का चयन करें.
5. ". gct" में समाप्त होने वाली फ़ाइल के लिए लोडिंग चरण दोहराएं । इस फ़ाइल में प्रति व्याख्या नमूना पेप्टाइड quantitation है ।
6. ऊपर भरी हुई फ़ाइलों के लिए विपरीत, प्रत्येक व्याख्या नमूना एक अलग ट्रैक के रूप में लोड किया जाएगा । खींचें और ड्रॉप आपरेशनों के माध्यम से नमूनों को पुनर्गठित ।
7. ड्रॉप-डाउन मेनू में एक गुणसूत्र का चयन करके जीनोम के भीतर नेविगेट, जीनोमिक निर्देशांक में टाइप, एक जीन प्रतीक खोज, या क्लिक करें और में ज़ूम करने के लिए एक गुणसूत्र के एक वर्ग का चयन करने के लिए पकड़.

3. मानचित्रण एक संदर्भ जीनोम के लिए एक कस्टम संस्करण डेटाबेस के माध्यम से पहचान पेप्टाइड्स

नोट: पोगो मैपिंग ग्राफ़िकल यूज़र इंटरफ़ेस (GUI) का उपयोग कर या कमांड लाइन इंटरफ़ेस के माध्यम से किया जा सकता है । वे विनिमेय हैं । प्रोटोकॉल के इस भाग में, कमांड लाइन अंतरफलक के लिए विनिमेयता को उजागर किया जाता है । इस प्रोटोकॉल अनुभाग के दूसरे भाग के लिए सॉफ़्टवेयर उपकरण R²⁶की आवश्यकता है । कृपया सुनिश्चित करें कि पैकेज स्थापित किया गया है ।

संदर्भ के जीनोम के संदर्भ पेप्टाइड्स नक्शा ।
1. एक कमांड प्रॉंप्ट खोलें (cmd) और निष्पादन योग्य फ़ोल्डर में नेविगेट पोगो (उदा., C:\PoGo\Executables\) ।
2. नीचे आदेश टाइप करें:
  पोगो. exe-gtf \PATH\TO\GTF-फसता \PATH\TO\FASTA-में \PATH\TO\IN-स्वरूप बिस्तर-प्रजातियों MYSPECIES
  1. \PATH\TO\GTF, \PATH\TO\FASTA, और \PATH\TO\IN करने के लिए पथ के साथ एनोटेशन GTF, प्रोटीन अनुक्रम फसता, और पेप्टाइड पहचान फ़ाइल (4-स्तंभ स्वरूप में समाप्त फ़ाइल के साथ ". tsv" या ". पोगो") क्रमशः स्थानापंन । इसके अलावा डेटा (जैसे, मानव) के साथ संगत प्रजातियों के साथ MYSPECIES स्थानापन्न ।
3. "Enter" कुंजी दबाकर निष्पादन की पुष्टि करें । किसी भी आगे बढ़ने से पहले निष्पादन समाप्त होने तक प्रतीक्षा करें ।
  नोट: यह कुछ मिनट लग सकते हैं । परिणामी फ़ाइल पेप्टाइड इनपुट फ़ाइल के रूप में एक ही फ़ोल्डर में संग्रहीत किया जाएगा और निम्न में \PATH\TO\OUT.pogo.bed के रूप में माना जाएगा ।
इनपुट फ़ाइल से केवल भिन्न पेप्टाइड्स को निकालें ।
1. R खोलें और निम्न आदेश का उपयोग करते हुए इनपुट फ़ाइल \PATH\TO\IN लोड करें:
  inputdata <-read. table ("पथ/TO/", शीर्षक = TRUE, sep = "\t")
2. आदेश का उपयोग कर पहले से ही मैप किए गए पेप्टाइड्स लोड:
  mappedpeptides <-read. table ("पथ/करने के लिए/पोगो. bed", sep = "\t", header = FALSE)
3. inputdata से पहले से मैप किए गए पेप्टाइड्स निकालें:
  peptidesnotmapped <-inputdata [! ( inputdata $ पेप्टाइड% में% mappedpeptides $ V4),]
4. एक नई इनपुट फ़ाइल में बिना मैप किए गए पेप्टाइड्स को मुद्रित करें:
  राईट. table (peptidesnotmapped, "PATH\TO\IN.notmapped.pogo", header = false, sep = "\t", कर्नल नाम = TRUE, row. names = false, उद्धरण = false)
शेष पेप्टाइड्स संदर्भ जीनोम अनुमति बेमेल के लिए मैप करें ।
1. चरण ३.१ में, कमांड प्रॉंप्ट खोलें और पोगो के निष्पादन योग्य फ़ोल्डर में नेविगेट करें ।
2. 1 एमिनो एसिड बेमेल की अनुमति के नीचे आदेश टाइप करें और \PATH\TO\GTF, \PATH\TO\FASTA, और एनोटेशन GTF, प्रोटीन अनुक्रम फसता के लिए पथ के साथ \PATH\TO\IN.notmapped.pogo स्थानापंन, और ३.२ चरण में बनाई गई पेप्टाइड पहचान फ़ाइल । इसके अलावा डेटा (जैसे, मानव) के साथ संगत प्रजातियों के साथ MYSPECIES स्थानापन्न.
  1. पोगो. exe-gtf \PATH\TO\GTF-फसता \PATH\TO\FASTA-में \PATH\TO\IN-स्वरूप बिस्तर-प्रजातियों MYSPECIES-mm 1
3. "Enter" कुंजी दबाकर आदेश के निष्पादन की पुष्टि करें । किसी भी आगे बढ़ने से पहले निष्पादन समाप्त होने तक प्रतीक्षा करें ।
  नोट: यह कुछ मिनट लग सकते हैं । परिणामी फ़ाइल पेप्टाइड इनपुट फ़ाइल के रूप में एक ही फ़ोल्डर में संग्रहीत किया जाएगा और निम्न में \PATH\TO\OUT.pogo_1MM.bed के रूप में माना जाएगा ।
बिना और बेमेल के साथ IGV चरण २.२ में वर्णित के रूप में मैप किए गए पेप्टाइड्स विज़ुअलाइज़ करें ।

4. मानचित्रण एकाधिक फ़ाइलों का उपयोग कर और बड़े डेटासेट के लिए ट्रैक केंद्र पैदा

PoGoGUI का उपयोग कर एकाधिक फ़ाइलों से पेप्टाइड्स मानचित्रण
1. निष्पादन योग्य फ़ोल्डर में नेविगेट करें और PoGoGUI-vX. x. jarचलाकर प्रोग्राम GUI को प्रारंभ करें ।
2. उपयोग में ऑपरेटिंग सिस्टम के लिए पोगो निष्पादन योग्य फ़ाइल का चयन करें (यहां Linux), और साथ ही संदर्भ इनपुट प्रोटीन अनुक्रम फसता फ़ाइल और एनोटेशन GTF फ़ाइल प्रोटोकॉल चरणों में वर्णित के रूप में 2.1.2-2.1.4 ।
3. "पेप्टाइड फ़ाइलें" के आगे जोड़ें बटन का उपयोग करके पेप्टाइड पहचान फ़ाइलों को जोड़ें; एकाधिक फ़ाइल चयन सक्षम है, साथ ही खींचें और ड्रॉप के नीचे रिक्त क्षेत्र में "पेप्टाइड फ़ाइलें".
4. PTM बिस्तर, GTF, और GCT आउटपुट स्वरूप अनुभाग में और केवल चेक बिस्तर छोड़ करने के लिए अगले चेकबॉक्सों को अनचेक करें ।
5. विकल्प चुनें एकाधिक इनपुट फ़ाइलों को एकल आउटपुट में मर्जकरें ।
  नोट: यह एक एकल आउटपुट फ़ाइल इनपुट फ़ाइलों के सभी पेप्टाइड्स संयोजन में परिणाम होगा । इस विकल्प को छोड़ कर अचयनित प्रत्येक इनपुट फ़ाइल के लिए अलग से कार्यक्रम के एक अनुक्रमिक निष्पादन में परिणाम होगा ।
6. फसता और GTF फ़ाइलों के संगत ड्रॉप-डाउन चयन से डेटा के लिए उपयुक्त प्रजातियों का चयन करें ।
7. प्रारंभ बटन क्लिक करके मैपिंग प्रारंभ करें । यदि आवश्यक हो, कार्यक्रम पोगो प्रारूप में इनपुट फ़ाइलों को बदल जाएगा । इस पर अमल करने में कुछ समय लग सकता है । इस बीच, ट्रैक हब जनरेशन के लिए आवश्यक उपकरण और स्क्रिप्ट डाउनलोड करें ।
ट्रैक हब जनरेशन के लिए तैयारी
1. एक वेब ब्राउज़र खोलें, https://github.com/cschlaffner/TrackHubGenerator करने के लिए नेविगेट और फ़ाइल "TrackHubGenerator.pl" डाउनलोड करें । फ़ाइल को निष्पादन योग्य फ़ोल्डर में सहेजें ।
2. वेब ब्राउज़र में, www.hgdownload.soe.ucsc.edu/admin/exe/करने के लिए नेविगेट करें और उपयोग में ऑपरेटिंग सिस्टम के लिए फ़ोल्डर का चयन करें (यहाँ Linux) । उपकरण bedToBigBed और स्क्रिप्ट fetchChromSizes निष्पादन योग्य फ़ोल्डर²⁷में डाउनलोड करें ।
मैप किए गए पेप्टाइड्स से एक ट्रैक हब जनरेट कर रहा है
नोट: PoGoGUI पेप्टाइड्स मानचित्रण पूरा कर लिया है के बाद, एक ट्रैक हब स्वचालित रूप से एक ही फ़ोल्डर में संग्रहीत बिस्तर प्रारूप में सभी परिणामी फ़ाइलों के लिए उत्पन्न किया जा सकता है ।
1. एक टर्मिनल विंडो खोलें और निम्न निर्देश टाइप करें:
  पर्ल TrackHubGenerator.pl पथ/करने के लिए/नाम विधानसभा FBED UCSC ईमेल
  1. ट्रैक हब (उदा., ~/PoGo/Data/Mytrackhub) के लिए फ़ाइल पथ और नाम के साथ पथ/करने के लिए/नाम, जिस पर एनोटेशन आधारित है (उदा., hg38 मानव के लिए), जिसमें उस फ़ोल्डर के पथ के साथ FBED बिस्तर फ़ाइलें जिस पर ट्रैक हब आधारित हो जाएगा (उदा, ~/PoGo/Data/), फ़ोल्डर जहां UCSC से डाउनलोड उपकरणों के साथ UCSC (उदा, ~/PoGo/Executables/) जमा हो जाती है, और ट्रैक के लिए जिंमेदार व्यक्ति के लिए एक ईमेल पते के साथ ईमेल हब.
2. "Enter" कुंजी दबाकर निष्पादन की पुष्टि करें; निष्पादन को समाप्त होने में केवल कम समय लगेगा ।
3. एक वेब-पहुंच FTP सर्वर के लिए अपनी सभी सामग्री के साथ जनरेट किया गया ट्रैक हब (अर्थात, बनाया गया फ़ोल्डर ~/PoGo/Data/Mytrackhub/) स्थानांतरण ।
  नोट: प्रोटोकॉल ftp और http के माध्यम से ट्रैक हब के लिए पहुँच को सक्षम करने के लिए एक संबंधित वेब सर्वर के साथ एक FTP सर्वर पसंद है । खजाने github (github.com) और figshare (figshare.com) का उपयोग इस प्रकार का समर्थन है और एक FTP सर्वर के बजाय इस्तेमाल किया जा सकता है ।
UCSC जीनोम ब्राउज़र में एक ट्रैक हब visualizing
1. किसी वेब ब्राउज़र में, https://genome.ucsc.edu/पर नेविगेट करें और MyData । ट्रैक हब। मेरे केंद्रटैब पर क्लिक करें ।
2. पाठ फ़ील्ड में ट्रैक हब के लिए URL की प्रतिलिपि बनाएँ ।
  नोट: URL में सर्वर पता, ट्रैक हब स्थान और नाम और हब. txt फ़ाइल (जैसे, http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt) होते हैं ।
3. हब जोड़ेंक्लिक करके ट्रैक हब को लोड करें ।
  नोट: हब लोड किया जाएगा, और एक छोटा संदेश दिखाई देगा, ट्रैक हब का विवरण जैसे इसका नाम, ट्रैक हब के लिए जिंमेदार व्यक्ति की संपर्क जानकारी, और जीनोम असेंबली इस्तेमाल किया । वेबसाइट मुख्य पृष्ठ पर वापस आ जाएगा ।
4. ब्राउज़र दृश्य दर्ज करने के लिए GenomeBrowser चुनें ।
  नोट: कस्टम ट्रैक हब सूची के शीर्ष पर दिखाया जाएगा । एक से अधिक बिस्तर फ़ाइलें ट्रैक हब के लिए आधार बनाया है, तो प्रत्येक फ़ाइलें हब के भीतर एक अलग ट्रैक के रूप में प्रतिनिधित्व किया जाएगा ।

Representative Results

एक चित्रमय चित्रण पर प्रकाश डाला जो एक नियमित रूप से proteomic कार्यप्रवाह के चरण पोगो¹⁸ लागू किया जाता है, साथ ही दृश्य के बहाव विकल्प, चित्रा 5में दिखाया गया है । शॉटगन प्रोटियोमिक् (यानी, प्रोटीन के proteolytic पाचन तरल क्रोमैटोग्राफी मिलकर जन स्पेक्ट्रोमेट्री के साथ युग्मित द्वारा पीछा किया) एक proteogenomic मानचित्रण के अग्रदूत कदम है । परिणामस्वरूप मिलकर जन स्पेक्ट्रा सामांयतः सैद्धांतिक स्पेक्ट्रा प्रोटीन अनुक्रम डेटाबेस से व्युत्पंन की तुलना में हैं । Proteogenomics अध्ययन डेटाबेस में संभावित और गैर-पर्यायवाची एकल न्यूक्लियोटाइड वेरिएंट (SNVs) कोडिंग के साथ उपंयास टेप के अनुवाद दृश्यों परिचय, यह मुश्किल आसानी से संदर्भ जीनोम⁸के लिए इन वापस संबंधित करने के लिए कर रही है । पोगो के ग्राफिकल यूजर इंटरफेस (PoGoGUI) जन स्पेक्ट्रोमेट्री प्रयोगों से पेप्टाइड पहचान की मानकीकृत रिपोर्टिंग के लिए फ़ाइल स्वरूपों का समर्थन करता है और उन्हें सरलीकृत 4-स्तंभ पोगो स्वरूप में धर्मांतरित । PoGoGUI कमांड लाइन उपकरण पोगो wraps और इस तरह जीनोम पर पेप्टाइड का मानचित्रण सक्षम बनाता है निर्देशांक प्रोटीन के संदर्भ एनोटेशन-कोडिंग सामांयतः GTF में प्रदान की जीन और फसता प्रारूप में अनुवादित प्रतिलिपि दृश्यों का उपयोग । विभिंन आउटपुट स्वरूपों पोगो द्वारा उत्पंन कर रहे है के विभिंन पहलुओं के दृश्य को सक्षम करने के लिए बड़े पैमाने पर स्पेक्ट्रोमेट्री के माध्यम से पहचान, पोस्ट-शोधों संशोधनों और पेप्टाइड स्तर ठहराव सहित । बिस्तर में आउटपुट फ़ाइलें आगे और परिवर्तित किया जा सकता है ऑनलाइन पहुंच निर्देशिका में संयुक्त ट्रैक हब कहा जाता है । एकल आउटपुट फ़ाइलें, साथ ही ट्रैक केंद्रों, तो UCSC जीनोम ब्राउज़र²⁵, Ensembl जीनोम ब्राउज़र²⁰, IGV²⁴, और Biodalliance²⁸ के रूप में ब्राउज़र में visualized किया जा सकता है ( चित्रा 5 नीचे देखें) ।

हम मसौदा मानव proteome उच्च महत्व पर फ़िल्टर के रूप में राइट एट अल में वर्णित नक्शे के पुनर्विश्लेषण के लिए पोगो लागू किया । ⁷ और यह proteogenomic मानचित्रण के लिए दो अंय उपकरणों की तुलना में, अर्थात् iPiG¹⁴ और PGx¹⁰। डेटासेट में ५९ वयस्क और भ्रूण के ऊतकों में २३३,०५५ अद्वितीय पेप्टाइड्स शामिल हैं जिसके परिणामस्वरूप ३,०००,००० से अधिक दृश्यों का योग है । पोगो रनटाइम में दोनों (6.9 x और 96.4 x तेज़, क्रमशः) और स्मृति उपयोग (20% और ६०% कम स्मृति, क्रमशः) के रूप में चित्र 6¹⁸में दिखाए गए इन उपकरणों का प्रदर्शन । सफलतापूर्वक मैप किए गए पेप्टाइड का एक उदाहरण चित्रा 7में दिखाया गया है ।

जबकि पोगो काफी गति और स्मृति में अंय उपकरणों से बेहतर प्रदर्शन, यह भी पोस्ट-शोधों संशोधनों और मात्रात्मक जीनोम पर पेप्टाइड्स के साथ जुड़े जानकारी मानचित्रण में सक्षम है । चित्रा 8A योजनाबद्ध रूप से एक एक्सॉन और ब्याह जंक्शनों भर में पेप्टाइड्स मानचित्रण के लिए एक जीनोम ब्राउज़र में बिस्तर प्रारूप के दृश्य को दर्शाया गया है । पोगो के जीनोम के भीतर पेप्टाइड मानचित्रण की विशिष्टता के संबंध में आसान दृश्य सहायता प्रदान करने के लिए रंग विकल्प का इस्तेमाल करता है । लाल रंग में मैपिंग एक एकल प्रतिलिपि करने के लिए विशिष्टता का संकेत है, जबकि काले एक जीन को मानचित्रण पर प्रकाश डाला गया । हालांकि, पेप्टाइड अलग टेप के बीच साझा किया जाता है । धूसर मैपिंग एकाधिक जीनों के बीच साझा किए गए पेप्टाइड को दिखाते हैं । ये हैं, उदाहरण के लिए, कम विश्वसनीय एक जीन की ठहराव के लिए या एक जीन की अभिव्यक्ति फोन डिग । पोगो के PTM बिस्तर विकल्प के रूप में चित्रा 8Bमें दिखाया के रूप में पोस्ट-शोधों संशोधनों के विभिंन प्रकार के समायोजित करने के लिए रंग कोड को परिभाषित । इसके अतिरिक्त, PTMs मोटी ब्लॉकों द्वारा इंगित कर रहे हैं ( चित्र 8Bदेखें) । एक प्रकार की एक एकल PTM संशोधित अमीनो अम्ल अवशेषों की स्थिति पर एक मोटी ब्लॉक द्वारा प्रकाश डाला है, जबकि एक ही प्रकार के कई PTMs पहले संशोधित एमिनो एसिड से पिछले करने के लिए एक मोटी ब्लॉक द्वारा फैले हुए हैं ।

हम पोगो लागू किया और बाद में पूरे proteome और phosphoproteome²⁹सहित ५० कोलोरेक्टल कैंसर सेल लाइनों के एक डेटासेट के लिए TrackHubGenerator । जबकि UCSC जीनोम ब्राउज़र में लोड ट्रैक हब जीनोम के लिए मैप पेप्टाइड्स दिखाता है और मैपिंग और फास्फारिलीकरण साइटों की विशिष्टता पर प्रकाश डाला गया ( चित्र 9देखें), अतिरिक्त डेटा पूरक फ़ोल्डर में प्रदान की जाती हैं । GCT फ़ाइलें तो एक जीनोमिक संदर्भ में पेप्टाइड और phosphopeptide quantitation के दृश्य सक्षम करें । हालांकि, GCT फ़ाइलें ब्याह जंक्शनों भर में फैले पेप्टाइड्स का एक आसान दृश्य प्रदान नहीं करते हैं ( चित्रा 10 शीर्ष देखें). ब्याह जंक्शनों भर पेप्टाइड्स उनके संबंधित exons को मानचित्रण भागों में विभाजित हैं । हालांकि यह एक्सॉन मैपिंग के एक ही मात्रात्मक मूल्यों के माध्यम से ब्याह पेप्टाइड्स की पहचान करने के लिए संभव है, इस तरह के बिस्तर या GTF है कि एक पतली intron फैले लाइन से exons कनेक्ट के रूप में अनुक्रम-आधारित मानचित्रण फ़ाइलें लोड हो रहा है व्याख्या का समर्थन (देखें चित्रा 10 नीचे) ।

भिन्नता सक्षम मानचित्रण की उपयोगिता को उजागर करने के लिए, हम एक बहु-एंजाइम रणनीति का उपयोग कर लापता प्रोटीन के लिए शिकार करने के लिए neXtProt के खिलाफ खोजा मानव वृषण proteome के एक डेटासेट के लिए दो विन्यास में पोगो लागू किया²². neXtProt ५,०००,००० एकल एमिनो एसिड वेरिएंट³⁰से अधिक संदर्भ प्रोटीन अनुक्रम के अलावा शामिल हैं । मानचित्रण एक एमिनो एसिड संस्करण के साथ पहचान पेप्टाइड्स अंय मानचित्रण उपकरण द्वारा समर्थित नहीं है । कुल १७७,०१२ अद्वितीय पेप्टाइड्स की पहचान की गई । इनमें से, ९९.८% (१७६,६९४) पेप्टाइड्स पहले सफलतापूर्वक मिलान की अनुमति के बिना मैप किए गए थे । पहचाने गए पेप्टाइड सूची से उन को निकालने के परिणामस्वरूप ०.२% (३१८) पेप्टाइड्स कि बाद में एक एमिनो एसिड प्रतिस्थापन की अनुमति मैप किए गए थे । यह १६२ पेप्टाइड्स कि किसी भी अन्य उपलब्ध उपकरण के साथ संदर्भ जीनोम के लिए मैप नहीं किया गया होगा की ३,४४६ मैपिंग के परिणामस्वरूप । एक बेमेल सहित मैपिंग की औसत संख्या उच्च है, जबकि ६२ पेप्टाइड्स सही भिन्न अनुक्रम इंगित करता है, केवल एक एकल लोकस करने के लिए मैप किए गए थे । एक एमिनो एसिड प्रतिस्थापन के साथ मैप किए गए एक पेप्टाइड का एक उदाहरण इसके अनुक्रम के साथ हाइलाइट किया गया है और चित्र 11में अनुवादित जीनोमिक अनुक्रम ।

चित्र 1. विभिन्न पेप्टाइड-से-जीनोम मैपिंग उपकरणों की दृश्य तुलना. तुलना के साथ दिखाया गया है विभिंन पहलुओं का संबंध है । इन पहलुओं में एक मानचित्रण संदर्भ, चौखटे में एकीकरण के स्तर, और ऑनलाइन और ऑफलाइन ब्राउज़रों का समर्थन शामिल हैं । इसके अतिरिक्त, proteogenomics के उपंयास पहलुओं और उनकी सुविधा का समर्थन अलग से प्रकाश डाला है । पोगो केवल क्षमता की कमी के लिए सीधे एक जीनोम अनुक्रम के लिए अंय उपकरणों की तुलना में नक्शा । हालांकि, यह सभी उपंयास सुविधाओं का समर्थन करता है कि अधिकांश अंय उपकरणों का समर्थन नहीं करते । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 2. मैपिंग पेप्टाइड्स के लिए उदाहरण इनपुट फ़ाइल । पोगो 4 कॉलम के साथ एक टैब में अलग प्रारूप में इनपुट डेटा स्वीकार करता है । पहली पंक्ति में स्तंभ शीर्ष लेख ' प्रयोग ', ' पेप्टाइड ', ' PSMs ', और ' क्वांट ' हैं, निम्न पंक्तियों में यह दर्शाता है कि प्रयोग या नमूना पहचानकर्ता, पेप्टाइड अनुक्रम, पेप्टाइड-स्पेक्ट्रम मैचों की संख्या, और पेप्टाइड के लिए एक मात्रात्मक मान, क्रमशः. समर्थित फ़ाइल नाम एक्सटेंशन *. txt, *. tsv, और *. पोगो हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 3. PoGoGUI फ़ाइल चयन और पैरामीटर विकल्प के लिए हाइलाइट किए गए चरणों के साथ इंटरफ़ेस । यह आंकड़ा चयन और सभी आवश्यक फ़ाइलों को अपलोड करने और मानव संदर्भ जीनोम पर पोस्ट-शोधों संशोधनों के साथ पेप्टाइड्स मानचित्रण के लिए विकल्पों के चयन के लिए कदम दिखाता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 4. एकीकृत जीनोमिक्स दर्शक (IGV) डेटा अपलोड प्रक्रिया का स्क्रीनशॉट. यह आंकड़ा IGV ब्राउजर में पोगो आउटपुट फाइल अपलोड करने के कदमों पर प्रकाश डालता है । इसके अलावा, यह मानचित्रण और अनुक्रम को हाइलाइट करने के लिए मैप किए गए पेप्टाइड्स के ट्रैक के विस्तार का विकल्प दिखाता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 5. के जीनोम ब्राउज़रों में दृश्य को नियंत्रण रेखा से कदम की सरलीकृत कार्यप्रवाह-ms/। पोगो मैपिंग मिलकर मास स्पेक्ट्रा से पेप्टाइड्स की पहचान के बाद । जीनोम के लिए मानचित्रण को प्राप्त करने के लिए, पोगो संदर्भ जीनोम एनोटेशन (GTF) और प्रतिलिपि अनुवाद दृश्यों (फसता) के रूप में प्रदान की एनोटेशन का इस्तेमाल करता है । विभिंन उत्पादन प्रारूपों उत्पंन कर रहे है कि जीनोम ब्राउज़रों में अलग से लोड किया जा सकता है । साथ ही, बिस्तर स्वरूप में फ़ाइलें बड़े-स्केल datasets का दृश्य समर्थन केंद्र ट्रैक में संयोजित किया जा सकता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्रा 6. PGx और iPiG के खिलाफ बेंचमार्किंग पोगो. पोगो बेंचमार्किंग पर अंय उपकरणों का प्रदर्शन । ५९ वयस्क और भ्रूण के ऊतकों में २३३,०५५ अद्वितीय पेप्टाइड्स मानचित्रण में जिसके परिणामस्वरूप ३,०००,००० से अधिक दृश्यों, पोगो था 6.9 x और 96.4 x तेजी से PGx और iPiG, क्रमशः । इसके अलावा, पोगो 20% और ६०% कम स्मृति PGx और iPiG, क्रमशः की तुलना में आवश्यक है । जबकि पोगो और PGx सफलतापूर्वक समाप्त, iPiG 16 GB पर एक स्मृति त्रुटि के परिणामस्वरूप । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 7. UCSC जीनोम ब्राउज़र मैप किए गए पेप्टाइड्स के उदाहरण देखें । यह आंकड़ा जीन mTOR के लिए मैप किए गए पेप्टाइड्स को दिखाता है । जबकि संयुक्त ट्रैक ब्याह जंक्शनों भर में फैले पेप्टाइड्स और संबंधित दृश्यों के साथ केवल एक एक्सॉन के लिए मानचित्रण से पता चलता है, ऊतक विशिष्ट पटरियों केवल एक गाढ़ा प्रारूप में मानचित्रण पर प्रकाश डाला । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 8. मानचित्रण दृश्य और रंग कोडिंग की योजनाबद्ध । (A) मानक बिस्तर आउटपुट फ़ाइल में, एक एक्सॉन के लिए मैपिंग पेप्टाइड्स एकल ब्लॉक (बाएँ) के रूप में दिखाए जाते हैं, जबकि एकाधिक exons भर पेप्टाइड्स मैपिंग ब्लॉक (दाएँ) के रूप में एक्सॉन कवर भागों को हाइलाइट करें । Introns को पतली श्रेणीबद्ध रेखाओं के रूप में दिखाया गया है । पोगो रंग कोड मानचित्रण या पेप्टाइड्स की विशिष्टता जीन के लिए, और एक 3-टियर प्रणाली का उपयोग कर टेप । (ख) बिस्तर प्रारूप के ब्लॉक संरचना के अलावा, PTM बिस्तर उत्पादन के बाद मोटी ब्लॉकों के रूप में अनुवाद के संशोधन की स्थिति पर प्रकाश डाला गया । एक प्रकार की एक एकल PTM की उपस्थिति एक मोटी ब्लॉक के साथ संशोधित अमीनो एसिड अवशेषों पर प्रकाश डाला गया है, जबकि एक ही PTM के कई साइटों को लंबे समय से पिछले संशोधन साइट के लिए पहले से फैले ब्लॉकों में संयुक्त रहे हैं । पेप्टाइड मैपिंग आगे PTM प्रकार और रंग कोडेक संशोधन के आधार पर विभाजित हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 9. कोलोरेक्टल कैंसर proteome और phosphoproteome डेटा के UCSC जीनोम ब्राउजर में ट्रैक हब देखें । ट्रैक हब पूरे proteome डेटा के साथ ही phosphoproteome शामिल हैं । जबकि proteome और phosphoproteome पटरियों में लाल रंग SFN के एकल प्रतिलिपि करने के लिए मानचित्रण की विशिष्टता का संकेत है, _ptm में समाप्त पटरियों पेप्टाइड्स के भीतर फास्फारिलीकरण साइटों को दिखाने के । यहाँ, लाल रंग फास्फारिलीकरण के रूप में संशोधन के प्रकार को इंगित करता है. केवल दो पेप्टाइड्स एक एकल फास्फारिलीकरण (मोटी ब्लॉकों) दिखाने के साथ पहचान की गई है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 10. IGV में कोलोरेक्टल कैंसर phosphopeptides और एसोसिएटेड quantitation का दृश्य । यह आंकड़ा ५० कैंसर सेल लाइनों के एक सबसेट को दर्शाता है । यह इसके अलावा प्रकाश लाल के भिंन रंगों में ब्लॉकों के चार कॉलम से पता चलता है । रंग (लाल) उच्च करने के लिए कम (सफेद) से सापेक्ष बहुतायत इंगित करता है । जबकि चार कॉलम शुरू में विश्वास है कि वहां 4 पेप्टाइड्स हैं, यह संबंधित अनुक्रम-आधारित GTF उत्पादन फ़ाइल के साथ स्पष्ट हो जाता है कि इन वास्तव में दो पेप्टाइड्स, प्रत्येक एक ब्याह जंक्शन फैले हो जाता है का नेतृत्व कर सकते हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

चित्र 11. IGV में एमिनो एसिड वैरिएंट के साथ पेप्टाइड का देखें । आंकड़ा एक एमिनो एसिड जीन GPSM1के अनुवाद शुरू में संदर्भ जीनोम के लिए प्रतिचित्रित संस्करण के साथ एक पेप्टाइड से पता चलता है । इस संस्करण एमिनो एसिड अवशेषों में 8 पर तैनात है और alanine के प्रतिस्थापन वैलिन (एक → V) में परिणाम है । व्याख्यात्मक टेप के अनुवाद दृश्यों (नीला) पेप्टाइड अनुक्रम की तुलना में संस्करण पर प्रकाश डाला । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Discussion

इस प्रोटोकॉल का वर्णन कैसे सॉफ्टवेयर उपकरण पोगो और उसके ग्राफिकल यूजर इंटरफेस PoGoGUI जीनोम निर्देशांक पर पेप्टाइड्स की एक तेजी से मानचित्रण सक्षम । उपकरण मात्रात्मक, पद अनुवाद संशोधन और संदर्भ एनोटेशन का उपयोग जीनोम के लिए संस्करण सक्षम मानचित्रण जैसे अद्वितीय विशेषताएं प्रदान करता है । यह आलेख एक बड़े पैमाने पर proteogenomic अध्ययन पर विधि को प्रदर्शित करता है और अन्य उपलब्ध उपकरण¹⁸की तुलना में इसकी गति और स्मृति दक्षता पर प्रकाश डाला गया है । उपकरण TrackHubGenerator, जो जीनोमिक और जीनोम जुड़ा हुआ डेटा, पोगो, अपनी ग्राफिकल यूजर इंटरफेस के साथ के ऑनलाइन सुलभ हब बनाता है के साथ संयोजन में, बड़े पैमाने पर proteogenomics अध्ययन करने के लिए जल्दी से जीनोमिक संदर्भ में अपने डेटा कल्पना सक्षम बनाता है । इसके अलावा, हम वेरिएंट डेटाबेस और मात्रात्मक phosphoproteomics²²^,²⁹के खिलाफ खोज डेटासेट के साथ पोगो की अनूठी विशेषताओं का प्रदर्शन ।

एकल फ़ाइलें, जैसे GCT फ़ाइल, बहुमूल्य दृश्य और पेप्टाइड सुविधाओं और जीनोमिक loci के बीच लिंक प्रदान करते हैं । हालांकि, यह ध्यान रखें कि इन अकेले पर आधारित एक व्याख्या मुश्किल हो सकता है या भ्रामक proteogenomics के एकल पहलुओं जैसे विशिष्टता, पोस्ट-शोधों के संशोधन, और मात्रात्मक मूल्यों के लिए अपनी सीमा की वजह से महत्वपूर्ण है । इसलिए, यह ध्यान से जो आउटपुट फ़ाइलें, विकल्प चुनते हैं, और संयोजन हाथ में proteogenomic प्रश्न के लिए उपयुक्त है और संयोजनों को संशोधित करने के लिए महत्वपूर्ण है । उदाहरण के लिए, एक विशिष्ट जीनोमिक लोकस के लिए मानचित्रण की विशिष्टता के बारे में जानकारी एक जीनोमिक सुविधा के एनोटेशन के लिए महान मूल्य का हो सकता है⁷, जबकि विभिंन नमूनों में ठहराव से संबंधित अध्ययन के लिए अधिक उपयुक्त हो सकता है जीनोमिक प्रोटीन बहुतायत में परिवर्तन के लिए²⁹विशेषताएं । आउटपुट प्रत्येक सेटिंग के लिए पोगो द्वारा जनरेट किया जाना चाहिए । मामले में कोई आउटपुट उत्पंन होता है, या खाली फ़ाइलें आउटपुट फ़ोल्डर में दिखाए जाते हैं, यह वांछित सामग्री और आवश्यक फ़ाइल स्वरूप के लिए इनपुट फ़ाइलों की जांच करने के लिए अनुशंसित है । मामलों में जहां फ़ाइल प्रारूप या सामग्री पोगो की उंमीदों का पालन नहीं करता है (उदा., फसता फ़ाइल माना जाता है प्रतिलिपि अनुवाद दृश्यों से युक्त टेप के न्यूक्लियोटाइड दृश्यों में शामिल हैं), त्रुटि संदेश के लिए उपयोगकर्ता से पूछना होगा इनपुट फ़ाइलों की जांच करें ।

प्रोटोकॉल और उपकरण के प्रतिबंध ज्यादातर फ़ाइल स्वरूपों के पुनः प्रयोग पर आधारित सामांयतः जीनोमिक्स में उपयोग किया जाता है । Repurposing फ़ाइल स्वरूपों proteogenomic अनुप्रयोगों के लिए जीनोमिक्स में प्रयुक्त विशिष्ट सीमाओं के साथ है । इन जीनोमिक और proteogenomic डेटा के जीनोम केंद्रित दृश्य के लिए आवश्यकताओं के भिंन सेट की वजह से कर रहे हैं, प्रोटियोमिक् डेटा से पोस्ट-शोधों संशोधनों कल्पना की जरूरत के रूप में । यह एकल सुविधा उपयोग द्वारा जीनोमिक्स फ़ाइल स्वरूपों में प्रतिबंधित है । कई दृष्टिकोण और उपकरण प्रोटियोमिक् के लिए विकसित किया गया है के लिए आत्मविश्वास से स्थानीयकरण पेप्टाइड अनुक्रम³¹^,^३२^,^३३^,^३४के भीतर पोस्ट-शोधों संशोधनों । तथापि, जीनोम पर एक अद्वितीय और समझदार तरीके से कई संशोधनों के दृश्य जीनोमिक फ़ाइल स्वरूपों की संरचना द्वारा रुकावट है । इसलिए, एक ही प्रकार के कई PTMs के एकल ब्लॉक दृश्य संशोधन साइटों की कोई अस्पष्टता का गठन नहीं करता है, लेकिन जीनोमिक्स समुदाय से अलग आवश्यकता का परिणाम है केवल एक समय में एकल सुविधाओं कल्पना । बहरहाल, पोगो जीनोमिक पर पोस्ट-शोधों संशोधनों मानचित्रण का लाभ है निर्देशांक इस तरह के पोस्ट-शोधों संशोधनों पर एकल न्यूक्लियोटाइड वेरिएंट के रूप में जीनोमिक सुविधाओं के प्रभाव पर ध्यान केंद्रित अध्ययन को सक्षम करने के लिए. पोगो का उपयोग कर, भिन् न मैपिंग कुल मैपिंग की संख्या बढ़ाता है । हालांकि, मैप किए गए पेप्टाइड्स की अद्वितीय रंग कोडिंग अविश्वसनीय लोगों से विश्वसनीय मैपिंग हाइलाइट करता है । ज्ञात एकल न्यूक्लियोटाइड भिन्नताओं से पहचाने जाने वाले भिन्न पेप्टाइड्स की मैपिंग के साथ VCF स्वरूप में भिन्न रूप से मैप किए गए पेप्टाइड्स visualizing द्वारा किया जा सकता है । इस तरह रंग कोड एक भिन्न पेप्टाइड का एक अविश्वसनीय मैपिंग इंगित करने के लिए ज्ञात न्यूक्लियोटाइड भिन्न की उपस्थिति द्वारा सुशासन है ।

पोगो का उपयोग करने के लिए एक महत्वपूर्ण कदम सही फ़ाइलों और स्वरूपों का उपयोग है । प्रोटीन अनुक्रम GTF प्रारूप में एनोटेशन के साथ के रूप में अनुवादित प्रतिलिपि दृश्यों का उपयोग मुख्य मानदंड है । एक अंय महत्वपूर्ण तत्व जब पोगो का उपयोग कर एमिनो एसिड बेमेल के साथ पेप्टाइड्स नक्शा करने पर विचार स्मृति है । एक मानक आवेदन के लिए अत्यधिक स्मृति-कुशल, एक या दो बेमेल के साथ संभावित मैपिंग की काफी और तेजी से बढ़ती संख्या में स्मृति उपयोग¹⁸में एक समान घातीय वृद्धि की ओर जाता है । हम पहली बार बेमेल बिना पेप्टाइड्स को मैप करने और उन्हें सेट से निकालने के लिए इस प्रोटोकॉल में वर्णित के रूप में एक स्टेज्ड मैपिंग का प्रस्ताव है । बाद में पहले बिना मैप किए गए पेप्टाइड्स फिर एक बेमेल का उपयोग कर मैप किया जा कर सकते हैं और प्रक्रिया दो बेमेल के साथ दोहराया जा सकता है बिना मैप की गई पेप्टाइड्स के लिए ।

मास स्पेक्ट्रोमेट्री के प्रवाह के बाद से काफी बढ़ गया है और अध्ययन के सामने जीनोमिक और proteomic डेटा हाल के वर्षों में और अधिक लगातार होते जा रहे हैं, उपकरणों को आसानी से एक ही समंवय प्रणाली में डेटा के इन प्रकार का सामना करना पड़ सक्षम तेजी से अपरिहार्य है । यहां प्रस्तुत उपकरण जीनोमिक और proteomic डेटा गठबंधन करने के लिए एक संदर्भ एनोटेशन पर पेप्टाइड्स द्वारा छोटे और बड़े डेटासेट भर में एकीकृत अध्ययन की एक बेहतर समझ को बढ़ाने की आवश्यकता सहायता करेगा । उत्साहजनक, पोगो जीन के लिए संदर्भ एनोटेशन के रूप में एक ही प्रारूप में उपलब्ध कराई उंमीदवारों को मैप करने के लिए लागू किया गया है के लिए उपंयास जीन मानव वृषण^३५में व्यक्त की एनोटेशन के प्रयासों का समर्थन । यहां प्रस्तुत दृष्टिकोण पेप्टाइड पहचान के लिए इस्तेमाल किया डेटाबेस से स्वतंत्र है । प्रोटोकॉल की पहचान और अनुवाद दृश्यों से अनुकूलित इनपुट फ़ाइलें और आरएनए-seq प्रयोगों से संबद्ध GTF फ़ाइलों का उपयोग करके उपंयास अनुवाद उत्पादों की दृश्य में सहायता हो सकती है ।

कई दृष्टिकोण और उपकरण विशेष अनुप्रयोग परिदृश्यों की एक विस्तृत श्रृंखला के साथ जीनोमिक निर्देशांक करने के लिए पेप्टाइड्स नक्शा करने के लिए, मानचित्रण पेप्टाइड्स से सीधे आरएनए-अनुक्रमण निर्देशित मानचित्रण के लिए जीनोम अनुक्रम से लेकर, पेश किया गया है¹⁰^, ¹¹ ^, ¹² ^, ¹³ ^, ¹⁴ ^, ¹⁵ ^, ¹⁶ ^, ¹⁷. हालांकि, ये एक विफलता में सही ढंग से जब पोस्ट-शोधों के संशोधन मौजूद है पेप्टाइड्स मैप करने के लिए परिणाम कर सकते हैं और आरएनए-sequencing पढ़ता की अंतर्निहित मैपिंग में त्रुटियाँ पेप्टाइड स्तर करने के लिए प्रचारित किया जा सकता है । पोगो विशेष रूप से उन बाधाओं को दूर करने के लिए विकसित किया गया है और ओर्थोगोनल जीनोमिक्स प्लेटफार्मों के साथ एकीकृत करने के लिए मात्रात्मक उच्च संकल्प proteomic डेटासेट की तेजी से वृद्धि के साथ सामना करने के लिए. यहां वर्णित उपकरण को उच्च-प्रवाह वर्कफ़्लोज़ में एकीकृत किया जा सकता है । चित्रमय अंतरफलक PoGoGUI के माध्यम से, उपकरण का उपयोग करने के लिए सरल है और कोई विशेषज्ञ bioinformatics प्रशिक्षण की आवश्यकता है ।

Disclosures

लेखकों का खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

यह काम वेलकम ट्रस्ट (WT098051) और NIH ग्रांट (U41HG007234) द्वारा GENCODE परियोजना के लिए वित्त पोषित किया गया ।

Materials

Name	Company	Catalog Number	Comments
PoGo (software)	NA	NA	https://github.com/cschlaffner/PoGo
PoGoGUI (software)	NA	NA	https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software)	NA	NA	https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software)	NA	NA	http://software.broadinstitute.org/software/igv/
UCSC genome browser (website)	NA	NA	https://genome.ucsc.edu/
GENCODE (website)	NA	NA	http://gencodegenes.org
Ensembl (website)	NA	NA	http://ensembl.org
bedToBigBed (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/

DOWNLOAD MATERIALS LIST

References

Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. Bioinformatics. 33 (8), 1218-1220 (2017).
Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. Bioinformatics. 31 (17), 2903-2905 (2015).
Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
The R Development Core Team. R: A Language and Environment for Statistical Computing. , R Foundation for Statistical Computing. Vienna, Austria. (2008).
Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. Bioinformatics. 26 (17), 2204-2207 (2010).
Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. Bioinformatics. 27 (6), 889-890 (2011).
Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. Bioinformatics. 31 (7), 1141-1143 (2015).
Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Genetics

एक तेजी से और मात्रात्मक विधि के बाद अनुवाद संशोधन और संस्करण के लिए पेप्टाइड्स की मैपिंग जीनोम के लिए सक्षम

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.