Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

एफडीआर नियंत्रण-आधारित अलक्षित चयापचय पर पहचान और मात्रा का ठहराव का एक एकीकृत वर्कफ़्लो

Published: September 20, 2022 doi: 10.3791/63625
* These authors contributed equally

Summary

हमने एक अनटार्गेटेड मेटाबोलोमिक वर्कफ़्लो का निर्माण किया जो एक्सवाई-मेटा और मेटाएक्स को एक साथ एकीकृत करता है। इस प्रोटोकॉल में, हमने प्रदर्शित किया कि ओपन एक्सेस स्पेक्ट्रा संदर्भ से एक डिकॉय स्पेक्ट्रल लाइब्रेरी उत्पन्न करने के लिए एक्सवाई-मेटा का उपयोग कैसे किया जाए, और फिर एफडीआर नियंत्रण किया और मेटाबोलॉमिक्स स्पेक्ट्रा की पहचान करने के बाद मेटाबोलाइट्स को मापने के लिए मेटाएक्स का उपयोग किया।

Abstract

हाल के वर्षों में अनियंत्रित चयापचय तकनीकों का व्यापक रूप से उपयोग किया जा रहा है। हालांकि, तेजी से बढ़ते थ्रूपुट और नमूनों की संख्या स्पेक्ट्रा की एक बड़ी मात्रा बनाती है, मास स्पेक्ट्रोमेट्री स्पेक्ट्रा के गुणवत्ता नियंत्रण के लिए चुनौतियां निर्धारित करती है। झूठी सकारात्मकता को कम करने के लिए, झूठी खोज दर (एफडीआर) गुणवत्ता नियंत्रण आवश्यक है। हाल ही में, हमने अनटारगेटेड मेटाबोलोम पहचान के एफडीआर नियंत्रण के लिए एक सॉफ्टवेयर विकसित किया है जो एक्सवाई-मेटा नामक लक्ष्य-डिकॉय रणनीति पर आधारित है। यहां, हमने एक पूर्ण विश्लेषण पाइपलाइन का प्रदर्शन किया जो एक्सवाई-मेटा और मेटाएक्स को एक साथ एकीकृत करता है। यह प्रोटोकॉल दिखाता है कि मौजूदा संदर्भ डेटाबेस से एक डिकॉय डेटाबेस उत्पन्न करने और ओपन-एक्सेस डेटासेट पर बड़े पैमाने पर मेटाबोलोम पहचान के लिए लक्ष्य-डिकॉय रणनीति का उपयोग करके एफडीआर नियंत्रण करने के लिए XY-मेटा का उपयोग कैसे करें। चयापचयों का पता लगाने और मात्रा के लिए मेटाएक्स चलाने के बाद अंतर विश्लेषण और चयापचयों एनोटेशन का प्रदर्शन किया गया था। अधिक शोधकर्ताओं की मदद करने के लिए, हमने जैव सूचना विज्ञान कौशल या किसी भी कंप्यूटर भाषाओं की आवश्यकता के बिना, इन विश्लेषणों के लिए एक उपयोगकर्ता के अनुकूल क्लाउड-आधारित विश्लेषण मंच भी विकसित किया।

Introduction

चयापचय जैविक प्रक्रियाओं में महत्वपूर्ण भूमिका निभाते हैं। मेटाबोलाइट्स अक्सर विभिन्न प्रक्रियाओं जैसे ऊर्जा हस्तांतरण, हार्मोन नियमों, न्यूरोट्रांसमीटर के विनियमन, सेलुलर संचार और प्रोटीन पोस्ट-ट्रांसलेशनल संशोधनों आदिके नियामक होते हैं। अनटार्गेटेड मेटाबोलॉमिक्स कई चयापचयों 5,6 का वैश्विक दृष्टिकोण प्रदान करता है। मास स्पेक्ट्रोमेट्री और क्रोमैटोग्राफी प्रौद्योगिकियों में प्रगति के साथ, मेटाबोलोम एमएस / एमएस स्पेक्ट्रा का थ्रूपुट हाल के वर्षों मेंतेजी से बढ़ रहा है 7,8,9,10,11। इन विशाल डेटासेट से चयापचयों की पहचान करने के लिए, विभिन्न एनोटेशन सॉफ़्टवेयर11 विकसित किए गए थे, जैसे कि एमजेडमाइन12, एमएस-फाइंडर13, सीएफएम-आईडी14, मेटफ्रैग15 और एसएलएलएडब्ल्यू16। हालांकि, इन पहचानों में अक्सर कई झूठी सकारात्मकताएं होती हैं। कारणों में शामिल हैं: (1) एमएस /एमएस स्पेक्ट्रा में यादृच्छिक शोर होता है, जो शिखर मिलान को गुमराह कर सकता है। (2) आइसोमर्स और विखंडन ऊर्जा में अंतर कई स्पेक्ट्रा उंगलियों के निशान का कारण बनता है और इस प्रकार संदर्भ पुस्तकालय की मात्रा में वृद्धि करता है। (3) संदर्भ पुस्तकालयों की गुणवत्ता भिन्न होती है। एक अच्छा संदर्भ वर्णक्रमीय पुस्तकालय बनाने के लिए एक उचित मानक की आवश्यकता है। इसलिए, कार्यात्मक चयापचय अनुसंधान 7,8,9,17 के लिए असंतुलित चयापचय विज्ञान के लिए एक व्यवस्थित झूठी खोज दर (एफडीआर) नियंत्रण आवश्यक है।

अनुभवजन्य बेयस दृष्टिकोण और लक्ष्य-डिकॉय रणनीति दोनों ने आम तौर पर एफडीआर नियंत्रण समस्या से निपटा। केर्स्टिन श्यूबर्ट एट अल ने दिखाया कि विखंडन पेड़-आधारित विधि से उत्पन्न डिकॉय डेटाबेस पर लक्ष्य-डिकॉय रणनीति एफडीआर नियंत्रण9 के लिए सबसे अच्छी विधि है। ज़ुशेंग वांग एट अल ने रसायन विज्ञान में ऑक्टेट नियम के आधार पर डिकॉय पीढ़ी के लिए एक विधि तैयार की और एफडीआर अनुमान17 की सटीकता में सुधार किया। डिकॉय डेटाबेस उत्पन्न करने के लिए वर्णक्रमीय पुस्तकालय बेहतर प्रदर्शन18 के लिए प्रदर्शित किया गया था। यहां, हमने वर्णक्रमीय पुस्तकालय-आधारित विधि में सुधार किया और एक्सवाई-मेटा19 नामक एक सॉफ्टवेयर विकसित किया जो एफडीआर अनुमान की सटीकता में और सुधार कर सकता है। यह लक्ष्य-डिकॉय योजना के तहत एफडीआर नियंत्रण के लिए एक डिकॉय लाइब्रेरी उत्पन्न करने के लिए मौजूदा संदर्भ वर्णक्रमीय लाइब्रेरी का उपयोग करता है। एक्सवाई-मेटा अपने स्वयं के स्पेक्ट्रा मिलान और कोसाइन समानता एल्गोरिदम का समर्थन करता है। यह पारंपरिक खोज और पुनरावृत्ति खोज मोड की अनुमति देता है। एफडीआर मूल्यांकन के चरण में, यह लक्ष्य-डिकॉय संकुचित मोड और अलग मोड का समर्थन करता है। बेहतर लचीलेपन के लिए, एक्सवाई-मेटा बाहरी डिकॉय पुस्तकालयों को स्वीकार करता है।

चयापचयों का पीक डिटेक्शन और परिमाणीकरण भी अनियंत्रित चयापचय विश्लेषण का एक महत्वपूर्ण कदम है। पीक डिटेक्शन मेटाबोलोम पहचान के लिए मुख्य विधि है। सामान्य तौर पर, चयापचयों के शिखर का पता लगाने की सटीकता कई कारकों से प्रभावित थी, जैसे कि मास स्पेक्ट्रोमेट्री के शोर संकेत, चयापचयों की कम बहुतायत, दूषित पदार्थ, और चयापचयों के क्षरण उत्पाद20. जब नमूनों की संख्या बहुत बड़ी होती है या तरल क्रोमैटोग्राफी कॉलम को अनियंत्रित चयापचय के प्रयोगों में बदल दिया जाता है, तो उल्लेखनीय बैच प्रभाव दिखाई दे सकते हैं, जो चयापचय परिमाणन21,22,23 के लिए एक बड़ी चुनौती है। वर्तमान में, एक्ससीएमएस24, वर्कफ़्लो 4 मेटाबोलोमिक25, आईमेट-क्यू26 और मेटाएक्स19 जैसे सॉफ़्टवेयर अनियंत्रित चयापचय की चोटी का पता लगाने और मात्रा निर्धारित कर सकते हैं, लेकिन हम सुझाव देते हैं कि मेटाएक्स की पाइपलाइन अधिक पूर्ण और उपयोग में आसान है। यहां, हम एक्सवाई-मेटा का उपयोग करके सार्वजनिक रूप से उपलब्ध डेटासेट एमएसवी000084112 के लिए पहचान और एफडीआर नियंत्रण की प्रक्रिया का प्रदर्शन करते हैं, और मेटाएक्स का उपयोग करके चयापचयों का चोटी का पता लगाने और मात्रा का ठहराव करते हैं। इस वर्कफ़्लो के लिए केवल दो समूहों की आवश्यकता होती है, और प्रत्येक समूह को कम से कम दो नमूनों की आवश्यकता होती है. एमएस स्पेक्ट्रा डेटा की आवश्यकता होती है, मास स्पेक्ट्रोमीटर प्लेटफॉर्म, आयनीकरण मोड, चार्ज मोड और नमूना प्रकार की परवाह किए बिना, और नमूना-आधारित सामान्यीकरण और शिखर-आधारित सामान्यीकरण का समर्थन कर सकता है। इस उदाहरण के बाद, शोधकर्ता चयापचय की पहचान और मात्रा का ठहराव आसान तरीके से कर सकते हैं। इस पाइपलाइन का उपयोग करने के लिए आर प्रोग्रामिंग क्षमता की आवश्यकता होती है। बिना किसी प्रोग्रामिंग ज्ञान के शोधकर्ता की मदद करने के लिए, हमने चयापचय विश्लेषण के लिए एक क्लाउड विश्लेषण मंच भी विकसित किया। हमने अनुपूरक सामग्री 5 में इस क्लाउड विश्लेषण मंच का प्रदर्शन किया।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. विश्लेषण के लिए मेटाबोलॉमिक्स डेटासेट तैयार करें

नोट: इस प्रदर्शन में, हम क्यूसी नमूने के बिना चयापचय डेटासेट का उपयोग करते हैं। केस और नियंत्रण समूहों के लिए डेटा की आवश्यकता होती है। प्रदर्शन के लिए, हम जीएनपीएस डेटाबेस 27 में एक सार्वजनिक डेटासेट का उपयोगकरते हैं

  1. वेबपेज पर जाएं https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp। क्लिक करें,डेटासेट ब्राउज़ करें.
  2. शीर्षक स्तंभ में कीवर्ड "msv000084112" खोजें। विवरण के लिए डेटासेट आईडी नंबर पर क्लिक करें और एफ़टीपी का उपयोग करके डेटासेट डाउनलोड करें।
  3. रॉ डेटा फ़ोल्डर /msv000084112 में रखें।
    नोट: यह डेटासेट सकारात्मक मोड में क्यू सटीक मंच पर सी 18 आरपी-यूएचपीएलसी का उपयोग करके अधिग्रहित किया गया था। यह मूत्र के नमूनों के डेटा के चयापचय की एक अनियंत्रित बीमारी के साथ एक पलटन का प्रतिनिधित्व करता है, जिसमें स्वस्थ लोगों के 33 नमूने, 12 खाली नमूने, दो मिश्रण नमूने और रोगियों के 82 नमूने28 (पूरक सामग्री 8) शामिल हैं। वर्कफ़्लो प्रदर्शित करने के लिए, हमने यादृच्छिक रूप से स्वस्थ लोगों (एनएच) के छह नमूनों को नियंत्रण समूह के रूप में और बीमारी (एनटी) के साथ छह नमूनों को वर्कफ़्लो करने के लिए एक केस समूह के रूप में चुना।

2. डेटा प्रारूप रूपांतरण

नोट: यदि डेटासेट सीधे द्रव्यमान स्पेक्ट्रोमीटर से उत्पन्न कच्चा डेटा है, तो यह आमतौर पर .raw, .wiff या .cdf प्रारूप में होता है। उन्हें एमजेडएक्सएमएल और एमजीएफ प्रारूपों में परिवर्तित किया जाना चाहिए। यहां, हम प्रारूप रूपांतरण करने के लिए प्रोटियोविज़ार्ड29 पैकेज में एमएसकनवर्ट टूल का उपयोग करते हैं।

  1. https://proteowizard.sourceforge.io/download.html से प्रोटियोविज़ार्ड डाउनलोड करें और इसे इंस्टॉल करें।
  2. प्रोटियोविज़ार्ड इंस्टॉलेशन पथ के तहत एमएसकनवर्ट.exe का उपयोग करके डेटा प्रारूप कनवर्ट करें।
    1. कच्चे डेटा को एमजेडएक्सएमएल प्रारूप में कनवर्ट करें और उन्हें / एमजेडएक्सएमएल फ़ोल्डर में स्टोर करें: / एमएसजेडएक्सएमएल फ़ोल्डर: / .exe / कच्चा / * .raw -ओ / कच्चा / एमजेडएक्सएमएल / -- फ़िल्टर "पीकपिकिंग ट्रू [1,2]" - फ़िल्टर "शून्य नमूने निकालेंएक्सट्रा" - एमजेडएमएल -- एमजेड 64 - फ़िल्टर "एमएसलेईवीएल 1-2" -- फ़िल्टर "< >>.< <स्कैन>ंबर>> <चार्ज स्टेट>".
    2. कच्चे/एमजेडएक्सएमएल डेटा को एमजीएफ प्रारूप में कनवर्ट करें और उन्हें /एमजीएफ फ़ोल्डर में स्टोर करें:/एमएस.exe वी000084112/* .raw -ओ/एमएसवी000084112/एमजीएफ/-फिल्टर "पीकपिकिंग ट्रू [1,2]" --फिल्टर "शून्य नमूने निकालेंएक्सट्रा" --एमजीएफ --एमजेड 64 --फिल्टर "एमएसलेवल 1-2< <> <>> <चार्ज स्टेट>".

3. चयापचयों के लिए संदर्भ वर्णक्रमीय पुस्तकालय तैयार करें

नोट: एक्सवाई-मेटा केवल एमजीएफ प्रारूप में संदर्भ वर्णक्रमीय पुस्तकालयों का समर्थन करता है।

  1. वेबपेज पर जाएं https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp। आइटम खोजने के लिए कीवर्ड "एनआईएसटी" खोजें। विवरण के लिए देखें क्लिक करें और लायब्रेरी डाउनलोड करें.
    नोट: जीएनपीएस पब्लिक स्पेक्ट्रल लाइब्रेरी ने कई मेटाबोलाइट्स पुस्तकालयों को एकत्र किया, जो प्रकार, उत्पत्ति, प्रजातियों और संग्रह मोड में व्यवस्थित थे। यद्यपि इन पुस्तकालयों का केवल एक छोटा सा अंश मानक सामग्रियों का उपयोग करके उत्पन्न होता है, वे आमतौर पर अधिकांश मौलिक अनुसंधान के लिए पर्याप्त होते हैं।
  2. डाउनलोड की गई लाइब्रेरी जीएनपीएस-एनआईएसटी 14-मैच्स.एमजीएफ /डेटाबेस फ़ोल्डर में रखें।

4. मेटाबोलाइट्स पहचान और एफडीआर नियंत्रण

  1. एक्सवाई-मेटा (विंडोज संस्करण) डाउनलोड करें। /XY-मेटा-विन/कॉन्फ़िगरेशन/फ़ोल्डर के अंतर्गत पैरामीटर कॉन्फ़िगरेशन फ़ाइल पैरामीटर.डिफ़ॉल्ट ढूँढें। अनुपूरक सामग्री के अनुसार इसकी सामग्री बदलें 1.
    नोट: समाधान में, मेटाबोलाइट्स अक्सर आयनों या उद्धरणों के साथ एडक्ट बनाते हैं, जो मूल आयनों के बड़े पैमाने पर बदलाव की ओर जाता है। इसलिए, एडक्ट के प्रकार सेट करना आवश्यक है। हमने आयन एक्सचेंज कॉलम के लिए एडक्ट सूचियां प्रदान कीं और सकारात्मक चार्ज मोड के तहत रिवर्स विश्लेषणात्मक कॉलम और /एडक्ट फ़ोल्डर में नकारात्मक चार्ज मोड। उपयोगकर्ता अपने शोध परियोजना के अनुसार अपनी स्वयं की एडक्ट सूची को भी संपादित कर सकते हैं। एडक्ट सूची प्रदान की गई सूची के समान प्रारूप में होनी चाहिए।
  2. एक्सवाई-मेटा: एक्सवाई-मेटा.exe -एस / एक्सवाई-मेटा-विन / कॉन्फ़िगरेशन / पैरामीटर.डिफ़ॉल्ट -डी / एमएसवी000084112 / pos_wt-1_a.एमजीएफ -आर / डेटाबेस / जीएनपीएस-एनआईएसटी 14-मैच्स.एमजीएफ का उपयोग करके मेटाबोलाइट पहचान और एफडीआर नियंत्रण करें।
    नोट:: XY-मेटा पैरामीटर में वाइल्डकार्ड का समर्थन नहीं करता है। इसलिए, प्रत्येक एमजीएफ फ़ाइल को संसाधित करने के लिए एक एकल कमांड का उपयोग किया जाना चाहिए। बड़ी संख्या में फ़ाइलों के लिए, एक बैच फ़ाइल की सिफारिश की जाती है।

5. विभेदक विश्लेषण

नोट: मेटाएक्स एक ओपन-सोर्स आर पैकेज है। कृपया इसे https://github.com/wenbostar/metaX पर गाइड के अनुसार स्थापित करें। इस विश्लेषण के लिए 8 जीबी रैम की आवश्यकता होती है।

  1. नमूना और उसके संगत एमएस डेटा को निर्दिष्ट करने के लिए नमूना सूची.txt फ़ाइल संपादित करें। कृपया अनुपूरक सामग्री 2 देखें।
    नोट: मेटाएक्स क्यूसी नमूनों के साथ डेटासेट के लिए मात्रात्मक विश्लेषण का समर्थन करता है। क्यूसी नमूनों का उपयोग करते समय, कृपया क्यूसी नमूनों के लिए एनए के लिए कक्षा संपत्ति को संशोधित करें।
  2. मात्रात्मक विश्लेषण के परिणामों को संग्रहीत करने के लिए /आउटपुट फ़ोल्डर बनाएँ। मॉक और डब्ल्यूटी समूहों को मापने के लिए मेटाक्स का उपयोग करने के लिए पूरक सामग्री 3 में स्क्रिप्ट चलाने के लिए R का उपयोग करें।
    नोट:: पूरक सामग्री 3 में स्क्रिप्ट चलाने से पहले, वास्तविक स्थानीय पथ के लिए स्क्रिप्ट में पथ संशोधित करें।

6. गुणात्मक और मात्रात्मक परिणामों का एकीकरण

  1. मेटाबोलाइट पहचान का उपयोग करके गुणात्मक और मात्रात्मक विश्लेषण में चोटियों को एनोटेट करने के लिए पूरक सामग्री 4 में आर स्क्रिप्ट चलाएं।
    नोट:: पूरक सामग्री 4 में स्क्रिप्ट चलाने से पहले, कृपया अपने वास्तविक स्थानीय पथ के लिए स्क्रिप्ट में पथ संशोधित करें।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

एमएसवी000084112 के कच्चे डेटा को एमएस-कन्वर्ट.exe द्वारा परिवर्तित किया गया था और एमजीएफ फाइलों (पूरक सामग्री एस 6) को उत्पन्न किया गया था।

एक्सवाई-मेटा ने जीएनपीएस-एनआईएसटी 14-MATCHES_Decoy.एमजीएफ फ़ाइल /डेटाबेस फ़ोल्डर के तहत उत्पन्न की। यह मूल संदर्भ वर्णक्रमीय पुस्तकालय जीएनपीएस-एनआईएसटी 14-मैच्स.एमजीएफ से उत्पन्न डिकॉय लाइब्रेरी है। इस डिकॉय लाइब्रेरी का पुन: उपयोग किया जा सकता है। इस डिकॉय लाइब्रेरी का पुन: उपयोग करते समय, उपयोगकर्ता को decoy_pattern पैरामीटर.डिफ़ॉल्ट फ़ाइल में 1 के रूप में सेट करना चाहिए, और डिकॉय लाइब्रेरी के पूर्ण पथ के रूप में डिकॉयइनपुट सेट करना चाहिए। एमजीएफ फ़ोल्डर (प्रत्यय .मेटा के साथ) के तहत पहचान परिणाम उत्पन्न किए गए थे, जिसमें स्पेक्ट्रा मिलान स्कोर, एफडीआर, चयापचयों के एम / जेड, प्रतिधारण समय और चयापचयों का नाम (पूरक सामग्री 7) शामिल है।

मेटाएक्स द्वारा मात्रात्मक विश्लेषण /आउटपुट फ़ोल्डर में था। एनएच और एनटी का सामान्य मात्रात्मक वितरण समान है, माध्य मूल्यों (चित्रा 1 ए) के कम उतार-चढ़ाव के साथ। लापता मूल्यों का केवल एक छोटा सा अंश था: केवल 3.39% चयापचयों में लापता मूल्यों (चित्रा 1 बी) का 30% से अधिक है। मेटाएक्स ने उल्लेखनीय रूप से सीवी ≤ 0.3 (चित्रा 1 सी) के साथ चयापचयों के अनुपात में वृद्धि की। बॉक्स प्लॉट /metaX_box फ़ोल्डर में संग्रहीत किए गए थे। क्षालन प्रोफ़ाइल /metaX_eic फ़ोल्डर में संग्रहीत किए गए थे। मेटाबोलाइट चोटियों को मेटाएक्स-फीचर.txt में दर्ज किया गया था। चयापचयों के मात्रात्मक मूल्यजो दोनों समूहों में पहचाने गए थे और अंतर विश्लेषण परिणाम metaX_peaks.txt (चित्रा 1 डी) में संग्रहीत किए गए थे। | की दहलीज लागू करना लॉगएफसी| ≥ 1 और पी-वैल्यू 0.05 <, 342 चयापचयों का अलग-अलग पता लगाया गया था, जिसमें 206 अप-विनियमित और 136 डाउन-विनियमित (पूरक सामग्री 9) थे।

हमने 0.01 पहचान के < एफडीआर का उपयोग करके मेटाएक्स का पता लगाया। यदि एक चोटी को कई चयापचयों द्वारा एनोटेट किया जा सकता है, तो हमने अंतिम एनोटेशन के रूप में उच्चतम स्पेक्ट्रम मिलान स्कोर के साथ एक लिया। इन मानदंडों का उपयोग करते हुए, हमने छह अंतर मेटाबोलाइट चोटियों (चित्रा 2) को एनोटेट किया।

Figure 1
चित्र 1. मेटाएक्स द्वारा मात्रात्मक विश्लेषण। () सभी नमूनों के परिमाणित चयापचयों का बॉक्स प्लॉट। (बी) लापता मूल्य वितरण का हिस्टोग्राम। (सी) दो समूह नमूनों के पीसीए भूखंड। (डी) तीन सांख्यिकीय परीक्षण विधियों से अलग-अलग पता लगाए गए चयापचयों का वेन आरेख। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

Figure 2
चित्र 2. सभी एनोटेट किए गए चयापचयों का प्रतिधारण समय (आरटी) और एम / लाल डॉट्स महत्वपूर्ण और अलग-अलग रूप से पता लगाए गए चयापचयों का प्रतिनिधित्व करते हैं। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

अनुपूरक सामग्री 1: एक्सवाई-मेटा की पैरामीटर फ़ाइल। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 2: मेटाएक्स के लिए नमूनों की सूचना पत्रक को समूहीकृत करना। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 3: XY-मेटा और मेटाएक्स के वर्कफ़्लो को एकीकृत करने के लिए स्क्रिप्ट। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 4: चयापचय पहचान का उपयोग करके चोटियों को एनोटेट करने के लिए स्क्रिप्ट। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 5: क्लाउड प्लेटफ़ॉर्म का उपयोग करके चयापचय विश्लेषण के लिए एक पूर्ण वर्कफ़्लो। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 6: एमएसवी000084112 के नमूना डेटा के लिए एमएसकन्वर्ट से परिवर्तित एक एमजीएफ फ़ाइल। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 7: msv000084112 के नमूना डेटा के लिए XY-मेटा से एक पहचान परिणाम तालिका। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 8: एमएसवी000084112 की पलटन नैदानिक सूचना पत्रक। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

अनुपूरक सामग्री 9: सभी मेटाबोलाइट्स की पहचान सूची और सभी मेटाबोलाइट चोटियों के अंतर विश्लेषण परिणाम। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

अनटारगेटेड मेटाबोलाइट्स का एफडीआर नियंत्रण एक बड़ी चुनौती रही है। यहां, हमने एफडीआर नियंत्रण के साथ बड़े पैमाने पर अलक्षित चयापचय विश्लेषण (गुणात्मक और मात्रात्मक) की एक पूरी पाइपलाइन का प्रदर्शन किया। यह प्रभावी रूप से झूठी सकारात्मकता को कम करता है, जो एमएस विश्लेषण में बहुत आम हैं।

अपने अध्ययन के लिए एक उपयुक्त संदर्भ वर्णक्रमीय पुस्तकालय तैयार करना एक महत्वपूर्ण बिंदु है। एमएस पहचान के लिए न केवल उचित मिलान एल्गोरिदम की आवश्यकता होती है, बल्कि उचित संदर्भ वर्णक्रमीय पुस्तकालयों की भी आवश्यकता होती है। सार्वजनिक वर्णक्रमीय पुस्तकालयों की प्रयोज्यता निम्नलिखित कारणों से सीमित है: (1) कई सार्वजनिक वर्णक्रमीय पुस्तकालयों में पूर्ण मेटाबोलाइट सूचियां शामिल नहीं हैं। (2) सार्वजनिक वर्णक्रमीय पुस्तकालयों में स्पेक्ट्रा विभिन्न एमएस उपकरणों और / या विभिन्न विखंडन स्थितियों30,31 से उत्पन्न हुआ। इसलिए, हम सुझाव देते हैं कि आप "अनन्य" वर्णक्रमीय पुस्तकालय के निर्माण के लिए मानक चयापचयों का उपयोग करके एक ही उपकरण और समान विखंडन स्थितियों में स्पेक्ट्रा एकत्र करें। इसके अलावा, इन स्थितियों को वास्तविक माप के दौरान बनाए रखा जाना चाहिए। इसके अतिरिक्त, पैरामीटर फ़ाइल को संशोधित करते समय, अग्रदूत आयनों और टुकड़ा आयनों की सहिष्णुता साधन के मापदंडों के साथ मेल खाना चाहिए। आम तौर पर, अग्रदूत सहिष्णुता की सीमा 10 पीपीएम और 20 पीपीएम के बीच होनी चाहिए, और टुकड़ा सहिष्णुता 0.01 दा और 0.5 दा के बीच सेट की जानी चाहिए। इस डेटा सेट के लिए, साधन के पैरामीटर अज्ञात हैं, लेकिन 0.05 दा की टुकड़ा सहिष्णुता इस वर्कफ़्लो के लिए सामान्य रूप से प्रदर्शन करने के लिए एक रूढ़िवादी विकल्प है।

वे इस पाइपलाइन को चलाते समय उपयोगकर्ताओं को अभी भी विभिन्न त्रुटि संदेश प्राप्त हो सकता है। सामान्य गलतियों में गलत इनपुट फ़ाइल पथ, लापता पैरामीटर फ़ाइल और फ़ाइल एक्सेस संघर्ष शामिल हैं (उदाहरण के लिए, ऑपरेटिंग सिस्टम द्वारा अस्वीकार की गई पहुंच और एक ही फ़ाइल का एक साथ एक्सेस करना)।

ध्यान देने योग्य है, यह वर्कफ़्लो वर्तमान में केवल 1,000 दा से कम छोटे अणुओं के लक्षित और अनियंत्रित चयापचय विश्लेषण पर लागू होता है, और इसका उपयोग ग्लाइकन श्रृंखला या लिपिड श्रृंखला जैसे मैक्रोमोलेक्यूल्स के चयापचयों का विश्लेषण करने के लिए नहीं किया जा सकता है। इसके अलावा, डेटा स्वतंत्र अधिग्रहण (डीआईए) डेटा और आयन गतिशीलता डेटा दोनों इस वर्कफ़्लो के साथ विश्लेषण के लिए उपयुक्त नहीं हैं। यह वर्कफ़्लो पीक डिटेक्शन परिणामों को एनोटेट करने के लिए चयापचयों के एम /जेड और अवधारण समय के उपयोग का समर्थन नहीं करता है और केवल दो से अधिक नमूनों के साथ डेटा के दो समूहों के अंतर विश्लेषण का समर्थन करता है।

लंबे समय तक, पीक डिटेक्शन टेक्नोलॉजी के प्रभुत्व वाले अनटार्गेटेड मेटाबोलोम के पहचान परिणामों में बहुत सारे झूठे सकारात्मक होते हैं, मुख्य रूप से बड़ी संख्या में मेटाबोलाइट आइसोमर्स और विभिन्न आयनिक एडक्ट रूपों के कारण। ज्ञात चयापचयों के संदर्भ स्पेक्ट्रा के साथ चयापचयों के एमएस / एमएस स्पेक्ट्रा की तुलना आइसोमर्स32 को अलग करने के लिए चयापचयों की संरचना को हल कर सकती है। हालांकि, एक मेटाबोलाइट की पहचान नहीं की जा सकती है यदि मेटाबोलाइट का संदर्भ स्पेक्ट्रम सार्वजनिक रूप से या व्यावसायिक रूप से उपलब्ध नहीं है7. इसलिए, मेटाबोलाइट संदर्भ स्पेक्ट्रा की एक विश्वसनीय लाइब्रेरी का निर्माण एक बड़ी चुनौती है। कम गुणवत्ता का संदर्भ स्पेक्ट्रा और समान संरचना के साथ प्रयोगात्मक स्पेक्ट्रा के यादृच्छिक मिलान की ओर जाता है। इसलिए, आत्मविश्वास पहचान सुनिश्चित करने के लिए पहचान परिणामों का एफडीआर नियंत्रण आवश्यक है। उपयोगकर्ता इस पाइपलाइन का उपयोग एफडीआर नियंत्रण के साथ-साथ मात्रा और अंतर विश्लेषण के साथ स्वचालित रूप से चयापचय की पहचान करने के लिए कर सकते हैं, आवश्यक प्रोटोकॉल के रूप में आवश्यक इनपुट डेटा प्रदान करके। यह कई शोधकर्ताओं के लिए सुविधाजनक और किफायती है, खासकर शुरुआती लोगों के लिए।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

हितों का टकराव नहीं है।

Acknowledgments

यह काम राष्ट्रीय कुंजी अनुसंधान और विकास कार्यक्रम (2018वाईएफसी0910200/2017वाईएफए0505001) और गुआंग्डोंग कुंजी अनुसंधान एवं विकास कार्यक्रम (2019बी020226001) द्वारा समर्थित है।

Materials

Name Company Catalog Number Comments
GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

DOWNLOAD MATERIALS LIST

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Tags

जैव रसायन अंक 187
एफडीआर नियंत्रण-आधारित अलक्षित चयापचय पर पहचान और मात्रा का ठहराव का एक एकीकृत वर्कफ़्लो
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Li, D., Liang, J., Zhang, Y., Zhang, More

Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter