हम तीन आयामी क्रोमेटिन इंटरैक्शन का उपयोग करके जीनोम-वाइड एसोसिएशन स्टडीज (जीडब्ल्यूएएस) द्वारा पहचाने गए गैर-कोडिंग वेरिएंट के कार्यात्मक प्रभावों की पहचान करने के लिए एक प्रोटोकॉल प्रस्तुत करते हैं।
जीनोम-वाइड एसोसिएशन स्टडीज (जीडब्ल्यूएएस) ने सैकड़ों जीनोमिक लोकी की सफलतापूर्वक पहचान की है जो मानव लक्षणों और बीमारी से जुड़े हुए हैं। हालांकि, क्योंकि जीनोम-वाइड महत्वपूर्ण (जीडब्ल्यूएस) लोकी का अधिकांश हिस्सा गैर-कोडिंग जीनोम पर पड़ता है, इसलिए कई का कार्यात्मक प्रभाव अज्ञात रहता है। हाई-सी या इसके डेरिवेटिव द्वारा पहचाने गए त्रि-आयामी क्रोमेटिन इंटरैक्शन गैर-कोडिंग वेरिएंट को उनके क्रियात्मक जीन से जोड़कर इन लोकी को एनोटेट करने के लिए उपयोगी उपकरण प्रदान कर सकते हैं। यहां, हम मानव वयस्क मस्तिष्क ऊतक से अल्जाइमर रोग (विज्ञापन) जीडब्ल्यूएएस और हाय-सी डेटासेट का उपयोग करके अपने ख्यात जीन के लिए जीडब्ल्यूएएस गैर-कोडिंग वेरिएंट को मैप करने के लिए एक प्रोटोकॉल की रूपरेखा तैयार करते हैं। ख्यात कारण एकल-न्यूक्लियोटाइड बहुरूपता (SNPs) की पहचान फाइन-मैपिंग एल्गोरिदम के आवेदन द्वारा की जाती है। इसके बाद एसएनपी को हाय-सी के आधार पर एन्हांस्ड-प्रमोटर इंटरैक्शन का उपयोग करके अपने ख्यात लक्ष्य जीन के लिए मैप किया जाता है । परिणामस्वरूप जीन सेट विज्ञापन जोखिम जीन का प्रतिनिधित्व करता है, क्योंकि वे संभावित विज्ञापन जोखिम वेरिएंट द्वारा विनियमित कर रहे हैं । विज्ञापन अंतर्निहित आणविक तंत्र में आगे जैविक अंतर्दृष्टि जुटाने के लिए, हम विकासात्मक मस्तिष्क अभिव्यक्ति डेटा और मस्तिष्क एकल सेल अभिव्यक्ति प्रोफाइल का उपयोग कर विज्ञापन जोखिम जीन की विशेषता है । इस प्रोटोकॉल को विभिन्न मानव लक्षणों और रोगों में अंतर्निहित ख्यात लक्ष्य जीन और आणविक तंत्र की पहचान करने के लिए किसी भी जीडब्ल्यूए और हाई-सी डेटासेट में विस्तारित किया जा सकता है।
जीनोम-वाइड एसोसिएशन अध्ययन (जीडब्ल्यूएएस) ने मानव लक्षणों और बीमारियों की एक श्रृंखला के आनुवंशिक आधार को उजागर करने में महत्वपूर्ण भूमिका निभाई है। इस बड़े पैमाने पर जोनोटाइपिंग ने ऊंचाई से लेकर सिजोफ्रेनिया जोखिम तक फेनोटाइप से जुड़े हजारों जीनोमिक वेरिएंट का पर्दाफाश किया है । हालांकि, रोग और विशेषता जुड़े loci की पहचान करने में GWAS की भारी सफलता के बावजूद, कैसे इन वेरिएंट फेनोटाइप में योगदान की एक यंत्रवादी समझ चुनौतीपूर्ण रहा है क्योंकि सबसे फेनोटाइप जुड़े वेरिएंट गैर कोडिंग में रहते है मानव जीनोम का अंश। चूंकि ये वेरिएंट अक्सर भविष्यवाणी किए गए नियामक तत्वों के साथ ओवरलैप होते हैं, इसलिए वे पास के जीन के प्रतिलेखन नियंत्रण को बदलने की संभावना रखते हैं। हालांकि, गैर कोडिंग loci एक मेगाबेस से अधिक रैखिक दूरी पर जीन के प्रतिलेखन को प्रभावित कर सकते हैं, प्रत्येक संस्करण से प्रभावित जीन की पहचान करने के लिए मुश्किल बना रही है । त्रि-आयामी (3 डी) क्रोमेटिन संरचना दूर के नियामक लोकी और जीन प्रमोटरों के बीच कनेक्शन मध्यस्थता करने में महत्वपूर्ण भूमिका निभाती है और इसका उपयोग फेनोटाइप संबद्ध एकल-न्यूक्लियोटाइड बहुरूपता (एसएनपी) से प्रभावित जीन की पहचान करने के लिए किया जा सकता है।
जीन विनियमन एक जटिल प्रक्रिया द्वारा मध्यस्थता की जाती है, जिसमें वृद्धि सक्रियण और क्रोमेटिन लूप गठन शामिल है जो जीन प्रमोटरों से शारीरिक रूप से बढ़ाने वालों को जोड़ता है जिससे प्रतिलेखन मशीनरी को1,2,3निर्देशित किया जा सकता है। क्योंकि क्रोमेटिन छोरों अक्सर कई सौ किलोकुर्सियां (केबी) अवधि, जीन नियामक तंत्र को समझने के लिए 3 डी क्रोमेटिन वास्तुकला के विस्तृत नक्शे की आवश्यकता होती है। 3 डी क्रोमेटिन आर्किटेक्चर4की पहचान करने के लिए कई क्रोमेटिन संरचना कैप्चर प्रौद्योगिकियों का आविष्कार किया गया है। इन प्रौद्योगिकियों में, हाय-सी सबसे व्यापक वास्तुकला प्रदान करता है, क्योंकि यह जीनोम-वाइड 3 डी क्रोमेटिन इंटरैक्शन प्रोफाइल को कैप्चर करता है। हाई-सी डेटासेट को गैर-कोडिंग जीनोम-वाइड महत्वपूर्ण (जीडब्ल्यूएस) लोकी5,6,7,8,9,10,11,12,13की व्याख्या करने के लिए जल्दी से अनुकूलित किया गया है, क्योंकि यह क्रोमेटिन इंटरैक्शन प्रोफाइल के आधार पर गैर-कोडिंग वेरिएंट को उनके ख्यात लक्ष्य जीन से जोड़ सकता है।
इस लेख में, हम क्रोमेटिन इंटरैक्शन प्रोफाइल का उपयोग करके जीडब्ल्यूए जोखिम वेरिएंट के ख्यात लक्ष्य जीन की गणना करने के लिए एक प्रोटोकॉल की रूपरेखा तैयार करते हैं। हम वयस्क मानव मस्तिष्क9में हाय-सी डेटासेट का उपयोग करके अपने लक्षित जीन के लिए विज्ञापन जीडब्ल्यूएस लोकी14 को मैप करने के लिए इस प्रोटोकॉल को लागू करते हैं। परिणामस्वरूप विज्ञापन जोखिम जीन अन्य कार्यात्मक जीनोमिक डेटासेट की विशेषता है जिसमें एकल सेल ट्रांसक्रिप्टोमिक और विकासात्मक अभिव्यक्ति प्रोफाइल शामिल हैं।
यहां हम एक विश्लेषणात्मक ढांचे का वर्णन करते हैं जिसका उपयोग स्थितीय मानचित्रण और क्रोमेटिन इंटरैक्शन के आधार पर जीडब्ल्यूएस लोकी को कार्यात्मक रूप से एनोटेट करने के लिए किया जा सकता है। इस प्रक्रिया में कई चरण शामिल हैं (अधिक जानकारी के लिए इस समीक्षा13को देखें)। सबसे पहले, यह देखते हुए कि क्रोमेटिन इंटरैक्शन प्रोफाइल अत्यधिक सेल-प्रकार विशिष्ट हैं, उपयुक्त कोशिका/ऊतक प्रकारों से प्राप्त हाय-सी डेटा जो विकार के अंतर्निहित जीव विज्ञान को सबसे अच्छा कैप्चर करते हैं। यह देखते हुए कि विज्ञापन एक न्यूरोडीजेनेरेटिव डिसऑर्डर है, हमने जीडब्ल्यूएस लोकी को एनोटेट करने के लिए वयस्क मस्तिष्क हाय-सी डेटा9 का उपयोग किया। दूसरा, प्रत्येक जीडब्ल्यूएस लोकस में अक्सर सैकड़ों एसएनपीएस होते हैं जो लिंकेज डिजिलिब्रियम (एलडी) के कारण विशेषता से जुड़े होते हैं, इसलिए गणनात्मक कारण की भविष्यवाणी करके ख्यात कारण (‘विश्वसनीय’) एसएनपी प्राप्त करना महत्वपूर्ण है फाइन-मैपिंग एल्गोरिदम21,22 के उपयोग के माध्यम से या प्रायोगिक रूप से उच्च-थ्रूपुट दृष्टिकोणों का उपयोग करके नियामक गतिविधियों का परीक्षण करना जैसे बड़े पैमाने पर समानांतर रिपोर्टर परख (एमपीआरए)23 या सक्रिय नियामक क्षेत्र अनुक्रमण को आत्म-पार करना ( स्टार-seq)24। यहां वर्णित काम के लिए, हम विश्वसनीय SNPs Jansen एट अल14में रिपोर्ट का इस्तेमाल किया । तीसरा, प्रमोटर और एक्सोनिक एसएनपी स्थितीय मानचित्रण के आधार पर एनोटेट किया जाता है। हमने एक सरल स्थितीय मानचित्रण रणनीति का उपयोग किया जिसमें एसएनपीएस को जीन के लिए मैप किया गया था जब वे प्रमोटरों के साथ छा गए थे (ट्रांसक्रिप्शन स्टार्ट साइट के 2 केबी अपस्ट्रीम के रूप में परिभाषित) या exons। हालांकि, इस दृष्टिकोण को एक्सोनिक एसएनपी के कार्यात्मक परिणामों का आकलन करके और विस्तार से बताया जा सकता है, जैसे कि क्या एसएनपी बकवास मध्यस्थता क्षय, गलत भिन्नता या बकवास भिन्नता को प्रेरित करता है। चौथा, उपयुक्त ऊतक/कोशिका प्रकार से क्रोमेटिन इंटरैक्शन प्रोफाइल का उपयोग भौतिक निकटता के आधार पर अपने ख्यात लक्ष्य जीन को एसएनपी असाइन करने के लिए किया जा सकता है । हमने प्रमोटरों के लिए लंगर डाले गए इंटरैक्शन प्रोफाइल का उपयोग किया, लेकिन हम एन्हांसियर गतिविधियों (हिस्टोन एच3 के27 एसिटिलेशन या क्रोमेटिन एक्सेसिबिलिटी द्वारा निर्देशित) या एक्सोनिक इंटरैक्शन को ध्यान में रखकर इंटरैक्शन प्रोफाइल को और परिष्कृत या विस्तारित कर सकते हैं। इस प्रक्रिया में एक महत्वपूर्ण विचार लगातार मानव जीनोम निर्माण का उपयोग करना है। उदाहरण के लिए, यदि सारांश आंकड़ों की जीनोमिक स्थितियां एचजी19 (यानी एचजी18 या एचजी38) पर आधारित नहीं हैं, तो संदर्भ जीनोम का एक उपयुक्त संस्करण प्राप्त किया जाना चाहिए या सारांश आंकड़ों कोलिफ्टओवर 25का उपयोग करके एचजी19 में परिवर्तित करने की आवश्यकता है।
हमने विज्ञापन जीडब्ल्यूए के लिए ख्यात लक्ष्य जीन की पहचान करने के लिए इस ढांचे को लागू किया, ११२ विज्ञापन जोखिम जीन के लिए २८४ SNPs निर्दिष्ट । विकासात्मक अभिव्यक्ति प्रोफाइल26 और सेल-प्रकार विशिष्ट अभिव्यक्ति प्रोफाइल9का उपयोग करते हुए, हमने तब दिखाया कि यह जीन सेट विज्ञापन विकृति के बारे में जाना जाता है, सेल प्रकार (माइक्रोग्लिया), जैविक कार्यों (प्रतिरक्षा प्रतिक्रिया और एमिलॉयड बीटा) और उम्र पर ऊंचा जोखिम का खुलासा करने के अनुरूप था।
जब तक हम एक रूपरेखा है कि विज्ञापन और उसके अंतर्निहित जीव विज्ञान के संभावित लक्ष्य जीन चित्रित प्रस्तुत किया, यह ध्यान दें कि हाय सी आधारित एनोटेशन किसी भी गैर कोडिंग भिन्नता एनोटेट करने के लिए विस्तारकिया जा सकता है । के रूप में और अधिक पूरे जीनोम अनुक्रमण डेटा उपलब्ध हो जाता है और गैर कोडिंग दुर्लभ भिन्नता के बारे में हमारी समझ बढ़ता है, हाय सी रोग से जुड़े आनुवंशिक वेरिएंट की व्याख्या के लिए एक महत्वपूर्ण संसाधन प्रदान करेगा । इसलिए कई ऊतकों और कोशिका प्रकारों से प्राप्त हाय-सी संसाधनों का एक संग्रह विभिन्न मानव लक्षणों और रोग में जैविक अंतर्दृष्टि जुटाने के लिए इस ढांचे के एक विस्तृत अनुप्रयोग को सुविधाजनक बनाने के लिए महत्वपूर्ण होगा।
The authors have nothing to disclose.
इस काम को NIH अनुदान R00MH113823 (H.W.) और R35GM128645 (D.H.P.), NARSAD युवा अन्वेषक पुरस्कार (H.W.), और सिमंस फाउंडेशन आत्मकेंद्रित अनुसंधान पहल (SFARI, एनएम और एचडब्ल्यू) से स्पार्क अनुदान द्वारा समर्थित किया गया था ।
10 kb resolution Hi-C interaction profiles in the adult brain from psychencode | http://adult.psychencode.org/ | ||
Developmental expression datasets | http://www.brainspan.org/ | ||
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) | https://static-content.springer.com/ | ||
HOMER | http://homer.ucsd.edu/ | ||
R (version 3.5.0) | https://www.r-project.org/ | ||
RStudio Desktop | https://www.rstudio.com/ | ||
Single cell expression datasets | http://adult.psychencode.org/ |