Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

सिलिको में। मेजबान-रोगज़नक़ इंटरैक्शन के दौरान सीआईआरएनए की पहचान और लक्षण वर्णन

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

यहां प्रस्तुत प्रोटोकॉल मेजबान-रोगज़नक़ इंटरैक्शन का अध्ययन करने वाले आरएनए-अनुक्रमण ट्रांसस्क्रिप्टम डेटा से लगभग आरएनए की भविष्यवाणी करने और कार्यात्मक रूप से चिह्नित करने के लिए आवश्यक सिलिको पाइपलाइन में पूर्ण की व्याख्या करता है।

Abstract

सर्कुलर आरएनए (सीआईआरआरएनए) गैर-कोडिंग आरएनए का एक वर्ग है जो बैक-स्प्लिसिंग के माध्यम से बनता है। इन सीआईआरएनए का मुख्य रूप से विभिन्न जैविक प्रक्रियाओं के नियामकों के रूप में उनकी भूमिकाओं के लिए अध्ययन किया जाता है। विशेष रूप से, उभरते सबूत दर्शाते हैं कि रोगजनकों (जैसे, इन्फ्लूएंजा और कोरोनावायरस) के संक्रमण पर मेजबान सर्आरएनए को अलग-अलग व्यक्त (डीई) किया जा सकता है, जो मेजबान जन्मजात प्रतिरक्षा प्रतिक्रियाओं को विनियमित करने में सीआईआरएनए की भूमिका का सुझाव देता है। हालांकि, रोगजनक संक्रमण ों के दौरान सीआईआरएनए की भूमिका पर जांच आरएनए अनुक्रमण (आरएनए-सेक) डेटा से डीई सर्कोआरएनए की पहचान करने के लिए आवश्यक जैव सूचना विज्ञान विश्लेषण करने के लिए आवश्यक ज्ञान और कौशल द्वारा सीमित है। जैव सूचना विज्ञान की भविष्यवाणी और सीआईआरएनए की पहचान किसी भी सत्यापन से पहले महत्वपूर्ण है, और महंगी और समय लेने वाली गीली-प्रयोगशाला तकनीकों का उपयोग करके कार्यात्मक अध्ययन। इस मुद्दे को हल करने के लिए, इस पांडुलिपि में आरएनए-सेक डेटा का उपयोग करके सिलिको भविष्यवाणी और सीआईआरएनए के लक्षण वर्णन का एक चरण-दर-चरण प्रोटोकॉल प्रदान किया गया है। प्रोटोकॉल को चार चरणों में विभाजित किया जा सकता है: 1) सीआईआरआईक्वांट पाइपलाइन के माध्यम से डीई सर्काआरएनए की भविष्यवाणी और परिमाणीकरण; 2) सीआईआरसीबेस के माध्यम से एनोटेशन और डीई सर्आरएनए के लक्षण वर्णन; 3) सीआईआरसी पाइपलाइन के माध्यम से सीआईआरआरएनए-एमआरएनए इंटरैक्शन भविष्यवाणी; 4) जीन ऑन्कोलॉजी (जीओ) और क्योटो एनसाइक्लोपीडिया ऑफ जीन एंड जीनोम (केईजीजी) का उपयोग करके लगभग आरएनए माता-पिता के जीन का कार्यात्मक संवर्धन विश्लेषण। यह पाइपलाइन भविष्य में इन विट्रो और विवो अनुसंधान में उपयोगी होगी ताकि मेजबान-रोगज़नक़ इंटरैक्शन में सीआईआरएनए की भूमिका को और उजागर किया जा सके।

Introduction

मेजबान-रोगज़नक़ इंटरैक्शन रोगजनकों और मेजबान जीवों के बीच एक जटिल अंतःक्रिया का प्रतिनिधित्व करते हैं, जो मेजबानों की जन्मजात प्रतिरक्षा प्रतिक्रियाओं को ट्रिगर करता है जिसके परिणामस्वरूप अंततः हमलावर रोगजनकोंको हटा दिया जाता है1,2. रोगजनक संक्रमण के दौरान, रोगजनकों की प्रतिकृति और रिहाई को रोकने के लिए मेजबान प्रतिरक्षा जीन की एक भीड़ को विनियमित किया जाता है। उदाहरण के लिए, रोगजनक संक्रमणों पर विनियमित सामान्य इंटरफेरॉन-उत्तेजित जीन (आईएसजी) में एडीएआर 1, आईएफआईटी 1, आईएफआईटी 2, आईएफआईटी 3, आईएसजी 20, आरआईजी-आई और ओएएसएल 3,4 शामिल हैं। प्रोटीन-कोडिंग जीन के अलावा, अध्ययनों से यह भी पता चला है कि गैर-कोडिंग आरएनए जैसे कि लंबे समय तक गैर-कोडिंग आरएनए (एलएनसीआरएनए), माइक्रोआरएनए (एमआईआरएनए), और परिपत्र आरएनए (सीआईआरआरएनए) भी एक भूमिका निभाते हैं और रोगजनक संक्रमण 5,6,7 के दौरान समवर्ती रूप से विनियमित होते हैं। प्रोटीन-कोडिंग जीन के विपरीत जो मुख्य रूप से प्रोटीन को कार्यात्मक अणुओं के रूप में एन्कोड करते हैं, गैर-कोडिंग आरएनए (एनसीआरएनए) को ट्रांसक्रिप्शनल और पोस्ट-ट्रांसक्रिप्शनल स्तरों पर जीन के नियामकों के रूप में कार्य करने के लिए जाना जाता है। हालांकि, मेजबान ों के प्रतिरक्षा जीन को विनियमित करने में गैर-कोडिंग आरएनए, विशेष रूप से सीआईआरएनए की भागीदारी से जुड़े अध्ययन प्रोटीन-कोडिंग जीन की तुलना में अच्छी तरह से रिपोर्ट नहीं किए गए हैं।

सीआईआरएनए को व्यापक रूप से उनके सहसंयोजक बंद निरंतर लूप संरचना की विशेषता है, जो बैक-स्प्लिसिंग8 नामक एक गैर-कैननिकल स्प्लिसिंग प्रक्रिया के माध्यम से उत्पन्न होती है। बैक-स्प्लिसिंग की प्रक्रिया, आत्मीय रैखिक आरएनए की स्प्लिसिंग प्रक्रिया के विपरीत, डाउनस्ट्रीम डोनर साइट को अपस्ट्रीम स्वीकर्ता साइट तक ले जाना शामिल है, जो एक गोलाकार आकार की संरचना बनाता है। वर्तमान में, सीआईआरएनए के बायोजेनेसिस के लिए तीन अलग-अलग बैक-स्प्लिसिंग तंत्र प्रस्तावित किए गए हैं। ये आरएनए बाइंडिंग प्रोटीन (आरबीपी) मध्यस्थता परिपत्रीकरण9,10, इंट्रोन-पेयरिंग-संचालित परिपत्रीकरण 11, और लारियाट-संचालित परिपत्रीकरण12,13,14 हैं। यह देखते हुए कि सीआईआरएनए एक गोलाकार संरचना में एंड-टू-एंड जुड़े होते हैं, वे स्वाभाविक रूप से सामान्य एक्सोन्यूक्लिज़ पाचन के लिए प्रतिरोधी होते हैं और इस प्रकार, उनके रैखिक समकक्षोंकी तुलना में अधिक स्थिर माना जाता है। सीआईआरएनए द्वारा प्रदर्शित एक अन्य सामान्य विशेषता में मेजबान16 में कोशिका या ऊतक प्रकार-विशिष्ट अभिव्यक्ति शामिल है।

जैसा कि उनकी अनूठी संरचना और सेल या ऊतक-विशिष्ट अभिव्यक्ति से निहित है, कोशिकाओं में महत्वपूर्ण जैविक कार्य करने के लिए सीआईआरएनए की खोज की गई है। आज तक, सीआईआरएनए के प्रमुख कार्यों में से एक माइक्रोआरएनए (एमआईआरएनए) स्पंज17,18 के रूप में उनकी भूमिका है। सीआईआरएनए की यह नियामक भूमिका एमआईआरएनए के बीज क्षेत्र के साथ सीआईआरएनए न्यूक्लियोटाइड के पूरक बंधन के माध्यम से होती है। इस तरह की एक सीआईआरआरएनए-एमआरएनए इंटरैक्शन लक्ष्य एमआरएनए पर एमआईआरएनए के सामान्य नियामक कार्यों को रोकता है, इस प्रकार जीन19,20 की अभिव्यक्ति को विनियमित करता है। इसके अतिरिक्त, आरएनए को आरएनए बाइंडिंग प्रोटीन (आरबीपी) के साथ बातचीत करके और आरएनए-प्रोटीन कॉम्प्लेक्स21 बनाकर जीन अभिव्यक्ति को विनियमित करने के लिए भी जाना जाता है। यद्यपि सीआईआरएनए को गैर-कोडिंग आरएनए के रूप में वर्गीकृत किया गया है, लेकिन इस बात के भी प्रमाण हैं कि सीआईआरएनए प्रोटीन अनुवाद22,23,24 के लिए टेम्पलेट के रूप में कार्य कर सकते हैं।

हाल ही में, विशेष रूप से मेजबानों और वायरस के बीच मेजबान-रोगज़नक़ इंटरैक्शन को विनियमित करने में महत्वपूर्ण भूमिका निभाने के लिए सीआईआरएनए का प्रदर्शन किया गया है। आम तौर पर, मेजबान सीआईआरएनए को हमलावर रोगजनकों को खत्म करने के लिए मेजबान की प्रतिरक्षा प्रतिक्रियाओं को विनियमित करने में सहायता करने के लिए माना जाता है। मेजबान प्रतिरक्षा प्रतिक्रियाओं को बढ़ावा देने वाले सर्आरएनए का एक उदाहरण circRNA_0082633 है, जो गुओ एट अल .25 द्वारा रिपोर्ट किया गया है। यह सर्आरएनए ए 549 कोशिकाओं के भीतर टाइप 1 इंटरफेरॉन (आईएफएन) सिग्नलिंग को बढ़ाता है, जो इन्फ्लूएंजा वायरस प्रतिकृति25 को दबाने में मदद करता है। इसके अलावा, क्यू एट अल ने एक मानव इनट्रोनिक सर्आरएनए की भी सूचना दी, जिसे सीआईआरएनए एआईवीआर कहा जाता है, जो सीआरईबी-बाइंडिंग प्रोटीन (सीआरईबीबीपी) की अभिव्यक्ति को विनियमित करके प्रतिरक्षा को बढ़ावा देता है, जो आईएफएन -β26,27 का सिग्नल ट्रांसड्यूसर है। हालांकि, संक्रमण पर रोग के रोगजनन को बढ़ावा देने के लिए जाने जाने वाले सीआईआरएनए भी मौजूद हैं। उदाहरण के लिए, यू एट अल ने हाल ही में मेजबान सेल ऑटोफैगी28 के निषेध के माध्यम से एच 1 एन 1 वायरस प्रतिकृति को बढ़ावा देने में 2 ए जीन (सीआईआरसीएटीएडी 2 ए) युक्त गाटा जिंक फिंगर डोमेन से अलग किए गए एक सर्आरएनए द्वारा निभाई गई भूमिका की सूचना दी।

लगभग आरएनए का प्रभावी ढंग से अध्ययन करने के लिए, आमतौर पर एक जीनोम-वाइड सर्आरएनए भविष्यवाणी एल्गोरिथ्म लागू किया जाता है, इसके बाद किसी भी कार्यात्मक अध्ययन को करने से पहले अनुमानित सर्आरएनए उम्मीदवारों का इनसिलिको लक्षण वर्णन किया जाता है। इस तरह के जैव सूचना विज्ञान दृष्टिकोण की भविष्यवाणी करने और उसे चिह्नित करने के लिए कम खर्चीला और अधिक समय कुशल है। यह कार्यात्मक रूप से अध्ययन किए जाने वाले उम्मीदवारों की संख्या को परिष्कृत करने में मदद करता है और संभावित रूप से नए निष्कर्षों को जन्म दे सकता है। यहां, हम मेजबान-रोगज़नक़ इंटरैक्शन के दौरान सिलिको पहचान, लक्षण वर्णन और सीआईआरएनए के कार्यात्मक एनोटेशन के लिए एक विस्तृत जैव सूचना विज्ञान-आधारित प्रोटोकॉल प्रदान करते हैं। प्रोटोकॉल में आरएनए-अनुक्रमण डेटासेट से सीआईआरएनए की पहचान और परिमाणीकरण, सर्कबेस के माध्यम से एनोटेशन, और सर्आरएनए प्रकार, अतिव्यापी जीन की संख्या और अनुमानित सर्आरएनए-एमआरएनए इंटरैक्शन के संदर्भ में सर्आरएनए उम्मीदवारों के लक्षण वर्णन शामिल हैं। यह अध्ययन जीन ऑन्कोलॉजी (जीओ) और क्योटो एनसाइक्लोपीडिया ऑफ जीन एंड जीनोम (केईजीजी) संवर्धन विश्लेषण के माध्यम से लगभग आरएनए माता-पिता के जीन का कार्यात्मक एनोटेशन भी प्रदान करता है।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

इस प्रोटोकॉल में, इन्फ्लूएंजा ए वायरस से संक्रमित मानव मैक्रोफेज कोशिकाओं से तैयार किए गए डी-आइडेंटिफाइड राइबोसोमल आरएनए (आरआरएनए) -क्षीण आरएनए-सेक लाइब्रेरी डेटासेट को जीन एक्सप्रेशन ओमनीबस (जीईओ) डेटाबेस से डाउनलोड और उपयोग किया गया था। लगभग आरएनए के पूर्वानुमान से कार्यात्मक लक्षण वर्णन तक संपूर्ण जैव सूचना विज्ञान पाइपलाइन को चित्र 1 में संक्षेपित किया गया है। पाइपलाइन के प्रत्येक भाग को नीचे दिए गए अनुभागों में आगे समझाया गया है।

1. डेटा विश्लेषण से पहले तैयारी, डाउनलोड और सेटअप

नोट: इस अध्ययन में उपयोग किए जाने वाले सभी सॉफ्टवेयर पैकेज स्वतंत्र और खुले स्रोत हैं।

  1. लिनक्स प्लेटफॉर्म पर आवश्यक उपकरण डाउनलोड करना
    1. डेवलपर द्वारा प्रदान किए गए निर्देशों का उपयोग करके लिनक्स उच्च प्रदर्शन कंप्यूटर पर सामग्री तालिका में सूचीबद्ध आवश्यक सॉफ़्टवेयर और उपकरण डाउनलोड और स्थापित करें।
      नोट: अधिकांश उपकरणों और सॉफ़्टवेयर के अपने स्वयं के ऑनलाइन GitHub पृष्ठ या दस्तावेज हैं जिनमें उनके उपकरणों को स्थापित करने और उपयोग करने के निर्देश हैं ( सामग्री की तालिका देखें)।
    2. अनुक्रम संग्रह वेबसाइटों (जैसे, यूरोपीय न्यूक्लियोटाइड ्स आर्काइव और जीन एक्सप्रेशन ओमनीबस) से सीआईआरएनए का पता लगाने और विश्लेषण के लिए वांछित आरएनए-सेक डेटासेट डाउनलोड करें।
    3. संदर्भ जीनोम (एस) (एफएएसटीए प्रारूप) और एनोटेशन फाइलें (जीटीएफ / जीएफएफ 3 प्रारूप) डाउनलोड करें, जो उस मेजबान के साथ संगत है जहां से आरएनए-सेक डेटासेट तैयार किया गया था। होस्ट संदर्भ जीनोम (ओं) और एनोटेशन फाइलें आमतौर पर ऑनलाइन जीनोम ब्राउज़र जैसे नेशनल सेंटर फॉर बायोटेक्नोलॉजी इंफॉर्मेशन (एनसीबीआई), कैलिफोर्निया सांता क्रूज़ विश्वविद्यालय (यूसीएससी), और एनसेम्बल वेबसाइटों पर पाई जाती हैं।
  2. आरएनए-सेक की गुणवत्ता की जांच
    1. आरएनए अनुक्रमों की गुणवत्ता निर्धारित करने के लिए FASTQ फ़ाइलों को FASTQC प्रोग्राम में इनपुट करें। यदि FASTQ फ़ाइलों की गुणवत्ता कम है (उदाहरण के लिए, 29,30 जैसे उपकरणों का उपयोग करके आगे ट्रिमिंग की आवश्यकता हो सकती है।

2. सीआईआरआईक्वांट का उपयोग करके सीआईआरएनए की भविष्यवाणी और अंतर अभिव्यक्ति विश्लेषण

नोट: अंतर अभिव्यक्ति विश्लेषण स्थापित करने और प्रदर्शन करने पर एक अधिक विस्तृत मैनुअल CIRIquant पेपर31 के कोड उपलब्धता अनुभाग में पाया जा सकता है। पूरक डेटा में इस प्रोटोकॉल में उपयोग किए जाने वाले कुछ बुनियादी कमांड भी शामिल हैं।

  1. लगभग आरएनए भविष्यवाणियां।
    1. पहले BWA और HISAT2 संरेखकों का उपयोग करके मेजबान के संदर्भ जीनोम को इंडेक्स करें। फिर, लिनक्स टर्मिनल पर, इसे इंडेक्स करने के लिए होस्ट के संदर्भ जीनोम की निर्देशिका में कमांड बीडब्ल्यूए इंडेक्स32 और हिसैट 2-बिल्ड33 निष्पादित करें।
    2. इसके बाद, एक YML कॉन्फ़िगरेशन फ़ाइल तैयार करें जिसमें फ़ाइल का नाम, उपकरणों का पथ (BWA, HISAT2, stringtie34, samtools35), डाउनलोड की गई संदर्भ फ़ाइलों का पथ (होस्ट की संदर्भ जीनोम FASTA फ़ाइलें, एनोटेशन फ़ाइलें), और चरण 2.1.1 से अनुक्रमणिका फ़ाइलों का पथ शामिल है।
    3. डिफ़ॉल्ट या मैन्युअल पैरामीटर का उपयोग करके टर्मिनल से CIRIquant उपकरण निष्पादित करें। उपयोगकर्ता CIRIquant उपकरण निष्पादित करते समय RNA-seq डेटा के लाइब्रेरी प्रकार (या तो फंसे हुए या गैर-फंसे हुए) को निर्दिष्ट कर सकता है।
      नोट: आरएनए-सेक डेटा का लाइब्रेरी प्रकार उपयोग की जाने वाली लाइब्रेरी तैयारी किट के प्रकार को जानकर निर्धारित किया जा सकता है। यदि लाइब्रेरी तैयारी किट की पहचान अज्ञात है, तो आरएनए-सेक डेटा की फंसी हुई ता को निर्धारित करने के लिए आरएसईक्यूसी36 नामक एक आरएनए-सेक नियंत्रण जैव सूचना विज्ञान पैकेज का उपयोग किया जा सकता है।
  2. विभेदक अभिव्यक्ति विश्लेषण
    नोट: CIRIquant पैकेज में prep_CIRIquant, prepDE.py और CIRI_DE_replicate शामिल हैं; इसलिए, इन तीन उपकरणों के लिए कोई अतिरिक्त डाउनलोड की आवश्यकता नहीं है।
    1. निम्न वाले डेटा की सूची के साथ एक पाठ फ़ाइल (.lst) तैयार करें:
      पहलाकॉलम : चरण 2.1.3 में उपयोग किए गए आरएनए-सेक डेटा की आईडी
      दूसरास्तंभ: CIRIquant द्वारा आउटपुट की गई GTF फ़ाइलों का पथ
      तीसराकॉलम : आरएनए-सेक डेटा का समूहीकरण, चाहे वह एक नियंत्रण या उपचारित समूह हो।
    2. एक उदाहरण के लिए, नीचे दी गई तालिका 1 देखें।
      नोट: हेडर में डालना आवश्यक नहीं है क्योंकि वे केवल संदर्भ के लिए हैं।
    3. लिनक्स टर्मिनल पर, इनपुट के रूप में चरण 2.2.1 में तैयार पाठ फ़ाइल (.lst) के साथ prep_CIRIquant चलाएँ। रन फ़ाइलों की एक सूची उत्पन्न करेगा: library_info.csv, circRNA_info.csv, circRNA_bsj.csv और circRNA_ratio.csv
    4. आरएनए-सेक आईडी और उनके संबंधित स्ट्रिंगटाई आउटपुट के पथ वाले डेटा की सूची के साथ एक दूसरी टेक्स्ट फ़ाइल तैयार करें। फ़ाइल लेआउट समूहीकरण स्तंभ के बिना चरण 2.2.1 में पाठ फ़ाइल के समान होना चाहिए।
    5. जीन गणना मैट्रिक्स फ़ाइलों को उत्पन्न करने के लिए इनपुट के रूप में चरण 2.2.4 में तैयार पाठ फ़ाइल के साथ prepDE.py चलाएं।
    6. अंतिम circRNA_de.tsv फ़ाइल को आउटपुट करने के लिए इनपुट के रूप में चरण 2.2.3 से library_info.csv और circRNA_bsj.csv फ़ाइलों और चरण 2.2.5 से gene_count_matrix.csv फ़ाइल के साथ CIRI_DE_replicate निष्पादित करें।
  3. डीई सर्आरएनए की फ़िल्टरिंग।
    1. चरण 2.2.6 से उत्पन्न circRNA_de.tsv फ़ाइल को खोलने के लिए R (कंप्यूटर टर्मिनल या RStudio में) या किसी भी स्प्रेडशीट सॉफ़्टवेयर (जैसे, Microsoft Excel) का उपयोग करें ताकि विभेदक रूप से व्यक्त (DE) परिसंचारी आरएनए की संख्या फ़िल्टर और निर्धारित की जा सके।
    2. मानदंड ों के अनुसार डीई सर्आरएनए को फ़िल्टर करें लॉगएफसी > | और एफडीआर < 0.05।
    3. डीई सीआईआरएनए की जानकारी संग्रहीत करने के लिए DE_circRNAs.txt नाम की एक फ़ाइल बनाएं।

3. अनुमानित डीई सीआईआरएनए का लक्षण वर्णन और एनोटेशन।

  1. डीई सीआईआरएनए की एनोटेशन स्थिति।
    1. RStudio में DE_circRNAs.txt नाम की फ़ाइल लोड करें, जिसमें चरण 2.3.3 से फ़िल्टर किए गए DE circRNA की सूची होती है। जीनोमिक स्थिति (Chr, Start, End), स्ट्रैंड ओरिएंटेशन (+ या -), जीन नाम और सर्आरएनए प्रकार जैसी अन्य जानकारी शामिल करें। आगे बढ़ने से पहले, 1 आधार जोड़ी को घटाकर सीआईआरआईक्वांट से 0-आधारित में सीआईआरएनए जीनोमिक स्टार्ट निर्देशांक को परिवर्तित करें।
      नोट: ऊपर बताई गई अन्य जानकारी CIRIquant (पूरक फ़ाइल 1) द्वारा आउटपुट की गई GTF फ़ाइलों से प्राप्त की जा सकती है।
    2. सीआईआरएनए द्वारा जमा किए गए सीआईआरएनए डेटाबेस (जैसे, सर्काबेस) की जीनोमिक स्थितियों वाली लाइब्रेरी डाउनलोड करके अनुमानित डीई सर्आरएनए की एनोटेशन स्थिति निर्धारित करें।
      नोट: आश्वस्त करें कि तुलना करने से पहले सीआईआरएनए की भविष्यवाणी करने के लिए उपयोग किया जाने वाला जीनोम संस्करण सीआईआरएनए डेटाबेस लाइब्रेरी के समान है। यहां उपयोग की जाने वाली सीआईआरसीबेस डेटा फ़ाइल Github (https://github.com/bicciatolab/Circr)37 में प्रदान किए गए ड्राइव फ़ोल्डर में स्वतंत्र रूप से उपलब्ध है।
    3. एक बार चरण 3.1.1 और चरण 3.1.2 से दोनों फाइलें तैयार हो जाने के बाद, पूरक फ़ाइल 1 में दी गई आर स्क्रिप्ट चलाएं। स्थिति एनोटेट या अननोटेट करने से पहले डीई सर्कोआरएनए के क्रोमोसोमल स्थानों को लाइब्रेरी में पूछताछ की जाती है।
  2. डीई सीआईआरएनए का लक्षण वर्णन।
    1. आर और अन्य स्प्रेडशीट सॉफ़्टवेयर का उपयोग करके सीआईआरएनए प्रकारों (यानी, एक्सॉन, इंट्रॉन, इंटरजेनिक और एंटीसेंस) के अनुसार सीआईआरएनए की संख्या और जीन की संख्या जो सर्आरएनए (1 या >1) (पूरक फ़ाइल 1) में फैली हुई है।नोट: CIRIquant केवल चार प्रकार के CIRCrRNA (एक्सॉन, इंट्रॉन, इंटरजेनिक और एंटीसेंस) का पता लगा सकता है। एक्सॉन-इंट्रॉन सर्आरएनए, जिसे एलसीआईआरएनए के रूप में भी जाना जाता है, सीआईआरआईक्वांट द्वारा पता नहीं लगाया जा सकता है।

4. सीआईसीआर का उपयोग करके सीआईआरआरएनए-एमआरएनए इंटरैक्शन की भविष्यवाणी करना।

नोट: सीआईआरआरएनए-एमआरएनए इंटरैक्शन विश्लेषण के लिए सिरकर को स्थापित करने और उपयोग करने के तरीके पर एक अधिक विस्तृत मैनुअल यहां पाया जा सकता है: https://github.com/bicciatolab/Circr37.

  1. फाइलों की तैयारी
    1. "WinRar" या "7-zip" जैसे प्रासंगिक सॉफ़्टवेयर का उपयोग करके Circr.zip फ़ाइल को Circr पृष्ठ से डाउनलोड करने के बाद एक नई निर्देशिका में अनज़िप करें और निकालें जहां विश्लेषण आयोजित किया जाएगा।
    2. सीआईआरआरएनए-एमआरएनए विश्लेषण करने से पहले आवश्यक सॉफ़्टवेयर एप्लिकेशन (miRanda, RNAहाइब्रिड, Pybedtools, और samtools) स्थापित करें।
    3. रुचि के कई जीवों के लिए संदर्भ जीनोम और एनोटेशन फाइलें, आरआरएनए निर्देशांक फ़ाइल, मान्य एमआरएनए इंटरैक्शन फ़ाइल, और सर्कबेस सर्कोआरएनए फाइलें गिथुब पेज (https://github.com/bicciatolab/Circr) 37 में सिरकर लेखक द्वारा प्रदान की जाती हैं। ड्राइव फ़ोल्डर में समर्थन फ़ाइलों पर क्लिक करने पर, रुचि के जीव, MIRNA फ़ोल्डर और circBase पाठ फ़ाइल के लिए फ़ोल्डर का चयन करें और इसे डाउनलोड करें।
    4. चरण 4.1.3 में आवश्यक फ़ाइलों को डाउनलोड करने के बाद, चरण 4.1.1 में उल्लिखित निर्देशिका में support_files नाम की एक नई निर्देशिका बनाएँ। फिर, सामग्री को अनज़िप करें और support_files निर्देशिका में निकालें।
    5. सैमटूल्स फैडक्स कमांड (पूरक फ़ाइल 1) का उपयोग करके रुचि के जीव की संदर्भ जीनोम फ़ाइल को इंडेक्स करें।
    6. तालिका 2 में दिखाए गए अनुसार, टैब-सीमांकित बीईडी फ़ाइल में रुचि के डीई सर्कोआरएनए के निर्देशांक से युक्त एक इनपुट फ़ाइल तैयार करें।
      नोट: चूंकि CIRIquant द्वारा अनुमानित CIRCaRNA 0-आधारित नहीं हैं, इसलिए उन्हें बीईडी प्रारूप में परिवर्तित करने से पहले शुरुआती निर्देशांक (जैसा कि चरण 3.1.1 में उल्लेख किया गया है) पर माइनस 1 बीपी करना आवश्यक है। तालिका 2 में दिखाए गए हेडर केवल संदर्भ के लिए हैं और बीईडी फाइलों में उनकी आवश्यकता नहीं है।
    7. इस बिंदु पर, सुनिश्चित करें कि सीआईआरसी विश्लेषण के लिए अपेक्षित फ़ोल्डर ट्री संरचना चित्रा 2 में है।
  2. रनिंग Circr.py
    1. पायथन 3 का उपयोग करके Circr.py निष्पादित करें, और तर्क के रूप में, सीआईआरएनए इनपुट फ़ाइल, रुचि के जीव के एफएएसटीए जीनोम, चयनित जीव के जीनोम संस्करण, धागे की संख्या और कमांड लाइन में आउटपुट फ़ाइल का नाम निर्दिष्ट करें।
    2. यदि चरण 4.1.3 में सूचीबद्ध ड्राइव फ़ोल्डर में रुचि का जीव प्रदान नहीं किया गया है या यदि उपयोगकर्ता विश्लेषण चलाने के लिए फ़ाइलों का एक कस्टम सेट रखना पसंद करता है, तो Circr.py निष्पादित करते समय इन फ़ाइलों के स्थान को निर्दिष्ट करने वाले अतिरिक्त आदेशों को शामिल करने की आवश्यकता होती है।
    3. सीआईसीआर विश्लेषण पूरा होने के बाद, प्रोग्राम सीएसवी प्रारूप में एक सिरआरएनए-एमआरएनए इंटरैक्शन फ़ाइल आउटपुट करता है।
    4. उपयोगकर्ता-विशिष्ट वरीयता के अनुसार सिरआरएनए-एमआरएनए इंटरैक्शन परिणामों को फ़िल्टर करें। इस अध्ययन के लिए, नीचे दिए गए मानदंडों के अनुसार आरस्टूडियो का उपयोग करके भविष्यवाणियों को फ़िल्टर किया जाता है:
      -सभी तीन सॉफ्टवेयर उपकरणों द्वारा पता लगाया गया
      -टारगेटस्कैन और मिरांडा दोनों द्वारा रिपोर्ट की गई दो या अधिक बाइंडिंग साइटें
      -"एजीओ" या "मान्य" कॉलम में पहचाना गया
      -बिना बीज क्षेत्र इंटरैक्शन को फ़िल्टर करें
    5. चरण 4.2.3 से फ़िल्टर की गई स्थितियों को circRNA_miRNA.txt नामक एक नई पाठ फ़ाइल में पारित करने वाले सीआईआरएनए लिखें। इस तरह के फ़िल्टरिंग से अनुमानित इंटरैक्शन का आत्मविश्वास बढ़ सकता है।

5. सीआरएनए नेटवर्क का निर्माण

नोट: साइटोस्केप का उपयोग करने के तरीके पर एक विस्तृत मैनुअल यहां पाया जा सकता है: http://manual.cytoscape.org/en/stable/ और https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. डाउनलोड और तैयारी
    1. से साइटोस्केप38 का नवीनतम संस्करण डाउनलोड करें: https://cytoscape.org/download.html.
    2. चरण 5.1.1 में डाउनलोड किए गए इंस्टॉलर विज़ार्ड को निष्पादित करें और साइटोस्केप सॉफ़्टवेयर के लिए फ़ाइल स्थान का चयन करें।
    3. एक टैब-सीमांकित फ़ाइल तैयार करें जिसमें रुचि के सीआईआरएनए और उनके लक्ष्य एमआईआरएनए शामिल हों। पहले कॉलम में सर्आरएनए नाम होता है; दूसरा कॉलम पहले कॉलम से आरएनए के प्रकार को निर्दिष्ट करता है; तीसरा कॉलम लक्ष्य एमआईआरएनए है; और चौथा कॉलम तीसरे कॉलम से आरएनए के प्रकार को निर्दिष्ट करता है। फ़ाइल का एक उदाहरण तालिका 3 में दिखाया गया है।
  2. CERNA नेटवर्क मानचित्र का निर्माण
    1. चरण 5.1.2 में स्थापित साइटोस्केप सॉफ़्टवेयर खोलें।
    2. साइटोस्केप में, फ़ाइल से फ़ाइल > आयात करें > फ़ाइल पर नेविगेट करें. चरण 5.1.3 में तैयार की गई फ़ाइल का चयन करें।
    3. नए टैब में, पहले और दूसरे कॉलम को "स्रोत नोड" और "स्रोत नोड विशेषता" के रूप में चुनें, जबकि तीसरे और चौथे कॉलम को क्रमशः "लक्ष्य नोड" और "लक्ष्य नोड विशेषता" के रूप में चुनें। ठीक पर क्लिक करें और नेटवर्क साइटोस्केप के ऊपरी दाईं ओर दिखाई देगा।
    4. नेटवर्क की दृश्य शैली को बदलने के लिए, साइटोस्केप के बाईं ओर स्टाइल बटन दबाएं।
    5. फिल कलर के दाईं ओर तीर दबाएं। स्तंभ के लिए प्रकार और मैपिंग प्रकार के लिए असतत मैपिंग चुनें. फिर, प्रत्येक आरएनए प्रकार के लिए वांछित रंग का चयन करें।
    6. रंग बदलने के बाद, आकार पर नेविगेट करके और चरण 5.2.5 का पालन करके नोड्स का आकार बदलें।

6. कार्यात्मक संवर्धन विश्लेषण

  1. जीन ऑन्कोलॉजी (जीओ) और क्योटो एनसाइक्लोपीडिया ऑफ जीन एंड जीनोम (केईजीजी) विश्लेषण सीआईआरएनए के माता-पिता के जीन के लिए
    1. क्लस्टर प्रोफाइलर 39,40 और ओआरजी सुनिश्चित करें। Hs.eg.dbRstudio में 41 पैकेज स्थापित किए गए हैं। ऑर्ग। उदाहरण के लिए.db 41 पैकेज केवल मनुष्यों के लिए एक जीनोम-वाइड एनोटेशन पैकेज हैयदि रुचि का जीव एक और प्रजाति है, तो देखें: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. DE_circRNA जानकारी चरण 2.3.1 से Rstudio कार्यस्थान में आयात करें।
    3. आगामी चरणों में संवर्धन विश्लेषण के लिए इस फ़ाइल में प्रदान किए गए सीआईआरएनए के पैतृक जीन का उपयोग करें। हालांकि, यदि उपयोगकर्ता जीन प्रतीक को अन्य प्रारूपों में परिवर्तित करना चाहता है, जैसे कि एंट्रेज़ आईडी, तो "बिटर" जैसे फ़ंक्शन का उपयोग करें।
    4. एक इनपुट के रूप में जीन आईडी का उपयोग करके, डिफ़ॉल्ट पैरामीटर का उपयोग करके क्लस्टरप्रोफाइलर 39,40 पैकेज के भीतर एनरिचगो फ़ंक्शन का उपयोग करके जीओ संवर्धन विश्लेषण चलाएं।
    5. एक इनपुट के रूप में जीन आईडी का उपयोग करके, डिफ़ॉल्ट पैरामीटर का उपयोग करके क्लस्टरप्रोफाइलर39,40 पैकेज के भीतर एनरिचकेजीजी फ़ंक्शन का उपयोग करके केईजीजी संवर्धन विश्लेषण चलाएं।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

पिछले अनुभाग में सूचीबद्ध प्रोटोकॉल को लिनक्स ओएस सिस्टम के अनुरूप संशोधित और कॉन्फ़िगर किया गया था। मुख्य कारण यह है कि सीआईआरएनए के विश्लेषण में शामिल अधिकांश मॉड्यूल पुस्तकालय और पैकेज केवल लिनक्स प्लेटफॉर्म पर काम कर सकते हैं। इस विश्लेषण में, इन्फ्लूएंजा ए वायरस से संक्रमित मानव मैक्रोफेज कोशिकाओं से तैयार किए गए डी-आइडेंटिफाइड राइबोसोमल आरएनए (आरआरएनए)-क्षीण आरएनए-सेक लाइब्रेरी डेटासेट को जीईओ डेटाबेस42 से डाउनलोड किया गया था और प्रतिनिधि परिणाम उत्पन्न करने के लिए उपयोग किया गया था।

सीआईआरएनए भविष्यवाणी और परिमाणीकरण।
इस विश्लेषण में, इन्फ्लूएंजा ए वायरस संक्रमित मानव मैक्रोफेज कोशिकाओं से तैयार राइबोसोमल आरएनए (आरआरएनए) -क्षीण आरएनए-सेक लाइब्रेरी डेटासेट का उपयोग सीआईआरएनए का पता लगाने और कार्यात्मक विश्लेषण करने के लिए किया गया था। जैसा कि प्रोटोकॉल अनुभाग में निर्दिष्ट किया गया है, सीआईआरआईक्वांट का उपयोग इनपुट के रूप में आरएनए-सेक लाइब्रेरी डेटासेट का उपयोग करके पहचाने गए सीआईआरएनए की पहचान करने और डीई विश्लेषण करने के लिए किया गया था। उपयोग की जाने वाली संदर्भ फाइलें नवीनतम मानव जीनोम संस्करण (एचजी 38) पर आधारित हैं। तालिका 4 सीआईआरआईक्वांट विश्लेषण से अंतिम आउटपुट का एक उदाहरण दिखाती है। सीआईआरआईक्वांट आउटपुट से डीई सर्काआरएनए की पहचान और फ़िल्टरिंग सरल आरस्टूडियो स्क्रिप्ट (पूरक फ़ाइल 1) के माध्यम से निष्पादित की गई थी। सीआईआरएनए को केवल डीई के रूप में वर्गीकृत किया जाता है जब झूठी-खोज दर (एफडीआर) मान < 0.05 और लॉग फोल्ड परिवर्तन (लॉगएफसी) >| तालिका 5 में पता लगाए गए लगभग आरएनए और डीई सर्आरएनए की कुल संख्या को दर्शाया गया है। कुल 35,846 सीआईआरएनए का पता चला, जिसमें 306 डीई थे। इस आउटपुट में पाए गए डीई सीआईआरएनए पूरी तरह से अनियमित हैं (लॉगएफसी > 2), जिसमें कोई भी डाउनरेगुलेटेड नहीं है (लॉगएफसी < 2)।

डीई सीआईआरएनए की एनोटेशन और लक्षण वर्णन।
डीई सीआईआरएनए की एनोटेशन स्थिति।
पहचान किए गए डीई सर्काआरएनए को एक स्थापित सर्आरएनए डेटाबेस, सीआईआरसीबेस के साथ क्रॉस-चेक किया गया था। हालांकि, चूंकि सर्कबेस में जमा किए गए सर्आरएनए निर्देशांक पिछले मानव जीनोम संस्करण (एचजी 19) पर आधारित हैं, इसलिए इस अध्ययन में क्रॉस-चेकिंग के लिए सर्काबेस से सर्आरएनए निर्देशांक को वर्तमान मानव जीनोम संस्करण (एचजी 38) में परिवर्तित किया जाना चाहिए। इसके अतिरिक्त, प्रारंभिक निर्देशांक CIRIquant के 1-आधारित आउटपुट से 0-आधारित में परिवर्तित किया जाना चाहिए। सिरिकबेस के एचजी 38 संस्करण-परिवर्तित सर्आरएनए निर्देशांक गिथुब (https://github.com/bicciatolab/Circr)37 में एक ड्राइव फ़ोल्डर में प्रदान किए जाते हैं। फिर, एक नए डेटा फ्रेम कॉलम में सीआईआरएनए की एनोटेशन स्थिति को असाइन करने के लिए आरस्टूडियो स्क्रिप्ट (पूरक फ़ाइल 1) का उपयोग किया गया था। तालिका 6 एनोटेशन स्थिति के साथ सीआईआरएनए का एक उदाहरण दिखाती है।

डीई सीआईआरएनए का लक्षण वर्णन।
यह भाग पूरी तरह से RStudio सॉफ्टवेयर में R स्क्रिप्ट के माध्यम से निष्पादित किया गया था। आर स्क्रिप्ट विश्लेषणात्मक प्रक्रियाओं को आसान बनाती है, और केवल बुनियादी ज्ञान की आवश्यकता होती है।

सर्आरएनए के प्रकार।
इस चरण में, डीई सर्आरएनए को उनके जीनोमिक पदों के आधार पर उनके सर्आरएनए प्रकारों (एंटीसेंस, एक्सोनिक, इंटरजेनिक और इनट्रोनिक) की विशेषता थी। नीचे दी गई तालिका 7 पहचाने गए डीई सर्आरएनए द्वारा शामिल विभिन्न सर्आरएनए प्रकारों के प्रतिशत टूटने को प्रदर्शित करती है। कुल 306 डीई सीआईआरएनए में से, 263 सीआईआरएनए (85.95%) की पहचान एक्सोनिक सर्आरएनए के रूप में की गई थी, जो कि पहचाने जाने वाले सबसे प्रचुर मात्रा में सर्आरएनए प्रकार है। इनट्रोनिक सर्आरएनए दूसरे सबसे अधिक पहचाने जाने वाले सर्आरएनए प्रकार के रूप में आते हैं, जिसमें 17 डीई सर्आरएनए शामिल हैं, जो कुल डीई सीआईआरएनए का 5.56% बनाते हैं। इसके बाद इंटरजेनिक सर्आरएनए (16 डीई सर्आरएनए ~ 5.23%) और एंटीसेंस सर्आरएनए (10 डीई सर्आरएनए ~ 3.27%) हैं।

प्रति सर्आरएनए में फैले जीन ों की संख्या
सीआईआरआईक्वांट द्वारा पहचाने जाने वाले सीआईआरएनए कई जीनों में ओवरलैप हो सकते हैं। आज तक, अधिकांश अध्ययन एक जीन को फैलाने वाले लगभग आरएनए पर केंद्रित हैं। इसलिए, इस प्रोटोकॉल में, एक से अधिक जीन फैलाने वाले सीआईआरएनए उम्मीदवारों को डाउनस्ट्रीम विश्लेषण से बाहर रखा गया है। नीचे दी गई तालिका 8 में एक और एक से अधिक जीनों में फैले डीई सर्आरएनए की संख्या और प्रतिशत का वर्णन किया गया है। इस तालिका में, इंटरजेनिक सर्आरएनए (16 डीई सर्आरएनए ) को बाहर रखा गया है क्योंकि वे किसी भी मेजबान जीन को ओवरलैप नहीं करते हैं, जबकि बाकी सर्आरएनए प्रकार (290 डीई सीआईआरसीएनए) इस विश्लेषण के अधीन हैं। 290 डीई सीआईआरएनए में से, अधिकांश डीई सर्आरएनए (261 सर्आरएनए ~ 90%) केवल एक जीन का विस्तार करते हैं, जबकि शेष 29 सीआईआरएनए (~ 10%) एक से अधिक जीन का विस्तार करते हैं।

सीआरएनए नेटवर्क का निर्माण
एक सीआरएनए नेटवर्क आमतौर पर भविष्यवाणी के बाद सीआईआरआरएनए-एमआरएनए इंटरैक्शन की कल्पना करने के लिए तैयार किया जाता है। नीचे दिए गए चित्र 3 में, केवल एक डीई सर्आरएनए को प्रतिनिधि परिणाम के रूप में चुना गया था, जो hsa_DE_58 सिरआरएनए है। सीआईआरसी भविष्यवाणियों के आधार पर, hsa_DE_58 नौ अलग-अलग एमआईआरएनए तक स्पंज कर सकते हैं। इन नौ एमआईआरएनए की पहचान कड़े मानदंडों के माध्यम से फ़िल्टर करने के बाद की जाती है।

कार्यात्मक संवर्धन विश्लेषण
"माता-पिता के जीन के जीओ और केईजीजी विश्लेषण"।
नीचे दिया गया चित्र 4 जीओ विश्लेषण के माध्यम से डीई सर्आरएनए पैतृक जीन के कार्यात्मक संवर्धन के एक बुलबुले प्लॉट को दर्शाता है। मूल रूप से, जीओ विश्लेषण का उद्देश्य जैविक प्रक्रियाओं, सेलुलर स्थानों और आणविक कार्यों को उजागर करना है जो अध्ययन की गई स्थिति में समृद्ध या प्रभावित होते हैं, इस मामले में, वायरस से संक्रमित नमूना। संवर्धन को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है और बुलबुला प्लॉट पर केवल तभी प्लॉट किया जाता है जब पी-वैल्यू 0.01 < हो। जैसा कि चित्र 4 में दिखाया गया है, जैविक प्रक्रियाओं (बीपी) के लिए शीर्ष तीन संवर्धनों में राइबोन्यूक्लियोप्रोटीन कॉम्प्लेक्स बायोजेनेसिस, वायरस की प्रतिक्रिया और जैविक उत्तेजना की प्रतिक्रिया का विनियमन शामिल है, जबकि आणविक कार्यों (एमएफ) के लिए केवल आरएनए और एकल-फंसे आरएनए बाइंडिंग पर कार्य करने वाली उत्प्रेरक गतिविधि सांख्यिकीय रूप से समृद्ध है। दूसरी ओर, सेलुलर घटकों (सीसी) के लिए केवल रेट्रोमर कॉम्प्लेक्स सांख्यिकीय रूप से समृद्ध है।

चित्रा 5 एक बुलबुला प्लॉट में डीई सर्आरएनए माता-पिता के जीन के केईजीजी संवर्धन विश्लेषण को दर्शाता है। जीओ संवर्धन विश्लेषण के समान, केईजीजी संवर्धन को केवल सांख्यिकीय रूप से महत्वपूर्ण माना जाता है और पी-मान < 0.01 होने पर बुलबुला भूखंड पर प्लॉट किया जाता है। इस मामले में केवल दो केईजीजी शब्द समृद्ध थे, जो इन्फ्लूएंजा ए और वायरल जीवन चक्र (एचआईवी -1) मार्ग हैं।

Figure 1
चित्रा 1: सीआईआरएनए के पूर्वानुमान और कार्यात्मक लक्षण वर्णन के लिए पाइपलाइन। पाइपलाइन शुरू से अंत तक प्रमुख चरणों का एक सरल अवलोकन दिखाती है जिसमें आवश्यक सॉफ्टवेयर पैकेजों की स्थापना, सर्आरएनए अभिव्यक्ति की भविष्यवाणी और मात्रा, सीआरएनए नेटवर्क का निर्माण और सर्आरएनए पैतृक जीन कार्यात्मक संवर्धन करना शामिल है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 2
चित्र 2: सिरकर के लिए फ़ोल्डर ट्री संरचना। विश्लेषण के लिए आवश्यक फ़ाइलों का पता लगाने के लिए इस फ़ोल्डर ट्री संरचना को सिरकर सॉफ़्टवेयर चलाने से पहले स्थापित किया जाना आवश्यक है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 3
चित्रा 3: सीआरएनए नेटवर्क जिसमें सिरआरएनए-एमआरएनए इंटरैक्शन शामिल है। नीला अंडाकार आकार सर्आरएनए का प्रतिनिधित्व करता है, जबकि नारंगी त्रिकोण एमआईआरएनए का प्रतिनिधित्व करते हैं। सीआईआरएनए को एमआईआरएनए से जोड़ने वाली ठोस रेखाएं hsa_DE_58 सर्आरएनए के संभावित माइआरएनए स्पंजिंग फ़ंक्शन का वर्णन करती हैं। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 4
चित्रा 4: डीई सर्आरएनए माता-पिता के जीन के जीओ संवर्धन विश्लेषण का बुलबुला प्लॉट। एक्स-अक्ष पर जीनअनुपात इनपुट जीन की कुल संख्या को विभाजित करने वाले दिए गए जीओ शब्द से जुड़े इनपुट सूची में जीन की संख्या है। प्लॉट में डॉट आकार को गणना मूल्य द्वारा दर्शाया जाता है, जो दिए गए जीओ शब्द से जुड़े इनपुट सूची में जीन की संख्या है। डॉट्स का आकार जितना बड़ा होगा, शब्द से जुड़े इनपुट जीन की संख्या उतनी ही बड़ी होगी। इसके अलावा, प्लॉट में डॉट्स पी-वैल्यू के आधार पर रंग-कोडित हैं। पी-वैल्यू की गणना संयोग से अपेक्षित आवृत्ति के साथ एनोटेशन शब्द की देखी गई आवृत्ति की तुलना करके की जाती है। व्यक्तिगत शब्दों को कट-ऑफ मान (पी-वैल्यू < 0.01) से परे समृद्ध माना जाता है। नीले से लाल तक के पी-वैल्यू का रंग ढाल शब्दों के बढ़ते संवर्धन को इंगित करता है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 5
चित्रा 5: डीई सर्आरएनए माता-पिता के जीन का केईजीजी संवर्धन विश्लेषण। एक्स-अक्ष पर जीनअनुपात इनपुट जीन की कुल संख्या को विभाजित करने वाले केईजीजी शब्द से जुड़े इनपुट सूची में जीन की संख्या है। प्लॉट में डॉट आकार को गणना मूल्य द्वारा दर्शाया जाता है, जो दिए गए केईजीजी शब्द से जुड़े इनपुट सूची में जीन की संख्या है। डॉट्स का आकार जितना बड़ा होगा, शब्द से जुड़े इनपुट जीन की संख्या उतनी ही बड़ी होगी। इसके अलावा, प्लॉट में डॉट्स पी-वैल्यू के आधार पर रंग-कोडित हैं। पी-वैल्यू की गणना संयोग से अपेक्षित आवृत्ति के साथ एनोटेशन शब्द की देखी गई आवृत्ति की तुलना करके की जाती है। व्यक्तिगत शब्दों को कट-ऑफ मान (पी-वैल्यू < 0.01) से परे समृद्ध माना जाता है। नीले से लाल तक के पी-वैल्यू का रंग ढाल शब्दों के बढ़ते संवर्धन को इंगित करता है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

नमूना नाम CIRIquant आउटपुट GTF फ़ाइल के लिए पथ समूहीकरण
नियंत्रण 1 /path/to/CIRIquant/ctrl1.gtf C
नियंत्रण 2 /path/to/CIRIquant/ctrl2.gtf C
संक्रमित 1 /path/to/CIRIquant/infect1.gtf T
संक्रमित 2 /path/to/CIRIquant/infect2.gtf T

तालिका 1: CIRIquant की .lst फ़ाइल तैयारी। CIRIquant आउटपुट से नियंत्रण और उपचारित नमूनों के गंतव्य पथ दो प्रकार के नमूनों के बीच सर्आरएनए की अभिव्यक्तियों की तुलना करने के लिए एक पाठ फ़ाइल में लिखे गए हैं।

Chr निकल समाप्ति नाम . तट
chr2 137428930 137433876 hsa_circ_000076 . -
chr2 154705868 154706632 hsa_circ_000105 . -
chr2 159104273 159106793 hsa_circ_000118 . -
chr2 159215701 159226125 hsa_circ_000119 . -
chr4 39980067 39980129 hsa_circ_002584 . -

तालिका 2: सीआईसीआर के लिए उदाहरण बीईडी फ़ाइल। बीईडी फ़ाइल उत्पन्न करने के लिए सीआईआरएनए से जुड़े छह कॉलम (सीएचआर, स्टार्ट, एंड, नाम, जीन और स्ट्रैंड) की आवश्यकता होती है।

circRNA_name प्रकार miRNA_name प्रकार
DE_circRNA_1 लगभग आरएनए; MIR-001 MIRNA
DE_circRNA_1 लगभग आरएनए; MIR-002 MIRNA
DE_circRNA_2 लगभग आरएनए; MIR-003 MIRNA
DE_circRNA_2 लगभग आरएनए; MIR-004 MIRNA

तालिका 3: साइटोस्केप इनपुट फ़ाइल। पाठ फ़ाइल में लिखने के लिए चार स्तंभ (circRNA_name, प्रकार, miRNA_name, और प्रकार) आवश्यक हैं.

लगभग आरएनए। logFC logCPM LR Pvalue डी FDR
Chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
अध्याय 16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
अध्याय 14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

तालिका 4: CIRIquant के अंतिम आउटपुट (.csv) फ़ाइल का हिस्सा। CIRIquant LogFC, लॉग काउंट्स प्रति मिलियन (LogCPM), लॉजिस्टिक रिग्रेशन (LR), पी-वैल्यू, डिफरेंशियल एक्सप्रेशन और FDR जैसी जानकारी प्रदान करता है।

CIRIquant परिणाम
कुल डी ऊपर नीचे
35846 306 306 0

तालिका 5: पहचाने गए कुल और विभेदक रूप से व्यक्त (डीई) आरएनए की संख्या का सारांश। कुल 35,846 सीआईआरएनए का पता लगाया गया है, जिनमें से 306 डीई सीआईआरएनए हैं। नियंत्रण नमूनों की तुलना में उपचारित नमूनों में सभी 306 डीई सर्काआरएनए को विनियमित किया जाता है (कोई भी डाउनरेगुलेट नहीं किया जाता है)।

Custom_Name Annotation_Status
hsa_DE_22 गैर-एनोटेट
hsa_DE_2 एनोटेट
hsa_DE_58 गैर-एनोटेट
hsa_DE_3 एनोटेट

तालिका 6: एनोटेशन स्थिति के साथ कस्टम सर्आरएनए नामों की तालिका। सीआईआरएनए को ज्ञात जमा किए गए सीआईआरएनए (सीआईआरसीबेस) के डेटाबेस में पूछताछ की जाती है। यदि सर्आरएनए डेटाबेस के भीतर मौजूद है, तो इसे एनोटेट करने के लिए लेबल किया जाता है, जबकि सीआईआरएनए की अनुपस्थिति को गैर-एनोटेट के रूप में लेबल किया जाता है।

सीआईआरएनए प्रकार; Freq प्रतिशतता
एंटीसेंस 10 3.27%
एक्सॉन 263 85.95%
इंटरजेनिक 16 5.23%
इंट्रॉन 17 5.56%

तालिका 7: पहचाने गए सीआईआरएनए के प्रकार। सीआईआरएनए को उनके अनुक्रम क्षेत्र, अर्थात्, एक्सोनिक, इंट्रोनिक, एंटीसेंस और इंटरजेनिक के आधार पर विभिन्न प्रकार के सीआईआरएनए में वर्गीकृत किया जा सकता है।

माता-पिता के जीन की संख्या Freq प्रतिशतता
1 261 90%
> 1 29 10%

तालिका 8: विभिन्न जीनों के साथ लगभग आरएनए का प्रतिशत फैला हुआ है। सीआईआरएनए आमतौर पर एक जीन के एक्सॉन से एन्कोड किए जाते हैं, लेकिन एक से अधिक जीन ों में फैले लगभग आरएनए का पता सीआईआरआईक्वांट द्वारा भी लगाया जा सकता है।

पूरक फ़ाइल 1: प्रोटोकॉल में उपयोग की जाने वाली स्क्रिप्ट। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

इस प्रोटोकॉल की उपयोगिता को स्पष्ट करने के लिए, इन्फ्लूएंजा ए वायरस से संक्रमित मानव मैक्रोफेज कोशिकाओं से आरएनए-सेक का उपयोग एक उदाहरण के रूप में किया गया था। मेजबान-रोगज़नक़ इंटरैक्शन में संभावित एमआरएनए स्पंज के रूप में काम करने वाले सीआईआरएनए और एक मेजबान के भीतर उनके जीओ और केईजीजी कार्यात्मक संवर्धन की जांच की गई। यद्यपि ऑनलाइन विभिन्न प्रकार के सीआईआरएनए उपकरण उपलब्ध हैं, उनमें से प्रत्येक एक स्टैंडअलोन पैकेज है जो एक दूसरे के साथ बातचीत नहीं करता है। यहां, हमने कुछ उपकरणों को एक साथ रखा है जो सर्आरएनए भविष्यवाणी और परिमाणीकरण, सीआईआरएनए कार्यात्मक संवर्धन, सर्आरएनए-एमआरएनए इंटरैक्शन भविष्यवाणी और सीआरएनए नेटवर्क निर्माण के लिए आवश्यक हैं। यह सुव्यवस्थित प्रोटोकॉल समय की बचत है और नैदानिक और रोगसूचक मूल्यों के साथ सीआईआरएनए उम्मीदवारों का पता लगाने के लिए नैदानिक नमूनों पर लागू किया जा सकता है।

अनिवार्य रूप से, हमने CIRIquant31 का उपयोग किया, जो CIRI2 के साथ पूर्व-पैक किया गया एक सर्आरएनए परिमाणीकरण उपकरण है, जो CIRIrna के डीई विश्लेषण का पता लगा सकता है और कर सकता है। डीई सर्आरएनए को लॉगएफसी के कट-ऑफ मान के आधार पर फ़िल्टर किया जाता है > | और एफडीआर < 0.05, जो डाउनस्ट्रीम विश्लेषण में संभावित झूठी सकारात्मकता को खत्म करने में मदद करता है। एनोटेशन स्थिति, सर्आरएनए प्रकार, और जीन की संख्या के संदर्भ में डीई सर्आरएनए का लक्षण वर्णन लगभग आरएनए उम्मीदवारों को वर्गीकृत करने और आगे फ़िल्टर करने में सहायता करता है। इसके बाद, लगभग37, एक सिरआरएनए-एमआरएनए भविष्यवाणी उपकरण, का उपयोग संभावित माइआरएनए स्पंजिंग उम्मीदवारों की भविष्यवाणी करने के लिए किया जाता है। सीआईआरएनए के लक्ष्य के रूप में संभावित एमआईआरएनए की भविष्यवाणी करने के बाद, एक सीआरएनए नेटवर्क तैयार किया जाता है। अंत में, सीआईआरएनए के पैतृक जीन के आधार पर, आर क्लस्टरप्रोफाइलर पैकेज39 का उपयोग जीओ और केईजीजी मार्ग संवर्धन विश्लेषण के माध्यम से कार्यात्मक एनोटेशन के लिए किया जाता है। जीओ और केईजीजी के परिणाम सीआईआरएनए से प्रभावित जैविक तंत्र को उजागर करने में मदद कर सकते हैं।

आज तक, कई अलग-अलग सीआईआरएनए पूर्वानुमान उपकरण विकसित किए गए हैं, जिनमें CIRI2 43, CIRClorblor2 44, find_circ45, MapSplice 46 और UROBORUS 47 शामिल हैं। हैनसेन एट अल द्वारा किए गए एक अध्ययन में, सीआईआरआई 2 को उच्च समग्र प्रदर्शन होने की सूचना मिली है। यह कुछ सीआईआरएनए डिटेक्शन टूल ्स में से एक है जो नए सिरे से भविष्यवाणी और झूठी सकारात्मक पहचान48 को कम करने के संदर्भ में अच्छी तरह से कार्य कर सकता है। इसलिए इस अध्ययन में सीआईआरआईक्वांट का उपयोग किया गया था, जो सीआईआरआई 2 का उपयोग सीआईआरआई का पता लगाने और मात्रा का निर्धारण करने के लिए करता है। सीआईआरआईक्वांट का उपयोग बैक स्प्लिस जंक्शन (बीएसजे) रीडिंग को गिनने के लिए किया गया था, और गिनती डेटा को एक ही जीन लोकी से स्थानांतरित रैखिक आरएनए को मैप करने के लिए मैप किए गए रीड में सामान्यीकृत किया गया था। यह एक नमूने में सीआईआरएनए की मात्रा का ठहराव करने की अनुमति देता है। प्रयोगात्मक स्थितियों में सीआईआरएनए की अंतर अभिव्यक्ति को निर्धारित करने के लिए, सीआईआरआईक्वांट ने डीई विश्लेषण के लिए एजआर49 में एक सामान्यीकृत रैखिक मॉडल लागू किया, और सटीक दर-अनुपात परीक्षण का उपयोग सीआईआरएनए जंक्शन अनुपात में अंतर के महत्व को निर्धारित करने के लिए सांख्यिकीय परीक्षण के रूप में किया गया था। यद्यपि सीआईआरसीएक्सप्लोर3-क्लियर50 जैसे अन्य सीआईआरएनए परिमाणीकरण उपकरणों का उपयोग सीआईआरएनए के अभिव्यक्ति स्तर को निर्धारित करने के लिए किया जा सकता है, यह उपकरण केवल एक नमूने में सर्आरएनए परिमाणीकरण की अनुमति देता है क्योंकि यह एक नमूने में बीएसजे रीडिंग की गणना करता है और उसी नमूने से संबंधित रैखिक आरएनए गणना के खिलाफ गणना डेटा को सामान्य करता है। CIRClorklor3-CLEAR प्रयोगात्मक स्थितियों में सर्आरएनए अभिव्यक्तियों की तुलना नहीं कर सकता है। इसके अलावा, परिमाणित अभिव्यक्ति स्तर का समर्थन करने के लिए सीआईआरसीएक्सप्लोरर 3-क्लियर में कोई सांख्यिकीय विश्लेषण उपकरण लागू नहीं किया गया है। यद्यपि CIRIquant के भीतर कार्यान्वित डिफ़ॉल्ट CIRCrRNA पूर्वानुमान उपकरण CIRI2 है, find_circ और CIRCloroner2 जैसे अन्य उपकरणों के पूर्वानुमान परिणामों का उपयोग परिमाणीकरण और DE विश्लेषण31 के लिए भी किया जा सकता है। इस प्रोटोकॉल में, भविष्यवाणी के लिए केवल एक सीआईआरएनए पूर्वानुमान उपकरण (सीआईआरआई 2) का उपयोग किया गया था, जो अभी भी गलत-सकारात्मक सर्आरएनए उम्मीदवारों का उत्पादन कर सकता है। झूठी सकारात्मकता को कम करने के लिए, कोई विश्लेषण के लिए अन्य सीआईआरएनए पूर्वानुमान उपकरणों को जोड़ सकता है और विभिन्न सर्आरएनए पूर्वानुमान उपकरण48,51 के बीच पाए गए सामान्य सीआईआरएनए का चयन कर सकता है। सर्आरएनए का पता लगाने में और सुधार करने के लिए, आरएनए अनुक्रमण डेटासेट का उपयोग करना आदर्श है जो आरआरएनए-समाप्त और आरएनएस आर पूर्व-उपचार के अधीन हैं।

अध्ययन के उद्देश्य के आधार पर, डी नोवो और एनोटेट डीई सर्आरएनए को सीआईआरसीबेस डेटाबेस52 के आधार पर अलग-अलग पहचाना जा सकता है। हालांकि, एक से अधिक जीनों में फैले सीआईआरएनए को अक्सर यूसीएससी या किसी अन्य जीनोम ब्राउज़र पर मैन्युअल परीक्षा की आवश्यकता होती है ताकि सीआईआरएनए की प्रामाणिकता निर्धारित की जा सके और झूठी सकारात्मकता को खत्म किया जा सके। बहरहाल, एक से अधिक जीनों का विस्तार करने वाले लगभग आरएनए, जैसे संलयन जीन से प्राप्त सीआईआरएनए को हाल ही में53,54 रिपोर्ट किया गया है।

सीआईसीआर तीन अलग-अलग एमआरएनए-एमआरएनए भविष्यवाणी एल्गोरिदम, अर्थात्, टारगेटस्कैन55, मिरांडा 56 और आरएनएहाइब्रिड57 के संयोजन से काम करता है ताकि सर्आरएनए-एमआरएनए बाइंडिंग साइटों की भविष्यवाणी की जा सके। इसके शीर्ष पर, एल्गोरिथ्म में एजीओ चोटियों की जानकारी और सीआईआरआरएनए-एमआईआरएनए विश्लेषण में पहले से मान्य इंटरैक्शन भी शामिल हैं। यहां, एक अधिक विश्वसनीय सर्आरएनए-एमआरएनए भविष्यवाणी प्राप्त करने की अनुमति देने के लिए कड़े फ़िल्टरिंग मानदंड लागू किए गए थे, इस प्रकार, झूठी सकारात्मकता को और कम किया जा सकता है। हालाँकि, उपयोगकर्ता वरीयता के आधार पर इस फ़िल्टरिंग चरण की स्ट्रिंगता को अधिक या कम सेट किया जा सकता है।

क्लस्टरप्रोफाइलर एक अच्छी तरह से प्रलेखित आर पैकेज है जो कार्यात्मक रूप से विभिन्न जीवों में जीन सेट को एनोटेट कर सकता है। इस प्रोटोकॉल (एनरिचगो और एनरिचकेजीजी) में उल्लिखित आर क्लस्टरप्रोफाइलर पैकेज के भीतर कार्यों के अलावा, जो ओवर-प्रतिनिधित्व विश्लेषण का उपयोग करते हैं, जीएसईजीओ और जीएसईकेईजीजी जैसे अन्य फ़ंक्शन भी हैं जिनका उपयोग किया जा सकता है। यदि क्लस्टरप्रोफाइलर वर्कफ़्लो के लिए उपयुक्त विकल्प नहीं है, तो अन्य उपकरण और पैकेज भी हैं जैसे "AllEnricher" 58 या वेबसाइट-आधारित उपकरण जैसे "मेटास्केप" 59 जो कार्यात्मक रूप से जीन के एक सेट को एनोटेट कर सकते हैं। अंत में, हालांकि ऊपर दी गई पाइपलाइन संभावित सीआईआरएनए और उनके कार्यात्मक एनोटेशन की भविष्यवाणी करने में मदद करती है, ठोस सबूत प्रदान करने के लिए गीले-प्रयोगशाला सत्यापन की आवश्यकता होगी।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों के पास खुलासा करने के लिए कुछ भी नहीं है।

Acknowledgments

लेखक इस पांडुलिपि की आलोचनात्मक समीक्षा के लिए टैन के एन और डॉ कैमरन ब्रैकेन को धन्यवाद देना चाहते हैं। इस काम को मौलिक अनुसंधान अनुदान योजना (एफआरजीएस/1/2020/एसकेके0/यूएम/02/15) और मलाया विश्वविद्यालय उच्च प्रभाव अनुसंधान अनुदान (यूएम) से अनुदान द्वारा समर्थित किया गया था। सी/625/1/एचआईआर/एमओई/चान/02/07)।

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

वापसी अंक 188 परिपत्र आरएनए सर्आईआरएनए मेजबान-रोगज़नक़ इंटरैक्शन
<em>सिलिको में।</em> मेजबान-रोगज़नक़ इंटरैक्शन के दौरान सीआईआरएनए की पहचान और लक्षण वर्णन
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter