Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

في سيليكو تحديد وتوصيف الحمض النووي الريبي السيرك أثناء التفاعلات بين المضيف والممرض

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

يشرح البروتوكول المقدم هنا خط أنابيب السيليكو الكامل اللازم للتنبؤ بالحمض النووي الريبي الدائري وتوصيفه وظيفيا من بيانات نسخ تسلسل الحمض النووي الريبي التي تدرس تفاعلات المضيف والممرض.

Abstract

الحمض النووي الريبي الدائري (circRNAs) هي فئة من الحمض النووي الريبي غير المشفر الذي يتم تشكيله عن طريق الربط الخلفي. تتم دراسة هذه الحمضيات الراديكالية في الغالب لأدوارها كمنظم للعمليات البيولوجية المختلفة. والجدير بالذكر أن الأدلة الناشئة توضح أنه يمكن التعبير عن الحمض النووي الريبوزي الريسي المضيف بشكل تفاضلي (DE) عند الإصابة بمسببات الأمراض (مثل الأنفلونزا وفيروسات كورونا) ، مما يشير إلى دور ل circRNAs في تنظيم الاستجابات المناعية الفطرية للمضيف. ومع ذلك ، فإن التحقيقات حول دور circRNAs أثناء العدوى المسببة للأمراض محدودة بالمعرفة والمهارات المطلوبة لإجراء التحليل المعلوماتي الحيوي اللازم لتحديد DE circRNAs من بيانات تسلسل الحمض النووي الريبي (RNA-seq). يعد التنبؤ بالمعلوماتية الحيوية وتحديد circRNAs أمرا بالغ الأهمية قبل أي تحقق ، والدراسات الوظيفية باستخدام تقنيات المختبر الرطب المكلفة والمستهلكة للوقت. لحل هذه المشكلة ، يتم توفير بروتوكول خطوة بخطوة للتنبؤ بالسيليكو وتوصيف circRNAs باستخدام بيانات RNA-seq في هذه المخطوطة. يمكن تقسيم البروتوكول إلى أربع خطوات: 1) التنبؤ والقياس الكمي ل DE circRNAs عبر خط أنابيب CIRIquant. 2) التعليق التوضيحي عبر circBase وتوصيف DE circRNAs ؛ 3) التنبؤ بتفاعل CircRNA-miRNA من خلال خط أنابيب Circr ؛ 4) تحليل الإثراء الوظيفي للجينات الأبوية circRNA باستخدام علم الوجود الجيني (GO) وموسوعة كيوتو للجينات والجينوم (KEGG). سيكون خط الأنابيب هذا مفيدا في قيادة الأبحاث المستقبلية في المختبر وفي الجسم الحي لزيادة كشف دور circRNAs في تفاعلات المضيف والممرض.

Introduction

تمثل التفاعلات بين المضيف ومسبب المرض تفاعلا معقدا بين مسببات الأمراض والكائنات الحية المضيفة ، مما يؤدي إلى استجابات مناعية فطرية للمضيفين تؤدي في النهاية إلى إزالة مسببات الأمراض الغازية 1,2. أثناء العدوى المسببة للأمراض ، يتم تنظيم العديد من الجينات المناعية المضيفة لمنع تكاثر مسببات الأمراض وإطلاقها. على سبيل المثال ، تشمل الجينات الشائعة المحفزة بالإنترفيرون (ISGs) التي يتم تنظيمها عند العدوى المسببة للأمراض ADAR1 و IFIT1 و IFIT2 و IFIT3 و ISG20 و RIG-I و OASL 3,4. إلى جانب الجينات المشفرة للبروتين ، أفادت الدراسات أيضا أن الحمض النووي الريبي غير المشفر مثل الحمض النووي الريبي الطويل غير المشفر (lncRNAs) والحمض النووي الريبي الصغير (miRNAs) والحمض النووي الريبي الدائري (circRNAs) تلعب أيضا دورا ويتم تنظيمها بشكل متزامن أثناء العدوى المسببة للأمراض5،6،7. على عكس الجينات المشفرة للبروتين التي تشفر البروتينات بشكل أساسي كجزيئات وظيفية ، من المعروف أن الحمض النووي الريبي غير المشفر (ncRNAs) يعمل كمنظم للجينات على مستويات النسخ وما بعد النسخ. ومع ذلك ، فإن الدراسات التي تنطوي على مشاركة الحمض النووي الريبي غير المشفر ، وخاصة circRNAs ، في تنظيم الجينات المناعية للمضيفين لم يتم الإبلاغ عنها بشكل جيد مقارنة بالجينات المشفرة للبروتين.

تتميز CircRNAs على نطاق واسع ببنية الحلقة المستمرة المغلقة تساهميا ، والتي يتم إنشاؤها من خلال عملية ربط غير قانونية تسمى الربط الخلفي8. تتضمن عملية الربط الخلفي ، على عكس عملية الربط للحمض النووي الريبي الخطي المشابه ، ربط موقع المتبرع في اتجاه مجرى النهر بموقع المستقبل في المنبع ، مما يشكل بنية دائرية الشكل. حاليا ، تم اقتراح ثلاث آليات مختلفة للربط الخلفي للتكوين الحيوي ل circRNAs. هذه هي التعميم بوساطة بروتين ربط الحمض النووي الريبي (RBP)9,10 ، والتعميم المدفوع بالاقترانالداخلي 11 ، والتعميم الذي يحركه lariat12,13,14. بالنظر إلى أن الحمضيات الحمضية RNAs متصلة من طرف إلى طرف في بنية دائرية ، فإنها تميل إلى أن تكون مقاومة بشكل طبيعي لهضم exonuclease الطبيعي ، وبالتالي ، تعتبر أكثر استقرارا من نظيراتها الخطية15. تشمل الخاصية الشائعة الأخرى التي يظهرها circRNAs التعبير الخاص بنوع الخلية أو الأنسجة في المضيفين16.

كما يتضح من هيكلها الفريد وتعبيرها الخاص بالخلية أو الأنسجة ، تم اكتشاف أن circRNAs تلعب وظائف بيولوجية مهمة في الخلايا. حتى الآن ، تتمثل إحدى الوظائف البارزة ل circRNAs في دورها كإسفنج microRNA (miRNA)17,18. يحدث هذا الدور التنظيمي ل circRNAs من خلال الارتباط التكميلي لنيوكليوتيدات circRNA مع منطقة البذور من miRNAs. مثل هذا التفاعل circRNA-miRNA يمنع الوظائف التنظيمية الطبيعية ل miRNAs على mRNAs المستهدفة ، وبالتالي تنظيم التعبير عن الجينات19,20. بالإضافة إلى ذلك ، من المعروف أيضا أن circRNAs تنظم التعبير الجيني من خلال التفاعل مع بروتينات ربط الحمض النووي الريبي (RBPs) وتشكيل مجمعات بروتين الحمض النووي الريبي21. على الرغم من تصنيف circRNAs على أنها RNAs غير مشفرة ، إلا أن هناك أيضا أدلة على أن circRNAs يمكن أن تعمل كقوالب لترجمة البروتين22،23،24.

في الآونة الأخيرة ، ثبت أن circRNAs تلعب أدوارا محورية في تنظيم التفاعلات بين المضيف والممرض ، خاصة بين المضيفين والفيروسات. بشكل عام ، يفترض أن تساعد الحمض النووي الريبوزي الدائري المضيف في تنظيم الاستجابات المناعية للمضيف للقضاء على مسببات الأمراض الغازية. مثال على circRNA الذي يعزز الاستجابات المناعية للمضيف هو circRNA_0082633 ، الذي أبلغ عنه Guo et al.25. يعزز هذا الحمض النووي الريبي الدائري إشارات الإنترفيرون من النوع الأول (IFN) داخل خلايا A549 ، مما يساعد على قمع تكاثر فيروسالأنفلونزا 25. علاوة على ذلك ، أبلغ Qu et al. أيضا عن وجود حمض نووي روسي بشري ، يسمى circRNA AIVR ، والذي يعزز المناعة من خلال تنظيم التعبير عن البروتين المرتبط ب CREB (CREBBP) ، وهو محول إشارة IFN-β26,27. ومع ذلك ، توجد أيضا circRNAs المعروفة بتعزيز التسبب في المرض عند الإصابة. على سبيل المثال، أبلغ يو وآخرون مؤخرا عن الدور الذي يلعبه الحمض النووي الريبوزي السيرك المقسم من مجال إصبع الزنك GATA الذي يحتوي على الجين 2A (circGATAD2A) في تعزيز تكاثر فيروس H1N1 من خلال تثبيط الالتهام الذاتي للخلية المضيفة28.

لدراسة circRNAs بشكل فعال ، عادة ما يتم تنفيذ خوارزمية التنبؤ ب circRNA على مستوى الجينوم ، متبوعة بتوصيف السيليكو لمرشحي circRNA المتوقعين قبل إجراء أي دراسات وظيفية. مثل هذا النهج المعلوماتية الحيوية للتنبؤ وتوصيف circRNAs أقل تكلفة وأكثر كفاءة من حيث الوقت. فهو يساعد على تحسين عدد المرشحين للدراسة وظيفيا ويمكن أن يؤدي إلى نتائج جديدة. هنا ، نقدم بروتوكولا مفصلا قائما على المعلوماتية الحيوية لتحديد السيليكو والتوصيف والتعليق الوظيفي ل circRNAs أثناء تفاعلات المضيف والممرض. يتضمن البروتوكول تحديد وقياس circRNAs من مجموعات بيانات تسلسل الحمض النووي الريبي ، والتعليق التوضيحي عبر circBase ، وتوصيف المرشحين circRNA من حيث أنواع circRNA ، وعدد الجينات المتداخلة ، والتفاعلات المتوقعة بين circRNA-miRNA. توفر هذه الدراسة أيضا شرحا وظيفيا للجينات الأبوية circRNA من خلال علم الوجود الجيني (GO) وتحليل إثراء موسوعة كيوتو للجينات والجينوم (KEGG).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

في هذا البروتوكول ، تم تنزيل مجموعات بيانات مكتبة RNA-seq المستنفدة للريبوسوم (rRNA) المنضب من خلايا البلاعم البشرية المصابة بفيروس الأنفلونزا A واستخدامها من قاعدة بيانات Gene Expression Omnibus (GEO). يتم تلخيص خط أنابيب المعلوماتية الحيوية بالكامل من التنبؤ إلى التوصيف الوظيفي ل circRNAs في الشكل 1. يتم شرح كل جزء من خط الأنابيب بشكل أكبر في الأقسام أدناه.

1. التحضير والتنزيل والإعداد قبل تحليل البيانات

ملاحظة: جميع حزم البرامج المستخدمة في هذه الدراسة مجانية ومفتوحة المصدر.

  1. تنزيل الأدوات المطلوبة على منصة Linux
    1. قم بتنزيل وتثبيت البرامج والأدوات المطلوبة المدرجة في جدول المواد على جهاز كمبيوتر Linux عالي الأداء باستخدام الإرشادات المقدمة من المطور.
      ملاحظة: تحتوي معظم الأدوات والبرامج على صفحات GitHub الخاصة بها عبر الإنترنت أو وثائق تحتوي على إرشادات حول تثبيت أدواتها واستخدامها (راجع جدول المواد).
    2. قم بتنزيل مجموعات بيانات RNA-seq المطلوبة للكشف عن circRNA وتحليلها من مواقع أرشيف التسلسل (على سبيل المثال ، أرشيف النيوكليوتيدات الأوروبية والتعبير الجيني الشامل).
    3. قم بتنزيل الجينوم المرجعي (تنسيق FASTA) وملفات التعليقات التوضيحية (تنسيق GTF / GFF3) ، المتوافقة مع المضيف الذي تم إعداد مجموعة بيانات RNA-seq منه. عادة ما توجد ملفات الجينوم (الجينوم) المرجعي للمضيف وملفات التعليقات التوضيحية على متصفحات الجينوم عبر الإنترنت مثل المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) وجامعة كاليفورنيا سانتا كروز (UCSC) ومواقع Ensembl على الويب.
  2. فحص جودة RNA-seq
    1. أدخل ملفات FASTQ في برنامج FASTQC لتحديد جودة تسلسلات الحمض النووي الريبي. إذا كانت جودة ملفات FASTQ منخفضة (على سبيل المثال ، 29,30.

2. التنبؤ وتحليل التعبير التفاضلي ل circRNAs باستخدام CIRIquant

ملاحظة: يمكن العثور على دليل أكثر تفصيلا حول تثبيت وإجراء تحليل التعبير التفاضلي في قسم توفر الكود في ورقة CIRIquant31. تتضمن البيانات التكميلية أيضا بعض الأوامر الأساسية المستخدمة في هذا البروتوكول.

  1. توقعات سيرك الحمض النووي الريبي
    1. فهرس الجينوم المرجعي للمضيف أولا باستخدام مصففات BWA و HISAT2. بعد ذلك ، على محطة Linux ، قم بتنفيذ الأوامر bwa index 32 و hisat2-build33 في دليل الجينوم المرجعي للمضيف لفهرسته.
    2. بعد ذلك ، قم بإعداد ملف تكوين YML يحتوي على اسم الملف ومسار الأدوات (BWA و HISAT2 و stringtie34 و samtools35) والمسار إلى الملفات المرجعية التي تم تنزيلها (ملفات FASTA للجينوم المرجعي للمضيف وملفات التعليقات التوضيحية) والمسار إلى ملفات الفهرس من الخطوة 2.1.1.
    3. قم بتنفيذ أداة CIRIquant من المحطة الطرفية باستخدام المعلمات الافتراضية أو اليدوية. يمكن للمستخدم تحديد نوع المكتبة (إما تقطعت بهم السبل أو غير تقطعت بهم السبل) لبيانات RNA-seq عند تنفيذ أداة CIRIquant.
      ملاحظة: يمكن تحديد نوع مكتبة بيانات RNA-seq من خلال معرفة نوع مجموعة أدوات إعداد المكتبة المستخدمة. إذا كانت هوية مجموعة إعداد المكتبة غير معروفة ، فيمكن استخدام حزمة معلوماتية حيوية للتحكم في RNA-seq تسمى RSeQC36 لتحديد تقطع السبل ببيانات RNA-seq.
  2. تحليل التعبير التفاضلي
    ملاحظة: تتضمن حزمة CIRIquant prep_CIRIquant و prepDE.py و CIRI_DE_replicate ؛ لذلك ، ليست هناك حاجة إلى تنزيلات إضافية لهذه الأدوات الثلاث.
    1. قم بإعداد ملف نصي (.lst) مع قائمة بيانات تحتوي على ما يلي:
      العمود الأول: معرفات بيانات RNA-seq المستخدمة في الخطوة 2.1.3
      العمود 2: المسار إلى ملفات GTF الناتجة عن CIRIquant
      العمود 3: تجميع بيانات RNA-seq ، سواء كانت مجموعة تحكم أو معالجة.
    2. على سبيل المثال، يرجى الرجوع إلى الجدول 1 أدناه.
      ملاحظة: ليس من الضروري وضع الرؤوس لأنها للإشارة فقط.
    3. على جهاز Linux ، قم بتشغيل prep_CIRIquant باستخدام الملف النصي (.lst) الذي تم إعداده في الخطوة 2.2.1 كمدخل. سيؤدي التشغيل إلى إنشاء قائمة بالملفات: library_info.csv و circRNA_info.csv و circRNA_bsj.csv و circRNA_ratio.csv.
    4. قم بإعداد ملف نصي ثان يحتوي على قائمة بالبيانات التي تحتوي على معرفات RNA-seq والمسار إلى إخراج StringTie الخاص بكل منها. يجب أن يكون تخطيط الملف مشابها للملف النصي في الخطوة 2.2.1 بدون عمود التجميع.
    5. قم بتشغيل prepDE.py باستخدام الملف النصي الذي تم إعداده في الخطوة 2.2.4 كإدخال لإنشاء ملفات مصفوفة عدد الجينات.
    6. قم بتنفيذ CIRI_DE_replicate باستخدام ملفات library_info.csv و circRNA_bsj.csv من الخطوة 2.2.3 وملف gene_count_matrix.csv من الخطوة 2.2.5 كمدخلات لإخراج ملف circRNA_de.tsv النهائي.
  3. تصفية DE circRNAs
    1. استخدم R (في محطة الكمبيوتر أو RStudio) أو أي برنامج جدول بيانات (على سبيل المثال ، Microsoft Excel) لفتح ملف circRNA_de.tsv الذي تم إنشاؤه من الخطوة 2.2.6 لتصفية وتحديد عدد circRNAs المعبر عنها تفاضليا (DE).
    2. قم بتصفية DE circRNAs وفقا لمعايير LogFC > |2| و FDR < 0.05.
    3. قم بإنشاء ملف باسم DE_circRNAs.txt لتخزين معلومات DE circRNAs.

3. توصيف وشرح DE circRNAs المتوقعة

  1. حالة التعليق التوضيحي ل DE circRNAs
    1. قم بتحميل الملف المسمى DE_circRNAs.txt في RStudio ، والذي يتكون من قائمة DE circRNAs التي تمت تصفيتها من الخطوة 2.3.3. قم بتضمين معلومات أخرى مثل المواضع الجينومية (Chr ، Start ، End) ، اتجاهات الشريط (+ أو -) ، اسم الجين ، ونوع circRNA. قبل المتابعة ، قم بتحويل إحداثيات البدء الجينومي circRNA من CIRIquant إلى 0 عن طريق طرح 1 زوج أساسي.
      ملاحظة: يمكن الحصول على المعلومات الأخرى المذكورة أعلاه من ملفات GTF التي تم إخراجها بواسطة CIRIquant (الملف التكميلي 1).
    2. حدد حالة التعليق التوضيحي ل DE circRNAs المتوقعة عن طريق تنزيل مكتبة تحتوي على المواضع الجينومية لقاعدة بيانات circRNA (على سبيل المثال ، circBase) المودعة circRNAs.
      ملاحظة: تأكد من أن نسخة الجينوم المستخدمة للتنبؤ ب circRNAs مطابقة لمكتبة قاعدة بيانات circRNA قبل إجراء المقارنة. يتوفر ملف بيانات circBase المستخدم هنا مجانا في مجلد محرك الأقراص المتوفر في Github (https://github.com/bicciatolab/Circr) 37.
    3. بمجرد إعداد كل من الملفات من الخطوة 3.1.1 والخطوة 3.1.2 ، قم بتشغيل البرنامج النصي R الوارد في الملف التكميلي 1. يتم الاستعلام عن مواقع الكروموسومات ل DE circRNAs إلى المكتبة قبل تعيين الحالة مشروحة أو غير مشروحة.
  2. توصيف DE circRNAs
    1. استخدم R وبرامج جداول البيانات الأخرى لتلخيص عدد circRNAs وفقا لأنواع circRNA (أي exon و intron و intergenic و antisense) وعدد الجينات التي تمتد عبر circRNAs (1 أو >1) (الملف التكميلي 1).ملاحظة: يمكن ل CIRIquant اكتشاف أربعة أنواع فقط من circRNAs (إكسون ، إنترون ، بين الجينات ، ومضاد للحساسية). لا يمكن اكتشاف Exon-intron circRNAs ، المعروف أيضا باسم ElciRNAs ، بواسطة CIRIquant.

4. التنبؤ بتفاعل circRNA-miRNA باستخدام Circr

ملاحظة: يمكن العثور على دليل أكثر تفصيلا حول كيفية تثبيت واستخدام Circr لتحليل تفاعل circRNA-miRNA على: https://github.com/bicciatolab/Circr 37.

  1. إعداد الملفات
    1. قم بفك ضغط واستخراج محتويات ملف Circr.zip بعد تنزيله من صفحة Circr GitHub باستخدام البرامج ذات الصلة مثل "WinRar" أو "7-zip" في دليل جديد حيث سيتم إجراء التحليل.
    2. قم بتثبيت التطبيقات البرمجية الأساسية (miRanda و RNAhybrid و Pybedtools و samtools) قبل إجراء تحليل circRNA-miRNA.
    3. يتم توفير الجينومات المرجعية وملفات التعليقات التوضيحية للعديد من الكائنات الحية ذات الأهمية ، وملف إحداثيات rRNA ، وملف تفاعل miRNA الذي تم التحقق من صحته ، وملفات circBase circRNA بواسطة مؤلف Circr في صفحة Github (https://github.com/bicciatolab/Circr) 37. عند النقر فوق ملفات الدعم في مجلد محرك الأقراص ، حدد المجلد الخاص بالكائن محل الاهتمام ومجلد miRNA والملف النصي circBase وقم بتنزيله.
    4. بعد تنزيل الملفات الضرورية في الخطوة 4.1.3 ، قم بإنشاء دليل جديد باسم support_files في الدليل المذكور في الخطوة 4.1.1. بعد ذلك ، قم بفك ضغط المحتوى واستخراجه في دليل support_files .
    5. فهرس ملف الجينوم المرجعي للكائن محل الاهتمام باستخدام الأمر samtools faidx (الملف التكميلي 1).
    6. قم بإعداد ملف إدخال يتكون من إحداثيات DE circRNAs ذات الأهمية في ملف BED محدد بعلامات جدولة ، كما هو موضح في الجدول 2.
      ملاحظة: نظرا لأن circRNAs التي تنبأ بها CIRIquant لا تستند إلى 0 ، فمن الضروري ناقص 1 نقطة أساس عند إحداثيات البداية (كما هو مذكور في الخطوة 3.1.1) قبل تحويلها إلى تنسيق BED. الرؤوس الموضحة في الجدول 2 هي للإشارة فقط وليست مطلوبة في ملفات BED.
    7. في هذه المرحلة ، تأكد من أن بنية شجرة المجلد المتوقعة لتحليل Circr كما في الشكل 2.
  2. الجري Circr.py
    1. قم بتنفيذ Circr.py باستخدام Python 3 ، وكوسيطات ، حدد ملف إدخال circRNA ، وجينوم FASTA للكائن الحي محل الاهتمام ، وإصدار الجينوم للكائن المحدد ، وعدد مؤشرات الترابط ، واسم ملف الإخراج في سطر الأوامر.
    2. إذا لم يتم توفير الكائن محل الاهتمام في مجلد محرك الأقراص المدرج في الخطوة 4.1.3 أو إذا كان المستخدم يفضل أن يكون لديه مجموعة مخصصة من الملفات لتشغيل التحليل ، فيجب تضمين أوامر إضافية تحدد موقع هذه الملفات عند تنفيذ Circr.py.
    3. بعد اكتمال تحليل Circr ، يقوم البرنامج بإخراج ملف تفاعل circRNA-miRNA بتنسيق csv.
    4. قم بتصفية نتائج تفاعل circRNA-miRNA وفقا للتفضيل الخاص بالمستخدم. بالنسبة لهذه الدراسة ، يتم تصفية التنبؤات باستخدام Rstudio وفقا للمعايير أدناه:
      -الكشف عنها من قبل جميع أدوات البرمجيات الثلاثة
      - موقعان ملزمان أو أكثر تم الإبلاغ عنهما من قبل كل من Targetcan و miRanda
      -تم تحديدها في الأعمدة "AGO" أو "تم التحقق من صحتها"
      -تصفية أي تفاعلات منطقة البذور
    5. اكتب circRNAs التي تمرر الشروط التي تمت تصفيتها من الخطوة 4.2.3 إلى ملف نصي جديد باسم circRNA_miRNA.txt. يمكن أن تزيد هذه التصفية من ثقة التفاعلات المتوقعة.

5. بناء شبكة ceRNA

ملاحظة: يمكن العثور على دليل مفصل حول كيفية استخدام Cytoscape على: http://manual.cytoscape.org/en/stable/ و https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. التنزيل والتحضير
    1. قم بتنزيل أحدث إصدار من Cytoscape38 من: https://cytoscape.org/download.html.
    2. قم بتنفيذ معالج المثبت الذي تم تنزيله في الخطوة 5.1.1 وحدد موقع الملف لبرنامج Cytoscape.
    3. قم بإعداد ملف محدد بعلامات جدولة يحتوي على circRNAs ذات الأهمية و miRNA المستهدفة. يتكون العمود الأول من اسم circRNA. يحدد العمود الثاني نوع الحمض النووي الريبي من العمود الأول ؛ العمود الثالث هو miRNA المستهدف ؛ ويحدد العمود الرابع نوع الحمض النووي الريبي من العمود الثالث. يظهر مثال على الملف في الجدول 3.
  2. بناء خريطة شبكة ceRNA
    1. افتح برنامج Cytoscape المثبت في الخطوة 5.1.2.
    2. في Cytoscape، انتقل إلى ملف > استيراد شبكة > من ملف. حدد الملف الذي تم إعداده في الخطوة 5.1.3.
    3. في علامة التبويب الجديدة ، حدد العمود الأول والثاني ك "عقدة المصدر" و "سمة عقدة المصدر" بينما حدد العمود الثالث والرابع ك "العقدة الهدف" و "سمة العقدة الهدف" على التوالي. انقر فوق "موافق" وستظهر الشبكة في الجانب الأيمن العلوي من Cytoscape.
    4. لتغيير النمط المرئي للشبكة ، اضغط على زر النمط على الجانب الأيسر من Cytoscape.
    5. اضغط على السهم الموجود على الجانب الأيسر من لون التعبئة. اختر الكتابة للعمود والتعيين المنفصل لنوع التعيين . ثم حدد اللون المطلوب لكل نوع من أنواع الحمض النووي الريبي.
    6. بعد تغيير اللون ، قم بتغيير شكل العقد بالانتقال إلى الشكل واتباع الخطوة 5.2.5.

6. تحليل الإثراء الوظيفي

  1. تحليل أنطولوجيا الجينات (GO) وموسوعة كيوتو للجينات والجينوم (KEGG) للجين الأبوي ل circRNAs
    1. تأكد من clusterProfiler 39,40 والمؤسسة. Hs.eg.db تم تركيب 41 حزمة في Rstudio. المؤسسة. حزمة Hs.eg.db41 هي حزمة تعليقات توضيحية على مستوى الجينوم للبشر فقط. إذا كان الكائن الحي محل الاهتمام هو نوع آخر ، فارجع إلى: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. استيراد معلومات DE_circRNA من الخطوة 2.3.1 إلى مساحة عمل Rstudio.
    3. استخدم الجين الأبوي ل circRNAs المتوفرة في هذا الملف لتحليل التخصيب في الخطوات القادمة. ومع ذلك ، إذا رغب المستخدم في تحويل رمز الجين إلى تنسيقات أخرى ، مثل معرف Entrez ، فاستخدم وظيفة مثل "bitr".
    4. باستخدام معرف الجين كمدخل، قم بتشغيل تحليل التخصيب GO باستخدام الدالة enrichGO داخل حزمة clusterProfiler39,40 باستخدام المعلمات الافتراضية.
    5. باستخدام معرف الجين كمدخل ، قم بتشغيل تحليل التخصيب KEGG باستخدام وظيفة enrichKEGG داخل حزمة clusterProfiler39,40 باستخدام المعلمات الافتراضية.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

تم تعديل البروتوكول المدرج في القسم السابق وتكوينه ليناسب نظام التشغيل Linux. السبب الرئيسي هو أن معظم مكتبات الوحدات والحزم المشاركة في تحليل circRNAs يمكن أن تعمل فقط على نظام Linux الأساسي. في هذا التحليل ، تم تنزيل مجموعات بيانات مكتبة RNA-seq المستنفدة للريبوسوم (rRNA) المحضرة من خلايا البلاعم البشرية المصابة بفيروس الأنفلونزا A من قاعدة بيانات GEO42 واستخدمت لتوليد النتائج التمثيلية.

التنبؤ بالحمض النووي الريبي السيرك والقياس الكمي
في هذا التحليل ، تم استخدام مجموعات بيانات مكتبة RNA-seq المستنفدة للريبوسوم (rRNA) المحضرة من خلايا البلاعم البشرية المصابة بفيروس الأنفلونزا A لإجراء الكشف عن الحمض النووي الريبي المحيطي والتحليل الوظيفي. كما هو محدد في قسم البروتوكول ، تم استخدام CIRIquant لتحديد وتنفيذ تحليل DE ل circRNAs المحددة باستخدام مجموعات بيانات مكتبة RNA-seq كمدخلات. تستند الملفات المرجعية المستخدمة إلى أحدث إصدار من الجينوم البشري (hg38). يوضح الجدول 4 مثالا على الناتج النهائي من تحليل CIRIquant. تم تنفيذ تحديد وتصفية DE circRNAs من مخرجات CIRIquant من خلال نصوص RStudio بسيطة (الملف التكميلي 1). يتم تصنيف CircRNAs على أنها DE فقط عندما تكون قيمة معدل الاكتشاف الخاطئ (FDR) <0.05 وتغيير الطيات اللوغاريتمية (LogFC) >|2|. يوضح الجدول 5 العدد الإجمالي ل circRNAs و DE circRNAs المكتشفة. تم اكتشاف ما مجموعه 35,846 circRNAs ، مع 306 DE. يتم تنظيم DE circRNAs المكتشفة في هذا الإخراج بالكامل (LogFC > 2) ، مع عدم تخفيض أي منها (LogFC < 2).

شرح وتوصيف DE circRNAs
حالة التعليق التوضيحي ل DE circRNAs
تم التحقق من DE circRNAs التي تم تحديدها مع قاعدة بيانات circRNA المنشأة ، circBase. ومع ذلك ، نظرا لأن إحداثيات circRNA المودعة في circBase تستند إلى إصدار جينوم بشري سابق (hg19) ، يجب تحويل إحداثيات circRNA من circBase إلى إصدار الجينوم البشري الحالي (hg38) للتحقق في هذه الدراسة. بالإضافة إلى ذلك، يجب تحويل إحداثيات البدء إلى 0 من الإخراج المستند إلى 1 من CIRIquant. يتم توفير إحداثيات circRNA المحولة من إصدار hg38 ل circBase في مجلد محرك أقراص في Github (https://github.com/bicciatolab/Circr) 37. بعد ذلك ، تم استخدام البرامج النصية Rstudio (الملف التكميلي 1) لتعيين حالة التعليق التوضيحي ل circRNAs في عمود إطار بيانات جديد. يوضح الجدول 6 مثالا على circRNAs مع حالة التعليق التوضيحي.

توصيف DE circRNAs
تم تنفيذ هذا الجزء بالكامل من خلال البرامج النصية R في برنامج RStudio. تسهل البرامج النصية R العمليات التحليلية ، ولا يلزم سوى المعرفة الأساسية.

أنواع CircRNA
في هذه الخطوة ، تميزت DE circRNAs بأنواع circRNA الخاصة بها (Antisense و Exonic و Intergenic و Intronic) بناء على مواقعها الجينومية. يعرض الجدول 7 أدناه النسبة المئوية لتوزيع أنواع circRNA المختلفة التي يشملها DE circRNAs المحددة. من إجمالي 306 DE circRNAs ، تم تحديد 263 circRNAs (85.95٪) على أنها circRNAs exonic ، وهو أكثر أنواع circRNA وفرة التي تم تحديدها. تأتي الحمضيات الحمضية السيركية Intronic كثاني أكثر أنواع الحمض النووي الريبي السيركRNA التي تم تحديدها والتي تضم 17 DE circRNAs ، مما يشكل ما يصل إلى 5.56٪ من إجمالي الحمض النووي الريبي السيركي DE. ويلي ذلك الحمض النووي الريبي السيرك بين الجينات (16 DE circRNAs ~ 5.23٪) و circRNAs المضادة للحساسية (10 DE circRNAs ~ 3.27٪).

عدد الجينات الممتدة لكل circRNA
يمكن أن تتداخل CircRNAs التي حددها CIRIquant عبر عدد من الجينات. حتى الآن ، تركز معظم الدراسات على circRNAs التي تمتد عبر جين واحد. ومن ثم ، في هذا البروتوكول ، يتم استبعاد مرشحي circRNA الذين يمدون أكثر من جين واحد من تحليل المصب. يصف الجدول 8 أدناه عدد ونسبة DE circRNAs التي تغطي جينا واحدا وأكثر من جين واحد. في هذا الجدول ، يتم استبعاد circRNAs بين الجينات (16 DE circRNAs) لأنها لا تتداخل مع أي جينات مضيفة ، بينما تخضع بقية أنواع circRNA (290 DE circRNAs) لهذا التحليل. من بين 290 من الحمض النووي الريبوزي الدائري DE ، فإن غالبية ال DE circRNAs (261 circRNAs ~ 90٪) تمتد عبر جين واحد فقط ، في حين أن ال 29 circRNAs المتبقية (~ 10٪) تمتد عبر أكثر من جين واحد.

بناء شبكة الحمض النووي الريبوزي المرسال
عادة ما يتم رسم شبكة ceRNA لتصور تفاعلات circRNA-miRNA بعد التنبؤ بها. في الشكل 3 أدناه ، تم اختيار DE circRNA واحد فقط كنتيجة تمثيلية ، وهي hsa_DE_58 circRNA. استنادا إلى تنبؤات Circr ، يمكن hsa_DE_58 إسفنج ما يصل إلى تسعة miRNAs مختلفة. يتم تحديد هذه miRNAs التسعة بعد التصفية من خلال معايير صارمة.

تحليل الإثراء الوظيفي
تحليل GO و KEGG للجينات الأبوية circRNA
يوضح الشكل 4 أدناه مخطط فقاعي للإثراء الوظيفي للجينات الأبوية DE circRNA من خلال تحليل GO. بشكل أساسي ، يهدف تحليل GO إلى كشف العمليات البيولوجية والمواقع الخلوية والوظائف الجزيئية التي يتم تخصيبها أو تأثرها في الحالة التي تمت دراستها ، في هذه الحالة ، العينة المصابة بالفيروس. يعتبر التخصيب ذا دلالة إحصائية ويتم رسمه على مخطط الفقاعة فقط إذا كانت القيمة الاحتمالية < 0.01. كما هو موضح في الشكل 4 ، تشمل الإثراء الثلاثة الأولى للعمليات البيولوجية (BP) التكوين الحيوي المعقد للبروتين النووي الريبي ، والاستجابة للفيروس ، وتنظيم الاستجابة لمحفز حيوي ، بينما بالنسبة للوظائف الجزيئية (MF) فقط النشاط التحفيزي الذي يعمل على الحمض النووي الريبي وارتباط الحمض النووي الريبي أحادي الشريط يتم إثراؤه إحصائيا. من ناحية أخرى ، يتم إثراء مجمع retromer فقط إحصائيا للمكونات الخلوية (CC).

يوضح الشكل 5 تحليل التخصيب KEGG للجينات الأبوية DE circRNA في مخطط فقاعة. على غرار تحليل التخصيب GO ، يعتبر إثراء KEGG ذا دلالة إحصائية فقط ويتم رسمه على مخطط فقاعة إذا كانت القيمة p < 0.01. تم إثراء مصطلحين فقط من KEGG في هذه الحالة ، وهما مسارات الأنفلونزا A ودورة الحياة الفيروسية (HIV-1).

Figure 1
الشكل 1: خط الأنابيب للتنبؤ والتوصيف الوظيفي ل circRNAs. يعرض خط الأنابيب نظرة عامة بسيطة على الخطوات الرئيسية من البداية إلى النهاية التي تتضمن تثبيت حزم البرامج الضرورية ، والتنبؤ بتعبير circRNA وقياسه ، وبناء شبكة ceRNA ، وإجراء الإثراء الوظيفي للجين الأبوي circRNA. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 2
الشكل 2: هيكل شجرة المجلد ل Circr. من الضروري إنشاء بنية شجرة المجلد هذه قبل تشغيل برنامج Circr لاكتشاف الملفات المطلوبة للتحليل. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 3
الشكل 3: شبكة ceRNA تتكون من تفاعل circRNA-miRNA. يمثل الشكل البيضاوي الأزرق circRNA ، بينما تمثل المثلثات البرتقالية miRNAs. تصف الخطوط الصلبة التي تربط السيرك RNA ب miRNAs وظيفة إسفنج miRNA المحتملة ل hsa_DE_58 circRNA. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 4
الشكل 4: مخطط الفقاعة لتحليل إثراء GO للجينات الأبوية DE circRNA. GeneRatio على المحور السيني هو عدد الجينات في قائمة المدخلات المرتبطة بمصطلح GO المحدد الذي يقسم العدد الإجمالي لجينات الإدخال. يتم تمثيل حجم النقطة في المخطط بقيمة العد ، وهي عدد الجينات في قائمة المدخلات المرتبطة بمصطلح GO المحدد. كلما زاد حجم النقاط ، زاد عدد جينات الإدخال المرتبطة بالمصطلح. إلى جانب ذلك ، يتم ترميز النقاط في الرسم بالألوان بناء على القيمة p. يتم حساب القيمة الاحتمالية من خلال مقارنة التردد المرصود لمصطلح التعليق التوضيحي مع التردد المتوقع بالصدفة. تعتبر المصطلحات الفردية غنية بما يتجاوز القيمة الفاصلة (القيمة الاحتمالية < 0.01). يشير التدرج اللوني للقيمة p التي تتراوح من الأزرق إلى الأحمر إلى زيادة إثراء المصطلحات. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 5
الشكل 5: تحليل إثراء KEGG للجينات الأبوية DE circRNA. GeneRatio على المحور السيني هو عدد الجينات في قائمة المدخلات المرتبطة بمصطلح KEGG المحدد الذي يقسم العدد الإجمالي لجينات الإدخال. يتم تمثيل حجم النقطة في المخطط بقيمة العد ، وهي عدد الجينات في قائمة المدخلات المرتبطة بمصطلح KEGG المحدد. كلما زاد حجم النقاط ، زاد عدد جينات الإدخال المرتبطة بالمصطلح. إلى جانب ذلك ، يتم ترميز النقاط في الرسم بالألوان بناء على القيمة p. يتم حساب القيمة الاحتمالية من خلال مقارنة التردد المرصود لمصطلح التعليق التوضيحي مع التردد المتوقع بالصدفة. تعتبر المصطلحات الفردية غنية بما يتجاوز القيمة الفاصلة (القيمة الاحتمالية < 0.01). يشير التدرج اللوني للقيمة p التي تتراوح من الأزرق إلى الأحمر إلى زيادة إثراء المصطلحات. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

اسم العينة المسار إلى ملف GTF الناتج CIRIquant تجميع
التحكم 1 /path/to/CIRIquant/ctrl1.gtf C
التحكم 2 /path/to/CIRIquant/ctrl2.gtf C
مصاب 1 /path/to/CIRIquant/infect1.gtf T
مصاب 2 /path/to/CIRIquant/infect2.gtf T

الجدول 1: إعداد ملف .lst ل CIRIquant. تتم كتابة المسارات الوجهة للعينات الضابطة والمعالجة من مخرجات CIRIquant في ملف نصي لمقارنة تعبيرات circRNA بين نوعي العينات.

تشر بدء انتهاء اسم . حبلا
CHR2 137428930 137433876 hsa_circ_000076 . -
CHR2 154705868 154706632 hsa_circ_000105 . -
CHR2 159104273 159106793 hsa_circ_000118 . -
CHR2 159215701 159226125 hsa_circ_000119 . -
الفصل 4 39980067 39980129 hsa_circ_002584 . -

الجدول 2: مثال على ملف BED ل Circr. مطلوب ستة أعمدة (Chr و Start و End و Name و Gene و Strand) المرتبطة ب circRNAs لإنشاء ملف BED.

circRNA_name نوع miRNA_name نوع
DE_circRNA_1 سيرك آرنا مير-001 ميرنا
DE_circRNA_1 سيرك آرنا مير-002 ميرنا
DE_circRNA_2 سيرك آرنا مير-003 ميرنا
DE_circRNA_2 سيرك آرنا مير-004 ميرنا

الجدول 3: ملف إدخال Cytoscape. يجب كتابة أربعة أعمدة (circRNA_name و Type و miRNA_name و Type) في ملف نصي.

سيرك آرنا لوج إف سي logCPM لويدز ريج بالقيمة دي روزفلت
CHR4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
CHR16: 18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
CHR14: 73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

الجدول 4: جزء من ملف الإخراج النهائي (.csv) ل CIRIquant. يقدم CIRIquant معلومات مثل LogFC ، وعدد السجلات لكل مليون (LogCPM) ، والانحدار اللوجستي (LR) ، والقيمة p ، والتعبير التفاضلي ، و FDR.

نتائج CIRIquant
مجموع دي فَوْق اسفل
35846 306 306 0

الجدول 5: ملخص لعدد الحمضيات المنطقية الإجمالية والمعبر عنها تفاضليا (DE) التي تم تحديدها. تم الكشف عن ما مجموعه 35,846 circRNAs ، مع 306 من DE circRNAs. يتم تنظيم جميع 306 DE circRNAs (مع عدم تنظيم أي منها) في العينات المعالجة عند مقارنتها بعينات التحكم.

Custom_Name Annotation_Status
hsa_DE_22 غير مشروح
hsa_DE_2 المشروح
hsa_DE_58 غير مشروح
hsa_DE_3 المشروح

الجدول 6: جدول أسماء circRNA المخصصة مع حالة التعليق التوضيحي. يتم الاستعلام عن CircRNAs في قاعدة بيانات ل circRNAs المودعة المعروفة (circBase). إذا كان circRNA موجودا داخل قاعدة البيانات ، تصنيفه على أنه مشروح ، بينما يتم تصنيف غياب circRNA على أنه غير مشروح.

نوع سيرك RNA التكرار النسبه المئويه
مضاد للإحساس 10 3.27%
إكسون 263 85.95%
بين الجينات 16 5.23%
انترون 17 5.56%

الجدول 7: أنواع الحمض النووي الريبي السيرك التي تم تحديدها. يمكن تصنيف CircRNAs إلى أنواع مختلفة من circRNAs بناء على منطقة تسلسلها ، وهي exonic و intronic و antisense و intergenic.

عدد الجينات الأبوية التكرار النسبه المئويه
1 261 90%
> 1 29 10%

الجدول 8: النسبة المئوية ل circRNAs مع عدد مختلف من الجينات الممتدة. عادة ما يتم تشفير CircRNAs من إكسونات جين واحد ، ولكن يمكن أيضا اكتشاف circRNAs التي تغطي أكثر من جين واحد بواسطة CIRIquant.

الملف التكميلي 1: البرامج النصية المستخدمة في البروتوكول. الرجاء الضغط هنا لتنزيل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

لتوضيح فائدة هذا البروتوكول ، تم استخدام RNA-seq من خلايا البلاعم البشرية المصابة بفيروس الأنفلونزا A كمثال. تم التحقيق في عمل CircRNAs كإسفنج miRNA محتمل في تفاعلات المضيف والممرض والتخصيب الوظيفي GO و KEGG داخل المضيف. على الرغم من وجود مجموعة متنوعة من أدوات circRNA المتاحة عبر الإنترنت ، إلا أن كل منها عبارة عن حزمة قائمة بذاتها لا تتفاعل مع بعضها البعض. هنا ، قمنا بتجميع عدد قليل من الأدوات المطلوبة للتنبؤ ب circRNA وقياسه ، والإثراء الوظيفي ل circRNA ، والتنبؤ بتفاعل circRNA-miRNA ، وبناء شبكة ceRNA. هذا البروتوكول المبسط موفر للوقت ويمكن تطبيقه على العينات السريرية للكشف عن مرشحي circRNA بقيم تشخيصية وتنبؤية.

بشكل أساسي ، استخدمنا CIRIquant31 ، وهي أداة تقدير كمي circRNA معبأة مسبقا مع CIRI2 ، والتي يمكنها اكتشاف وتنفيذ تحليل DE ل circRNAs. تتم تصفية DE circRNAs بناء على القيمة الفاصلة ل LogFC > |2| و FDR < 0.05 ، مما يساعد على القضاء على الإيجابيات الخاطئة المحتملة في تحليلات المصب. يساعد توصيف DE circRNAs من حيث حالة التعليق التوضيحي وأنواع circRNA وعدد الجينات الممتدة في تصنيف وتصفية مرشحي circRNA. بعد ذلك ، يتم استخدام Circr37 ، وهي أداة تنبؤ circRNA-miRNA ، للتنبؤ بالمرشحين المحتملين لإسفنج miRNA. بعد التنبؤ ب miRNAs المحتملة كأهداف ل circRNAs ، يتم رسم شبكة ceRNA. أخيرا ، استنادا إلى الجينات الأبوية ل circRNAs ، يتم استخدام حزمة R clusterProfiler39 للتعليق التوضيحي الوظيفي عبر تحليل إثراء مسار GO و KEGG. قد تساعد نتائج GO و KEGG في كشف الآليات البيولوجية المتأثرة ب circRNAs.

حتى الآن ، تم تطوير العديد من أدوات التنبؤ المختلفة ل circRNA ، بما في ذلك CIRI2 43 و CIRCexplorer244 و find_circ 45 و MapSplice 46 و UROBORUS 47. في دراسة أجراها Hansen et al. ، تم الإبلاغ عن CIRI2 لأداء عام عال. إنه من بين أدوات الكشف القليلة عن circRNA التي يمكن أن تعمل بشكل جيد من حيث التنبؤ الجديد وتقليل التحديد الإيجابي الخاطئ48. لذلك تم استخدام CIRIquant الذي يستخدم CIRI2 للكشف عن circRNA والقياس الكمي في هذه الدراسة. تم استخدام CIRIquant لحساب قراءات تقاطع اللصق الخلفي (BSJ) ، وتم تطبيع بيانات العد إلى القراءات المعينة لترميز الحمض النووي الريبي الخطي المنسوخ من نفس موقع الجين. هذا يسمح بالقياس الكمي ل circRNAs في العينة. لتحديد التعبير التفاضلي ل circRNAs عبر الظروف التجريبية ، نفذت CIRIquant نموذجا خطيا معمما في edgeR49 لتحليل DE ، وتم استخدام اختبار نسبة المعدل الدقيق كاختبار إحصائي لتحديد أهمية الاختلاف في نسبة تقاطع circRNA. على الرغم من أنه يمكن استخدام أدوات القياس الكمي الأخرى ل circRNA مثل CIRCexplorer3-CLEAR50 لتحديد مستوى التعبير عن circRNAs ، إلا أن هذه الأداة تسمح فقط بالقياس الكمي ل circRNA في عينة لأنها تحسب قراءات BSJ في عينة وتطبيع بيانات العد مقابل أعداد الحمض النووي الريبي الخطي المشابهة من نفس العينة. لا يمكن ل CIRCexplorer3-CLEAR مقارنة تعبيرات circRNA عبر الظروف التجريبية. علاوة على ذلك، لم يتم تنفيذ أي أداة تحليل إحصائي في CIRCexplorer3-CLEAR لدعم مستوى التعبير الكمي. على الرغم من أن أداة التنبؤ الافتراضية circRNA المطبقة داخل CIRIquant هي CIRI2 ، إلا أنه يمكن أيضا استخدام نتائج التنبؤ من أدوات أخرى مثل find_circ و CIRCexplorer2 للقياس الكمي وتحليل DE31. في هذا البروتوكول ، تم استخدام أداة تنبؤ circRNA واحدة فقط (CIRI2) للتنبؤ ، والتي قد لا تزال تسفر عن مرشحين إيجابيين كاذبين ل circRNA. لتقليل الإيجابيات الخاطئة ، يمكن للمرء الجمع بين أدوات التنبؤ الأخرى ل circRNA للتحليل واختيار circRNAs الشائعة المكتشفة من بين أدوات التنبؤ المختلفة circRNA48,51. لزيادة تحسين اكتشاف circRNA ، من المثالي استخدام مجموعات بيانات تسلسل الحمض النووي الريبي المستنفدة للحمض النووي الريبي وتخضع للمعالجة المسبقة ل RNase R.

اعتمادا على هدف الدراسة ، يمكن تحديد de novo و DE circRNAs المشروحة بشكل منفصل بناء على قاعدة بيانات circBase52. ومع ذلك ، غالبا ما تتطلب circRNAs التي تغطي أكثر من جين واحد فحصا يدويا على UCSC أو أي متصفح جينوم آخر لتحديد صحة circRNAs والقضاء على الإيجابيات الخاطئة. ومع ذلك ، فقد تم الإبلاغ مؤخرا عن circRNAs التي تمتد عبر أكثر من جين واحد ، مثل circRNAs المشتقة من جينات الاندماج ، 53,54.

يعمل Circr من خلال الجمع بين ثلاث خوارزميات مختلفة للتنبؤ miRNA-mRNA ، وهي TargetScan55 و miRanda 56 و RNAhybrid57 للتنبؤ بمواقع ربط circRNA-miRNA. علاوة على ذلك ، تتضمن الخوارزمية أيضا معلومات عن قمم AGO والتفاعلات التي تم التحقق من صحتها مسبقا في تحليل circRNA-miRNA. هنا ، تم تطبيق معايير تصفية صارمة للسماح بالحصول على تنبؤ circRNA-miRNA أكثر موثوقية ، وبالتالي تقليل الإيجابيات الكاذبة. ومع ذلك ، يمكن تعيين صرامة خطوة التصفية هذه أعلى أو أقل حسب تفضيل المستخدم.

ClusterProfiler عبارة عن حزمة R موثقة جيدا يمكنها التعليق وظيفيا على مجموعات الجينات عبر الكائنات الحية المتنوعة. إلى جانب الوظائف الموجودة ضمن حزمة R clusterProfiler المذكورة في هذا البروتوكول (enrichGO و enrichKEGG) ، والتي تستخدم تحليل التمثيل الزائد ، هناك أيضا وظائف أخرى مثل gseGO و gseKEGG يمكن استخدامها. إذا لم يكن clusterProfiler خيارا مناسبا لسير العمل ، فهناك أيضا أدوات وحزم أخرى مثل "AllEnricher"58 أو الأدوات المستندة إلى موقع الويب مثل "Metascape"59 التي يمكنها التعليق وظيفيا على مجموعة من الجينات. أخيرا ، على الرغم من أن خط الأنابيب المقدم أعلاه يساعد في التنبؤ ب circRNAs المحتملة وشروحها الوظيفية ، إلا أنه ستكون هناك حاجة إلى التحقق من المختبر الرطب لتقديم أدلة قوية.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

ليس لدى المؤلفين ما يكشفون عنه.

Acknowledgments

يود المؤلف أن يشكر تان كي إن والدكتور كاميرون براكين على مراجعتهما النقدية لهذه المخطوطة. تم دعم هذا العمل بمنح من برنامج منح البحوث الأساسية (FRGS / 1/2020 / SKK0 / UM / 02/15) ومنحة جامعة مالايا للأبحاث عالية التأثير (UM. () الوثيقة C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

التراجع ، العدد 188 ، الحمض النووي الريبي الدائري ، الحمض النووي الريبي الدائري ، التفاعل بين المضيف والممرض
<em>في سيليكو</em> تحديد وتوصيف الحمض النووي الريبي السيرك أثناء التفاعلات بين المضيف والممرض
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter