Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

ב Silico זיהוי ואפיון של circRNAs במהלך אינטראקציות פונדקאי-פתוגן

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

הפרוטוקול המוגש כאן מסביר את צנרת הסיליקו המלאה הדרושה לחיזוי ולאפיון פונקציונלי של CirRNAs מנתוני שעתוק ריצוף RNA החוקרים אינטראקציות מארח-פתוגן.

Abstract

רנ"א מעגלי (circRNAs) הוא סוג של רנ"א לא מקודד שנוצר באמצעות שחבור אחורי. מעגלי רנ"א אלה נחקרים בעיקר בשל תפקידם כרגולטורים של תהליכים ביולוגיים שונים. יש לציין כי ראיות חדשות מוכיחות כי CirRNA מארח יכול לבוא לידי ביטוי באופן דיפרנציאלי (DE) בעת הדבקה בפתוגנים (למשל, שפעת ווירוסי קורונה), דבר המצביע על תפקיד של circRNA בוויסות תגובות החיסון המולד של המארח. עם זאת, חקירות על תפקידם של circRNAs במהלך זיהומים פתוגניים מוגבלות על ידי הידע והמיומנויות הדרושים לביצוע הניתוח הביואינפורמטי הדרוש לזיהוי DE circRNAs מנתוני ריצוף RNA (RNA-seq). חיזוי וזיהוי ביואינפורמטיקה של circRNA הוא חיוני לפני כל אימות, ומחקרים פונקציונליים המשתמשים בטכניקות מעבדה רטובות יקרות וגוזלות זמן. כדי לפתור בעיה זו, פרוטוקול שלב אחר שלב של חיזוי סיליקו ואפיון של circRNAs באמצעות נתוני RNA-seq מסופק בכתב יד זה. ניתן לחלק את הפרוטוקול לארבעה שלבים: 1) חיזוי וכימות של DE circRNA באמצעות צינור CIRIquant; 2) ביאור באמצעות circBase ואפיון של DE circRNAs; 3) חיזוי אינטראקציה CircRNA-miRNA דרך צינור Circr; 4) ניתוח העשרה פונקציונלית של גנים הוריים circRNA באמצעות אונטולוגיה גנטית (GO) ואנציקלופדיה קיוטו של גנים וגנומים (KEGG). צינור זה יהיה שימושי בהנעת מחקר עתידי במבחנה ו-in vivo כדי לפענח עוד יותר את התפקיד של circRNA באינטראקציות מארח-פתוגן.

Introduction

אינטראקציות מארח-פתוגן מייצגות יחסי גומלין מורכבים בין הפתוגנים לבין אורגניזמים מארחים, אשר מעוררים את התגובה החיסונית המולדת של המארחים שבסופו של דבר מביאה לסילוק פתוגנים פולשים 1,2. במהלך זיהומים פתוגניים, מספר רב של גנים חיסוניים המאכסן מווסתים כדי לעכב את השכפול והשחרור של פתוגנים. לדוגמה, גנים נפוצים המעוררים אינטרפרון (ISGs) המווסתים על זיהומים פתוגניים כוללים ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I ו- OASL 3,4. מלבד גנים מקודדי חלבונים, מחקרים דיווחו גם כי RNA שאינו מקודד כגון RNA ארוך שאינו מקודד (lncRNAs), microRNA (miRNAs) ו- RNA מעגלי (circRNAs) גם לשחק תפקיד והם מווסתים בו זמנית במהלך זיהומים פתוגניים 5,6,7. בניגוד לגנים מקודדי חלבונים המקודדים בעיקר חלבונים כמולקולות פונקציונליות, RNA לא מקודד (ncRNAs) ידוע כמתפקד כמווסת של גנים ברמת השעתוק ואחרי השעתוק. עם זאת, מחקרים הכוללים השתתפות של RNA לא מקודד, במיוחד circRNAs, בוויסות הגנים החיסוניים של המארחים אינם מדווחים היטב בהשוואה לגנים מקודדי החלבון.

CircRNAs מאופיינים באופן נרחב על ידי מבנה לולאה רציפה סגורה קוולנטית, אשר נוצר באמצעות תהליך שחבור לא קנוני שנקרא שחבור אחורי8. תהליך השחבור האחורי, בניגוד לתהליך השחבור של רנ"א ליניארי קוגנטי, כולל קשירה של אתר התורם במורד הזרם לאתר המקבל במעלה הזרם, ויוצר מבנה בצורת מעגל. נכון לעכשיו, הוצעו שלושה מנגנוני שחבור אחוריים שונים עבור הביוגנזה של circRNAs. אלה הם RNA binding protein (RBP) mediated circularization9,10, intron-pairing-driven circularization 11, and lariat-driven circularization12,13,14. בהתחשב בכך ש-circRNA מחוברים מקצה לקצה במבנה מעגלי, הם נוטים להיות עמידים באופן טבעי לעיכול אקסונוקלאז רגיל, ולכן נחשבים יציבים יותר מעמיתיהם הליניאריים15. מאפיין נפוץ נוסף המוצג על ידי circRNA כולל ביטוי ספציפי לסוג התא או הרקמה במארחים16.

כפי שמשתמע מהמבנה הייחודי שלהם ומהביטוי הספציפי שלהם לתא או לרקמה, התגלו כבעלי תפקידים ביולוגיים חשובים בתאים. נכון להיום, אחד התפקידים הבולטים של סירק-רנ"א הוא תפקידם כספוגי מיקרו-רנ"א (miRNA)17,18. תפקיד רגולטורי זה של circRNAs מתרחש באמצעות קשירה משלימה של נוקלאוטידים circRNA עם אזור הזרעים של miRNAs. אינטראקציה כזו של circRNA-miRNA מעכבת את תפקודי הבקרה הרגילים של miRNA על mRNA מטרה, ובכך מווסתת את ביטוי הגנים19,20. בנוסף, CirRNAs ידועים גם לווסת ביטוי גנים על ידי אינטראקציה עם חלבונים קושרי RNA (RBPs) ויצירת קומפלקסים RNA-חלבון21. למרות ש-circRNA מסווגים כ-RNA שאינו מקודד, יש גם ראיות לכך ש-circRNA יכול לשמש כתבניות לתרגום חלבונים22,23,24.

לאחרונה הודגם כי CirRNAs ממלאים תפקיד מרכזי בוויסות יחסי הגומלין בין המאכסן לפתוגן, במיוחד בין המארחים לנגיפים. באופן כללי, מניחים כי הרנ"א של הפונדקאי מסייע בוויסות התגובה החיסונית של הפונדקאי כדי לחסל את הפתוגנים הפולשים. דוגמה ל-circRNA שמקדם תגובות חיסוניות של המארח היא circRNA_0082633, שדווחה על ידי Guo et al.25. CirRNA זה משפר את איתות אינטרפרון מסוג I (IFN) בתוך תאי A549, אשר מסייע לדכא שכפול וירוס שפעת25. יתר על כן, Qu et al. דיווחו גם על CirRNA אינטרוני אנושי, הנקרא circRNA AIVR, המקדם חסינות על ידי ויסות הביטוי של חלבון קושר CREB (CREBBP), מתמר אותות של IFN-β26,27. עם זאת, קיימים גם סירק-רנ"א הידועים כמקדמים את הפתוגנזה של מחלה בעת זיהום. לדוגמה, Yu et al. דיווחו לאחרונה על התפקיד שממלא CirRNA שחבור מתחום אצבע אבץ GATA המכיל את הגן 2A (circGATAD2A) בקידום שכפול נגיף H1N1 באמצעות עיכוב של אוטופגיה של התא המארח28.

כדי לחקור ביעילות circRNAs, מיושם בדרך כלל אלגוריתם חיזוי circRNA כלל-גנומי, ואחריו אפיון בסיליקו של המועמדים החזויים ל-circRNA לפני שניתן לבצע מחקרים פונקציונליים כלשהם. גישה ביואינפורמטית כזו לחיזוי ואפיון CirRNA היא פחות יקרה ויותר חסכונית בזמן. זה עוזר לחדד את מספר המועמדים להיחקר באופן פונקציונלי ועשוי להוביל לממצאים חדשים. כאן, אנו מספקים פרוטוקול מפורט מבוסס ביואינפורמטיקה לזיהוי, אפיון וביאור פונקציונלי של circRNA במהלך אינטראקציות פונדקאי-פתוגן. הפרוטוקול כולל זיהוי וכימות של circRNA ממערכי נתונים של ריצוף RNA, ביאור באמצעות circBase, ואפיון המועמדים ל-circRNA במונחים של סוגי circRNA, מספר גנים חופפים ואינטראקציות circRNA-miRNA חזויות. מחקר זה מספק גם את הביאור הפונקציונלי של הגנים ההוריים circRNA באמצעות אונטולוגיה גנטית (GO) ואנציקלופדיה קיוטו של גנים וגנומים (KEGG) ניתוח העשרה.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

בפרוטוקול זה, מערכי נתונים של ספריית RNA-seq ריבוזומלית (rRNA)-מדולדלת RNA-seq שהוכנו מתאי מקרופאג אנושיים נגועים בנגיף שפעת A הורדו ושימשו ממסד הנתונים של אומניבוס ביטוי גנים (GEO). כל צינור הביואינפורמטיקה מהחיזוי ועד לאפיון הפונקציונלי של ה-circRNA מסוכם באיור 1. כל חלק של הצינור מוסבר בהרחבה בסעיפים הבאים.

1. הכנה, הורדה והגדרה לפני ניתוח נתונים

הערה: כל חבילות התוכנה המשמשות במחקר זה הן חופשיות וקוד פתוח.

  1. הורדת הכלים הנדרשים לפלטפורמת לינוקס
    1. הורד והתקן את התוכנות והכלים הדרושים המפורטים בטבלת החומרים במחשב בעל ביצועים גבוהים של Linux באמצעות ההוראות שסופקו על-ידי המפתח.
      הערה: לרוב הכלים והתוכנות יש דפי GitHub מקוונים משלהם או תיעוד המכיל הוראות להתקנת הכלים שלהם ולשימוש בהם (עיין בטבלת החומרים).
    2. הורד את ערכות הנתונים הרצויות של RNA-seq לזיהוי וניתוח circRNA מאתרי ארכיון רצפים (לדוגמה, ארכיון הנוקלאוטידים האירופי ואומניבוס ביטוי גנים).
    3. הורד את גנום הייחוס (תבנית FASTA) ואת קובצי הביאור (תבנית GTF/GFF3), התואמים למחשב המארח שממנו הוכן מערך הנתונים RNA-seq. גנום ייחוס מארח וקבצי ביאור נמצאים בדרך כלל בדפדפני גנום מקוונים כגון המרכז הלאומי למידע ביוטכנולוגי (NCBI), אוניברסיטת קליפורניה סנטה קרוז (UCSC) ואתרי האינטרנט של אנסמבל.
  2. בדיקת איכות של RNA-seq
    1. הזן את קבצי FASTQ לתוכנית FASTQC כדי לקבוע את איכות רצפי הרנ"א. אם האיכות של קבצי FASTQ נמוכה (לדוגמה, 29,30.

2. חיזוי וניתוח ביטוי דיפרנציאלי של circRNA באמצעות CIRIquant

הערה: מדריך מפורט יותר להתקנה וביצוע של ניתוח ביטויים דיפרנציאליים ניתן למצוא בסעיף זמינות הקוד במאמר CIRIquant31. הנתונים המשלימים כוללים גם כמה מהפקודות הבסיסיות המשמשות בפרוטוקול זה.

  1. תחזיות CircRNA
    1. צור אינדקס של גנום הייחוס של המארח תחילה באמצעות קשתיות יישור BWA ו- HISAT2. לאחר מכן, במסוף לינוקס, בצע את הפקודות bwa index 32 ו- hisat2-build33 בספרייה של גנום הייחוס של המארח כדי לאנדקס אותו.
    2. לאחר מכן, הכן קובץ תצורת YML המכיל את שם הקובץ, נתיב הכלים (BWA, HISAT2, stringtie34, samtools35), הנתיב לקובצי הייחוס שהורדו (קבצי FASTA של גנום הייחוס של המארח, קבצי ביאור) והנתיב לקבצי האינדקס משלב 2.1.1.
    3. הפעל את הכלי CIRIquant מהמסוף באמצעות ברירת המחדל או פרמטרים ידניים. המשתמש יכול לציין את סוג הספרייה (תקועה או לא תקועה) של נתוני RNA-seq בעת הפעלת הכלי CIRIquant.
      הערה: ניתן לקבוע את סוג הספרייה של נתוני RNA-seq על-ידי הכרת סוג ערכת הכנת הספרייה שבה נעשה שימוש. אם זהותה של ערכת הכנת הספרייה אינה ידועה, ניתן להשתמש בחבילה ביואינפורמטית של בקרת RNA-seq בשם RSeQC36 כדי לקבוע את גדילות נתוני RNA-seq.
  2. ניתוח ביטוי דיפרנציאלי
    הערה: חבילת CIRIquant כוללת prep_CIRIquant, prepDE.py ו-CIRI_DE_replicate; לכן, אין צורך בהורדות נוספות עבור שלושת הכלים הללו.
    1. הכנת קובץ טקסט ( .lst) עם רשימת נתונים המכילה את הנתונים הבאים:
      עמודה 1st : מזהים של נתוני RNA-seq המשמשים בשלב 2.1.3
      עמודהשנייה : נתיב לקבצי GTF שהופקו על ידי CIRIquant
      עמודהשלישית : קיבוץ של נתוני RNA-seq, בין אם מדובר בקבוצת ביקורת או בקבוצת טיפול.
    2. לדוגמה, עיין בטבלה 1 להלן.
      הערה: אין צורך לשים את הכותרות כפי שהם רק לעיון.
    3. במסוף Linux, הפעל prep_CIRIquant עם קובץ הטקסט ( .lst) שהוכן בשלב 2.2.1 כקלט. ההפעלה תיצור רשימה של קבצים: library_info.csv, circRNA_info.csv, circRNA_bsj.csv ו - circRNA_ratio.csv.
    4. הכן קובץ טקסט שני עם רשימת נתונים המכילה את מזהי RNA-seq ואת הנתיב לפלט StringTie המתאים שלהם. פריסת הקובץ חייבת להיות דומה לקובץ הטקסט בשלב 2.2.1 ללא עמודת הקיבוץ.
    5. הפעל prepDE.py עם קובץ הטקסט שהוכן בשלב 2.2.4 כקלט ליצירת קבצי מטריצת ספירת הגנים.
    6. הפעל CIRI_DE_replicate עם קבצי library_info.csv ו- circRNA_bsj.csv משלב 2.2.3 וקובץ gene_count_matrix.csv משלב 2.2.5 כקלט כדי להפיק את קובץ circRNA_de.tsv הסופי.
  3. סינון של DE circRNAs
    1. השתמש ב- R (במסוף המחשב או ב- RStudio) או בכל תוכנת גיליון אלקטרוני (לדוגמה, Microsoft Excel) כדי לפתוח את קובץ circRNA_de.tsv שנוצר משלב 2.2.6 כדי לסנן ולקבוע את מספר ה- circRNA המבוטאים באופן דיפרנציאלי (DE).
    2. סינון DE circRNAs על פי הקריטריונים LogFC > |2| ו- FDR < 0.05.
    3. צור קובץ בשם DE_circRNAs.txt לאחסון המידע של DE circRNAs.

3. אפיון וביאור של DE circRNA חזוי

  1. מצב ביאור של DE circRNAs
    1. טען את הקובץ בשם DE_circRNAs.txt ב- RStudio , המורכב מרשימת DE circRNA המסוננת משלב 2.3.3. כלול מידע נוסף כגון המיקומים הגנומיים (Chr, Start, End), כיווני גדיל (+ או -), שם הגן וסוג circRNA. לפני שתמשיך, המר את קואורדינטות ההתחלה הגנומית של circRNA מ- CIRIquant ל- 0-based על ידי חיסור זוג בסיס אחד.
      הערה: ניתן לקבל את המידע האחר המצוין לעיל מקבצי GTF שהופקו על ידי CIRIquant (קובץ משלים 1).
    2. קבע את מצב הביאור של ה- DE החזוי circRNAs על ידי הורדת ספרייה המכילה את המיקומים הגנומיים של מסד הנתונים circRNA (למשל, circBase) שהופקד circRNAs.
      הערה: ודא שגרסת הגנום המשמשת לחיזוי ה- circRNA זהה לספריית מסד הנתונים circRNA לפני ביצוע ההשוואה. קובץ הנתונים circBase המשמש כאן זמין באופן חופשי בתיקיית הכונן המסופקת ב- Github (https://github.com/bicciatolab/Circr)37.
    3. לאחר הכנת שני הקבצים משלב 3.1.1 ושלב 3.1.2, הפעל את סקריפט R שניתן בקובץ משלים 1. מיקומים כרומוזומליים של DE circRNA נשאלים לספריה לפני הקצאת המצב מבואר או לא מבואר.
  2. אפיון DE circRNAs
    1. השתמש ב-R ובתוכנות גיליון אלקטרוני אחרות כדי לסכם את מספר ה-circRNAs לפי סוגי ה-circRNA (כלומר, אקסון, אינטרון, אינטרגני ואנטיסנס) ומספר הגנים שה-circRNA משתרעים על פני (1 או >1) (קובץ משלים 1).הערה: CIRIquant יכול לזהות רק ארבעה סוגים של circRNA (אקסון, אינטרון, אינטרגני ואנטיסנס). CirRNA אקסון-אינטרון, הידוע גם בשם ElciRNAs, אינו ניתן לזיהוי על ידי CIRIquant.

4. חיזוי האינטראקציה circRNA-miRNA באמצעות Circr

הערה: מדריך מפורט יותר כיצד להתקין ולהשתמש ב- Circr לניתוח אינטראקציה circRNA-miRNA ניתן למצוא בכתובת: https://github.com/bicciatolab/Circr 37.

  1. הכנת תיקים
    1. פתח וחלץ את התוכן של הקובץ Circr.zip לאחר הורדתו מדף Circr GitHub באמצעות התוכנה הרלוונטית כגון "WinRar" או "7-zip" לספרייה חדשה שבה יבוצע הניתוח.
    2. התקן את יישומי התוכנה הנדרשים מראש (miRanda, RNAhybrid, Pybedtools ו- samtools) לפני ביצוע ניתוח circRNA-miRNA.
    3. גנומי ייחוס וקובצי ביאור עבור מספר אורגניזמים בעלי עניין, קובץ קואורדינטות rRNA, קובץ אינטראקציה מאומת miRNA וקבצי circBase circRNA מסופקים על ידי מחבר Circr בדף Github (https://github.com/bicciatolab/Circr)37. לאחר לחיצה על קבצי התמיכה בתיקיית הכונן, בחר את התיקיה עבור האורגניזם המעניין, תיקיית miRNA וקובץ הטקסט circBase והורד אותו.
    4. לאחר הורדת הקבצים הדרושים בשלב 4.1.3, צור ספריה חדשה בשם support_files בספריה המוזכרת בשלב 4.1.1. לאחר מכן, חלץ וחלץ את התוכן לספריית support_files .
    5. אינדקס את קובץ גנום הייחוס של האורגניזם המעניין באמצעות הפקודה samtools faidx (קובץ משלים 1).
    6. הכן קובץ קלט המורכב מהקואורדינטות של DE circRNA המעניינות בקובץ BED מופרד באמצעות טאבים, כפי שמוצג בטבלה 2.
      הערה: מכיוון ש- circRNA שנחזה על ידי CIRIquant אינו מבוסס 0, יש צורך במינוס 1 bp בקואורדינטת ההתחלה (כפי שהוזכר בשלב 3.1.1) לפני המרתם לתבנית BED. הכותרות המוצגות בטבלה 2 מיועדות לעיון בלבד ואינן נחוצות בקבצי BED.
    7. בשלב זה, ודא שמבנה עץ התיקיות הצפוי עבור ניתוח Circr הוא כמו באיור 2.
  2. ריצה Circr.py
    1. בצע Circr.py באמצעות Python 3, וכארגומנטים, ציין את קובץ הקלט circRNA, את גנום FASTA של האורגניזם המעניין, את גרסת הגנום של האורגניזם שנבחר, את מספר החוטים ואת שם קובץ הפלט בשורת הפקודה.
    2. אם האורגניזם המעניין אינו מסופק בתיקיית הכונן המפורטת בשלב 4.1.3 או אם המשתמש מעדיף לקבל קבוצה מותאמת אישית של קבצים להפעלת הניתוח, פקודות נוספות המציינות את המיקום של קבצים אלה צריכות להיכלל בעת ביצוע Circr.py.
    3. לאחר השלמת ניתוח Circr, התוכנית מפיקה קובץ אינטראקציה circRNA-miRNA בפורמט csv.
    4. סנן את תוצאות האינטראקציה circRNA-miRNA בהתאם להעדפה הספציפית למשתמש. עבור מחקר זה, התחזיות מסוננות באמצעות Rstudio על פי הקריטריונים הבאים:
      -זוהה על ידי כל שלושת כלי התוכנה
      - שני אתרי כריכה או יותר שדווחו הן על ידי Targetscan והן על ידי miRanda
      -מזוהה בעמודות "AGO" או "מאומת"
      -לסנן ללא אינטראקציות באזור הזרעים
    5. כתוב את ה- circRNA שמעביר את התנאים המסוננים משלב 4.2.3 לקובץ טקסט חדש בשם circRNA_miRNA.txt. סינון כזה יכול להגביר את הביטחון של האינטראקציות החזויות.

5. בניית רשת ceRNA

הערה: מדריך מפורט כיצד להשתמש ב-Cytoscape ניתן למצוא בכתובת: http://manual.cytoscape.org/en/stable/ ו-https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. הורדה והכנה
    1. הורידו את הגרסה האחרונה של Cytoscape38 מ: https://cytoscape.org/download.html.
    2. הפעל את אשף ההתקנה שהורדת בשלב 5.1.1 ובחר את מיקום הקובץ עבור תוכנת Cytoscape.
    3. הכינו קובץ מופרד בטאבים המכיל את ה-circRNA המעניינים ואת miRNA היעד שלהם. העמודה הראשונה מורכבת משם ה-circRNA; העמודה השנייה מציינת את סוג הרנ"א מהעמודה הראשונה; העמודה השלישית היא miRNA המטרה; והעמודה הרביעית מציינת את סוג הרנ"א מהעמודה השלישית. דוגמה של הקובץ מוצגת בטבלה 3.
  2. בניית מפת רשת ceRNA
    1. פתח את תוכנת Cytoscape המותקנת בשלב 5.1.2.
    2. ב- Cytoscape, נווט אל File > Import > Network from File. בחר את הקובץ שהוכן בשלב 5.1.3.
    3. בכרטיסייה החדשה, בחר את העמודה הראשונה והשנייה כ"צומת מקור" ו"תכונת צומת מקור" ואילו בחר את העמודה השלישית והרביעית כ"צומת יעד" ו"תכונת צומת יעד" בהתאמה. לחץ על אישור והרשת תופיע בפינה השמאלית העליונה של Cytoscape.
    4. כדי לשנות את הסגנון החזותי של הרשת, לחץ על הלחצן Style בצד שמאל של Cytoscape.
    5. לחצו על החץ בצד ימין של 'צבע מילוי'. בחר Type עבור העמודה ו - Disdisc Mapping עבור סוג המיפוי. לאחר מכן, בחר את הצבע הרצוי עבור כל אחד מסוגי RNA.
    6. לאחר שינוי הצבע, שנה את צורת הצמתים על-ידי ניווט אל צורה וביצוע שלב 5.2.5.

6. ניתוח העשרה פונקציונלית

  1. ניתוח אונטולוגיה גנטית (GO) ואנציקלופדיית קיוטו לגנים וגנומים (KEGG) עבור הגן ההורי של ה-circRNA
    1. ודא את clusterProfiler39,40 ו- org. Hs.eg.db41 חבילות הותקנו ב-Rstudio. הארגון. חבילת Hs.eg.db41 היא חבילת ביאור כלל גנומית לבני אדם בלבד. אם האורגניזם המעניין הוא מין אחר, עיין ב: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. יבא את המידע DE_circRNA משלב 2.3.1 לסביבת העבודה של Rstudio.
    3. השתמש בגן ההורים של circRNA שסופק בקובץ זה לניתוח העשרה בשלבים הקרובים. עם זאת, אם המשתמש מעוניין להמיר את סמל הגן לפורמטים אחרים, כגון מזהה Entrez, השתמש בפונקציה כגון "bitr".
    4. על ידי שימוש במזהה הגן כקלט, הפעל את ניתוח העשרת GO באמצעות הפונקציה enrichGO בתוך חבילת clusterProfiler39,40 באמצעות פרמטרי ברירת מחדל.
    5. על ידי שימוש במזהה הגן כקלט, הפעל את ניתוח העשרת KEGG באמצעות הפונקציה enrichKEGG בתוך חבילת clusterProfiler39,40 באמצעות פרמטרי ברירת המחדל.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

הפרוטוקול שגויס בסעיף הקודם שונה והוגדר כך שיתאים למערכת ההפעלה לינוקס. הסיבה העיקרית היא שרוב ספריות המודולים והחבילות המעורבות בניתוח circRNAs יכולות לעבוד רק על פלטפורמת לינוקס. בניתוח זה, מערכי נתונים של ספריית RNA-seq ריבוזומלית (rRNA)-מדולדלת RNA-seq שהוכנו מתאי המקרופאגים האנושיים הנגועים בנגיף שפעת A הורדו ממסד הנתוניםGEO 42 ושימשו ליצירת התוצאות המייצגות.

חיזוי וכימות CircRNA
בניתוח זה, מערכי נתונים של ספריית RNA-seq ריבוזומלית (rRNA) שהוכנו מתאי מקרופאג אנושיים נגועים בנגיף שפעת A שימשו לביצוע זיהוי CirRNA וניתוח פונקציונלי. כפי שצוין בסעיף הפרוטוקול, CIRIquant שימש לזיהוי וביצוע ניתוח DE של circRNA מזוהים באמצעות ערכות הנתונים של ספריית RNA-seq כקלט. קובצי הייחוס שבהם נעשה שימוש מבוססים על גרסת הגנום האנושי העדכנית ביותר (hg38). טבלה 4 מציגה דוגמה לפלט הסופי מניתוח CIRIquant. הזיהוי והסינון של DE circRNA מפלט CIRIquant בוצעו באמצעות סקריפטים פשוטים של RStudio (קובץ משלים 1). CircRNAs מסווגים כ- DE רק כאשר ערך קצב גילוי השווא (FDR) הוא <0.05 ושינוי קיפול יומן (LogFC) >|2|. טבלה 5 מציגה את המספר הכולל של circRNAs ו- DE circRNAs שזוהו. בסך הכל התגלו 35,846 סירק-רנ"א, כאשר 306 הם DE. ה-DE circRNAs שזוהו בפלט זה מווסתים לחלוטין (LogFC > 2), ואף אחד מהם אינו מווסת כלפי מטה (LogFC < 2).

ביאור ואפיון DE circRNAs
מצב ביאור של DE circRNAs
DE circRNA שזוהו הוצלבו עם מסד נתונים מבוסס של circRNA, circBase. עם זאת, מכיוון שקואורדינטות ה-circRNA שהופקדו ב-circBase מבוססות על גרסת גנום אנושית קודמת (hg19), יש להמיר את קואורדינטות ה-circRNA מ-circBase לגרסת הגנום האנושי הנוכחית (hg38) לצורך הצלבה במחקר זה. בנוסף, יש להמיר את הקואורדינטה ההתחלתית למבוססת 0 מהפלט מבוסס 1 של CIRIquant. קואורדינטות circRNA שהומרו לגרסת hg38 של circBase מסופקות בתיקיית כונן ב- Github (https://github.com/bicciatolab/Circr)37. לאחר מכן, נעשה שימוש בסקריפטים של Rstudio (קובץ משלים 1) כדי להקצות את מצב הביאור של circRNA בעמודת מסגרת נתונים חדשה. טבלה 6 מציגה דוגמה של circRNA עם מצב הביאור.

אפיון DE circRNAs
חלק זה בוצע כולו באמצעות סקריפטים R בתוכנת RStudio. סקריפטים R להקל על תהליכים אנליטיים, ורק ידע בסיסי נדרש.

סוגי CircRNA
בשלב זה, DE circRNA אופיינו על ידי סוגי ה-circRNA שלהם (Antisense, Exonic, Intergenic ו-Intronic) בהתבסס על מיקומם הגנומי. טבלה 7 להלן מציגה את התפלגות האחוזים של סוגי ה-circRNA השונים הכלולים ב-DE circRNA שזוהו. מתוך סך 306 ה-DE circRNAs, 263 circRNA (85.95%) זוהו כ-circRNA אקסוני, שהוא סוג ה-circRNA הנפוץ ביותר שזוהה. CirRNA אינטרוניק הוא סוג ה-circRNA השני המזוהה ביותר הכולל 17 DE circRNAs, המהווים עד 5.56% מכלל ה-DE circRNAs. אחריהם נמצאים circRNA אינטרגניים (16 DE circRNAs ~ 5.23%) ו- antisense circRNA (10 DE circRNAs ~ 3.27%).

מספר הגנים המורחבים לכל circRNA
CircRNAs המזוהים על ידי CIRIquant יכולים לחפוף בין מספר גנים. נכון להיום, רוב המחקרים מתמקדים ב-circRNAs המקיפים גן אחד. לפיכך, בפרוטוקול זה, המועמדים ל-circRNA המשתרעים על פני יותר מגן אחד אינם נכללים בניתוח במורד הזרם. טבלה 8 להלן מתארת את המספר והאחוז של DE circRNA המשתרעים על פני גן אחד ויותר מגן אחד. בטבלה זו, circRNA intergenic (16 DE circRNAs) אינם נכללים מכיוון שהם אינם חופפים גנים מארחים כלשהם, בעוד שאר סוגי circRNA (290 DE circRNAs) כפופים לניתוח זה. מתוך 290 DE circRNAs, רוב ה- DE circRNAs (261 circRNAs ~ 90%) כוללים גן אחד בלבד, בעוד 29 ה- circRNA הנותרים (~ 10%) מקיפים יותר מגן אחד.

בניית רשת ceRNA
רשת ceRNA נמשכת בדרך כלל כדי לדמיין את אינטראקציות circRNA-miRNA לאחר שהיא נחזה. באיור 3 למטה, רק DE circRNA אחד נבחר כתוצאה מייצגת, שהיא ה-circRNA hsa_DE_58. בהתבסס על תחזיות Circr, hsa_DE_58 יכול לספוג עד תשעה miRNA שונים. תשעת ה-miRNA הללו מזוהים לאחר סינון לפי קריטריונים מחמירים.

ניתוח העשרה פונקציונלית
ניתוח GO ו-KEGG של הגנים ההוריים של ה-circRNA
איור 4 למטה מתאר תרשים בועה של העשרה תפקודית של גנים הוריים מסוג DE circRNA באמצעות ניתוח GO. ביסודו של דבר, ניתוח GO נועד לפענח את התהליכים הביולוגיים, המיקומים התאיים והתפקודים המולקולריים המועשרים או מושפעים במצב הנחקר, במקרה זה, הדגימה הנגועה בנגיף. ההעשרה נחשבת מובהקת סטטיסטית ומשורטט על חלקת הבועה רק אם ערך ה-p הוא <-0.01. כפי שניתן לראות באיור 4, שלוש ההעשרה המובילות עבור התהליכים הביולוגיים (BP) כוללות את הביוגנזה של קומפלקס ריבונוקלאו פרוטאין, התגובה לווירוס וויסות התגובה לגירוי ביוטי, בעוד שעבור הפונקציות המולקולריות (MF) רק הפעילות הקטליטית הפועלת על רנ"א וקשירת רנ"א חד-גדילי מועשרת סטטיסטית. מצד שני, רק קומפלקס הרטרומר מועשר סטטיסטית עבור הרכיבים התאיים (CC).

איור 5 מראה את ניתוח העשרת KEGG של הגנים ההוריים DE circRNA בחלקת בועה. בדומה לניתוח העשרת GO, העשרת KEGG נחשבת מובהקת סטטיסטית רק ומשורטט על חלקת בועה אם ערך ה-p הוא < 0.01. רק שני מונחי KEGG הועשרו במקרה זה, שהם מסלולי שפעת A ומחזור החיים הנגיפי (HIV-1).

Figure 1
איור 1: צנרת החיזוי והאפיון הפונקציונלי של circRNAs. הצינור מציג סקירה פשוטה של שלבי המפתח מתחילתם ועד סופם הכוללים את התקנת חבילות התוכנה הדרושות, חיזוי וכימות ביטוי ה- circRNA, בניית רשת ceRNA וביצוע העשרה תפקודית של הגן ההורי circRNA. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.

Figure 2
איור 2: מבנה עץ תיקיות עבור Circr. יש צורך להקים מבנה עץ תיקיות זה לפני הפעלת תוכנת Circr על מנת לזהות את הקבצים הדרושים לניתוח. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.

Figure 3
איור 3: רשת ceRNA המורכבת מאינטראקציית circRNA-miRNA. צורת האליפסה הכחולה מייצגת את ה-circRNA, בעוד המשולשים הכתומים מייצגים את miRNAs. הקווים המוצקים המחברים בין ה-circRNA ל-miRNA מתארים את פונקציית ספוג ה-miRNA הפוטנציאלית של ה-circRNA hsa_DE_58. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.

Figure 4
איור 4: תרשים בועות של ניתוח העשרת GO של גנים הוריים מסוג DE circRNA. GeneRatio על ציר x הוא מספר הגנים ברשימת הקלט המשויכים למונח GO נתון המחלק את המספר הכולל של גני הקלט. גודל הנקודה בתרשים מיוצג על ידי ערך הספירה, שהוא מספר הגנים ברשימת הקלט המשויכים למונח GO הנתון. ככל שהנקודות גדולות יותר, כך גדל מספר גני הקלט הקשורים למונח. חוץ מזה, הנקודות בעלילה מקודדות בצבע בהתבסס על ערך p. ערך P מחושב על ידי השוואת התדירות הנצפית של מונח ביאור לתדירות הצפויה במקרה. המונחים הבודדים נחשבים מועשרים מעבר לערך חתך (p-value < 0.01). מעבר הצבע של ערך p הנע בין כחול לאדום מצביע על העשרה מוגברת של המונחים. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.

Figure 5
איור 5: ניתוח העשרת KEGG של גנים הוריים מסוג DE circRNA. GeneRatio על ציר x הוא מספר הגנים ברשימת הקלט המשויכים למונח KEGG נתון המחלק את המספר הכולל של גני הקלט. גודל הנקודה בתרשים מיוצג על ידי ערך הספירה, שהוא מספר הגנים ברשימת הקלט המשויכים למונח KEGG הנתון. ככל שהנקודות גדולות יותר, כך גדל מספר גני הקלט הקשורים למונח. חוץ מזה, הנקודות בעלילה מקודדות בצבע בהתבסס על ערך p. ערך P מחושב על ידי השוואת התדירות הנצפית של מונח ביאור לתדירות הצפויה במקרה. מונחים בודדים נחשבים מועשרים מעבר לערך חתך (ערך p < 0.01). מעבר הצבע של ערך p הנע בין כחול לאדום מצביע על העשרה מוגברת של מונחים. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.

שם לדוגמה נתיב לקובץ GTF פלט CIRIquant קיבוץ
שליטה 1 /path/to/CIRIquant/ctrl1.gtf C
שליטה 2 /path/to/CIRIquant/ctrl2.gtf C
נגוע 1 /path/to/CIRIquant/infect1.gtf T
נגוע 2 /path/to/CIRIquant/infect2.gtf T

טבלה 1: הכנת קובץ .lst של CIRIquant. נתיבי היעד של דגימות הבקרה והדגימות המטופלות מפלט CIRIquant נכתבים בקובץ טקסט כדי להשוות את ביטויי circRNA בין שני סוגי הדגימות.

אנונימי התחלה קצה שם . סטרנד
CHR2 137428930 137433876 hsa_circ_000076 . -
CHR2 154705868 154706632 hsa_circ_000105 . -
CHR2 159104273 159106793 hsa_circ_000118 . -
CHR2 159215701 159226125 hsa_circ_000119 . -
CHR4 39980067 39980129 hsa_circ_002584 . -

טבלה 2: קובץ BED לדוגמה עבור Circr. שש עמודות (Chr, Start, End, Name, Gene ו- Strand) המשויכות ל- circRNA נדרשות כדי ליצור את קובץ ה- BED.

circRNA_name סוג miRNA_name סוג
DE_circRNA_1 circRNA miR-001 miRNA
DE_circRNA_1 circRNA miR-002 miRNA
DE_circRNA_2 circRNA miR-003 miRNA
DE_circRNA_2 circRNA miR-004 miRNA

טבלה 3: קובץ קלט Cytoscape. ארבע עמודות (circRNA_name, סוג, miRNA_name וסוג) נדרשות כדי להיכתב בקובץ טקסט.

CircRNA logFC logCPM ל.ר. ערך דה רוזוולט
chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
chr16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
chr14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

טבלה 4: חלק מקובץ הפלט הסופי (.csv) של CIRIquant. CIRIquant מספק מידע כגון LogFC, ספירת לוגים למיליון (LogCPM), רגרסיה לוגיסטית (LR), ערך p, ביטוי דיפרנציאלי ו- FDR.

תוצאות CIRIquant
סך דה למעלה מטה
35846 306 306 0

טבלה 5: סיכום מספר הרנ"א הכולל והדיפרנציאלי (DE) שזוהה. בסך הכל זוהו 35,846 circRNAs, כאשר 306 הם DE circRNAs. כל 306 ה-DE circRNAs עוברים upregulated (כאשר אף אחד מהם אינו מפוקח כלפי מטה) בדגימות מטופלות בהשוואה לדגימות ביקורת.

Custom_Name Annotation_Status
hsa_DE_22 ללא ביאורים
hsa_DE_2 מוערת
hsa_DE_58 ללא ביאורים
hsa_DE_3 מוערת

טבלה 6: טבלה של שמות עגולים מותאמים אישית עם מצב ביאור. CircRNAs נשאלים במסד נתונים של circRNA מופקד ידוע (circBase). אם ה-circRNA נמצא בתוך מסד הנתונים, הוא מסומן כמבואר, בעוד שהיעדרו של ה-circRNA מסומן כ-non-annoted.

סוג CircRNA פריק אחוז
אנטיסנס 10 3.27%
אקסון 263 85.95%
אינטרגני 16 5.23%
אינטרון 17 5.56%

טבלה 7: סוגי ה-circRNA שזוהו. ניתן לסווג את ה-circRNAs לסוגים שונים של circRNA בהתבסס על אזור הרצף שלהם, כלומר, אקסוני, אינטרוני, אנטיסנס ואינטרגני.

מספר גנים הוריים פריק אחוז
1 261 90%
> 1 29 10%

טבלה 8: אחוז ה-circRNAs עם מספר שונה של גנים מורחבים. CircRNAs מקודדים בדרך כלל מאקסונים של גן אחד, אך CirRNA המשתרע על פני יותר מגן אחד יכול להיות מזוהה גם על ידי CIRIquant.

קובץ משלים 1: סקריפטים המשמשים בפרוטוקול. אנא לחץ כאן כדי להוריד קובץ זה.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

כדי להמחיש את התועלת של פרוטוקול זה, RNA-seq מתאי מקרופאג אנושיים נגועים בנגיף שפעת A שימש כדוגמה. נבדקו סירקרנ"א המתפקדים כספוגי miRNA פוטנציאליים באינטראקציות פונדקאי-פתוגן והעשרה תפקודית של GO ו-KEGG בתוך פונדקאי. למרות שיש מגוון רחב של כלי circRNA זמין באינטרנט, כל אחד מהם הוא חבילה עצמאית שאינה אינטראקציה אחד עם השני. כאן, ריכזנו כמה מהכלים הדרושים לחיזוי וכימות circRNA, העשרה תפקודית circRNA, חיזוי אינטראקציה circRNA-miRNA ובניית רשת ceRNA. פרוטוקול יעיל זה חוסך זמן וניתן ליישם אותו על דגימות קליניות כדי לזהות מועמדים circRNA עם ערכים אבחוניים ופרוגנוסטיים.

בעיקרו של דבר, השתמשנו ב-CIRIquant31, כלי לכימות circRNA ארוז מראש עם CIRI2, שיכול לזהות ולבצע ניתוח DE של circRNAs. DE circRNA מסוננים על בסיס ערך חיתוך של LogFC > |2| ו- FDR < 0.05, המסייע לחסל תוצאות חיוביות שגויות פוטנציאליות בניתוחים במורד הזרם. אפיון ה-circRNA של DE מבחינת סטטוס הביאור, סוגי ה-circRNA ומספר הגנים המורחבים מסייעים בסיווג וסינון נוסף של מועמדים ל-circRNA. לאחר מכן, Circr37, כלי חיזוי circRNA-miRNA, משמש לחיזוי מועמדים פוטנציאליים לספוג miRNA. לאחר ניבוי miRNA פוטנציאליים כמטרות של circRNAs, רשת ceRNA נמשכת. לבסוף, בהתבסס על הגנים ההוריים של circRNAs, חבילת R clusterProfiler39 משמשת לביאור פונקציונלי באמצעות ניתוח העשרת מסלול GO ו- KEGG. תוצאות של GO ו-KEGG עשויות לעזור לפענח את המנגנונים הביולוגיים המושפעים מ-circRNAs.

עד כה, פותחו מספר כלי חיזוי שונים של circRNA, כולל CIRI2 43, CIRCexplorer2 44, find_circ 45, MapSplice 46 ו- UROBORUS 47. במחקר שנערך על ידי Hansen et al., CIRI2 מדווח כבעל ביצועים כלליים גבוהים. זהו בין הכלים הבודדים לזיהוי circRNA שיכולים לתפקד היטב במונחים של חיזוי דה נובו והפחתת זיהוי חיובי כוזב48. CIRIquant, אשר משתמש ב-CIRI2 לזיהוי וכימות circRNA, שימש לפיכך במחקר זה. CIRIquant שימש לספירת הקריאות של צומת ה-splice האחורי (BSJ), ונתוני הספירה נורמלו לקריאות שמופו ל-RNA ליניארי קוגניטיבי ששועתק מאותו גן loci. זה מאפשר כימות של circRNAs בדגימה. כדי לקבוע את הביטוי הדיפרנציאלי של circRNAs על פני תנאי ניסוי, CIRIquant יישמה מודל ליניארי כללי ב- edgeR49 עבור ניתוח DE, ומבחן יחס הקצב המדויק שימש כמבחן סטטיסטי כדי לקבוע את משמעות ההבדל ביחס צומת ה- CirRNA. למרות שניתן להשתמש בכלי כימות circRNA אחרים כגון CIRCexplorer3-CLEAR50 כדי לכמת את רמת הביטוי של circRNAs, כלי זה מאפשר רק כימות circRNA בדגימה מכיוון שהוא סופר את קריאות BSJ בדגימה ומנרמל את נתוני הספירה כנגד ספירת RNA ליניארית קוגניטיבית מאותה דגימה. CIRCexplorer3-CLEAR אינו יכול להשוות ביטויי circRNA בין תנאי ניסוי. יתר על כן, אין כלי ניתוח סטטיסטי מיושם ב- CIRCexplorer3-CLEAR לתמיכה ברמת הביטוי המכומת. למרות שכלי החיזוי circRNA המוגדר כברירת מחדל המיושם ב- CIRIquant הוא CIRI2, ניתן להשתמש בתוצאות החיזוי מכלים אחרים כגון find_circ ו- CIRCexplorer2 גם לכימות וניתוח DE31. בפרוטוקול זה, רק כלי חיזוי אחד של circRNA (CIRI2) שימש לחיזוי, אשר עדיין עשוי להניב מועמדים חיוביים כוזבים ל-circRNA. כדי להפחית תוצאות חיוביות שגויות, ניתן לשלב כלי חיזוי circRNA אחרים לניתוח ולבחור circRNA נפוצים שזוהו בין כלי חיזוי circRNA שונים 48,51. כדי לשפר עוד יותר את זיהוי ה-circRNA, אידיאלי להשתמש במערכי נתונים של ריצוף RNA שהם גם מרוקנים מ-rRNA וגם נתונים לטיפול מקדים ב-RNase R.

בהתאם למטרת המחקר, ניתן לזהות דה נובו ו- DE circRNA מבואר בנפרד בהתבסס על מסד הנתונים circBase52. עם זאת, circRNA המשתרע על יותר מגן אחד דורש לעתים קרובות בדיקה ידנית על UCSC או כל דפדפן גנום אחר כדי לקבוע את האותנטיות של circRNAs ולחסל תוצאות חיוביות שגויות. עם זאת, לאחרונה דווח גם על ציר-רנ"א הכולל יותר מגן אחד, כגון סירק-רנ"א שמקורו בגני היתוך,53,54.

Circr עובד על ידי שילוב של שלושה אלגוריתמים שונים לחיזוי miRNA-mRNA, כלומר TargetScan55, miRanda 56 ו-RNAhybrid57 כדי לחזות את אתרי הקישור של circRNA-miRNA. נוסף על כך, האלגוריתם משלב גם מידע על פסגות AGO ואינטראקציות מאומתות בעבר בניתוח circRNA-miRNA. כאן, הוחלו קריטריוני סינון מחמירים כדי לאפשר חיזוי אמין יותר של circRNA-miRNA, ובכך להפחית עוד יותר את התוצאות החיוביות הכוזבות. עם זאת, ניתן להגדיר את רמת החומרה של שלב סינון זה גבוה או נמוך יותר, בהתאם להעדפת המשתמש.

ClusterProfiler היא חבילת R מתועדת היטב שיכולה לבאר באופן פונקציונלי קבוצות גנים על פני אורגניזמים מגוונים. מלבד הפונקציות בתוך חבילת R clusterProfiler המוזכרות בפרוטוקול זה (enrichGO ו- enrichKEGG), המשתמשות בניתוח ייצוג יתר, ישנן גם פונקציות אחרות כגון gseGO ו- gseKEGG שניתן להשתמש בהן. אם clusterProfiler אינו בחירה מתאימה לזרימת העבודה, ישנם גם כלים וחבילות אחרים כגון "AllEnricher"58 או כלים מבוססי אתר כגון "Metascape"59 שיכולים לבאר באופן פונקציונלי קבוצה של גנים. לבסוף, למרות שהצינור שסופק לעיל מסייע בחיזוי מעגלים פוטנציאליים והביאורים הפונקציונליים שלהם, יהיה צורך באימות מעבדה רטובה כדי לספק ראיות מוצקות.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

למחברים אין מה לחשוף.

Acknowledgments

המחבר רוצה להודות לטאן קה אן ולד"ר קמרון בראקן על ביקורתם על כתב היד הזה. עבודה זו נתמכה על ידי מענקים מתוכנית מענקי מחקר בסיסית (FRGS/1/2020/SKK0/UM/02/15) ומענק מחקר בעל השפעה גבוהה באוניברסיטת מלאיה (UM. ג/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Retraction גיליון 188 RNA מעגלי circRNA אינטראקציה מארח-פתוגן
<em>ב Silico</em> זיהוי ואפיון של circRNAs במהלך אינטראקציות פונדקאי-פתוגן
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter