Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

מדריך לניתוח חישובי עבור Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries

Published: December 1, 2023 doi: 10.3791/65779

Summary

כאן, אנו מציגים פרוטוקול המדגים התקנה ושימוש בצנרת ביואינפורמטיקה לניתוח נתוני ריצוף RNA כימריים המשמשים במחקר אינטראקציות in vivo RNA:RNA.

Abstract

הבנה של אינטראקציות הבקרה של גנים in vivo של רנ"א קטן שאינו מקודד (sncRNAs), כגון מיקרו-רנ"א (miRNAs), עם רנ"א המטרה שלהם קודמה בשנים האחרונות על ידי גישות ביוכימיות המשתמשות בקישור צולב ואחריו קשירה כדי ללכוד אינטראקציות sncRNA:מטרת RNA באמצעות יצירת RNA כימרי וספריות ריצוף עוקבות. בעוד שמערכי נתונים מריצוף RNA כימרי מספקים קלט כלל גנומי והרבה פחות מעורפל מאשר תוכנת חיזוי miRNA, זיקוק נתונים אלה למידע משמעותי ובר ביצוע דורש ניתוחים נוספים ועשוי להניא חוקרים חסרי רקע חישובי. דוח זה מספק ערכת לימוד לתמיכה בביולוגים חישוביים ברמה התחלתית בהתקנה ויישום של כלי תוכנה עדכני בקוד פתוח: Small Chimeric RNA Analysis Pipeline (SCRAP). דרישות פלטפורמה, עדכונים והסבר על שלבי צינור ומניפולציה של משתני קלט משתמש מרכזיים מסופקים. הפחתת מחסום עבור ביולוגים כדי לקבל תובנות מגישות ריצוף RNA כימרי יש פוטנציאל קרש קפיצה חקירות מבוססות גילוי של sncRNA רגולטורי: אינטראקציות RNA מטרה בהקשרים ביולוגיים מרובים.

Introduction

רנ"א קטן שאינו מקודד נחקר רבות בשל תפקידיו שלאחר השעתוק בתיאום ביטוי מחבילות גנים בתהליכים מגוונים כגון התמיינות והתפתחות, עיבוד אותות ומחלות 1,2,3. היכולת לקבוע במדויק את תעתיקי המטרה של RNA קטן שאינו מקודד (sncRNAs), כולל מיקרו-רנ"א (miRNAs), היא בעלת חשיבות למחקרים של ביולוגיה של RNA הן ברמה הבסיסית והן ברמת התרגום. אלגוריתמים ביואינפורמטיים המנצלים את המשלימות הצפויה בין רצף זרעי ה-miRNA לבין המטרות הפוטנציאליות שלו שימשו לעתים קרובות לחיזוי אינטראקציות miRNA:target RNA. בעוד אלגוריתמים ביואינפורמטיים אלה הצליחו, הם יכולים גם להכיל תוצאות חיוביות כוזבות ושליליות כוזבות, כפי שנסקר במקומות אחרים 4,5,6. לאחרונה, מספר גישות ביוכימיות תוכננו ויושמו המאפשרות קביעה חד משמעית וכמותית למחצה של אינטראקציות in vivo sncRNA:target RNA על ידי הצלבה in vivo ושילוב של שלב קשירה לחיבור פיזי של sncRNA למטרה שלו ליצירת RNA כימרי יחיד 4,5,7,8,9,10 . הכנה עוקבת של ספריות ריצוף מהרנ"א הכימרי מאפשרת הערכה של אינטראקציות sncRNA:target RNA על ידי עיבוד חישובי של נתוני הריצוף. סרטון וידאו זה מספק הדרכה להתקנה ושימוש בצנרת חישובית המכונה Small Chimeric RNA Analysis Pipeline (SCRAP), אשר נועדה לאפשר ניתוח חזק וניתן לשחזור של sncRNA:אינטראקציות RNA מטרה מספריות ריצוף RNA כימריות6.

מטרת מדריך זה היא לסייע לחוקרים להימנע מהסתמכות מוגזמת על אלגוריתמים ביואינפורמטיים מנבאים גרידא על ידי הורדת מחסומים לניתוח נתונים המופקים באמצעות גישות ביוכימיות המספקות קריאות מולקולריות כימריות של אינטראקציות sncRNA:target RNA. מדריך זה מספק צעדים מעשיים וטיפים להנחיית מדענים חישוביים ברמה התחלתית באמצעות שימוש בצנרת, SCRAP, שפותחה לניתוח נתוני ריצוף RNA כימריים, אשר ניתן להפיק על ידי מספר פרוטוקולים ביוכימיים קיימים, כולל crosslinking, קשירה, וריצוף של היברידים (CLASH) וקשירה קוולנטית של RNA אנדוגני הקשור לארגונאוט - crosslinking ומשקעים חיסוניים (CLEAR-CLIP)7,9.

השימוש בגרוטאות מציע מספר יתרונות לניתוח נתוני ריצוף RNA כימריים, בהשוואה לצנרת חישובית אחרת6. יתרון בולט אחד הוא הביאור הנרחב שלה ושילוב של קריאות לסקריפטים ביואינפורמטיים נתמכים היטב ומתעדכנים באופן שגרתי בתוך הצינור, בהשוואה לצינורות חלופיים שלעתים קרובות מסתמכים על סקריפטים מותאמים אישית ו / או לא נתמכים עבור שלבים בצנרת. תכונה זו מעניקה יציבות לגרוטאות, מה שהופך את זה לכדאי יותר עבור חוקרים להכיר את הצינור ולשלב את השימוש בו בזרימת העבודה שלהם. SCRAP הוכח גם כעולה בביצועיו על צינורות חלופיים בקריאת שיאים של אינטראקציות sncRNA:target RNA ושיש לו פונקציונליות חוצת פלטפורמות, כמפורט בפרסום קודם6.

בסוף ערכת לימוד זו, המשתמשים יוכלו (i) לדעת את דרישות הפלטפורמה עבור SCRAP ולהתקין צינורות SCRAP, (ii) להתקין גנומי ייחוס ולהגדיר פרמטרים של שורת פקודה עבור SCRAP, וכן (iii) להבין קריטריונים של שיחות שיא ולבצע קריטריוני שיא וביאור שיא.

סרטון זה יתאר בפירוט מעשי כיצד חוקרים החוקרים ביולוגיה של רנ"א עשויים להתקין ולהשתמש באופן אופטימלי בצנרת החישובית, SCRAP, כדי לנתח אינטראקציות sncRNA עם רנ"א מטרה, כגון רנ"א שליח, בנתוני ריצוף RNA כימריים המתקבלים באמצעות אחת הגישות הביוכימיות הנדונות להכנת ספריית ריצוף.

SCRAP הוא כלי שורת פקודה. באופן כללי, בהתאם למדריך שלהלן, המשתמש יצטרך (i) להוריד ולהתקין SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) להתקין גנומי ייחוס ולהריץ SCRAP, וכן (iii) לבצע קריאות שיא וביאור.

פרטים נוספים על השלבים החישוביים בהליך זה ניתן למצוא בכתובת https://github.com/Meffert-Lab/SCRAP. מאמר זה יספק את ההגדרה ואת מידע הרקע כדי לאפשר לחוקרים עם מיומנויות חישוביות ברמה התחלתית להתקין, לייעל ולהשתמש בגרוטאות על ערכות נתונים של ספריית ריצוף RNA כימרי.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

הערה: הפרוטוקול יתחיל בהורדה והתקנה של תוכנה הנדרשת לניתוח ספריות ריצוף RNA כימריות באמצעות SCRAP.

1. התקנה

  1. לפני התקנת SCRAP, התקן את יחסי התלות Git ו- Miniconda במחשב שישמשו לניתוחים. סביר להניח ש-Git כבר מותקן. בפלטפורמת Mac OSX, לדוגמה, ודא זאת באמצעות איזה git כדי לראות שכלי השירות " git " קיים ומותקן בספריה זו. בדוק אם מיניקונדה מותקנת באמצעות איזו קונדה. אם לא מוחזר דבר, התקן את Miniconda. התקנת Miniconda דורשת שטח דיסק של 400 MB.
    1. ישנן מספר שיטות להתקנת מיניקונדה, והן נבדלות זו מזו לפי פלטפורמה. עיין בקובץ הסימון PLATFORM-SETUP במאגר Meffert Lab GitHub [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] שבו יש הוראות נוספות להתקנה ב-Windows, MacOS ו-Ubuntu. עבור משתמשי לינוקס, ללינוקס יש מנהל חבילות ברירת מחדל משלה (apt). במקרה הספציפי למחקר זה, השתמש בפקודה לחלוט להתקין את Miniconda כדי להתקין את Miniconda באמצעות מנהל חבילות קיים, לחלוט.
      הערה: 'Homebrew', המכונה 'brew' היא מערכת קוד פתוח לניהול חבילות תוכנה המפשטת את התקנת התוכנה במערכת ההפעלה של Apple, macOS.
    2. אם קונדה מותקנת בפעם הראשונה, הפעל conda init עבור המעטפת המסוימת שבשימוש. בדוגמה כאן, הקליפה בשימוש היא zsh. לאחר מכן, סגור ופתח מחדש את הקליפה. אם קונדה הותקנה בהצלחה, סביבת הבסיס שהופעלה במהלך הפעלת המסוף תיראה.
  2. הורד את מקור הגרוטאות והתקן את יחסי התלות שלו.
    1. השיטה המועדפת להשגת מקור SCRAP היא באמצעות Git. גש לזה על ידי הפעלת https://github.com/Meffert-Lab/SCRAP שיבוט git כדי להשיג את העותק העדכני ביותר של קוד המקור.
    2. התקן את mamba, פותר חבילות משופר עבור conda, והתקן את כל יחסי התלות עבור SCRAP מ- SCRAP_environment.yml לסביבת Conda משלו באמצעות הפקודות הבאות:
      Conda להתקין -n בסיס Conda-Forge::mamba
      mamba env ליצור -f SCRAP/SCRAP_environment.yml -n גרוטאות
  3. לאחר מכן, הפעל את התקנת ההפניה עבור SCRAP. הטיעונים המשמשים במתקן הייחוס יהיו ספציפיים לאורגניזם שאינטראקציות sncRNA-mRNA שלו מנותחות.
    bash גרוטאות/פח/Reference_Installation.sh -r מלא/נתיב/אל/גרוטאות/ -m יש -g hg38 -s אנושי
    1. ספק את הספרייה של תיקיית המקור של SCRAP להתקנת חומר עזר. לאחר מכן שלבי ההתקנה יבוצעו באמצעות הקבצים שבתיקיות fasta ו-annotation. פרט את הנתיב המלא ללא כל קיצור דרך. נסיים בלוכסן.
    2. עיין בטבלאות ב- README.md לקבלת הקיצורים הנכונים של מיני miRbase. גנומי הייחוס העדכניים נמצאים https://genome.ucsc.edu/ או https://www.ncbi.nlm.nih.gov/data-hub/genome/. בדוגמה זו, hg38 ישמש עבור הגנום GRCm38 של העכבר.
    3. המינים הכלולים כיום לביאור הם אדם, עכבר ותולעת. הצג את הקבצים המתאימים species.annotation.bed בספריית ההערות בתיקיית המקור SCRAP. אם רוצים להשתמש במין אחר לניתוח, ספק קובץ annotation.bed שעוקב אחר אותה ערכת שמות species.annotation.bed.

2. הפעלת גרוטאות

  1. כעת, לאחר התקנת יחסי התלות וה- SCRAP, - הפעל את קובץ ה- Script SCRAP.sh
    bash גרוטאות/פח/SCRAP.sh -d מלא/נתיב/אל/CLASH_Human/ -a מלא/נתיב/אל/CLASH_Human/CLASH_Human_Adapters.txt -p לא -f כן -r מלא/נתיב/אל/גרוטאות/ -m יש -g hg38
    1. פרט את כל הנתיב לספריות לדוגמה ללא כל קיצור דרך. עצב את הספריות לדוגמה עם שם התיקיה התואם בדיוק לשם הדגימה, כפי שמוצג באיור 1.
    2. שים לב שהנתיב המפורט הוא הנתיב לספריה המכילה את כל התיקיות לדוגמה, ולא הנתיב לתיקיית דוגמה בודדת או לקובץ לדוגמה (עיין בשורת הפקודה בשלב 2.1).
    3. לאחר מכן, רשום את כל הנתיב לקובץ המתאם. ודא שהשמות לדוגמה בקובץ המתאם תואמים לשמות התיקיות ולשמות הקבצים שהוזכרו קודם לכן (עיין בשורת הפקודה בשלב 2.1).
    4. ציין אם הדגימות מזווגות-קצה והאם יבוצע סינון עבור pre-miRNA ו/או tRNA. הוסף מסנן לניקוי rRNA במידת הצורך (עיין בשורת הפקודה בשלב 2.1).
      הערה: ייתכן שהמשתמשים יחליטו או לא יחליטו להשתמש במסננים אלה בהתאם לסוגי הדגימות ולמטרות הניסוי. בהתאם לתכנון הניסוי, קדם-miRNAs, tRNA ו-rRNA יכולים לצרוך עומק ריצוף זמין עבור כימרות sncRNA אמיתיות, ומשתמשים יכולים להשתמש במסננים כדי להוציא אותם. עם זאת, ייתכן שמשתמשים ירצו להימנע מסינון כזה בנסיבות מסוימות (למשל, מיפוי מטרות sncRNA לגנום המיטוכונדריאלי, המכיל rRNA מיטוכונדריאלי).
    5. לאחר מכן, פרט את כל הנתיב לספריית הייחוס, את קיצור miRbase ואת קיצור גנום הייחוס (עיין בשורת הפקודה בשלב 2.1).
      הערה: השלמת קובץ ה-script עשויה להימשך מספר שעות, בהתאם לגודל ערכת הנתונים ול-CPU של המחשב שבו נעשה שימוש.

3. שיא השיחות והביאור

  1. לאחר סיום הפעלת הגרוטאות, ודא שהפלט כולל, בין קבצים אחרים, קובץ SAMPLE.aligned.unique.bam. זהו קובץ בינארי המכיל יישור של רנ"א מטרה על גנום הייחוס שסופק על ידי המשתמש.
  2. כעת בצע שיחות שיא על-ידי הפעלת Peak_Calling.sh.
    באש גרוטאות/פח/Peak_Calling.sh -ד CLASH_Human/ -א CLASH_Human/CLASH_Human_Adapters.txt -ג 3 -l 2 -f לא -r גרוטאות/ -m יש -g hg38
    הערה: Peak calling היא תכונה של SCRAP, אשר נועדה לאפשר לחוקרים להעריך בקלות את האינטראקציות החזקות והניתנות לשחזור ביותר של RNA קטן שאינו מקודד: אינטראקציות RNA מטרה בתוך ספריות הרנ"א הכימריות שלהם. תכונה זו, למשל, יכולה לסייע לחוקרים לזהות אינטראקציות שהם עשויים לרצות לבחור לצורך חקירה נוספת. שלב 3.2.2 להלן מתאר כיצד המשתמש מגדיר את הקריטריונים שבהם הוא רוצה להשתמש כדי להגדיר את החומרה שבה נקרא שיא - זה כולל את מספר האינטראקציות הייחודיות, או קריאות רצף, שהתרחשו כדי שהשיא ייקרא, כמו גם את מספר הספריות שבהן אינטראקציה מסוימת זו חייבת להתרחש.
    1. שוב, פרט את הנתיבים המלאים לספריה המכילה את התיקיות לדוגמה ואת קובץ המתאם (עיין בשורת הפקודה בשלב 3.2).
    2. לאחר מכן, הגדר את המספר המינימלי של קריאות רצף הדרושות כדי לקרוא לשיא (עיין בשורת הפקודה בשלב 3.2).
    3. הגדר את המספר המינימלי של ספריות רצף נפרדות שחייבות להכיל שיא כדי שניתן יהיה לקרוא להן (עיין בשורת הפקודה בשלב 3.2).
      הערה: בחירת הערכים הן עבור 3.2.2 והן עבור 3.2.3 תהיה תלויה באופי הדגימות שרוצפו ובמספר הדגימות או סוגי הדגימות. כאן, נדרשות לפחות 3 קריאות ריצוף כימרי במדגם כדי לקרוא לשיא, והשיא חייב להיות נתמך על ידי לפחות 2 דגימות. חוקר המעריך מערך נתונים שבו יש ספריית רצף רבים משוכפלים עבור תנאי נתון, למשל, עשוי להחליט לדרוש את נוכחות הקריאות במספר גדול יותר של ספריות רצף לדוגמה.
    4. ציין אם sncRNA מאותה משפחה חייב לתרום לאותו שיא. לדוגמה, מאחר ש-miRNA מאותה משפחה חולק רצפי זרעים, miRNA אלה יכולים לקשור קבוצות משותפות וחופפות של מטרות גנים; ייתכן שמשתמש ירצה לזהות את ההשפעה המלאה של משפחה על יעדים אלה על-ידי הערכת הפסגות הקולקטיביות שלהם (עיין בשורת הפקודה בשלב 3.2).
    5. לאחר מכן, ציין את הנתיב המלא לספריית הייחוס, את קיצור miRBase ואת קיצור גנום הייחוס (עיין בשורת הפקודה בשלב 3.2).
  3. לאחר השלמת ביצוע שיחות שיא, הפעל ביאור שיא.
    bash גרוטאות/פח/Peak_Annotation.sh -p CLASH_Human/peaks.bed -r גרוטאות/ -s אנושי
    1. פרט את הנתיב המלא לקובץ peaks.bed (או peaks.family.bed) שנוצר מתוך peak calling, את הנתיב המלא לספריית ההפניות ואת המינים הרצויים לביאור.

4. ויזואליזציה של הנתונים

הערה: כל השלבים לניתוח באמצעות גרוטאות הושלמו כעת. להצגה חזותית של הנתונים, מומלץ מספר גישות:

  1. מזג את כל קבצי ה- .bam (קובץ SAM בינארי) שירצו להמחיש יחד (מיזוג samtools).
  2. מיין את קובץ ה- .bam הממוזג שנוצר (מיון samtools). תוכן הקובץ ממוין שורה אחר שורה כך ש- samtools עשוי ליצור אינדקס.
  3. צור אינדקס של קובץ ה- .bam הממוין (אינדקס samtools). קובץ BAI (אינדקס פורמט samtools בינארי) נוצר כדי לאפשר ויזואליזציה במציג הגנומיקה האינטגרטיבית (IGV).
  4. לבסוף, פתח את קובץ ה- .bam וה- .bai הממוין שנוצר ב- IGV.
    הערה: SncRNA: אינטראקציות RNA יעד מעניינות עשויות לקבל עדיפות למעקב במספר דרכים ספציפיות לחקירה. גישה ראשונית גנרית אחת היא להעריך את האינטראקציות שעבורן הפסגות נתמכות על ידי קריאות הריצוף הכימריות ביותר. ניתן גם להמחיש אינטראקציות מעניינות באמצעות שרת האינטרנט DuplexFold מחבילת RNAstructure על ידי הזנת הרצף הן עבור sncRNA והן עבור RNA המטרה מהאינטראקציה שזוהתה11. עבור כל שיא, הכרומוזום (עמודה ראשונה) והקואורדינטות הגנומיות (התחלה: סוף עמודה ראשונה: עמודה שנייה) נמצאים בתוך קובץ peaks.bed.species.annotation.txt שנוצר בביאור שיא. עבור miRNA בפרט, בעוד אינטראקציות ניתנות לשחזור ופונקציונליות יכולות להיות חסרות קישור תואם זרעים נרחב (למשל, אינטראקציות עשויות להשתמש בקשירה מפצה של 3'), נוכחותם של אתרים תואמי זרעים במוטיב קישור קוגניטיבי של רנ"א המטרה יכולה בכל זאת להיות מוערכת כתכונה מאמתת של אינטראקציות שזוהו בעלות חשיבות תפקודית 4,12. עיבוד נתונים נלווים יכול לכלול השוואות של כיסוי קריאה דיפרנציאלי בין שיאים בתנאים ביולוגיים שונים והערכה פוטנציאלית של אשכולות של גנים מוסדרים למסלולים באמצעות כלי ניתוח מסלולים.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

תוצאות עבור sncRNA: רנ"א מטרה שזוהה על-ידי גרסה שונה של SCRAP (SCRAP release 2.0, המיישמת שינויים עבור סינון rRNA) בערכות נתוני ריצוף שפורסמו בעבר שהוכנו באמצעות CLEAR-CLIP9 מוצגות באיור 2 ובטבלה 1. משתמשים יכולים להעריך את הירידה באינטראקציות miRNA של שבר יחסי עם אזורי אינטרון המתרחשת בעקבות בידוד של אינטראקציות ברמת ביטחון גבוהה על ידי קריאת שיא בגרוטאות. נתונים נוספים מניתוחים באמצעות SCRAP זמינים גם בפרסום הראשוני של צינור זה6. בהתאם לגישה הניסויית, סינון של נתוני ריצוף מספריות RNA כימריות מוכנות עשוי להידרש כדי להפחית ממצאים בתוצאות. הכנה ביוכימית תת-אופטימלית של ספריית הריצוף ו/או סינון תת-אופטימלי של נתוני הריצוף עלולים לגרום להכללה שגויה של קריאות שלא נבעו מקשירת sncRNA ורנ"א מטרה הקשורים לארגונאוט. קריאות מלאכותיות אלה יכולות לכלול דימרים פריימר או דימרים של מתאמים, rRNA וקדם-miRNA. טבלה 2 מתארת ממצאים אפשריים שעשויים להתגלות בתוצאות, ופתרונות אפשריים.

Figure 1
איור 1: עיצוב עבור ספריות נתונים. יש לספק קבצים הכוללים קריאות גולמיות לכל ספריית רצף בתבנית .fastq.gz. (A) אם הספריות אינן משויכות, קובץ .fastq.gz יחיד ישמש לניתוח. קובץ זה צריך להיקרא 'SAMPLE.fastq.gz' כאשר SAMPLE הוא שם הדגימה המדויק שסופק על-ידי המשתמש בקובץ המתאם. הקובץ צריך להיכלל בתוך תיקייה התואמת בדיוק לשם המדגם. (ב) עבור ספריות רצף זוגיות, ייעשה שימוש בשני קבצי .fastq.gz. קבצים אלה צריכים להיקרא 'SAMPLE-R1.fastq.gz' ו- 'SAMPLE-R2.fastq.gz' ולהיות ממוקמים בתוך תיקיה התואמת בדיוק לשם המדגם. כל הספריות הללו בשם SAMPLE צריכות להיות ממוקמות באותה ספריית אב, שהמשתמש יספק ל- SCRAP כ"ספריית לדוגמה". אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.

Figure 2
איור 2: שיעור miRNA: אינטראקציות RNA מטרה לפי סוג יעד ושיטות שיא קריאה. Chimeric sncRNA:ריצוף RNA מטרה נתונים שפורסמו מספריות שהוכנו באמצעות CLEAR-CLIP (SRR2413277 - SRR2413295)9 נותחו באמצעות גרסה שונה של SCRAP (SCRAP release 2.0) עם סינון rRNA מיושם. טרום-miRNAs, tRNA ו-rRNA סוננו, והגדרות שיא שיחות נפרדות שימשו עבור "ביטחון גבוה" (מינימום 3 קריאות ו-2 ספריות) ו"כל האינטראקציות" (מינימום קריאה אחת וספרייה אחת). האינטראקציות קובצו לפי משפחת miRNA או לא מקובצות. שברים יחסיים של קריאות RNA כימרי עבור הקטגוריות (CDS, 5' UTR, intergenic, intron, 3'UTR) חושבו ועברו גרפים. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.

כל האינטראקציות אינטראקציות בביטחון גבוה
miRNA בודדים משפחות miRNA miRNA בודדים משפחות miRNA
תקליטורים 8675 8679 925 1046
5' UTR 338 338 38 43
אינטרגני 2230 2230 320 339
אינטרון 9522 9519 382 406
3' UTR 6814 6813 548 644
סה"כ אינטראקציות: 31033 31034 4219 4597

טבלה 1: קריאה כימרית ספירות של miRNA:אינטראקציות RNA מטרה לפי סוג יעד ושיטת קריאת שיא. Chimeric sncRNA: נתוני ריצוף RNA מטרה שפורסמו מספריות שהוכנו באמצעות CLEAR-CLIP (SRR2413277 - SRR2413295)9 נותחו באמצעות גרסה שונה של SCRAP (SCRAP release 2.0) עם סינון rRNA מיושם. טרום-miRNAs, tRNA ו-rRNA סוננו, והגדרות שיא שיחות נפרדות שימשו לביטחון גבוה (מינימום 3 קריאות ו-2 ספריות) ולכל האינטראקציות (מינימום קריאה 1 וספרייה אחת), מקובצות לפי משפחת miRNA או לא מקובצות. עבור כל תנאי, מפורטות ספירות של סך כל אינטראקציות miRNA שזוהו: אינטראקציות RNA מטרה שבהן אינטראקציית RNA המטרה מופתה לקטגוריה של רצף קידוד (CDS), אזור לא מתורגם 5' (5' UTR), אזור אינטרגני, אינטרון או אזור לא מתורגם 3' (3'UTR).

מזהם פוטנציאלי זוהה כ גורם פתרונות אפשריים
פריימר דימרים אינטראקציות שזוהו בין miRNA שהרצף שלו תואם לקצה 5' של פריימר הגברה לבין רנ"א מטרה שהרצף שלו תואם את שאר הפריימר. הפרדת גודל לא נכונה (כלומר מיצוי ג'ל) של מוצר PCR לאחר הגברה. רוב דימרים פריימר יתעלמו על ידי גרוטאות לאחר הסרת המתאם בשל אורכם הקטן. אם הם נמשכים, שקול להוסיף רצפי פריימר למסנן.
rRNAs אינטראקציות בין miRNA שרירותי לבין rRNA ידועים או lncRNAs Gm26917 ו- Gm42418 בידוד לא יעיל (כלומר משקעים חיסוניים והפרדת ג'ל) של מתחמי ארגונאוט. סינון rRNA נחוץ לעתים קרובות כאשר זיהום rRNA הוא בשפע.
tRNA ו-pre-miRNA אינטראקציות בין מקטעי tRNA שהם תוצרי פירוק של אותו tRNA או miRNA 5p ו-3p המיוצרים מאותו pre-miRNA. שפע נמוך של sncRNA אמיתי: כימרות RNA מטרה או ביטוי ארגונאוט רקמות נמוך. סינון tRNA וסינון pre-miRNA.

טבלה 2: קריאות ופתרונות ריצוף מזהמים פוטנציאליים.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

פרוטוקול זה על השימוש בצנרת SCRAP לניתוח אינטראקציות sncRNA:target RNA נועד לסייע לחוקרים הנכנסים לניתוח חישובי. השלמת המדריך צפויה להנחות חוקרים בעלי ניסיון חישובי ברמה התחלתית ומעלה בשלבים הנדרשים להתקנה ושימוש בצנרת זו ויישומה לניתוח נתונים המתקבלים מספריות ריצוף RNA כימריות. השלבים הקריטיים להשלמת פרוטוקול זה כוללים התקנה נכונה של הפניות והפעלה של SCRAP, שיכולות להיות גוזלות זמן רב ויכולות להיות מקור לשגיאות, במיוחד אם לא ננקטה זהירות במהלך ההתקנה של יחסי תלות באמצעות אנקונדה או הקלדת ארגומנטים של שורת הפקודה.

כאן, ההתמקדות המיוחדת הייתה בטיפים וצעדים לשימוש מעשי בצנרת SCRAP לניתוח ספריות ריצוף כימריות sncRNA:target RNA. נמצא כי SCRAP עולה בביצועיו על פלטפורמות ניתוח RNA כימריות אחרות בזיהוי אינטראקציות sncRNA:target RNA 6,13. ייתכן שהסיבה לכך היא תכונת קריאת השיא של גרוטאות שפותחה במיוחד כדי לזהות את התכונות (למשל כתף 3 אינץ') שנצפו כתוצאה מצעדים ביוכימיים המעורבים ביצירת הרנ"א הכימרי. שיטות אחרות לקריאת שיא עבור גישות ביוכימיות שונות, כגון במורד הזרם של יישומי ריצוף משקעים חיסוניים של כרומטין (CHIP-seq), פותחו כדי לזהות שיאים בנתונים המפוזרים באופן סימטרי סביב ממוצע ובדרך כלל אינם מתפקדים היטב בזיהוי תכונות השיא של ספריות sncRNA כימריות: מטרות RNA. עם זאת, משתמשים עשויים לרצות לבדוק את השימוש בצינורות חישוביים אחרים שיכולים לעבוד טוב יותר עבור הצרכים שלהם, במיוחד אם הנתונים שלהם אינם מתאימים לתיאור זה.

בעוד של- SCRAP יש דרישות חומרה מינימליות, זמן הריצה של SCRAP משתנה בצורה גרועה עם גודל ערכת הנתונים. חוקרים שהם מעבר לרמת טירון, או שיש להם מספר רב של מערכי נתונים או מערכי נתונים עם כיסוי רצף גבוה, עשויים לרצות להשתמש בגרוטאות באופן שיכול להאיץ את שלבי הניתוח. מאחר שערכות נתונים גדולות (בדרך כלל, > מיליארד קריאות) דורשות יכולות אחסון קבצים משופרות ומהירויות קריאה/כתיבה עבור נתונים, הפעלת SCRAP באשכול מחשוב עתיר ביצועים (HPC) עשויה להיות רצויה לצורך ניתוח של ערכות נתונים גדולות יותר. מיטוב גרוטאות, שאמור לספק מקביליות וביצועים משופרים יהיה זמין ב- GitHub (https://github.com/Meffert-Lab/). גרסה מעודכנת זו של SCRAP (מהדורה 2.0) כוללת גם מסננים משופרים עבור rRNA ומזהמים אחרים.

כמו בכל ממשק, משתמשים עשויים להיתקל בהכרח בקשיים בעת שימוש בממשק שורת הפקודה. הנפוצים שבהם כוללים שגיאות איות, נתיבים שגויים והתקנה/ניהול גירסאות של חבילות. מומלץ לחוקרים לנקוט משנה זהירות ולהימנע משגיאות הקלדה בעת כתיבת טיעונים בשורת הפקודה ולשכפל נתיבים לקבצים או תיקיות בדיוק (שימוש בהשלמה אוטומטית של 'כרטיסייה' יכול לעזור בכך). יחסי תלות בגרוטאות מנוהלים באמצעות אנקונדה, כך שהחוקרים נוטים פחות להיתקל בבעיות בהתקנת חבילות או עדכוני גרסה.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

למחברים אין מה לחשוף.

Acknowledgments

אנו מודים לחברי מעבדת Meffert על דיונים מועילים, כולל BH Powell ו- WT Mills IV, על משוב קריטי על תיאור ההתקנה והיישום של הצינור. עבודה זו נתמכה על ידי פרס קרן בראודה, תוכנית ההשקה של קרן המחקר של תאי גזע במרילנד, פרס קרן בלאושטיין לחקר כאב וחינוך, ו- NINDS RO1NS103974 ו- NIMH RO1MH129292 ל- M.K.M.

Materials

Name Company Catalog Number Comments
Genomes UCSC Genome browser N/A https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux Linux Ubuntu 20.04 or 22.04 LTS recommended
Mac Apple Mac OSX (>11)
Platform setup GitHub N/A https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline GitHub N/A https://github.com/Meffert-Lab/SCRAP
Unix shell Unix operating system bash >=5.0
Unix shell Unix operating system zsh (5.9 recommended)
Windows Windows WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

  1. Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
  2. Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
  3. Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
  4. Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
  5. Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
  6. Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
  7. Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
  8. Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
  9. Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
  10. Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
  11. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
  12. Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
  13. Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Tags

החודש ב-JoVE גיליון 202
מדריך לניתוח חישובי עבור Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Eadara, S., Li, X., Eiss, E. A.,More

Eadara, S., Li, X., Eiss, E. A., Meffert, M. K. Computational Analysis Tutorial for Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries. J. Vis. Exp. (202), e65779, doi:10.3791/65779 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter