Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

De novo זיהוי של מסגרות קריאה פתוחות בתרגום פעיל עם נתוני יצירת פרופילים של ריבוזום

Published: February 18, 2022 doi: 10.3791/63366
* These authors contributed equally

Summary

תרגום ריבוזומים מפענח שלושה נוקלאוטידים לכל קודון לפפטידים. תנועתם לאורך mRNA, שנתפסה על ידי פרופיל ריבוזום, מייצרת את העקבות המציגות תקופת שלישייה אופיינית. פרוטוקול זה מתאר כיצד להשתמש RiboCode כדי לפענח תכונה בולטת זו מנתוני פרופיל ריבוזום כדי לזהות מסגרות קריאה פתוחות בתרגום פעיל ברמת התמלול המלא.

Abstract

זיהוי של מסגרות קריאה פתוחות (ORFs), במיוחד אלה קידוד פפטידים קטנים ותרגום פעיל תחת הקשרים פיזיולוגיים ספציפיים, הוא קריטי לביאורים מקיפים של תרגומים תלויי הקשר. פרופיל ריבוזום, טכניקה לזיהוי מיקומים וצפיפות מחייבים של תרגום ריבוזומים ב- RNA, מציע שדרה לגלות במהירות היכן מתרחש תרגום בקנה מידה רחב של הגנום. עם זאת, זה לא משימה טריוויאלית בביואינפורמטיקה לזהות ביעילות ובאופן מקיף את ORFs תרגום עבור פרופיל ריבוזום. מתואר כאן היא חבילה קלה לשימוש, בשם RiboCode, שנועדה לחפש תרגום פעיל ORFs בכל גודל מאותות מעוותים ודו-משמעיים בנתוני פרופיל ריבוזום. אם ניקח את ערכת הנתונים שפורסמה בעבר כדוגמה, מאמר זה מספק הוראות שלב אחר שלב עבור צינור RiboCode כולו, מעיבוד מראש של הנתונים הגולמיים ועד לפרשנות של קבצי תוצאות הפלט הסופיים. יתר על כן, להערכת שיעורי התרגום של ORFs המובאים, הליכים להדמיה וכימות של צפיפות ריבוזום על כל ORF מתוארים גם בפירוט. לסיכום, המאמר הנוכחי הוא הוראה שימושית ומתוזמנת לתחומי המחקר הקשורים לתרגום, ORFs קטנים ופפטידים.

Introduction

לאחרונה, גוף גדל והולך של מחקרים חשף ייצור נרחב של פפטידים שתורגמו מ ORFs של גנים קידוד ואת הגנים ביאורים בעבר כמו noncoding, כגון ארוך noncoding RNAs (lncRNAs)1,2,2,3,4,5,6,7,8. ORFs מתורגמים אלה מוסדרים או מושרים על ידי תאים כדי להגיב לשינויים סביבתיים, מתח, ובידול תאים1,8,9,10,11,12,13. מוצרי התרגום של כמה ORFs הוכחו לשחק תפקידים רגולטוריים חשובים בתהליכים ביולוגיים מגוונים בפיתוח ופיזיולוגיה. לדוגמה, Chng et al.14 גילה הורמון פפטיד בשם Elabela (אלה, הידוע גם בשם Apela / Ende / פעוט), אשר קריטי להתפתחות הלב וכלי הדם. פאולי ואח ' הציע כי אלה פועלת גם כמיטוגן המקדם נדידת תאים בעובר הדגים המוקדם15. Magny et al. דיווח על שני micropeptides של פחות מ 30 חומצות אמינו ויסות הובלת סידן ומשפיע על התכווצות שרירים רגילה בלב Drosophila10.

עדיין לא ברור כמה פפטידים כאלה מקודדים על ידי הגנום והאם הם רלוונטיים ביולוגית. לכן, זיהוי שיטתי של ORFs אלה קידוד פוטנציאלי רצוי מאוד. עם זאת, קביעה ישירה של המוצרים של ORFs אלה (כלומר, חלבון או פפטיד) באמצעות גישות מסורתיות כגון שימור אבולוציוני16,17 וספקטרומטריית מסה18,19 היא מאתגרת מכיוון שיעילות הזיהוי של שתי הגישות תלויה באורך, בשפע ובהרכב חומצות האמינו של החלבונים או הפפטידים המיוצרים. הופעתו של פרופיל ריבוזום, טכניקה לזיהוי התפוסה ריבוזום על mRNAs ברזולוציה נוקלאוטיד, סיפקה דרך מדויקת להעריך את פוטנציאל הקידוד של תמלילים שונים3,20,21, ללא קשר לאורכם ולהרכבם. תכונה חשובה ומשמשת לעתים קרובות לזיהוי תרגום פעיל של ORFs באמצעות פרופיל ריבוזום היא תקופת שלושת הנוקלאוטידים (3-nt) של עקבות הריבוזום על mRNA מהקודון ההתחלה ועד קודון העצירה. עם זאת, נתוני פרופיל ריבוזום לעתים קרובות יש מספר בעיות, כולל קריאות רצף נמוכות ודלילות לאורך ORFs, רעש רצף גבוה, וזיהומי RNA ריבוזומי (rRNA). לפיכך, האותות המעוותים והדו-משמעיים הנוצרים על ידי נתונים כאלה מחלישים את דפוסי התקופתיות של 3-nt של עקבות הריבוזומים על mRNA, מה שבסופו של דבר מקשה על זיהוי ה- ORFs המתורגמים בביטחון גבוה.

חבילה בשם "RiboCode" התאימה מבחן כיתה חתום וילקוקסון שונה ואסטרטגיית אינטגרציה P-ערך כדי לבחון אם ORF יש באופן משמעותי יותר בתוך מסגרת שברים מוגנים ריבוזום (RPFs) מאשר מחוץ למסגרת RPFs22. הוא הוכח כיעיל ביותר, רגיש ומדויק לביאור דה נובו של התרגום בנתוני פרופיל ריבוזום מדומים ואמיתיים. כאן, אנו מתארים כיצד להשתמש בכלי זה כדי לזהות את ORFs התרגום הפוטנציאלי מתוך ערכות נתונים רצף פרופיל ריבוזום גלם שנוצר על ידי המחקר הקודם23. ערכות נתונים אלה שימשו כדי לחקור את הפונקציה של יחידת המשנה EIF3 "E" (EIF3E) בתרגום על ידי השוואת פרופילי תפוסת הריבוזום של תאי MCF-10A שהודבקו בבקרה (si-Ctrl) ו- EIF3E (si-eIF3e) RNAs קטנים מפריעים (siRNAs). על ידי החלת RiboCode על ערכות נתונים לדוגמה אלה, זיהינו 5,633 ORFs רומן פוטנציאל קידוד פפטידים קטנים או חלבונים. ORFs אלה סווגו לסוגים שונים בהתבסס על מיקומם ביחס לאזורי הקידוד, כולל ORFs במעלה הזרם (uORFs), ORFs במורד הזרם (dORFs), ORFs חופפים, ORFs מגנים חדשניים לקידוד חלבונים (PCGs חדשניים), ו- ORFs מ קידוד nonprotein חדשני (גנים חדשניים NonPCGs). צפיפות הקריאה של RPF על UORFs גדלה באופן משמעותי בתאים לקויי EIF3E בהשוואה לתאי בקרה, אשר עשויים להיגרם לפחות באופן חלקי על ידי העשרה של ריבוזומים תרגום פעיל. הצטברות ריבוזום מקומית באזור מן הקודון ה - 25 עד ה - 75 של תאים לקוי EIF3E הצביע על חסימה של התארכות התרגום בשלב המוקדם. פרוטוקול זה גם מראה כיצד לדמיין את צפיפות ה- RPF של האזור הרצוי לבחינת דפוסי המחזור של 3 nt של עקבות ריבוזום על ORFs מזוהים. ניתוחים אלה מדגימים את התפקיד החזק של RiboCode בזיהוי תרגום ORFs וללמוד את הרגולציה של תרגום.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. הגדרת סביבה והתקנת RiboCode

  1. פתח חלון מסוף לינוקס וצור סביבת קונדה:
    conda create -n RiboCode python=3.8
  2. עבור לסביבה שנוצרה והתקן את RiboCode ואת יחסי התלות:
    קונדה להפעיל RiboCode
    conda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt עניבת פרפר כוכב samtools

2. הכנת נתונים

  1. קבל קבצי התייחסות לגנום.
    1. לקבלת רצף העיון, עבור אל אתר האינטרנט של אנסמבל https://www.ensembl.org/index.html, לחץ על התפריט העליון הורד והורדת FTP בתפריט הימני. בטבלה המוצגת, לחץ על FASTA בעמודה DNA (FASTA) ובשורה שבה מינים הם בני אדם. בדף הפתוח, העתק את הקישור של Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz, ולאחר מכן להוריד ולפתוח אותו במסוף:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
      gzip -d Homo_sapiens. GRCh38.dna.primary_assembly. פא.gz
    2. לקבלת ביאור לעיון, לחץ באמצעות לחצן העכבר הימני על GTF בעמודה ערכת הגנים בדף האינטרנט שנפתח לאחרונה. העתק את הקישור של Homo_sapiens. GRCh38.104.gtf.gz והורד אותו באמצעות:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
      gzip -d Homo_sapiens. GRCh38.104.gtf.gz

      הערה: מומלץ לקבל את קובץ ה- GTF מאתר האינטרנט של האנסמבל מכיוון שהוא מכיל ביאורי גנום המאורגנים בהיררכיה תלת-שכבתית, כלומר, כל גן מכיל תמלילים המכילים אקסונים ותרגומים אופציונליים (לדוגמה, רצפי קידוד [CDS], אתר התחלת התרגום, אתר סיום התרגום). כאשר ביאורים של גן או תעתיק חסרים, לדוגמה, קובץ GTF המתקבל מ- UCSC או NCBI, השתמש ב - GTFupdate כדי ליצור GTF מעודכן עם ביאורי הירארכיית אב-צאצא מלאים: GTFupdate original.gtf > מעודכן.gtf. עבור קובץ הביאור בתבנית .gff, השתמש בערכת הכלים AGAT24 או בכל כלי אחר כדי להמיר לתבנית .gtf.
  2. קבל רצפי rRNA.
    1. פתח את דפדפן הגנום של UCSC https://genome.ucsc.edu ולחץ על כלים | דפדפן טבלה ברשימה הנפתחת.
    2. בדף הפתוח, ציין יונק עבור clade, אדם עבור גנום, כל הטבלאות לקבוצה, rmask עבור שולחן, וגנום עבור אזור. עבור סינון, לחץ על צור כדי לעבור לדף חדש ולהגדיר repClass כפי שהוא תואם rRNA.
    3. לחץ על שלח ולאחר מכן הגדר את תבנית הפלט לרצף ולשם קובץ פלט כ- hg38_rRNA.fa. לבסוף, לחץ על קבל פלט | קבל רצף כדי לאחזר את רצף rRNA.
  3. קבל ערכות נתונים ליצירת פרופיל ריבוזום מארכיון קריאת רצף (SRA).
    1. הורד את דגימות לשכפל של si-eIF3e קבוצת טיפול ולשנות את שמם:
      fastq-dump SRR9047190 SRR9047191 SRR9047192
      mv SRR9047190.fastq si-eIF3e-1.fastq
      mv SRR9047191.fastq si-eIF3e-2.fastq
      mv SRR9047192.fastq si-eIF3e-3.fastq
    2. הורד את הדוגמאות המשוכפלות של קבוצת הבקרה ושנה את שמן:
      fastq-dump SRR9047193 SRR9047194 SRR9047195
      mv SRR9047193.fastq si-Ctrl-1.fastq
      mv SRR9047194.fastq si-Ctrl-2.fastq
      mv SRR9047195.fastq si-Ctrl-3.fastq
      הערה: מזהי הגישה של SRA עבור ערכות נתונים לדוגמה אלה התקבלו מאתר האינטרנט של Gene Expression Omnibus (GEO)25 על-ידי חיפוש GSE131074.

3. לקצץ מתאמים ולהסיר זיהום rRNA

  1. (אופציונלי) הסר מתאמים מנתוני הרצף. דלג על שלב זה אם רצפי המתאמים כבר נחתכו, כמו במקרה זה. אחרת, השתמש ב - cutadapt כדי לחתוך את המתאמים מקריאות.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    לעשות
    cutadapt -m 15 --match-read-תווים כלליים -a CTGTAGGCACCATCAAT \
    -o ${i}_trimmed.fastq ${i}.fastq
    לעשות
    הערה: רצף המתאם לאחר -פרמטר ישתנה בהתאם להכנת ספריית cDNA. קריאות קצרות מ- 15 (ניתנות על-ידי -m) נמחקות מכיוון שהקטעים המוגנים באמצעות ריבוזום בדרך כלל ארוכים יותר מגודל זה.
  2. הסר זיהום rRNA באמצעות השלבים הבאים:
    1. רצפי הפניות rRNA אינדקס:
      עניבת פרפר-build -f hg38_rRNA.fa hg38_rRNA
    2. יישר את הקריאות להפניה ל- rRNA כדי לשלול את הקריאות שמקורן ב- rRNA:
      for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
      לעשות
      עניבת פרפר -n 0 -y -a -a --norc --best --layerta -S -p 4 -l 15 \
      --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
      לעשות
      -p מציין את מספר הליכי המשנה להפעלת הפעילויות במקביל. בהתחשב בגודל הקטן יחסית של קריאות RPF, יש לציין ארגומנטים אחרים (לדוגמה, -n, -y, -a, -norc, --best, --layerta ו- -l) כדי להבטיח שהיישורים המדווחים הם הטובים ביותר. לפרטים נוספים, עיינו באתר האינטרנט של Bowtie26.

4. יישר את הקריאות הנקיות לגנום

  1. צור אינדקס גנום.
    mkdir STAR_hg38_genome
    STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFfile Homo_sapiens. GRCh38.104.gtf
  2. ישר את הקריאות הנקיות (ללא זיהום rRNA) להפניה שנוצרה.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    לעשות
    STAR --runThreadN 8 --outFilterType Normal --outWigType להתנועע --outWigStrand Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
    לעשות
    הערה: נוקלאוטיד לא מנוטרל מתווסף לעתים קרובות לסוף 5' של כל קריאה על ידי התמלול ההפוך27, אשר ייחתך ביעילות על ידי STAR כפי שהוא מבצע גזירה רכה כברירת מחדל. הפרמטרים עבור STAR מתוארים במדריך STAR28.
  3. מיון ויישור אינדקס של קבצים.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    לעשות
    samtools sort -T ${i}. Aligned.toTranscriptome.out.sorted \
    -o ${i}. Aligned.toTranscriptome.out.sorted.bam \
    ${i}. Aligned.toTranscriptome.out.bam
    samtools index ${i}. Aligned.toTranscriptome.out.sorted.bam
    samtools index ${i}. Aligned.sortedByCoord.out.bam
    לעשות

5. בחירת גודל של RPFs וזיהוי של אתרי P שלהם

  1. הכן את ביאורי התמליל.
    prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
    Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
    הערה: פקודה זו אוספת מידע נדרש של תמלילי mRNA מקובץ GTF ומחלצת את הרצפים עבור כל תמלילי ה- mRNA מקובץ FASTA (כל תעתיק מורכב על ידי מיזוג האקסונים בהתאם למבנים המוגדרים בקובץ GTF).
  2. בחר קובצי RPF באורכים ספציפיים וזיהה את מיקומי אתר ה- P שלהם.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    לעשות
    metaplots -a RiboCode_annot -r ${i}. Aligned.toTranscriptome.out.bam \
    -o ${i} -f0_percent 0.35 -pv1 0.001 -pv2 0.001
    לעשות
    הערה: פקודה זו מתווה את הפרופילים המצטברים של סוף 5' של הקריאות המיושרות של כל אורך סביב קודונים של התחלה (או עצירה) של תרגום מובא. ניתן לקבוע ידנית את אתר P התלוי באורך הקריאה על-ידי בחינת חלקות ההפצה (לדוגמה, איור 1B) של מרחקי היסט בין קצות 5' של הקריאות העיקריות לבין קודון ההתחלה. RiboCode גם יוצר קובץ תצורה עבור כל מדגם, שבו מיקומי אתר P של קריאות המציגות דפוסי מחזור משמעותיים של 3-nt נקבעים באופן אוטומטי. הפרמטרים -f0_percent, -pv1 ו- -pv2 מגדירים את סף הפרופורציות ואת הקיצוצים של ערך p לבחירת קריאות RPF מועשרות במסגרת הקריאה. בדוגמה זו, הנוקלאוטידים +12, +13 ו - +13 מסוף 5' של הקריאות 29, 30 ו - 31 nt מוגדרים באופן ידני בכל קובץ תצורה.
  3. עריכת קבצי התצורה עבור כל דוגמה ומיזוגם
    הערה: כדי ליצור ערכת קונצנזוס של ORFs ייחודיים ולהבטיח כיסוי מספיק של קריאות כדי לבצע ניתוח עוקב, הקריאות שנבחרו של כל הדגימות בשלב הקודם ממוזגות. הקריאות באורכים ספציפיים המוגדרים בקובץ merged_config.txt (קובץ משלים 1) ופרטי אתר ה- P שלהם משמשים להערכת פוטנציאל התרגום של ORFs בשלב הבא.

6. דה נובו ביאור תרגום ORFs

  1. תריץ את ריבו-קוד.
    RiboCode -a RiboCode_annot -c merged_config.txt -l yes -g \
    -o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG

    כאשר הפרמטרים החשובים של פקודה זו הם כדלקמן:
    -c, קובץ תצורה המכיל את הנתיב של קבצי קלט ואת המידע של קריאות נבחרות ואתרי P שלהם.
    -l, עבור תמלילים שיש להם קודוני התחלה מרובים במעלה הזרם של קודוני העצירה, בין אם ORFs הארוך ביותר (האזור מקודון ההתחלה הדיסטלי ביותר לעצור קודון) משמשים להערכת פוטנציאל התרגום שלהם. אם מוגדר לא, הקודונים ההתחלתיים ייקבעו באופן אוטומטי.
    -s, קודוני ההתחלה הקנוניים המשמשים לזיהוי ORFs.
    -A, (אופציונלית) קודוני ההתחלה הלא קנוניים (למשל, CTG, GTG ו- TTG עבור אדם) המשמשים לזיהוי ORF, אשר עשויים להיות שונים במיטוכונדריה או בגרעין של מינים אחרים29.
    -m, האורך המינימלי (כלומר, חומצות אמינו) של ORFs.
    -o, הקידומת של שם קובץ פלט המכילה את הפרטים של ORFs חזוי (קובץ משלים 2).
    -g ו - -b, פלט ORFs החזוי לפורמט GTF או מיטה , בהתאמה.

7. (אופציונלי) כימות וסטטיסטיקה של ORF

  1. ספירת קריאות RPF בכל ORF.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    לעשות
    ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
    -r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
    -o ${i}_ORF.counts -s yes -c junction-strict
    לעשות
    הערה: כדי לא לכלול את הריבוזומים המצטברים הפוטנציאליים סביב ההתחלה והקצוות של ORFs, מספר הקריאות שהוקצו ב- 15 הראשונים (שצוינו על-ידי -f) ובחמשת הקודונים האחרונים (ספציפיים על-ידי -l) אינם נספרים. באופן אופציונלי, האורכים של RPFs שנספרו מוגבלים לטווח שבין 25 ל - 35 nt (גדלים נפוצים של RPFs).
  2. חשב סטטיסטיקה בסיסית של ORFs שזוהו באמצעות RiboCode:
    Rscript RiboCode_utils. R
    הערה: RiboCode_utils. R (קובץ משלים 3) מספק סדרה של סטטיסטיקות עבור פלט RiboCode, למשל, ספירת מספר ORFs מזוהה, הצגת ההתפלגות של אורכי ORF וחישוב צפיפות RPF מנורמלת (כלומר, RPKM, קורא לכל קילו בסיס למיליון קריאות ממופות).

8. (אופציונלי) תצוגה חזותית של ORFs החזוי

  1. להשיג את העמדות היחסיות של ההתחלה ולעצור קודונים עבור ORF הרצוי (למשל, ENSG00000100902_35292349_35292552_67) על התמליל שלה מ RiboCode_ORFs_result_collapsed.txt (קובץ משלים 3). לאחר מכן, התווה את הצפיפות של קריאות RPF ב- ORF:
    plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
    -s 33 -e 236 --start-codon ATG -o ENSG00000100902_35292349_35292552_67
    כאשר -s ו - -e מציינים את מיקום ההתחלה והעצירה של התרגום של התוויית ORF. --start-codon מגדיר את קודון ההתחלה של ORF, שיופיע בכותרת הדמות. -o מגדיר את הקידומת של שם קובץ הפלט.

9. (אופציונלי) ניתוח Metagene באמצעות RiboMiner

הערה: בצע את ניתוח metagene כדי להעריך את ההשפעה של נוקאאוט EIF3E על התרגום של ORFs מוטבע זוהה, בעקבות השלבים הבאים:

  1. צור תעתיקים של ביאורים עבור RiboMiner, אשר מחלץ את התמליל הארוך ביותר עבור כל גן בהתבסס על קובץ הביאור שנוצר על ידי RiboCode (שלב 5.1).
    OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
    ג'י Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
    -o longest.transcripts.info.txt -O all.transcripts.info.txt
  2. הכן את קובץ התצורה עבור RiboMiner. העתק את קובץ התצורה שנוצר על-ידי הפקודה metaplots של RiboCode (שלב 5.4) ושנה את שמו ל-"RiboMiner_config.txt". לאחר מכן, שנה אותו בהתאם לתבנית המוצגת בקובץ משלים 4.
  3. מטאג'ן מנתחת באמצעות ריבומינר
    1. השתמש ב- MetageneAnalysis כדי ליצור פרופיל מצטבר וממוצע של צפיפות RPFs על פני תעתיקים.
      MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
      -o MA_normed -U codon -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norm yes \
      -y 100 --type UTR
      היכן נמצאים הפרמטרים החשובים: --type, ניתוח אזורי CDS או UTR ; -נורמה, אם נרמל את צפיפות הקריאה; -y, מספר הקודונים המשמשים לכל תעתיק; -U, צפיפות RPF להתוות או ברמת קודון או nt ; -u ו - -d, להגדיר את הטווח של ניתוח אזורים יחסית כדי להתחיל קודון או לעצור קודון; -l, האורך המינימלי (כלומר, מספר הקודונים) של CDS; -M, המצב לסינון תעתיקים, ספירות או RPKM; -n ספירות מינימליות או RPKM בתקליטורים לניתוח. -m ספירות מינימליות או RPKM של CDS באזור מנורמל; -e, מספר הקודונים שלא נכללו באזור המנורמל.
    2. צור קבוצה של קובצי PDF להשוואת תפוסות הריבוזום ב- mRNA בתאי בקרה ובתאים לקויי eIF3.
      PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
      -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode mean
      הערה: PlotMetageneAnalysis יוצר את ערכת קבצי PDF. פרטים על השימוש של MetageneAnalysis ו PlotMetageneאנליזה זמינים באתר האינטרנט של RiboMiner30.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

ערכות הנתונים לדוגמה של יצירת פרופיל ריבוזום הופקדו במסד הנתונים של GEO תחת מספר הגישה GSE131074. כל הקבצים והקודים המשמשים בפרוטוקול זה זמינים מקבצים משלימים 1-4. על ידי החלת RiboCode על קבוצה של ערכות נתונים פרופיל ריבוזום שפורסם23, זיהינו את הרומן ORFs בתרגום פעיל בתאי MCF-10A שטופלו עם שליטה ו- EIF3E siRNAs. כדי לבחור את קריאות RPF שככל הנראה קשורות לריבוזומים המתרגמים, נבדקו אורכי קריאות הרצף, וניתוח מטגן בוצע באמצעות RPFs שמיפו את הגנים התרגום הידועים. התפלגות התדרים של אורכי הקריאות הראתה כי רוב RPFs היו 25-35 nt (איור 1A), המתאים לרצף נוקלאוטידים המכוסה על ידי הריבוזומים כצפוי. מיקומי אתר P באורכים שונים של RPFs נקבעו על ידי בחינת המרחקים מקצוות ה-5 אינץ' שלהם אל קודוני ההתחלה והעצירה המובאים, בהתאמה (איור 1B). קריאות RPF בתוך 28-32nt הציגו תקופתיות חזקה של 3-nt, ואתרי ה- P שלהם היו ב- +12 nt (קובץ משלים 1).

RiboCode מחפש את ORFs המועמד מקודון התחלה קנוני (AUG) או קודוני התחלה חלופיים (אופציונלי, למשל, CUG ו- GUG) לקודון התחנה הבאה. לאחר מכן, בהתבסס על תוצאות המיפוי של RPFs בטווח המוגדר, RiboCode מעריכה את תקופתיות 3-nt על ידי הערכה אם מספר RPFs בתוך המסגרת (כלומר, אתרי P שלהם שהוקצו על הנוקלאוטיד הראשון של כל קודון) גדול ממספר RPFs מחוץ למסגרת (כלומר, אתרי P שלהם שהוקצו על הנוקלאוטיד השני או השלישי של כל קודון). זיהינו 13,120 גנים שעשויים לתרגם ORFs עם p < 0.05, ביניהם 10,394 גנים (70.8%) קידוד ORFs ביאורים, 168 (1.1%) גנים קידוד dORFs, 509 (3.5%) גנים קידוד uORFs, 939 (6.4%) גנים קידוד במעלה הזרם או במורד הזרם ORFs חופפים עם ORFs מובאים ידועים (חופפים), ו 68 (0.5%) גנים קידוד גנים קידוד רומן ORFs, ו 2,601 (17.7%) שהוקצו בעבר כמו ORFs קידוד גנים לא מקודדים (איור 2 וקובץ משלים 3)

השוואת גדלים של ORFs שונים הראתה כי UORFs ו ORFs חופפים הם קצרים יותר (195 ו 188 nt בממוצע, בהתאמה) מאשר ORFs ביאור (~ 1,771 nt). מגמה דומה נצפתה גם עבור ORFs חדשניים (670 ו 385 nt בממוצע עבור PCGs חדשניים וחדשנים שאינםPCGS, בהתאמה) ו dORFs (~ 671 nt) (איור 3). יחד, אותם ORFs לא קנוניים (ללא הודעה מוקדמת) שזוהו על ידי RiboCode נטו לקודד פפטידים קטנים יותר מאלה הידועים ORFs ביאור.

ספירות RPF יחסיות חושבו עבור כל ORF כדי להעריך את הפונקציה של EIF3 בתהליכי התרגום. התוצאות הראו כי צפיפות הריבוזום של עב"מים הייתה גבוהה משמעותית בתאים לקויי EIF3E מאשר בתאי בקרה (איור 4). מכיוון שדווח כי עב"מים רבים מפעילים השפעות מעכבות על התרגום של ORFs קידוד במורד הזרם, בדקנו עוד יותר אם הנוקאאוט של EIF3E משנה את הצפיפות הגלובלית של RPFs במורד הזרם של קודוני ההתחלה (איור 5). ניתוח המטגן, שבו פרופילים רבים של ORFs היו מיושרים ולאחר מכן ממוצע, גילה כי מסה של ריבוזומים נתקע בין קודונים 25 ו 75 במורד הזרם של קודון ההתחלה, מה שמרמז כי התארכות התרגום עשוי להיות חסום מוקדם בתאים EIF3E לקוי. חקירות נוספות נדרשות כדי לבחון אם יחס האות לרעש או השינויים ביעילות התרגום של ORFs תורמים לעלייה ב- UORF RPKM והצטברות של ריבוזומים בין קודונים 25 עד 75 בהיעדר EIF3E, כלומר, אם 1) פחות זיהום (או איכות ספריה טובה) או 2) תרגום פעיל (או השהיית ריבוזום) בדגימות ללא תוצאות EIF3E לקריאות נוספות ב- UORFs ובאזור המוגדר בין הקודונים ה-25 וה-75.

לבסוף, RiboCode מספק גם הדמיה עבור דחיסות של אתרי P של RPFs על ORF הרצוי, אשר יכול לעזור למשתמשים לבחון את דפוסי תקופתיות 3-nt וצפיפות של RPFs. לדוגמה, איור 6 מציג את צפיפות ה-RPF ב-UORF של PSMA6 וב-dORF של SENP3-EIF4A1; שניהם אומתו על ידי נתוני פרוטאומיקה שפורסמו23 (נתונים לא מוצגים).

Figure 1
איור 1: הערכת קריאות רצף ומיקומי אתר P. (A) התפלגות אורך של שברים מוגנים ריבוזום (RPFs) בתאים לקויי EIF3E בשכפול 1 (si-eIF3e-1); (B) להסיק מיקום P-site של RPFs של 29nt בהתבסס על הצפיפות שלהם סביב ההתחלה הידועה (למעלה) ולעצור קודונים (למטה). לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 2
איור 2: אחוזי הגנים המכילים סוגים שונים של ORFs שזוהו על-ידי RiboCode משתמשים בכל הדגימות יחד. קיצורים: ORF = מסגרת קריאה פתוחה; dORF = ORF במורד הזרם; PCG = גן קידוד חלבונים; NonPCG = גן קידוד nonprotein; UORF = ORF במעלה הזרם. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 3
איור 3: התפלגות אורך של סוגי ORF שונים. קיצורים: ORF = מסגרת קריאה פתוחה; dORF = ORF במורד הזרם; PCG = גן קידוד חלבונים; NonPCG = גן קידוד nonprotein; uORF = במעלה הזרם ORF; nt = נוקלאוטיד. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 4
איור 4: השוואה בין ספירות קריאה מנורמלות לסוגי ORF שונים בין תאים לקויי פקד לתאים לקויי EIF3E. ערכי p נקבעו על-ידי בדיקת הדירוג החתומה על-ידי וילקוקסון. קיצור: ORF = מסגרת קריאה פתוחה; dORF = ORF במורד הזרם; PCG = גן קידוד חלבונים; NonPCG = גן קידוד nonprotein; uORF = במעלה הזרם ORF; RPKM = קריאות לכל קילו-בסיס למיליון קריאות ממופות; siRNA = RNA קטן מפריע; si-Ctrl = control siRNA; si-eIF3e = siRNA targeting EIF3E. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 5
איור 5: ניתוח Metagene המציג את דוכן הריבוזומים בקודון 25-75 במורד הזרם של קודון ההתחלה של ORFs מובא. קיצור: ORF = מסגרת קריאה פתוחה; siRNA = RNA קטן מפריע; si-Ctrl = control siRNA; si-eIF3e = siRNA מיקוד EIF3E; A.U., כל יחידה. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 6
איור 6: פרופילי צפיפות של אתרי P של מיקרופפטידים לדוגמה של ORFs קידוד. (A) צפיפות אתר P של UORF החזוי ומיקומו ביחס לתקליטורים מובאים בתעתיק ENST00000622405; (B) זהה ל - A אך עבור dORF החזוי בתעתיק ENST000000614237. החלונית התחתונה מציגה את התצוגה המוגדלת של UORF (A) או dORF (B) החזויים. עמודות אדומות = קריאות במסגרת; פסים ירוקים וכחולים = קריאות מחוץ למסגרת. קיצור: ORF = מסגרת קריאה פתוחה; dORF = ORF במורד הזרם; uORF = במעלה הזרם ORF; CDS = רצפי קידוד. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

מידע משלים: הערכת התלות בין שני ערכי p והסבר על תוצאות RiboCode (uORF של ATF4 כדוגמה). נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 1: קובץ התצורה עבור RiboCode המגדיר את האורכים הנבחרים של RPFs ומיקומי אתר P. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 2: קובץ פלט RiboCode המכיל את המידע של ORFs חזוי. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 3: קובץ סקריפט R לביצוע סטטיסטיקה בסיסית של פלט RiboCode. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 4: קובץ התצורה (עבור RiboMiner) שונה מקובץ משלים 1. נא לחץ כאן כדי להוריד קובץ זה.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

פרופיל ריבוזום מציע הזדמנות חסרת תקדים ללמוד את פעולת הריבוזומים בתאים בקנה מידה של גנום. פענוח מדויק של המידע הנישאים על ידי נתוני פרופיל הריבוזום יכול לספק תובנה אילו אזורים של גנים או תמלילים מתורגמים באופן פעיל. פרוטוקול שלב אחר שלב זה מספק הדרכה כיצד להשתמש ב- RiboCode כדי לנתח נתוני פרופיל ריבוזום בפירוט, כולל התקנת חבילה, הכנת נתונים, ביצוע פקודות, הסבר תוצאות ותצוגה חזותית של נתונים. תוצאות הניתוח של RiboCode הצביעו על כך שהתרגום מתפשט ומתרחש על ORFs ללא הודעה מוקדמת של גנים מקודדים ותעתיקים רבים שנחשבו בעבר לא מקודדים. הניתוחים במורד הזרם סיפקו ראיות לכך שהריבוזומים נעים לאורך ORFs החזויים בשלבים של 3 נוקלאוטידים עם התרחשות התרגום; עם זאת, עדיין לא ברור אם תהליך התרגום או הפפטידים המיוצרים משרתים פונקציה כלשהי. עם זאת, ביאורים מדויקים של תרגום ORFs על הגנום יכול להוליד הזדמנויות מרגשות לזהות את הפונקציות של תמלילים לא ממופים בעבר31.

החיזוי של פוטנציאל קידוד עבור כל ORFs באמצעות נתוני פרופיל ריבוזום מסתמך מאוד על התקופתיות 3-nt של צפיפות אתרי P על כל קודון מההתחלה כדי לעצור קודונים של ORFs. לכן, זה דורש זיהוי מדויק של מיקומי אתר P של קריאות באורכים שונים. מידע כזה אינו מסופק ישירות על ידי נתוני פרופיל ריבוזום, אך ניתן להסיק אותו מהמרחקים שבין 5' הקצה של RPFs לבין קודונים התחלה או עצירה מובאים (שלב פרוטוקול 5.3). בהיעדר ביאורים של קודוני התחלה/עצירה ידועים בקובץ GTF, כגון עבור הגנומים החדשים שהורכבו, עלולים לגרום ל- RiboCode להיכשל בביצוע השלבים במורד הזרם, אלא אם מיקומי אתר ה- P המדויקים של הקריאות נקבעים באמצעים אחרים. ברוב המקרים, הגודל של שברים הקשורים לריבוזום ומיקומי אתר P שלהם קבועים, למשל, 28-30 nt ארוך ב +12 nt מקצה 5 ' של קריאות בתאים אנושיים. RiboCode מאפשר את הבחירה של קריאות בטווח מסוים כדי להגדיר עמדות P-site בהתבסס על ניסיון. עם זאת, שני האורכים של קריאות RPF והמיקום של אתרי ה- P שלהם עשויים להיות שונים כאשר התנאים הסביבתיים (למשל, מתח או גירוי) או ההליך הניסיוני (למשל, נוקלאז, חוצץ, הכנת ספריה ורצף) השתנו. לכן, אנו ממליצים לבצע את metaplots (שלב פרוטוקול 5.3) עבור כל מדגם כדי לחלץ את RPFs הביטחון הגבוה ביותר (כלומר, קורא הצגת דפוסי תקופתיות 3-nt) ולקבוע את מיקומי P-site שלהם בתנאים שונים. למרות שניתן לבצע פעולות אלה באופן אוטומטי באמצעות הפונקציה metaplots, לעתים קרובות רק מיעוט של קריאות המציגות מסגור או פיזור כמעט מושלמים עוברים את קריטריוני הבחירה הקפדניים ואת המבחן הסטטיסטי. לכן, עדיין יש צורך לשחרר את הפרמטרים מסוימים, במיוחד "-f0_percent", ולאחר מכן לבדוק חזותית את תקופתיות 3-nt של קריאות בכל אורך ולערוך באופן ידני את קובץ התצורה כדי לכלול קריאות נוספות בהתאם, במיוחד כאשר איכות הספרייה ירודה (שלב פרוטוקול 5.3).

RiboCode מחפש את ORFs המועמד מן קודוני התחלה קנוני או לא קנוני (NUGs) כדי קודון התחנה הבאה. עבור התמלילים עם קודוני התחלה מרובים במעלה הזרם של קודוני העצירה, קודונים ההתחלה הסבירים ביותר נקבעים על ידי הערכת תקופתיות 3-nt של RPF קורא ממופה בין שני קודונים התחלה שכנים או פשוט בחירת קודון התחלה במעלה הזרם שיש יותר בתוך מסגרת מאשר קריאות RPF מחוץ למסגרת. מגבלה של אסטרטגיה כזו היא שהקודונים ההתחלתיים בפועל עלולים להיות מזוהים באופן שגוי אם הקריאות המותאמות לאזורי קודון ההתחלה דלילות או נעדרות. למרבה המזל, אסטרטגיות אחרונות, כגון רצף ייזום תרגום גלובלי (GTI-seq)32 ורצף ייזום תרגום כמותי (QTI-seq)33, מספקות דרכים ישירות יותר לאיתור אתרי ייזום התרגום. עבור NUGs, מחקרים נוספים עדיין נדרשים כדי לחקור את תוקפם כמו קודונים התחלה יעילים.

פרסמנו גם עדכון חדש עבור RiboCode על ידי הוספת שלוש תכונות חדשות: 1) הוא מדווח על סוגי ORF פוטנציאליים אחרים שהוקצו על פי מיקומם ביחס לתמלילים שאינם הארוכים ביותר; 2) הוא מספק אפשרות להתאמת ערכי p משולבים אם הבדיקה של קריאות RPF בשתי המסגרות החיצוניות אינה עצמאית (ראה הסבר מפורט יותר במידע משלים); 3) הוא מבצע תיקון p-ערך לבדיקות מרובות, המאפשר הקרנה של תרגום ORFs מחמירה יותר.

כאשר RiboCode מזהה את ORFs המתרגמים באופן פעיל על ידי הערכת המחזוריות של 3-nt של RPF קורא צפיפות, יש לו מגבלות מסוימות עבור אותם ORFs כי הם קצרים מאוד (למשל, פחות מ 3 קודונים). Spealman ואח ' השווה את הביצועים של RiboCode עם uORF-seqr ודיווח כי אין uORFs קצר יותר מ 60 nt צפויים על ידי RiboCode בערכת הנתונים שלהם34. אנו טוענים כי הפרמטר עבור בחירת גודל ORF (-m) בגירסה הקודמת של RiboCode אינו מוגדר כראוי. שינינו את ערך ברירת המחדל של ארגומנט זה ל- 5 ב- RiboCode המעודכן.

RiboCode מדווח על ORFs שזוהו בשני קבצים: "RiboCode_ORFs_result.txt" המכיל את כל ORFs, כולל ORFs מיותר מתעתיקים שונים של אותו גן; "RiboCode_ORFs_result_collapsed.txt" (קובץ משלים 2) שילוב ORFs החופף עם אותו קודון עצירה אבל קודונים התחלה שונים, כלומר, אחד מחסה קודון ההתחלה במעלה הזרם ביותר באותה מסגרת קריאה יישמר. בשני הקבצים, ORFs שזוהו מסווגים או "רומן" תרגום ORFs או סוגים שונים אחרים על פי מיקומם היחסי לתקליטורים ידועים (ראה הסבר מפורט של סוגי ORF מנייר RiboCode22 או באתר ריבוקוד35). הדגמנו כיצד לפרש את יציאות RiboCode באמצעות uORF חזוי של גן ATF4 כדוגמה (מידע משלים). RiboCode סופר גם את מספר הגנים המכילים סוגים שונים של ORFs ומתווה אותם יחד עם האחוזים שלהם (איור 2).

מחקר דיווח כי כמה גנים מבוטאים אך בתרגום רגיעה ניתן להפעיל לתרגם פפטידים על סטרס חמצוני12, המציין כי יש כנראה ORFs אחרים שניתן לתרגם רק באופן תלוי תנאי. RiboCode יכול להתבצע עבור תנאים ניסיוניים שונים בנפרד (למשל, si-Ctrl או si-eIF3e) או במשותף, כפי שמוצג בפרוטוקול זה (שלבים 5.4 ו 6.1). להכפלת דגימות מרובות להפעלה אחת על-ידי הגדרת האורכים ומיקומי אתר P של קריאות נבחרות ב-"merged_config.txt" יש מספר יתרונות על-פני עיבוד כל דגימה בנפרד. ראשית, הוא מפחית את ההטיות הקיימות במדגם אחד; שנית, הוא חוסך לתוכנית זמן ריצה; לבסוף, הוא מספק מספיק נתונים כדי לבצע את הסטטיסטיקה. לכן, זה תיאורטית עובד טוב יותר מאשר מצב מדגם יחיד, במיוחד עבור דגימות עם כיסוי רצף נמוך רעשי רקע גבוהים. כימות נוסף והשוואה של מספרים של RPFs שהוקצו ORFs חזוי בין תנאים שונים (למשל, si-eIF3e לעומת si-Ctrl) מאפשרים לנו לגלות ORFs תלויי הקשר או לחקור את הרגולציה התרגומית של ORFs.

שים לב כי בשל הצטברות של ריבוזומים בתחילת ובקצוות של ORFs, תופעה הנקראת "רמפת תרגום", RPFs שהוקצו 15 קודון הראשון האחרון 5 קודונים יש להחריג מן הקריאות לספור כדי למנוע ניתוח של הטיית תרגום ORF דיפרנציאלית להבדלים של שיעורי ייזום3,5, 36. תוצאות אלה הראו כי השפע של סוגי uORFs גבוה יותר בתאים ללא EIF3 מאשר תאי בקרה, אשר עשוי להיגרם (או לפחות באופן חלקי) על ידי רמות גבוהות של ריבוזומים תרגום פעיל. המטא-אנליזה של צפיפות RPF סביב קודוני ההתחלה הציעה גם כי התארכות התרגום המוקדם מווסתת על ידי EIF3E. שים לב כי פשוט לספור את קריאות RPF ב ORF אינו מדויק לכימות תרגום, במיוחד כאשר התארכות התרגום נחסמת קשות.

לסיכום, פרוטוקול זה מראה כי RiboCode יכול להיות מיושם בקלות כדי לזהות ORFs מתורגם רומן בכל גודל, כולל אלה micropeptides קידוד. זה יהיה כלי רב ערך לקהילת המחקר לגלות סוגים שונים של ORFs בהקשרים פיזיולוגיים שונים או בתנאים ניסיוניים. אימות נוסף של מוצרי חלבון או פפטיד מ ORFs אלה יהיה שימושי לפיתוח של יישומים עתידיים של פרופיל ריבוזום.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

למחברים אין ניגודי עניינים לחשוף.

Acknowledgments

המחברים רוצים להכיר בתמיכת המשאבים החישוביים המסופקים על ידי פלטפורמת HPCC של אוניברסיטת שיאן ג'יאוטונג. Z.X. מודה תודה על תוכנית התמיכה בכישרונות טופנוץ' הצעירה של אוניברסיטת שיאן ג'יאוטונג.

Materials

Name Company Catalog Number Comments
A computer/server running Linux Any - -
Anaconda or Miniconda Anaconda - Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation - https://www.r-project.org/
Rstudio Rstudio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , Chapter 4 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. Dainat, J. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format. , Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020).
  25. Edgar, R. Gene Expression Omnibus. , Available from: https://www.ncbi.nim.nih.gov/geo (2002).
  26. Langmead, B. Bowtie: an ultrafast memory-efficient short read aligner. , Available from: http://bowtie-bio.sourceforge.net/manual.shtml (2021).
  27. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  28. Dobin, A. STAR manual. , Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022).
  29. Elzanowski, A. The genetic codes. , Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019).
  30. Li, F. RiboMiner. , Available from: https://github.com/xryanglab/RiboMiner (2020).
  31. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  32. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  33. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  34. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  35. Xiao, Z. RiboCode. , Available from: https://github.com/xryanglab/RiboCode (2018).
  36. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).

Tags

ביולוגיה גיליון 180 פרופיל ריבוזום מסגרת קריאה פתוחה תרגום mRNA מיקרופפטיד uORF dORF
<em>De novo</em> זיהוי של מסגרות קריאה פתוחות בתרגום פעיל עם נתוני יצירת פרופילים של ריבוזום
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Zhu, Y., Li, F., Yang, X., Xiao, Z.More

Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter