Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

دي نوفو تحديد إطارات القراءة المفتوحة المترجمة بنشاط باستخدام بيانات التنميط الريبوسومي

Published: February 18, 2022 doi: 10.3791/63366
* These authors contributed equally

Summary

ترجمة الريبوسومات فك تشفير ثلاثة نيوكليوتيدات لكل كودون إلى الببتيدات. حركتها على طول الحمض النووي الريبوزي المرسال ، التي تم التقاطها بواسطة التنميط الريبوسومي ، تنتج آثار أقدام تظهر دورية ثلاثية مميزة. يصف هذا البروتوكول كيفية استخدام RiboCode لفك شفرة هذه الميزة البارزة من بيانات التنميط الريبوسومي لتحديد إطارات القراءة المفتوحة المترجمة بنشاط على مستوى النسخ الكامل.

Abstract

يعد تحديد إطارات القراءة المفتوحة (ORFs) ، وخاصة تلك التي تشفر الببتيدات الصغيرة ويتم ترجمتها بنشاط في سياقات فسيولوجية محددة ، أمرا بالغ الأهمية للتعليقات التوضيحية الشاملة للتراتيمات المعتمدة على السياق. يوفر التنميط الريبوسومي، وهو تقنية للكشف عن مواقع الارتباط وكثافات ترجمة الريبوسومات على الحمض النووي الريبوسومي، وسيلة لاكتشاف مكان حدوث الترجمة بسرعة على نطاق الجينوم الواسع. ومع ذلك ، فليست مهمة تافهة في المعلوماتية الحيوية تحديد ترجمة ORFs بكفاءة وشمولية لتنميط الريبوسوم. الموضح هنا هو حزمة سهلة الاستخدام ، تسمى RiboCode ، مصممة للبحث عن ترجمة نشطة ل ORFs من أي حجم من الإشارات المشوهة والغامضة في بيانات التنميط الريبوسومي. إذا أخذنا مجموعة البيانات المنشورة مسبقا كمثال، توفر هذه المقالة إرشادات خطوة بخطوة لخط أنابيب RiboCode بأكمله، بدءا من المعالجة المسبقة للبيانات الخام إلى تفسير ملفات نتائج الإخراج النهائي. وعلاوة على ذلك، ومن أجل تقييم معدلات ترجمة الموارد المفتوحة، يرد أيضا وصف مفصل لإجراءات تصور وتقدير كمي لكثافات الريبوسوم في كل إطار من أطر عمل الريبوسوم. باختصار ، هذه المقالة هي تعليمات مفيدة وفي الوقت المناسب لمجالات البحث المتعلقة بالترجمة ، و ORFs الصغيرة ، والببتيدات.

Introduction

في الآونة الأخيرة ، كشفت مجموعة متزايدة من الدراسات عن إنتاج واسع النطاق للببتيدات المترجمة من ORFs من جينات الترميز والجينات المشروحة سابقا على أنها غير مشفرة ، مثل الحمض النووي الريبي الطويل غير المشفر (lncRNAs) 1،2،3،4،5،6،7،8. يتم تنظيم أو تحفيز هذه ORFs المترجمة بواسطة الخلايا للاستجابة للتغيرات البيئية والإجهاد وتمايز الخلايا1،8،9،10،11،12،13. وقد ثبت أن منتجات الترجمة لبعض الموارد المالية المفتوحة تلعب أدوارا تنظيمية هامة في العمليات البيولوجية المتنوعة في التنمية وعلم وظائف الأعضاء. على سبيل المثال ، اكتشف Chng et al.14 هرمون الببتيد المسمى Elabela (Ela ، المعروف أيضا باسم Abela / Ende / Toddler) ، وهو أمر بالغ الأهمية لتطور القلب والأوعية الدموية. اقترح باولي وآخرون أن إيلا يعمل أيضا كميتوجين يعزز هجرة الخلايا في جنين الأسماك المبكر15. أبلغ Magny et al. عن اثنين من الببتيدات الدقيقة التي تحتوي على أقل من 30 حمضا أمينيا تنظم نقل الكالسيوم وتؤثر على تقلص العضلات المنتظم في قلب ذبابة الفاكهة 10.

ولا يزال من غير الواضح عدد هذه الببتيدات التي يشفرها الجينوم وما إذا كانت ذات صلة بيولوجية. لذلك ، فإن التحديد المنهجي لهذه ORFs التي يحتمل أن تكون مشفرة أمر مرغوب فيه للغاية. ومع ذلك ، فإن التحديد المباشر لمنتجات هذه ORFs (أي البروتين أو الببتيد) باستخدام النهج التقليدية مثل الحفظ التطوري 16،17 وقياس الطيف الكتلي 18،19 يمثل تحديا لأن كفاءة الكشف عن كلا النهجين تعتمد على طول ووفرة وتكوين الأحماض الأمينية للبروتينات أو الببتيدات المنتجة. وقد وفر ظهور تنميط الريبوسوم، وهو تقنية لتحديد شغل الريبوسوم على الحمض النووي الريبوزي المرسال بدقة النوكليوتيدات، طريقة دقيقة لتقييم إمكانات الترميز للنسخ المختلفة3،20،21، بغض النظر عن طولها وتكوينها. ميزة مهمة وشائعة الاستخدام لتحديد ترجمة ORFs بنشاط باستخدام تنميط الريبوسوم هي دورية النيوكليوتيدات الثلاثة (3-nt) لآثار أقدام الريبوسوم على mRNA من كودون البداية إلى كودون التوقف. ومع ذلك ، غالبا ما تواجه بيانات التنميط الريبوسومي العديد من المشكلات ، بما في ذلك قراءات التسلسل المنخفضة والمتناثرة على طول ORFs ، وضوضاء التسلسل العالية ، وتلوث الحمض النووي الريبوسومي (rRNA). وبالتالي ، فإن الإشارات المشوهة والغامضة الناتجة عن هذه البيانات تضعف أنماط الدورية 3-nt لآثار أقدام الريبوسومات على الحمض النووي الريبوزي المرسال ، مما يجعل في نهاية المطاف تحديد ORFs المترجمة عالية الثقة أمرا صعبا.

قامت حزمة تسمى "RiboCode" بتكييف اختبار الرتبة المعدل الموقع من Wilcoxon واستراتيجية تكامل القيمة P لفحص ما إذا كان ORF يحتوي على شظايا محمية بالريبوسوم داخل الإطار (RPFs) أكثر بكثير من RPFs22 خارج الإطار. وقد ثبت أنه عالي الكفاءة وحساس ودقيق للتعليق التوضيحي الجديد للترانسلاتوم في بيانات التنميط الريبوسومي المحاكية والحقيقية. وهنا، نصف كيفية استخدام هذه الأداة للكشف عن عمليات ORFs المحتملة للترجمة من مجموعات بيانات تسلسل توصيف الريبوسوم الخام التي تم إنشاؤها بواسطة الدراسة السابقة23. وقد استخدمت مجموعات البيانات هذه لاستكشاف وظيفة الوحدة الفرعية EIF3 "E" (EIF3E) في الترجمة من خلال مقارنة ملامح إشغال الريبوسوم لخلايا MCF-10A المنقولة مع التحكم (si-Ctrl) و EIF3E (si-eIF3e) الحمض النووي الريبي الصغير التداخل (siRNAs). من خلال تطبيق RiboCode على مجموعات البيانات النموذجية هذه ، اكتشفنا 5,633 ORFs جديدة يحتمل أن تشفر الببتيدات الصغيرة أو البروتينات. تم تصنيف هذه ORFs إلى أنواع مختلفة بناء على مواقعها بالنسبة لمناطق الترميز ، بما في ذلك ORFs المنبع (uORFs) ، و ORFs في المصب (dORFs) ، و ORFs المتداخلة ، و ORFs من جينات ترميز البروتين الجديدة (PCGs الجديدة) ، و ORFs من الجينات الجديدة غير المشفرة للبروتين (NonPCGs الجديدة). زادت كثافات قراءة RPF على uORFs بشكل كبير في الخلايا التي تعاني من نقص EIF3E مقارنة بخلايا التحكم ، والتي قد تكون ناجمة جزئيا على الأقل عن إثراء الريبوسومات التي تترجم بنشاط. وأشار تراكم الريبوسوم الموضعي في المنطقة من الكودون 25 إلى 75 من الخلايا الناقصة EIF3E إلى وجود انسداد في استطالة الترجمة في المرحلة المبكرة. يوضح هذا البروتوكول أيضا كيفية تصور كثافة RPF للمنطقة المطلوبة لفحص أنماط الدورية 3-nt لآثار أقدام الريبوسوم على ORFs المحددة. تظهر هذه التحليلات الدور القوي ل RiboCode في تحديد ترجمة ORFs ودراسة تنظيم الترجمة.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. إعداد البيئة وتثبيت RiboCode

  1. افتح نافذة محطة Linux الطرفية وقم بإنشاء بيئة conda:
    كوندا إنشاء -n ريبوكود بيثون = 3.8
  2. التبديل إلى البيئة التي تم إنشاؤها وتثبيت RiboCode والتبعيات:
    conda تنشيط RiboCode
    كوندا تثبيت -c بيوكوندا ريبوكود ريبومينر sra-tools fastx_toolkit cutadapt القوس نجمة samtools

2. إعداد البيانات

  1. احصل على ملفات مرجعية للجينوم.
    1. للحصول على التسلسل المرجعي، انتقل إلى موقع Ensemble على الويب في https://www.ensembl.org/index.html، وانقر فوق القائمة العلوية تنزيل والقائمة الموجودة على الجانب الأيسر FTP Download. في الجدول المعروض، انقر فوق FASTA في العمود DNA (FASTA) والصف الذي يكون فيه النوع إنسانا. في الصفحة المفتوحة ، انسخ رابط Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz ، ثم قم بتنزيله وفك ضغطه في الجهاز الطرفي:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
      gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
    2. للحصول على تعليق توضيحي مرجعي، انقر بزر الماوس الأيمن فوق GTF في العمود Gene sets في صفحة الويب التي تم فتحها آخر مرة. انسخ رابط Homo_sapiens. GRCh38.104.gtf.gz وقم بتنزيله باستخدام:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
      gzip -d Homo_sapiens. GRCh38.104.gtf.gz

      ملاحظة: يوصى بالحصول على ملف GTF من موقع Ensemble على الويب لأنه يحتوي على تعليقات توضيحية للجينوم منظمة في تسلسل هرمي من ثلاثة مستويات ، أي أن كل جين يحتوي على نصوص تحتوي على exons وترجمات اختيارية (على سبيل المثال ، تسلسلات الترميز [CDS] ، موقع بدء الترجمة ، موقع نهاية الترجمة). عندما تكون التعليقات التوضيحية للجين أو النص مفقودة، على سبيل المثال، ملف GTF تم الحصول عليه من UCSC أو NCBI، استخدم GTFupdate لإنشاء GTF محدث مع تعليقات توضيحية كاملة للتسلسل الهرمي بين الوالدين والطفل: GTFupdate original.gtf > update.gtf. بالنسبة لملف التعليقات التوضيحية بتنسيق .gff، استخدم مجموعة أدوات AGAT24 أو أي أداة أخرى للتحويل إلى تنسيق .gtf.
  2. احصل على تسلسلات rRNA.
    1. افتح متصفح UCSC Genome في https://genome.ucsc.edu وانقر فوق أدوات | مستعرض الجدول في القائمة المنسدلة.
    2. في الصفحة المفتوحة، حدد الثدييات للكلاد، والإنسان للجينوم، وجميع الجداول للمجموعة، وrmask للجدول، والجينوم للمنطقة. بالنسبة للتصفية، انقر فوق إنشاء للانتقال إلى صفحة جديدة وتعيين repClass كما يتطابق مع rRNA.
    3. انقر فوق إرسال ثم قم بتعيين تنسيق الإخراج إلى تسلسل وإخراج اسم الملف ك hg38_rRNA.fa. أخيرا ، انقر فوق الحصول على | الإخراج احصل على تسلسل لاسترداد تسلسل rRNA.
  3. احصل على مجموعات بيانات التنميط الريبوسومي من أرشيف قراءة التسلسل (SRA).
    1. قم بتنزيل عينات النسخ المتماثل لمجموعة علاج si-eIF3e وإعادة تسميتها:
      فاست كيو تفريغ SRR9047190 SRR9047191 SRR9047192
      مف SRR9047190.fastq سي-eIF3e-1.fastq
      mv SRR9047191.fastq si-eIF3e-2.fastq
      mv SRR9047192.fastq si-eIF3e-3.fastq
    2. قم بتنزيل عينات النسخ المتماثل للمجموعة الضابطة وإعادة تسميتها:
      فاست كيو تفريغ SRR9047193 SRR9047194 SRR9047195
      mv SRR9047193.fastq si-Ctrl-1.fastq
      mv SRR9047194.fastq si-Ctrl-2.fastq
      mv SRR9047195.fastq si-Ctrl-3.fastq
      ملاحظة: تم الحصول على معرفات الانضمام إلى SRA لمجموعات البيانات النموذجية هذه من موقع التعبير الجيني الشامل (GEO)25 عن طريق البحث عن GSE131074.

3. تقليم المحولات وإزالة تلوث الحمض النووي الريبي الريبي

  1. (اختياري) قم بإزالة المحولات من بيانات التسلسل. تخطي هذه الخطوة إذا تم بالفعل قص تسلسلات المحول، كما في هذه الحالة. خلاف ذلك ، استخدم cutadapt لقص المحولات من القراءات.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    cutadapt -m 15 --مباراة-قراءة-أحرف البدل -a CTGTAGGCACCATCAAT \
    -o ${i}_trimmed.fastq ${i}.fastq
    منجز
    ملاحظة: سيختلف تسلسل المحول بعد -a المعلمة اعتمادا على إعداد مكتبة cDNA. يتم تجاهل القراءات الأقصر من 15 (التي يعطيها -m) لأن الأجزاء المحمية من الريبوسوم عادة ما تكون أطول من هذا الحجم.
  2. قم بإزالة تلوث الحمض النووي الريبي الريبي باستخدام الخطوات التالية:
    1. تسلسلات مرجع rRNA للفهرس:
      ربطة عنق بناء -f hg38_rRNA.fa hg38_rRNA
    2. قم بمحاذاة القراءات إلى مرجع rRNA لاستبعاد القراءات الناشئة عن rRNA:
      for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
      فعل
      ربطة عنق -n 0 -y -a --norc --best --strata -S -p 4 -l 15 \
      --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
      منجز
      -p يحدد عدد مؤشرات الترابط لتشغيل المهام بالتوازي. وبالنظر إلى الحجم الصغير نسبيا لقراءات الإطار الإقليمي الموحد، ينبغي تحديد حجج أخرى (مثل -n و-y و-a و-norc و--best و--strata و-l) لضمان أن تكون التحالفات المبلغ عنها هي الأفضل. لمزيد من التفاصيل، يرجى الرجوع إلى موقع Bowtie الإلكتروني26.

4. محاذاة القراءات النظيفة مع الجينوم

  1. إنشاء فهرس الجينوم.
    مكدير STAR_hg38_genome
    STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFملف Homo_sapiens. GRCh38.104.gtf
  2. قم بمحاذاة القراءات النظيفة (بدون تلوث rRNA) مع المرجع الذي تم إنشاؤه.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    STAR --runThreadN 8 --outFilterType Normal --outWigType تذبذب --outWigStrand تقطعت بهم السبل --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
    منجز
    ملاحظة: كثيرا ما تتم إضافة نيوكليوتيد غير قالب إلى نهاية 5 'لكل قراءة بواسطة النسخ العكسي27 ، والذي سيتم قصه بكفاءة بواسطة STAR أثناء قيامه بإجراء القطع الناعم بشكل افتراضي. يتم وصف معلمات STAR في دليل STAR28.
  3. فرز ملفات محاذاة الفهرسة.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    samtools فرز -T ${i}. Aligned.toTranscriptome.out.sorted \
    -o ${i}. Aligned.toTranscriptome.out.sorted.bam \
    ${i}. Aligned.toTranscriptome.out.bam
    مؤشر samtools ${i}. Aligned.toTranscriptome.out.sorted.bam
    مؤشر samtools ${i}. Aligned.sortedByCoord.out.bam
    منجز

5. اختيار حجم RPFs وتحديد مواقعها P

  1. إعداد التعليقات التوضيحية للنصوص.
    prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
    -و Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
    ملاحظة: يقوم هذا الأمر بتجميع المعلومات المطلوبة من نسخ mRNA من ملف GTF ويستخرج التسلسلات لكافة نسخ mRNA من ملف FASTA (يتم تجميع كل نسخة عن طريق دمج exons وفقا للهياكل المحددة في ملف GTF).
  2. حدد RPFs ذات الأطوال المحددة وحدد مواقعها في موقع P.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    metaplots -a RiboCode_annot -r ${i}. Aligned.toTranscriptome.out.bam \
    -o ${i} -f0_percent 0.35 -pv1 0.001 -pv2 0.001
    منجز
    ملاحظة: يقوم هذا الأمر بتخطيط ملفات التعريف المجمعة لنهاية 5 'من القراءات المحاذاة لكل طول حول رموز بدء (أو إيقاف) الترجمة المشروحة. يمكن تحديد موقع P المعتمد على طول القراءة يدويا من خلال فحص مخططات التوزيع (على سبيل المثال ، الشكل 1B) لمسافات الإزاحة بين نهايات 5 أقدام من القراءات الرئيسية وكودون البدء. يقوم RiboCode أيضا بإنشاء ملف تكوين لكل عينة، حيث يتم تلقائيا تحديد مواضع موقع P للقراءات التي تعرض أنماط دورية 3-nt مهمة. تحدد المعلمات -f0_percent و -pv1 و -pv2 عتبة النسبة وتخفيضات القيمة p لتحديد قراءات RPF المخصبة في إطار القراءة. في هذا المثال، يتم تعريف النيوكليوتيدات +12 و+13 و+13 من نهاية 5 أقدام من قراءات 29 و30 و31 nt يدويا في كل ملف تكوين.
  3. تحرير ملفات التكوين لكل عينة ودمجها
    ملاحظة: لإنشاء مجموعة توافقية من ORFs الفريدة وضمان تغطية كافية للقراءات لإجراء تحليل لاحق، يتم دمج القراءات المحددة لجميع العينات في الخطوة السابقة. يتم استخدام قراءات الأطوال المحددة المحددة في ملف merged_config.txt (الملف التكميلي 1) ومعلومات موقع P الخاصة بها لتقييم إمكانات الترجمة ل ORFs في الخطوة التالية.

6. De novo التعليق التوضيحي ترجمة ORFs

  1. قم بتشغيل RiboCode.
    RiboCode -a RiboCode_annot -c merged_config.txt -l yes -g \
    -O RiboCode_ORFs_result -S ATG -M 5 -A CTG,GTG,TTG

    حيث تكون المعلمات الهامة لهذا الأمر كما يلي:
    -c ، ملف تكوين يحتوي على مسار ملفات الإدخال ومعلومات القراءات المحددة ومواقع P الخاصة بها.
    -l، بالنسبة للنصوص التي تحتوي على عدة كودونات بدء في المنبع من كودونات التوقف، ما إذا كانت أطول ORFs (المنطقة من كودون البدء الأكثر بعدا إلى كودون التوقف) تستخدم لتقييم إمكانات الترجمة الخاصة بها. إذا تم تعيينها إلى لا، تحديد كودونات البدء تلقائيا.
    -s، كودون (كودونات) البدء الأساسي المستخدم لتحديد ORFs.
    -A، (اختياريا) كودونات البدء غير القانونية (على سبيل المثال، CTG، GTG، وTTG للإنسان) المستخدمة لتحديد ORF، والتي قد تختلف في الميتوكوندريا أو نواة الأنواع الأخرى29.
    -m ، الحد الأدنى للطول (أي الأحماض الأمينية) ل ORFs.
    -o ، بادئة اسم ملف الإخراج التي تحتوي على تفاصيل ORFs المتوقعة (الملف التكميلي 2).
    -g و -b ، إخراج ORFs المتوقعة إلى GTF أو تنسيق السرير ، على التوالي.

7. (اختياري) ORF القياس الكمي والإحصاءات

  1. يقرأ عدد RPF في كل ORF.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
    -r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
    -o ${i}_ORF.counts -s yes -c intersection-strict
    منجز
    ملاحظة: لاستبعاد الريبوسومات المتراكمة المحتملة حول بداية ونهاية ORFs، لا يتم احتساب عدد القراءات المخصصة في أول 15 (محددة بواسطة - f) وآخر 5 كودونات (محددة بواسطة -l). واختياريا، تقتصر أطوال ال RPFs المعدودة على النطاق من 25 إلى 35 nt (الأحجام الشائعة ل RPFs).
  2. حساب الإحصاءات الأساسية ل ORFs المكتشفة باستخدام RiboCode:
    RiboCode_utils Rscript. R
    ملاحظة: RiboCode_utils. يوفر R (الملف التكميلي 3) سلسلة من الإحصاءات لمخرجات RiboCode ، على سبيل المثال ، حساب عدد ORFs المحددة ، وعرض توزيع أطوال ORF ، وحساب كثافات RPF العادية (أي RPKM ، يقرأ لكل كيلوقاعدة لكل مليون قراءة خريطة).

8. تصور (اختياري) ل ORFs المتوقعة

  1. احصل على المواضع النسبية لكودونات البدء والتوقف ل ORF المطلوب (على سبيل المثال ، ENSG00000100902_35292349_35292552_67) على نسخته من RiboCode_ORFs_result_collapsed.txt (الملف التكميلي 3). ثم ، ارسم كثافة RPF يقرأ في ORF:
    plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
    -s 33 -e 236 --start-codon ATG -o ENSG00000100902_35292349_35292552_67
    حيث يحدد - s و -e موضع بدء الترجمة وتوقفها لتخطيط ORF. --start-codon يحدد كودون البدء الخاص ب ORF ، والذي سيظهر في عنوان الشكل. -o يحدد بادئة اسم ملف الإخراج.

9. (اختياري) تحليل الميتاجين باستخدام RiboMiner

ملاحظة: قم بإجراء تحليل metagene لتقييم تأثير ضربة EIF3E القاضية على ترجمة ORFs المشروحة المحددة، باتباع الخطوات التالية:

  1. قم بإنشاء تعليقات توضيحية للنصوص ل RiboMiner ، والتي تستخرج أطول نسخة لكل جين استنادا إلى ملف التعليقات التوضيحية الذي تم إنشاؤه بواسطة RiboCode (الخطوة 5.1).
    OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
    -ز Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
    -o longest.transcripts.info.txt -o all.transcripts.info.txt
  2. قم بإعداد ملف التكوين ل RiboMiner. انسخ ملف التكوين الذي تم إنشاؤه بواسطة أمر metaplots الخاص ب RiboCode (الخطوة 5.4) وأعد تسميته "RiboMiner_config.txt". ثم قم بتعديله وفقا للتنسيق الموضح في الملف التكميلي 4.
  3. تحليلات الميتاجين باستخدام ريبومينر
    1. استخدم MetageneAnalysis لإنشاء ملف تعريف إجمالي ومتوسط لكثافات RPFs عبر النصوص.
      التحليل الفوقي -f RiboMiner_config.txt -c longest.transcripts.info.txt \
      -o MA_normed -U codon -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norm yes \
      -y 100 --نوع UTR
      حيث تكون المعلمات المهمة هي: --type، تحليل إما CDS أو UTR المناطق؛ ---norm ، سواء تطبيع كثافة القراءة ؛ -y، عدد الكودونات المستخدمة لكل نسخة؛ -U ، كثافة RPF المؤامرة إما على مستوى الكودون أو مستوى nt ؛ -u و -d ، تحديد نطاق مناطق التحليل المتعلقة ببدء الكودون أو إيقاف الكودون ؛ -l، الحد الأدنى لطول (أي عدد المدونات) ل CDS؛ -M ، وضع تصفية النصوص ، إما العد أو RPKM ؛ -n الحد الأدنى من التهم أو RPKM في CDS للتحليل. -m الحد الأدنى من الأعداد أو RPKM من CDS في المنطقة العادية ؛ ، عدد الكودونات المستبعدة من المنطقة العادية.
    2. قم بإنشاء مجموعة من ملفات pdf لمقارنة الإشغالات الريبوسومية على mRNA في خلايا التحكم والخلايا الناقصة eIF3.
      PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
      -ز سي-كرترل,سي-eIF3e -r سي-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode mean
      ملاحظة: يقوم PlotMetageneAnalysis بإنشاء مجموعة من ملفات pdf. تتوفر تفاصيل حول استخدام MetageneAnalysis و PlotMetageneAnalysis على موقع RiboMiner على الويب30.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

وقد أودع مثال مجموعات بيانات التنميط الريبوسومي في قاعدة بيانات توقعات البيئة العالمية تحت رقم الانضمام GSE131074. تتوفر جميع الملفات والرموز المستخدمة في هذا البروتوكول من الملفات التكميلية 1-4. من خلال تطبيق RiboCode على مجموعة من مجموعات بيانات التنميط الريبوسومي المنشورة23 ، حددنا ORFs الجديدة المترجمة بنشاط في خلايا MCF-10A المعالجة بالتحكم و EIF3E siRNAs. لتحديد قراءات RPF التي من المرجح أن تكون مرتبطة بالريبوسومات المترجمة ، تم فحص أطوال قراءات التسلسل ، وتم إجراء تحليل metagene باستخدام RPFs التي تم تعيينها على جينات الترجمة المعروفة. وأظهر التوزيع الترددي لأطوال القراءات أن معظم ال RPFs كانت 25-35 nt (الشكل 1A)، المقابلة لتسلسل النيوكليوتيدات التي تغطيها الريبوسومات كما هو متوقع. تم تحديد مواقع موقع P لأطوال مختلفة من RPFs من خلال فحص المسافات من نهاياتها 5 أقدام إلى كودونات البداية والتوقف المشروحة ، على التوالي (الشكل 1B). أظهرت قراءات RPF في غضون 28-32nt دورية قوية 3-nt ، وكانت مواقع P الخاصة بهم في +12th nt (الملف التكميلي 1).

يبحث RiboCode عن ORFs المرشحة من كودون البدء الأساسي (AUG) أو كودونات البدء البديلة (اختياري ، على سبيل المثال ، CUG و GUG) إلى كودون المحطة التالية. بعد ذلك، واستنادا إلى نتائج رسم الخرائط للأطر RPFs ضمن النطاق المحدد، يقيم RiboCode دورية 3-nt من خلال تقييم ما إذا كان عدد RPFs داخل الإطار (أي مواقعها P المخصصة على النيوكليوتيدات الأولى لكل كودون) أكبر من عدد RPFs خارج الإطار (أي مواقعها P المخصصة على النيوكليوتيدات الثانية أو الثالثة لكل كودون). حددنا 13,120 جينا يحتمل أن تترجم ORFs مع p < 0.05 ، من بينها 10,394 جينا (70.8٪) يشفر ORFs المشروحة ، و 168 (1.1٪) جينات ترميز dORFs ، و 509 (3.5٪) جينات تشفر uORFs ، و 939 (6.4٪) جينات تشفير ORFs في المنبع أو المصب تتداخل مع ORFs المشروحة المعروفة (متداخلة) ، و 68 (0.5٪) جينات ترميز البروتين التي تشفر ORFs الجديدة ، و 2,601 (17.7٪) التي تم تعيينها سابقا كجينات غير مشفرة تشفر ORFs الجديدة (الشكل 2 والملف التكميلي 3)

أظهرت مقارنة أحجام ORFs المختلفة أن uORFs و ORFs المتداخلة أقصر (195 و 188 nt في المتوسط ، على التوالي) من ORFs المشروحة (~ 1,771 nt). ولوحظ نفس الاتجاه أيضا بالنسبة لل ORFs الجديدة (670 و 385 nt في المتوسط ل PCGs الجديدة وغير PCGS الجديدة ، على التوالي) و dORFs (~ 671 nt) (الشكل 3). معا ، تميل تلك ORFs غير القانونية (غير المشروحة) التي حددها RiboCode إلى تشفير الببتيدات الأصغر من تلك المعروفة ORFs المشروحة.

تم حساب الأعداد النسبية ل RPF لكل ORF لتقييم وظيفة EIF3 في عمليات الترجمة. أشارت النتائج إلى أن كثافات الريبوسوم ل uORFs كانت أعلى بكثير في الخلايا الناقصة EIF3E منها في الخلايا الضابطة (الشكل 4). نظرا لأنه تم الإبلاغ عن العديد من uORFs لممارسة تأثيرات مثبطة على ترجمة ORFs الترميز في المصب ، فقد درسنا كذلك ما إذا كانت ضربة EIF3E الضربة القاضية تغير الكثافات العالمية ل RPFs في اتجاه المصب من كودونات البدء (الشكل 5). كشف تحليل الميتاجينات، الذي تمت فيه محاذاة العديد من ملفات تعريف ORFs ثم متوسطها، أن كتلة من الريبوسومات توقفت بين الكودون 25 و 75 في اتجاه مجرى الكودون البادئ، مما يشير إلى أن استطالة الترجمة قد يتم حظرها في وقت مبكر في الخلايا الناقصة EIF3E. هناك ما يبرر إجراء مزيد من التحقيقات لفحص ما إذا كانت نسبة الإشارة إلى الضوضاء أو التغيرات في كفاءة الترجمة ل ORFs تسهم في زيادة uORF RPKM وتراكم الريبوسومات بين الكودونات 25 إلى 75 في غياب EIF3E ، أي ما إذا كان 1) تلوث أقل (أو جودة مكتبة جيدة) أو 2) ترجمة نشطة (أو إيقاف الريبوسوم مؤقتا) في العينات بدون EIF3E يؤدي إلى المزيد من القراءات في uORFs وفي المنطقة المحددة بين الكودونات 25 و 75.

وأخيرا، يوفر RiboCode أيضا تصورا لكثافات المواقع P من RPFs على ORF المطلوبة، والتي يمكن أن تساعد المستخدمين على فحص أنماط الدورية 3-nt وكثافات RPFs. فعلى سبيل المثال، يعرض الشكل 6 كثافات الجبهة الوطنية الرواندية على إطار من طراز PSMA6 وعلى شكل وحدة من نوع DORF من طراز SENP3-EIF4A1؛ تم التحقق من صحة كلاهما من خلال بيانات البروتينات المنشورة23 (البيانات غير معروضة).

Figure 1
الشكل 1: تقييم قراءات التسلسل ومواقع موقع P. (أ) توزيع طول الشظايا المحمية بالريبوسوم (RPFs) في الخلايا الناقصة EIF3E في التكرار 1 (si-eIF3e-1)؛ (ب) توزيع الشظايا المحمية بالريبوسوم (RPFs) في الخلايا الناقصة EIF3E في التكرار 1 (si-eIF3e-1)؛ (ج) توزيع الشظايا المحمية بالريبوسوم (RPFs) في الخلايا الناقصة EIF3E في التكرار 1 (si-eIF3e-1)؛ (ج) توزيع الشظايا المحمية بالريبوسوم (RPFs) في الخلايا الناقصة EIF3E في التكرار 1 (si-eIF3e-1 (ب) استنتاج موقع P-site ل RPFs من 29nt استنادا إلى كثافاتها حول البداية المعروفة (أعلى) وكودونات التوقف (أسفل). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 2
الشكل 2: النسب المئوية للجينات التي تؤوي أنواعا مختلفة من ORFs التي حددها RiboCode باستخدام جميع العينات معا. الاختصارات: ORF = إطار قراءة مفتوح. dORF = المصب ORF ؛ PCG = جين ترميز البروتين; NonPCG = جين غير مشفر للبروتين; uORF = المنبع ORF. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 3
الشكل 3: توزيعات الطول لأنواع ORF المختلفة. الاختصارات: ORF = إطار قراءة مفتوح. dORF = المصب ORF ؛ PCG = جين ترميز البروتين; NonPCG = جين غير مشفر للبروتين; uORF = المنبع ORF ؛ nt = النيوكليوتيدات. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 4
الشكل 4: مقارنة عدد القراءات العادية لأنواع ORF المختلفة بين الخلايا الضابطة والخلايا الناقصة EIF3E. تم تحديد قيم p بواسطة اختبار الرتبة الموقعة من Wilcoxon. اختصار: ORF = إطار قراءة مفتوح; dORF = المصب ORF ؛ PCG = جين ترميز البروتين; NonPCG = جين غير مشفر للبروتين; uORF = المنبع ORF ؛ RPKM = يقرأ لكل كيلوقاعدة لكل مليون قراءة تم تعيينها ؛ siRNA = الحمض النووي الريبي المتداخل الصغير; si-Ctrl = التحكم siRNA; si-eIF3e = siRNA يستهدف EIF3E. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 5
الشكل 5: تحليل ميتاجيني يظهر كشك الريبوسومات في الكودون 25-75 في اتجاه مجرى النهر من كودون البداية ل ORFs المشروحة. اختصار: ORF = إطار قراءة مفتوح; siRNA = الحمض النووي الريبي المتداخل الصغير; si-Ctrl = التحكم siRNA; si-eIF3e = siRNA يستهدف EIF3E ؛ أ. U.، أي وحدة. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 6
الشكل 6: ملامح كثافة موقع P لأمثلة ORFs التي تشفر الببتيدات الدقيقة. (أ) كثافات موقع P ل uORF المتوقعة وموقعها بالنسبة إلى CDS المشروحة على النص ENST00000622405 ؛ (B) كما هو الحال في A ولكن ل dORF المتوقع على النص ENST00000614237. اللوحة السفلية تعرض العرض الموسع ل uORF (A) أو dORF (B) المتوقع. الشريط الأحمر = يقرأ في الإطار; أشرطة خضراء وزرقاء = قراءات خارج الإطار. اختصار: ORF = إطار قراءة مفتوح; dORF = المصب ORF ؛ uORF = المنبع ORF ؛ CDS = تسلسلات الترميز. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

المعلومات التكميلية: تقييم الاعتماد بين قيمتين P وشرح نتائج RiboCode (uORF من ATF4 كمثال). يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 1: ملف التكوين الخاص ب RiboCode الذي يحدد الأطوال المحددة ل RPFs ومواضع موقع P. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 2: ملف إخراج RiboCode الذي يحتوي على معلومات ORF المتوقعة. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 3: ملف البرنامج النصي R لإجراء الإحصاءات الأساسية لإخراج RiboCode. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 4: ملف التكوين (ل RiboMiner) المعدل من الملف التكميلي 1. يرجى النقر هنا لتنزيل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

يوفر تنميط الريبوسوم فرصة غير مسبوقة لدراسة عمل الريبوسومات في الخلايا على نطاق الجينوم. يمكن أن يوفر فك رموز المعلومات التي تحملها بيانات التنميط الريبوسومي بدقة نظرة ثاقبة حول مناطق الجينات أو النصوص التي تترجم بنشاط. يوفر هذا البروتوكول خطوة بخطوة إرشادات حول كيفية استخدام RiboCode لتحليل بيانات توصيف الريبوسوم بالتفصيل، بما في ذلك تثبيت الحزمة، وإعداد البيانات، وتنفيذ الأوامر، وشرح النتائج، وتصور البيانات. أشارت نتائج تحليل RiboCode إلى أن الترجمة منتشرة وتحدث على ORFs غير المشروحة لجينات الترميز والعديد من النصوص التي كان يفترض سابقا أنها غير مشفرة. وقدمت التحليلات النهائية دليلا على أن الريبوسومات تتحرك على طول ال ORFs المتوقعة في 3 خطوات من النوكليوتيدات عند حدوث الترجمة؛ ومع ذلك، لا يزال من غير الواضح ما إذا كانت عملية الترجمة أو الببتيدات المنتجة تخدم أي وظيفة. ومع ذلك، فإن الشروح الدقيقة لترجمة ORFs على الجينوم يمكن أن تؤدي إلى فرص مثيرة لتحديد وظائف النصوص التي لم تكن مميزة من قبل31.

يعتمد التنبؤ بإمكانات الترميز لكل ORFs باستخدام بيانات تنميط الريبوسوم بشكل كبير على دورية 3-nt لكثافات مواقع P على كل كودون من البداية إلى كودونات التوقف الخاصة ب ORFs. لذلك ، فإنه يتطلب كشفا دقيقا لمواقع موقع P للقراءات ذات الأطوال المختلفة. لا يتم توفير هذه المعلومات مباشرة من خلال بيانات التنميط الريبوسومي ولكن يمكن استنتاجها من المسافات بين نهاية 5 أقدام من RPFs وكودونات البدء أو التوقف المشروحة (خطوة البروتوكول 5.3). قد يؤدي الافتقار إلى التعليقات التوضيحية لكودونات البدء / الإيقاف المعروفة في ملف GTF ، مثل تلك الجينومات التي تم تجميعها حديثا ، إلى فشل RiboCode في تنفيذ خطوات المصب ما لم يتم تحديد مواقع موقع P الدقيقة للقراءات بوسائل أخرى. في معظم الحالات ، يكون حجم الشظايا المرتبطة بالريبوسوم ومواقعها في موقع P ثابتا ، على سبيل المثال ، بطول 28-30 نانومتر وعند +12 nt من نهاية 5' للقراءات في الخلايا البشرية. يسمح RiboCode باختيار القراءات في نطاق معين لتحديد مواقع P-site بناء على الخبرة. ومع ذلك، قد يختلف كل من أطوال قراءات RPF وموقع مواقعها P عندما يتم تغيير الظروف البيئية (مثل الإجهاد أو التحفيز) أو الإجراء التجريبي (مثل النوكليز والمخزن المؤقت وإعداد المكتبة والتسلسل). لذلك، نوصي بإجراء مخططات التعريف (خطوة البروتوكول 5.3) لكل عينة لاستخراج RPFs الأكثر ثقة (أي القراءات التي تعرض أنماط دورية 3-nt) وتحديد مواضعها في موقع P في ظروف مختلفة. على الرغم من أنه يمكن إجراء هذه العمليات تلقائيا باستخدام وظيفة metaplots ، إلا أنه غالبا ما يتم اجتياز أقلية فقط من القراءات التي تظهر تأطيرا أو تدرجا شبه مثالي لمعايير الاختيار الصارمة والاختبار الإحصائي. لذلك ، لا يزال من الضروري تخفيف بعض المعلمات ، وخاصة "-f0_percent" ، ثم فحص دورية القراءة 3-nt بصريا في كل طول وتحرير ملف التكوين يدويا لتضمين المزيد من القراءات وفقا لذلك ، خاصة عندما تكون جودة المكتبة رديئة (خطوة البروتوكول 5.3).

يبحث RiboCode عن ORFs المرشحة من كودونات البدء الأساسية أو غير الأساسية (NUGs) إلى كودونات المحطة التالية. بالنسبة للنصوص التي تحتوي على رموز بدء متعددة في المنبع من كودونات التوقف ، يتم تحديد كودونات البدء الأكثر احتمالا من خلال تقييم دورية 3-nt لقراءات RPF التي تم تعيينها بين اثنين من كودونات البدء المجاورة أو ببساطة اختيار كودون البدء في المنبع الذي يحتوي على المزيد في الإطار من قراءات RPF خارج الإطار. أحد القيود المفروضة على مثل هذه الاستراتيجية هو أن كودونات البدء الفعلية قد يتم تحديدها بشكل خاطئ إذا كانت القراءات المحاذية لمناطق كودون البدء متناثرة أو غائبة. ولحسن الحظ، توفر الاستراتيجيات الحديثة، مثل تسلسل بدء الترجمة العالمية (GTI-seq)32 وتسلسل بدء الترجمة الكمية (QTI-seq)33، طرقا أكثر مباشرة لتحديد مواقع بدء الترجمة. بالنسبة ل NUGs ، لا تزال هناك حاجة إلى مزيد من الدراسات للتحقيق في صلاحيتها ككودونات بدء فعالة.

كما أصدرنا تحديثا جديدا ل RiboCode بإضافة ثلاث ميزات جديدة: 1) يبلغ عن أنواع ORF المحتملة الأخرى المعينة وفقا لمواقعها بالنسبة للنصوص بخلاف أطولها. 2) يوفر خيارا لضبط قيم P المجمعة إذا كان اختبار RPF يقرأ في الإطارين الخارجيين غير مستقل (انظر شرحا أكثر تفصيلا في المعلومات التكميلية) ؛ 3) يقوم بإجراء تصحيح قيمة P لإجراء اختبارات متعددة ، مما يسمح بفحص ترجمة ORFs بشكل أكثر صرامة.

نظرا لأن RiboCode يحدد ORFs التي تترجم بنشاط من خلال تقييم دورية 3-nt لكثافات قراءات RPF ، فإن لديه قيودا معينة على تلك ORFs القصيرة للغاية (على سبيل المثال ، أقل من 3 كدونات). قارن Spealman et al. أداء RiboCode مع uORF-seqr وأفاد أنه لا يتم التنبؤ بأي uORFs أقصر من 60 nt بواسطة RiboCode في مجموعة البيانات الخاصة بهم34. نحن نجادل بأن معلمة تحديد حجم ORF (-m) في الإصدار السابق من RiboCode لم يتم تعيينها بشكل صحيح. لقد قمنا بتغيير القيمة الافتراضية لهذه الوسيطة إلى 5 في RiboCode المحدث.

ويبلغ RiboCode عن ORFs المحددة في ملفين: "RiboCode_ORFs_result.txt" يحتوي على جميع ORFs ، بما في ذلك ORFs الزائدة عن الحاجة من نسخ مختلفة من نفس الجين. "RiboCode_ORFs_result_collapsed.txt" (الملف التكميلي 2) دمج ORFs المتداخلة مع نفس كودون التوقف ولكن سيتم الاحتفاظ بكودونات بدء مختلفة ، أي أن الشخص الذي يحتوي على كودون بدء المنبع في نفس إطار القراءة. في كلا الملفين، يتم تصنيف ORFs المكتشفة إما إلى "جديدة" تترجم ORFs أو أنواع مختلفة أخرى وفقا لمواقعها النسبية ل CDS المعروفة (انظر شرحا مفصلا لأنواع ORF من ورقة RiboCode22 أو في موقع RiboCode على الويب35). أوضحنا كيفية تفسير مخرجات RiboCode باستخدام uORF متوقع للجين ATF4 كمثال (معلومات تكميلية). يحسب RiboCode أيضا عدد الجينات التي تحتوي على أنواع مختلفة من ORFs ويرسمها مع نسبها المئوية (الشكل 2).

أفادت دراسة أنه يمكن تنشيط بعض الجينات المعبر عنها ولكن الهادئة ترجميا لترجمتها إلى ببتيدات عند الإجهاد التأكسدي12 ، مما يشير إلى أنه ربما يكون هناك ORFs أخرى يمكن ترجمتها فقط بطريقة تعتمد على الحالة. يمكن إجراء RiboCode لظروف تجريبية مختلفة بشكل منفصل (على سبيل المثال ، si-Ctrl أو si-eIF3e) أو بشكل مشترك ، كما هو موضح في هذا البروتوكول (الخطوتان 5.4 و 6.1). إن تعدد العينات المتعددة في تشغيل واحد من خلال تحديد الأطوال ومواضع موقع P للقراءات المختارة في "merged_config.txt" له العديد من المزايا على معالجة كل عينة على حدة. أولا ، يقلل من التحيزات الموجودة في عينة واحدة. ثانيا ، يوفر وقت تشغيل البرنامج ؛ وأخيرا، فإنه يوفر بيانات كافية لتنفيذ الإحصاءات. وبالتالي ، فإنه يعمل نظريا بشكل أفضل من وضع العينة الواحدة ، خاصة بالنسبة للعينات ذات التغطية المنخفضة للتسلسل والضوضاء العالية في الخلفية. ويتيح لنا المزيد من التحديد الكمي والمقارنة لأعداد الأطر الإقليمية المنسقة المخصصة للأطر التنظيمية الإقليمية المتوقعة بين الظروف المختلفة (على سبيل المثال، si-eIF3e مقابل si-Ctrl) اكتشاف الأطر التنظيمية الإقليمية المعتمدة على السياق أو استكشاف التنظيم الانتقالي للأطر التنظيمية الإقليمية.

لاحظ أنه نظرا لتراكم الريبوسومات في بداية ونهاية ORFs ، وهي ظاهرة تسمى "منحدر الترجمة" ، يجب استبعاد RPFs المخصصة في أول 15 كودون وآخر 5 كودونات من عد القراءات لتجنب تحليل تحيز ترجمة ORF التفاضلية إلى الاختلافات في معدلات البدء 3,5 ، 36. أشارت هذه النتائج إلى أن وفرة أنواع uORFs أعلى في الخلايا بدون EIF3 من خلايا التحكم ، والتي قد تكون ناجمة (أو على الأقل جزئيا) عن طريق المستويات المرتفعة للترجمة النشطة للريبوسومات. كما اقترح التحليل التلوي لكثافات RPF حول كودونات البدء أن استطالة الترجمة المبكرة تنظمها EIF3E. لاحظ أن مجرد حساب قراءات RPF في ORF ليس دقيقا لتحديد كمية الترجمة ، خاصة عندما يتم حظر استطالة الترجمة بشدة.

باختصار ، يوضح هذا البروتوكول أنه يمكن تطبيق RiboCode بسهولة لتحديد ORFs المترجمة الجديدة من أي حجم ، بما في ذلك تلك التي تشفر الببتيدات الدقيقة. سيكون أداة قيمة لمجتمع البحث لاكتشاف أنواع مختلفة من ORFs في سياقات فسيولوجية مختلفة أو ظروف تجريبية. وسيكون من المفيد إجراء مزيد من التحقق من صحة منتجات البروتين أو الببتيد من هذه ال ORFs لتطوير التطبيقات المستقبلية لتوصيف الريبوسوم.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

وليس لدى المؤلفين أي تضارب في المصالح للإفصاح عنه.

Acknowledgments

يود المؤلفون أن ينوه بالدعم المقدم من الموارد الحسابية التي توفرها منصة HPCC بجامعة شيان جياوتونغ. Z.X. بامتنان خطة دعم المواهب الشابة من الدرجة الأولى من جامعة شيان جياوتونغ.

Materials

Name Company Catalog Number Comments
A computer/server running Linux Any - -
Anaconda or Miniconda Anaconda - Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation - https://www.r-project.org/
Rstudio Rstudio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , Chapter 4 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. Dainat, J. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format. , Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020).
  25. Edgar, R. Gene Expression Omnibus. , Available from: https://www.ncbi.nim.nih.gov/geo (2002).
  26. Langmead, B. Bowtie: an ultrafast memory-efficient short read aligner. , Available from: http://bowtie-bio.sourceforge.net/manual.shtml (2021).
  27. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  28. Dobin, A. STAR manual. , Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022).
  29. Elzanowski, A. The genetic codes. , Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019).
  30. Li, F. RiboMiner. , Available from: https://github.com/xryanglab/RiboMiner (2020).
  31. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  32. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  33. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  34. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  35. Xiao, Z. RiboCode. , Available from: https://github.com/xryanglab/RiboCode (2018).
  36. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).

Tags

علم الأحياء ، العدد 180 ، تنميط الريبوسوم ، إطار القراءة المفتوح ، ترجمة mRNA ، الببتيد الدقيق ، uORF ، dORF
<em>دي نوفو</em> تحديد إطارات القراءة المفتوحة المترجمة بنشاط باستخدام بيانات التنميط الريبوسومي
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Zhu, Y., Li, F., Yang, X., Xiao, Z.More

Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter