Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

برنامج تعليمي للتحليل الحسابي للحمض النووي الريبي الصغير غير المشفر الوهمي: مكتبات تسلسل الحمض النووي الريبي المستهدفة

Published: December 1, 2023 doi: 10.3791/65779

Summary

هنا ، نقدم بروتوكولا يوضح تركيب واستخدام خط أنابيب المعلوماتية الحيوية لتحليل بيانات تسلسل الحمض النووي الريبي الوهمي المستخدمة في دراسة تفاعلات الحمض النووي الريبي: الحمض النووي الريبي في الجسم الحي .

Abstract

تم تطوير فهم التفاعلات التنظيمية الجينية في الجسم الحي للحمض النووي الريبي الصغير غير المشفر (sncRNAs) ، مثل microRNAs (miRNAs) ، مع الحمض النووي الريبي المستهدف في السنوات الأخيرة من خلال الأساليب الكيميائية الحيوية التي تستخدم الربط المتقاطع متبوعا بالربط لالتقاط sncRNA: تفاعلات الحمض النووي الريبي المستهدفة من خلال تكوين الحمض النووي الريبي الوهمي ومكتبات التسلسل اللاحقة. في حين أن مجموعات البيانات من تسلسل الحمض النووي الريبي الوهمي توفر مدخلات على مستوى الجينوم وأقل غموضا إلى حد كبير من برامج التنبؤ miRNA ، فإن تقطير هذه البيانات إلى معلومات ذات مغزى وقابلة للتنفيذ يتطلب تحليلات إضافية وقد يثني الباحثين الذين يفتقرون إلى خلفية حسابية. يقدم هذا التقرير برنامجا تعليميا لدعم علماء الأحياء الحاسوبية للمبتدئين في تثبيت وتطبيق أداة برمجية حديثة مفتوحة المصدر: خط أنابيب تحليل الحمض النووي الريبي الخيمري الصغير (SCRAP). يتم توفير متطلبات النظام الأساسي والتحديثات وشرح خطوات خط الأنابيب ومعالجة متغيرات إدخال المستخدم الرئيسية. إن تقليل الحاجز أمام علماء الأحياء لاكتساب رؤى من مناهج تسلسل الحمض النووي الريبي الوهمي لديه القدرة على بدء التحقيقات القائمة على الاكتشاف لتفاعلات الحمض النووي الريبي (sncRNA) التنظيمية: تفاعلات الحمض النووي الريبي المستهدفة في سياقات بيولوجية متعددة.

Introduction

تمت دراسة الحمض النووي الريبي الصغير غير المشفر بدرجة عالية لأدوارها بعد النسخ في تنسيق التعبير من مجموعات الجينات في عمليات متنوعة مثل التمايز والتطوير ومعالجة الإشارات والمرض1،2،3. تعد القدرة على تحديد النصوص المستهدفة بدقة للحمض النووي الريبي الصغير غير المشفر (sncRNAs) ، بما في ذلك الحمض النووي الريبي الصغير (miRNAs) ، ذات أهمية لدراسات بيولوجيا الحمض النووي الريبي على المستويين الأساسي والانتقالي. تم استخدام خوارزميات المعلوماتية الحيوية التي تستغل التكامل المتوقع بين تسلسل بذور miRNA وأهدافه المحتملة بشكل متكرر للتنبؤ بتفاعلات miRNA: الحمض النووي الريبي المستهدف. في حين أن هذه الخوارزميات المعلوماتية الحيوية كانت ناجحة ، إلا أنها يمكن أن تؤوي أيضا نتائج إيجابية خاطئة وسلبية خاطئة ، كما تمت مراجعته في مكان آخر4،5،6. في الآونة الأخيرة ، تم تصميم وتنفيذ العديد من الأساليب الكيميائية الحيوية التي تسمح بتحديد لا لبس فيه وشبه كمي لتفاعلات الحمض النووي الريبي في الجسم الحي: تفاعلات الحمض النووي الريبي المستهدفة عن طريق التشابك في الجسم الحي وما يترتب على ذلك من دمج خطوة ربط لربط sncRNA فعليا بهدفه لتشكيل RNA خيمري واحد4،5،7،8،9،10. يسمح الإعداد اللاحق لمكتبات التسلسل من الحمض النووي الريبي الوهمي بتقييم تفاعلات sncRNA: الحمض النووي الريبي المستهدف عن طريق المعالجة الحسابية لبيانات التسلسل. يوفر هذا الفيديو برنامجا تعليميا لتثبيت واستخدام خط أنابيب حسابي يسمى خط أنابيب تحليل الحمض النووي الريبي الوهمي الصغير (SCRAP) ، والذي تم تصميمه للسماح بتحليل قوي وقابل للتكرار لتفاعلات sncRNA: الهدف من تفاعلات الحمض النووي الريبي من مكتبات تسلسل الحمض النووي الريبي الوهمي6.

الهدف من هذا البرنامج التعليمي هو مساعدة الباحثين في تجنب الاعتماد المفرط على خوارزميات المعلوماتية الحيوية التنبؤية البحتة عن طريق تقليل الحواجز أمام تحليل البيانات الناتجة عن الأساليب الكيميائية الحيوية التي توفر قراءات جزيئية وهمية لتفاعلات الحمض النووي الريبي المستهدف: sncRNA. يوفر هذا البرنامج التعليمي خطوات ونصائح عملية لتوجيه علماء الحوسبة المبتدئين من خلال استخدام خط أنابيب ، SCRAP ، تم تطويره لتحليل بيانات تسلسل الحمض النووي الريبي الخيمري ، والتي يمكن إنشاؤها بواسطة العديد من البروتوكولات البيوكيميائية الحالية ، بما في ذلك التشابك والربط وتسلسل الهجينة (CLASH) والربط التساهمي للحمض النووي الريبي الداخلي المرتبط ب Argonaute - التشابك والترسيب المناعي (CLEAR-CLIP) 7,9.

يوفر استخدام SCRAP العديد من المزايا لتحليل بيانات تسلسل الحمض النووي الريبي الوهمي ، مقارنة بخطوط الأنابيب الحسابية الأخرى6. تتمثل إحدى المزايا البارزة في التعليق التوضيحي الشامل ودمج الاستدعاءات إلى نصوص المعلوماتية الحيوية المدعومة جيدا والمحدثة بشكل روتيني داخل خط الأنابيب ، مقارنة بخطوط الأنابيب البديلة التي تعتمد غالبا على البرامج النصية المخصصة و / أو غير المدعومة للخطوات في خط الأنابيب. تضفي هذه الميزة الاستقرار على SCRAP ، مما يجعلها أكثر جدوى للباحثين للتعرف على خط الأنابيب ودمج استخدامه في سير عملهم. كما ثبت أن SCRAP يتفوق على خطوط الأنابيب البديلة في استدعاء قمم sncRNA: تفاعلات الحمض النووي الريبي المستهدف ولديه وظائف عبر الأنظمة الأساسية ، كما هو مفصل في منشور سابق6.

بنهاية هذا البرنامج التعليمي ، سيتمكن المستخدمون من (i) معرفة متطلبات النظام الأساسي ل SCRAP وتثبيت خطوط أنابيب SCRAP ، (ii) تثبيت الجينومات المرجعية وإعداد معلمات سطر الأوامر ل SCRAP ، و (iii) فهم معايير استدعاء الذروة وإجراء ذروة الاتصال والتعليق التوضيحي للذروة.

سيصف هذا الفيديو بالتفصيل العملي كيف يمكن للباحثين الذين يدرسون بيولوجيا الحمض النووي الريبي تثبيت واستخدام خط الأنابيب الحسابي ، SCRAP ، على النحو الأمثل لتحليل تفاعلات sncRNA مع الحمض النووي الريبي المستهدف ، مثل الحمض النووي الريبي المرسال ، في بيانات تسلسل الحمض النووي الريبي الوهمية التي تم الحصول عليها من خلال أحد الأساليب الكيميائية الحيوية التي تمت مناقشتها لإعداد مكتبة التسلسل.

SCRAP هي أداة مساعدة لسطر الأوامر. بشكل عام ، باتباع الدليل أدناه ، سيحتاج المستخدم إلى (i) تنزيل وتثبيت SCRAP (https://github.com/Meffert-Lab/SCRAP) ، (ii) تثبيت الجينومات المرجعية وتشغيل SCRAP ، و (iii) إجراء ذروة الاتصال والتعليقات التوضيحية.

يمكن العثور على مزيد من التفاصيل حول الخطوات الحسابية في هذا الإجراء في https://github.com/Meffert-Lab/SCRAP. ستوفر هذه المقالة معلومات الإعداد والخلفية للسماح للمحققين ذوي المهارات الحسابية للمبتدئين بتثبيت SCRAP وتحسينه واستخدامه على مجموعات بيانات مكتبة تسلسل الحمض النووي الريبي الوهمي.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

ملاحظة: سيبدأ البروتوكول بتنزيل وتثبيت البرامج المطلوبة لتحليل مكتبات تسلسل الحمض النووي الريبي الوهمي باستخدام SCRAP.

1. التثبيت

  1. قبل تثبيت SCRAP ، قم بتثبيت التبعيات Git و Miniconda على الجهاز المراد استخدامه في التحليلات. من المحتمل أن يكون Git مثبتا بالفعل. على نظام Mac OSX الأساسي ، على سبيل المثال ، تحقق من ذلك باستخدام أي بوابة لمعرفة أن الأداة المساعدة "git" موجودة ومثبتة في هذا الدليل. تحقق مما إذا تم تثبيت Miniconda باستخدام أي كوندا. إذا لم يتم إرجاع أي شيء ، فقم بتثبيت Miniconda. يتطلب Miniconda 400 ميغابايت من مساحة القرص للتثبيت.
    1. هناك عدة طرق لتثبيت Miniconda ، وهي تختلف حسب النظام الأساسي. ارجع إلى ملف تخفيض السعر PLATFORM-SETUP في مستودع Meffert Lab GitHub [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] حيث توجد إرشادات أخرى للتثبيت على أنظمة التشغيل Windows و MacOS و Ubuntu. بالنسبة لمستخدمي Linux ، يحتوي Linux على مدير الحزم الافتراضي الخاص به (apt). في الحالة الخاصة بهذه الدراسة ، استخدم الأمر brew install Miniconda لتثبيت Miniconda باستخدام مدير حزم موجود ، الشراب.
      ملاحظة: "Homebrew" ، المسمى "brew" هو نظام إدارة حزم برامج مفتوح المصدر يبسط تثبيت البرامج على نظام تشغيل Apple ، macOS.
    2. إذا تم تثبيت conda لأول مرة ، فقم بتشغيل conda init للقذيفة المعينة قيد الاستخدام. في المثال هنا ، هذه القشرة المستخدمة هي zsh. ثم أغلق القشرة وأعد فتحها. إذا تم تثبيت conda بنجاح ، فستظهر البيئة الأساسية التي تم تنشيطها داخل الجلسة الطرفية.
  2. قم بتنزيل مصدر SCRAP وقم بتثبيت تبعياته.
    1. الطريقة المفضلة للحصول على مصدر SCRAP هي استخدام Git. قم بالوصول إلى هذا عن طريق تشغيل git clone https://github.com/Meffert-Lab/SCRAP للحصول على أحدث نسخة من شفرة المصدر.
    2. قم بتثبيت mamba ، وهو حل حزم محسن ل conda ، وقم بتثبيت جميع تبعيات SCRAP من SCRAP_environment.yml إلى بيئة conda الخاصة بها باستخدام الأوامر التالية:
      تثبيت كوندا -N قاعدة كوندا فورج :: مامبا
      مامبا البيئة إنشاء -f SCRAP / SCRAP_environment.yml -n SCRAP
  3. بعد ذلك ، قم بتشغيل التثبيت المرجعي ل SCRAP. ستكون الحجج المستخدمة في التثبيت المرجعي خاصة بالكائن الحي الذي يتم تحليل تفاعلات sncRNA-mRNA الخاصة به.
    باش سكراب / بن / Reference_Installation.sh -r كامل / مسار / إلى / خردة / -م لديه -g hg38 -s الإنسان
    1. قم بتوفير دليل المجلد المصدر SCRAP للتثبيت المرجعي. سيتم بعد ذلك تنفيذ خطوات التثبيت باستخدام الملفات الموجودة داخل مجلدات fasta والتعليقات التوضيحية. ضع قائمة بالمسار الكامل دون أي اختزال. تنتهي بشرطة مائلة.
    2. ارجع إلى الجداول الموجودة في README.md للحصول على اختصارات أنواع miRbase الصحيحة. يمكن العثور على الجينومات المرجعية الحديثة في https://genome.ucsc.edu/ أو https://www.ncbi.nlm.nih.gov/data-hub/genome/. في هذا المثال ، سيتم استخدام hg38 لجينوم الماوس GRCm38.
    3. الأنواع المدرجة حاليا للتعليق التوضيحي هي الإنسان والفأر والدودة. عرض ملفات species.annotation.bed المقابلة في دليل التعليقات التوضيحية في المجلد المصدر SCRAP. إذا كان استخدام نوع مختلف للتحليل مطلوبا ، فقم بتوفير ملف annotation.bed يتبع نفس نظام التسمية species.annotation.bed.

2. تشغيل الخردة

  1. الآن بعد تثبيت التبعيات و SCRAP ، - قم بتشغيل البرنامج النصي SCRAP.sh
    باش سكراب / بن / SCRAP.sh -د كامل / مسار / إلى / CLASH_Human / - كامل / مسار / إلى / CLASH_Human / CLASH_Human_Adapters.txt -p لا -f نعم -r كامل / مسار / إلى / خردة / -m لديه -g hg38
    1. سرد المسار بأكمله إلى أدلة العينة دون أي اختزال. قم بتنسيق نماذج الدلائل بحيث يتطابق اسم المجلد مع اسم العينة تماما ، كما هو موضح في الشكل 1.
    2. لاحظ أن المسار المدرج هو المسار إلى الدليل الذي يحتوي على كافة مجلدات العينة، وليس المسار إلى أي مجلد نموذج فردي أو ملف نموذج (راجع سطر الأوامر في الخطوة 2.1).
    3. بعد ذلك ، قم بإدراج المسار بالكامل إلى ملف المحول. تأكد من تطابق أسماء النماذج في ملف المحول مع أسماء المجلدات وأسماء الملفات المذكورة سابقا (راجع سطر الأوامر في الخطوة 2.1).
    4. حدد ما إذا كانت العينات مقترنة وما إذا كان سيتم إجراء ترشيح ل pre-miRNAs و / أو tRNAs أم لا. أضف مرشحا لتنظيف rRNA إذا رغبت في ذلك (راجع سطر الأوامر في الخطوة 2.1).
      ملاحظة: قد يقرر المستخدمون أو لا يقررون استخدام هذه المرشحات اعتمادا على أنواع العينات والأهداف التجريبية. اعتمادا على التصميم التجريبي ، يمكن أن تستهلك ما قبل miRNAs و tRNAs و rRNAs عمق التسلسل المتاح ل sncRNA الحقيقي: خيالات الحمض النووي الريبي المستهدفة ويمكن للمستخدمين استخدام المرشحات لاستبعادها. ومع ذلك ، قد يرغب المستخدمون في تجنب مثل هذا الترشيح في ظروف معينة (على سبيل المثال ، تعيين أهداف sncRNA إلى جينوم الميتوكوندريا ، الذي يحتوي على الحمض النووي الريبي للميتوكوندريا).
    5. بعد ذلك ، قم بإدراج المسار بالكامل إلى الدليل المرجعي واختصار miRbase واختصار الجينوم المرجعي (راجع سطر الأوامر في الخطوة 2.1).
      ملاحظة: قد يستغرق البرنامج النصي بضع ساعات لإكمال، اعتمادا على حجم مجموعة البيانات ووحدة المعالجة المركزية للكمبيوتر المستخدم.

3. ذروة الاتصال والتعليق التوضيحي

  1. بمجرد الانتهاء من تشغيل SCRAP ، تحقق من أن الإخراج يتضمن ، من بين ملفات أخرى ، ملف SAMPLE.aligned.unique.bam. هذا ملف ثنائي يحتوي على محاذاة الحمض النووي الريبي المستهدف على الجينوم المرجعي المقدم من المستخدم.
  2. الآن قم بإجراء مكالمات الذروة عن طريق تشغيل Peak_Calling.sh.
    باش سكراب / بن / Peak_Calling.sh -د CLASH_Human / -أ CLASH_Human / CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP / -m has -g hg38
    ملاحظة: استدعاء الذروة هو سمة من سمات SCRAP ، والتي تم تصميمها للسماح للباحثين بتقييم تفاعلات الحمض النووي الريبي الصغيرة غير المشفرة الأكثر قوة وقابلية للتكرار: تفاعلات الحمض النووي الريبي المستهدفة داخل مكتبات الحمض النووي الريبي الوهمية الخاصة بهم. هذه الميزة ، على سبيل المثال ، يمكن أن تساعد الباحثين في تحديد التفاعلات التي قد يرغبون في تحديدها لمزيد من التحقيق. تصف الخطوة 3.2.2 أدناه كيف يحدد المستخدم المعايير التي يريد استخدامها لتحديد الصرامة التي تسمى بها الذروة - وهذا يشمل عدد التفاعلات الفريدة ، أو قراءات التسلسل ، والتي يجب أن تكون قد حدثت حتى يتم استدعاء الذروة ، بالإضافة إلى عدد المكتبات التي يجب أن يكون هذا التفاعل المحدد قد حدث فيها.
    1. مرة أخرى ، قم بسرد المسارات الكاملة إلى الدليل الذي يحتوي على مجلدات العينة وملف المحول (راجع سطر الأوامر في الخطوة 3.2).
    2. بعد ذلك ، قم بتعيين الحد الأدنى لعدد قراءات التسلسل المطلوبة لاستدعاء الذروة (راجع سطر الأوامر في الخطوة 3.2).
    3. قم بتعيين الحد الأدنى لعدد مكتبات التسلسل المميزة التي يجب أن تحتوي على ذروة حتى يتم استدعاؤها (راجع سطر الأوامر في الخطوة 3.2).
      ملاحظة: يعتمد اختيار القيم لكل من 3.2.2 و 3.2.3 على طبيعة العينات المتسلسلة وعدد العينات أو أنواع العينات. هنا ، يلزم ما لا يقل عن 3 قراءات تسلسل خيمري في عينة لاستدعاء الذروة ، ويجب أن تكون الذروة مدعومة بعينات 2 على الأقل. قد يقرر المحقق الذي يقوم بتقييم مجموعة بيانات بها العديد من النسخ المتماثلة لمكتبة التسلسل لحالة معينة ، على سبيل المثال ، طلب وجود القراءات في عدد أكبر من مكتبات تسلسل العينات.
    4. وضح ما إذا كان يجب أن تساهم sncRNAs من نفس العائلة في نفس الذروة. على سبيل المثال ، نظرا لأن miRNAs من نفس العائلة تشترك في تسلسل البذور ، يمكن لهذه miRNAs ربط مجموعات مشتركة ومتداخلة من أهداف الجينات. قد يرغب المستخدم في تحديد التأثير الكامل للعائلة على هذه الأهداف من خلال تقييم ذروتها الجماعية (راجع سطر الأوامر في الخطوة 3.2).
    5. بعد ذلك ، أشر إلى المسار الكامل للدليل المرجعي واختصار miRBase واختصار الجينوم المرجعي (راجع سطر الأوامر في الخطوة 3.2).
  3. بمجرد اكتمال ذروة الاتصال، قم بتشغيل التعليق التوضيحي لذروة الاتصال.
    باش سكراب / بن / Peak_Annotation.sh -p CLASH_Human / peaks.bed -r SCRAP / -s الإنسان
    1. قم بإدراج المسار الكامل إلى ملف peaks.bed (أو peaks.family.bed) الناتج من استدعاء الذروة والمسار الكامل إلى الدليل المرجعي والأنواع المطلوبة للتعليق التوضيحي.

4. تصور البيانات

ملاحظة: تم الآن إكمال جميع خطوات التحليل باستخدام SCRAP. لتصور البيانات ، يوصى بعدة طرق:

  1. دمج كافة ملفات .bam (ملف SAM الثنائي) التي ستكون مطلوبة للتصور معا (دمج samtools).
  2. قم بفرز ملف .bam المدمج الناتج (فرز samtools). يتم فرز محتويات الملف سطرا بسطر بحيث يمكن فهرسة samtools.
  3. فهرسة ملف .bam الذي تم فرزه (فهرس samtools). يتم إنشاء ملف BAI (فهرس تنسيق samtools الثنائي) للسماح بالتصور في عارض الجينوم التكاملي (IGV).
  4. أخيرا ، افتح ملف .bam الذي تم فرزه وملف .bai المفهرس في IGV.
    ملاحظة: SncRNA: قد تكون تفاعلات الحمض النووي الريبي المستهدفة ذات الاهتمام ذات أولوية للمتابعة بعدد من الطرق الخاصة بالتحقيق. يتمثل أحد الأساليب الأولية العامة في تقييم التفاعلات التي يتم دعم القمم من خلال قراءات التسلسل الأكثر وهمية. يمكن أيضا تصور التفاعلات ذات الأهمية باستخدام خادم الويب DuplexFold من حزمة RNAstructure عن طريق إدخال تسلسل كل من sncRNA والحمض النووي الريبي المستهدف من التفاعل المكتشف11. لكل ذروة ، يمكن العثور على الكروموسوم (العمود الأول) والإحداثيات الجينومية (البداية: 1st العمود end: 2nd column) داخل ملف peaks.bed.species.annotation.txt الذي تم إنشاؤه في التعليق التوضيحي للذروة. بالنسبة ل miRNAs على وجه الخصوص ، في حين أن التفاعلات القابلة للتكرار والوظيفية يمكن أن تفتقر إلى الارتباط المطابق للبذور (على سبيل المثال ، قد تستخدم التفاعلات الارتباط التعويضي 3 بوصات) ، يمكن مع ذلك تقييم وجود مواقع مطابقة للبذور في شكل ربط مشابه للحمض النووي الريبي المستهدف كميزة تحقق من صحة التفاعلات المكتشفة المهمة وظيفيا 4,12. يمكن أن تشمل معالجة البيانات المساعدة مقارنات لتغطية القراءة التفاضلية بين القمم في ظروف بيولوجية متميزة وتقييم محتمل لتجميع الجينات المنظمة في مسارات باستخدام أداة تحليل المسار.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

نتائج sncRNA: يظهر الحمض النووي الريبي المستهدف المكتشف بواسطة نسخة معدلة من SCRAP (إصدار SCRAP 2.0 ، الذي ينفذ تعديلات لتصفية rRNA) على مجموعات بيانات التسلسل المنشورة مسبقا والتي تم إعدادها باستخدام CLEAR-CLIP9 في الشكل 2 والجدول 1. يمكن للمستخدمين تقدير الانخفاض في تفاعلات miRNA للكسر النسبي مع مناطق intron والذي يحدث بعد عزل التفاعلات عالية الثقة عن طريق استدعاء الذروة في SCRAP. تتوفر أيضا بيانات إضافية من التحليلات باستخدام SCRAP في المنشور الأولي لخط الأنابيبهذا 6. اعتمادا على النهج التجريبي ، قد تكون هناك حاجة لتصفية بيانات التسلسل من مكتبات الحمض النووي الريبي الوهمي المعدة لتقليل القطع الأثرية في النتائج. إن التحضير الكيميائي الحيوي دون المستوى الأمثل لمكتبة التسلسل و / أو التصفية دون المستوى الأمثل لبيانات التسلسل يمكن أن يؤدي إلى إدراج غير صحيح للقراءات التي لم تنشأ عن ربط sncRNAs والحمض النووي الريبي المستهدف المرتبط ب Argonaute. يمكن أن تتضمن هذه القراءات الأثرية دايمرات أولية أو دايمرات محول ، و rRNAs ، و pre-miRNAs. يصف الجدول 2 القطع الأثرية المحتملة التي يمكن اكتشافها في النتائج والحلول المحتملة.

Figure 1
الشكل 1: تنسيق أدلة البيانات. يجب توفير الملفات التي تحتوي على قراءات أولية لكل مكتبة تسلسل بالتنسيق .fastq.gz. (أ) إذا لم تكن المكتبات مقترنة ، استخدام ملف .fastq.gz واحد في التحليل. يجب تسمية هذا الملف "SAMPLE.fastq.gz" حيث يكون SAMPLE هو اسم العينة الدقيق الذي يوفره المستخدم في ملف المحول. يجب تضمين الملف داخل مجلد يطابق اسم العينة تماما. (ب) بالنسبة لمكتبات تسلسل الأطراف المزدوجة ، سيتم استخدام ملفين .fastq.gz. يجب تسمية هذه الملفات "SAMPLE-R1.fastq.gz" و "SAMPLE-R2.fastq.gz" ويجب أن تكون موجودة داخل مجلد يطابق اسم العينة تماما. يجب أن تكون جميع هذه الدلائل المسماة SAMPLE موجودة داخل نفس الدليل الأصلي ، والذي سيقدمه المستخدم إلى SCRAP باعتباره "نموذج الدليل". يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 2
الشكل 2: نسبة miRNA: تفاعلات الحمض النووي الريبي المستهدف حسب نوع الهدف وطرق استدعاء الذروة. الرنا الوهمي: تم تحليل البيانات المنشورة لتسلسل الحمض النووي الريبي المستهدف من المكتبات التي تم إعدادها باستخدام CLEAR-CLIP (SRR2413277 - SRR2413295)9 باستخدام نسخة معدلة من SCRAP (إصدار SCRAP 2.0) مع تنفيذ تصفية rRNA. تمت تصفية ما قبل miRNAs و tRNAs و rRNAs ، وتم استخدام إعدادات استدعاء الذروة المميزة ل "الثقة العالية" (الحد الأدنى 3 قراءات ومكتبات 2) و "جميع التفاعلات" (الحد الأدنى 1 قراءة و 1 مكتبة). تم تجميع التفاعلات حسب عائلة miRNA أو غير مجمعة. تم حساب الكسور النسبية لقراءات الحمض النووي الريبي الوهمي للفئات (CDS ، 5' UTR ، intergenic ، intron ، 3'UTR) ورسمها بيانيا. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

جميع التفاعلات تفاعلات عالية الثقة
miRNAs الفردية عائلات ميرنا miRNAs الفردية عائلات ميرنا
الاقراص المدمجه 8675 8679 925 1046
5 'UTR 338 338 38 43
بين الجينات 2230 2230 320 339
انترون 9522 9519 382 406
3' UTR 6814 6813 548 644
إجمالي التفاعلات: 31033 31034 4219 4597

الجدول 1: قراءة الخيمرية أعداد miRNA: تفاعلات الحمض النووي الريبي المستهدف حسب نوع الهدف وطريقة استدعاء الذروة. الرنا الخيمري sncRNA: تم تحليل بيانات تسلسل الحمض النووي الريبي المستهدف المنشورة من المكتبات التي تم إعدادها باستخدام CLEAR-CLIP (SRR2413277 - SRR2413295) 9 باستخدام نسخة معدلة من SCRAP (إصدار SCRAP 2.0) مع تنفيذ تصفية rRNA. تمت تصفية ما قبل miRNAs و tRNAs و rRNAs ، وتم استخدام إعدادات استدعاء الذروة المميزة للثقة العالية (الحد الأدنى 3 قراءات ومكتبات 2) وجميع التفاعلات (الحد الأدنى 1 قراءة ومكتبة واحدة) ، مجمعة حسب عائلة miRNA أو غير مجمعة. لكل حالة ، يتم سرد عدد إجمالي تفاعلات miRNA المكتشفة miRNA: الهدف الذي تم فيه تعيين تفاعل الحمض النووي الريبي المستهدف إلى فئة تسلسل الترميز (CDS) ، أو المنطقة غير المترجمة 5 '(5' UTR) ، أو المنطقة بين الجينات ، أو intron ، أو 3' المنطقة غير المترجمة (3'UTR).

ملوثات محتملة تم الكشف عنها على أنها اسباب الحلول المحتملة
دايمرز التمهيدي التفاعلات المكتشفة بين miRNAs التي يتطابق تسلسلها مع نهاية 5 'من التمهيدي للتضخيم والحمض النووي الريبي المستهدف الذي يتطابق تسلسله مع بقية التمهيدي. فصل الحجم غير الصحيح (أي استخراج الجل) لمنتج تفاعل البوليميراز المتسلسل بعد التضخيم. سيتم تجاهل معظم دايمرات التمهيدي بواسطة SCRAP بعد إزالة المحول نظرا لصغر طولها. إذا استمرت ، ففكر في إضافة تسلسلات أولية إلى مرشح.
الحمض النووي الريبي التفاعلات بين miRNAs التعسفية و rRNAs المعروفة أو lncRNAs Gm26917 و Gm42418 عزل غير فعال (أي الترسيب المناعي وفصل الهلام) لمجمعات Argonaute. غالبا ما يكون ترشيح rRNA ضروريا عندما يكون تلوث rRNA وفيرا.
tRNAs وما قبل miRNAs التفاعلات بين شظايا tRNA التي هي منتجات تحلل لنفس tRNA أو 5p و 3p miRNAs المنتجة من نفس ما قبل miRNA. وفرة منخفضة من sncRNA الحقيقي: الوهم الحمض النووي الريبي المستهدف أو تعبير Argonaute منخفض الأنسجة. ترشيح الحمض النووي الريبي وتصفية ما قبل الحمض النووي الريبوزي المرسال.

الجدول 2: قراءات وحلول تسلسل الملوثات المحتملة.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

تم تصميم هذا البروتوكول الخاص باستخدام خط أنابيب SCRAP لتحليل تفاعلات sncRNA: RNA المستهدفة لمساعدة الباحثين الذين يدخلون في التحليل الحسابي. من المتوقع أن يؤدي إكمال البرنامج التعليمي إلى توجيه الباحثين ذوي الخبرة الحسابية للمبتدئين أو أكبر من خلال الخطوات المطلوبة لتثبيت واستخدام خط الأنابيب هذا وتطبيقه لتحليل البيانات المكتسبة من مكتبات تسلسل الحمض النووي الريبي الوهمية. تتضمن الخطوات الحاسمة لإكمال هذا البروتوكول التثبيت المرجعي الصحيح وتشغيل SCRAP ، والذي يمكن أن يستغرق وقتا طويلا ويمكن أن يكون مصدرا للأخطاء ، خاصة إذا لم يتم توخي الحذر أثناء تثبيت التبعيات باستخدام Anaconda أو كتابة وسيطات سطر الأوامر.

هنا ، كان التركيز بشكل خاص على النصائح والخطوات للاستخدام العملي لخط أنابيب SCRAP لتحليل sncRNA الوهمي: مكتبات تسلسل الحمض النووي الريبي المستهدف. تم العثور على SCRAP لتتفوق على منصات تحليل الحمض النووي الريبي الوهمية الأخرى في الكشف عن sncRNA: تفاعلات الحمض النووي الريبي المستهدفة 6,13. قد يكون هذا بسبب ميزة استدعاء الذروة في SCRAP والتي تم تطويرها خصيصا للكشف عن الميزات (على سبيل المثال 3 'الكتف) التي لوحظت نتيجة للخطوات الكيميائية الحيوية المشاركة في تكوين الحمض النووي الريبي الوهمي. تم تطوير طرق استدعاء الذروة الأخرى للنهج الكيميائية الحيوية المتميزة ، مثل تطبيقات تسلسل الترسيب المناعي للكروماتين (CHIP-seq) ، للكشف عن القمم في البيانات الموزعة بشكل متماثل حول متوسط وعادة لا تعمل بشكل جيد في الكشف عن ميزات الذروة ل sncRNA الوهمي: مكتبات الحمض النووي الريبي المستهدف. ومع ذلك ، قد يرغب المستخدمون في اختبار استخدام خطوط أنابيب حسابية أخرى يمكن أن تعمل بشكل أفضل لاحتياجاتهم ، خاصة إذا كانت بياناتهم لا تتناسب مع هذا الوصف.

على الرغم من أن SCRAP لديها الحد الأدنى من متطلبات الأجهزة ، إلا أن وقت تشغيل SCRAP يتدرج بشكل سيئ مع حجم مجموعة البيانات. قد يرغب المحققون الذين تجاوزوا مستوى المبتدئين ، أو الذين لديهم أعداد كبيرة من مجموعات البيانات أو مجموعات البيانات ذات تغطية تسلسل عالية ، في استخدام SCRAP بطريقة يمكن أن تسرع خطوات التحليل. نظرا لأن مجموعات البيانات الكبيرة (عادة ، > 1 مليار قراءة) تتطلب إمكانات تخزين ملفات محسنة وسرعات قراءة / كتابة للبيانات ، فقد يكون تشغيل SCRAP على مجموعة الحوسبة عالية الأداء (HPC) مطلوبا لتحليل مجموعات البيانات الأكبر. سيتم توفير تحسين SCRAP ، والذي يجب أن يوفر التوازي والأداء المحسن على GitHub (https://github.com/Meffert-Lab/). يحتوي هذا الإصدار المحدث من SCRAP (الإصدار 2.0) أيضا على مرشحات محسنة ل rRNA والملوثات الأخرى.

كما هو الحال مع أي واجهة ، قد يواجه المستخدمون حتما صعوبات عند استخدام واجهة سطر الأوامر. الأكثر شيوعا من هذه تشمل الأخطاء الإملائية والمسارات غير الصحيحة وتثبيت / إصدار الحزمة. ينصح المحققون بتوخي الحذر وتجنب الأخطاء المطبعية عند كتابة وسيطات سطر الأوامر وإعادة إنتاج المسارات إلى الملفات أو المجلدات بالضبط (يمكن أن يساعد استخدام الإكمال التلقائي "علامة التبويب" في ذلك). تتم إدارة تبعيات SCRAP عبر Anaconda بحيث يقل احتمال مواجهة المحققين لمشكلات في تثبيت الحزمة أو تحديثات الإصدار.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

ليس لدى المؤلفين ما يكشفون عنه.

Acknowledgments

نشكر أعضاء مختبر Meffert على المناقشات المفيدة ، بما في ذلك BH Powell و WT Mills IV ، على التعليقات النقدية حول وصف تركيب وتنفيذ خط الأنابيب. تم دعم هذا العمل من خلال جائزة مؤسسة Braude ، وبرنامج إطلاق صندوق أبحاث الخلايا الجذعية في ماريلاند ، وجائزة Blaustein Endowment for Pain Research and Education ، و NINDS RO1NS103974 و NIMH RO1MH129292 إلى M.K.M.

Materials

Name Company Catalog Number Comments
Genomes UCSC Genome browser N/A https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux Linux Ubuntu 20.04 or 22.04 LTS recommended
Mac Apple Mac OSX (>11)
Platform setup GitHub N/A https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline GitHub N/A https://github.com/Meffert-Lab/SCRAP
Unix shell Unix operating system bash >=5.0
Unix shell Unix operating system zsh (5.9 recommended)
Windows Windows WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

  1. Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
  2. Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
  3. Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
  4. Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
  5. Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
  6. Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
  7. Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
  8. Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
  9. Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
  10. Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
  11. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
  12. Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
  13. Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Tags

هذا الشهر في JoVE ، العدد 202 ،
برنامج تعليمي للتحليل الحسابي للحمض النووي الريبي الصغير غير المشفر الوهمي: مكتبات تسلسل الحمض النووي الريبي المستهدفة
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Eadara, S., Li, X., Eiss, E. A.,More

Eadara, S., Li, X., Eiss, E. A., Meffert, M. K. Computational Analysis Tutorial for Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries. J. Vis. Exp. (202), e65779, doi:10.3791/65779 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter