Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine: متجر شامل لشرح miRNA للنبات

Published: May 1, 2021 doi: 10.3791/62430

Summary

هنا ، نقدم خط أنابيب miRNA جديدا ومؤتمتا بالكامل ، mirMachine يمكنه 1) تحديد miRNAs المعروفة والجديدة بشكل أكثر دقة و 2) مؤتمت بالكامل ومتاح مجانا. يمكن للمستخدمين الآن تنفيذ برنامج نصي قصير للإرسال لتشغيل خط أنابيب mirMachine المؤتمت بالكامل.

Abstract

من بين أنواع مختلفة من الحمض النووي الريبي غير المشفر ، يمكن القول إن الحمض النووي الريبي الصغير (miRNAs) كان في دائرة الضوء على مدار العقد الماضي. بصفتها منظمات ما بعد النسخ للتعبير الجيني ، تلعب miRNAs أدوارا رئيسية في المسارات الخلوية المختلفة ، بما في ذلك التطور والاستجابة للإجهاد الحيوي ، مثل الجفاف والأمراض. مكن وجود تسلسلات جينوم مرجعية عالية الجودة من تحديد وشرح miRNAs في العديد من الأنواع النباتية ، حيث يتم حفظ تسلسلات miRNA بشكل كبير. نظرا لأن عمليات تحديد miRNA الحسابية والتعليقات التوضيحية هي في الغالب عمليات معرضة للخطأ ، فإن التنبؤات القائمة على التماثل تزيد من دقة التنبؤ. لقد طورنا وقمنا بتحسين خط أنابيب التعليقات التوضيحية miRNA ، SUmir ، في العقد الماضي ، والذي تم استخدامه للعديد من جينومات النبات منذ ذلك الحين.

تقدم هذه الدراسة خط أنابيب miRNA جديد مؤتمت بالكامل ، mirMachine (miRNA Machine) ، من خلال (i) إضافة خطوة تصفية إضافية على تنبؤات الهيكل الثانوي ، (ii) جعله مؤتمتا بالكامل ، و (iii) تقديم خيارات جديدة للتنبؤ إما miRNA المعروف بناء على التماثل أو miRNAs الجديدة بناء على قراءات تسلسل الحمض النووي الريبي الصغيرة باستخدام خط الأنابيب السابق. تم اختبار خط أنابيب miRNA الجديد ، mirMachine ، باستخدام مورد معلومات Arabidopsis ، TAIR10 ، وإصدار جينوم Arabidopsis و International Wheat Genom Genocium (IWGSC) الجينوم المرجعي للقمح v2.

Introduction

أدى التقدم في تقنيات تسلسل الجيل التالي إلى توسيع فهم هياكل الحمض النووي الريبي والعناصر التنظيمية ، مما كشف عن الحمض النووي الريبي غير المشفر (ncRNAs) المهم وظيفيا. من بين الأنواع المختلفة من الحمض النووي الريبوزي الناقل ، تشكل الحمض النووي الريبي الصغير (miRNAs) فئة تنظيمية أساسية من الحمض النووي الريبي الصغير بطول يتراوح بين 19 و 24 نيوكليوتيدات في النباتات 1,2. منذ اكتشاف أول miRNA في الديدان الخيطية Caenorhabditis elegans3 ، تمت دراسة وجود ووظائف miRNAs على نطاق واسع في الجينوم الحيواني والنباتي وكذلك4،5،6. تعمل miRNAs عن طريق استهداف mRNAs للانقسام أو القمع الانتقالي7. أظهرت الأدلة المتراكمة أيضا أن miRNAs تشارك في مجموعة واسعة من العمليات البيولوجية في النباتات بما في ذلك النمو والتطور8 ، والتكوين الحيوي الذاتي9 ، والعديد من استجابات الإجهاد الحيوي وغير الحيوي10.

في النباتات ، تتم معالجة miRNAs في البداية من نصوص أولية طويلة تسمى pri-miRNAs11. هذه pri-miRNAs الناتجة عن RNA polymerase II داخل النواة هي نسخ طويلة تشكل بنية طي خلفي غير كاملة12. تخضع pri-miRNAs لاحقا لعملية انشقاق لإنتاج سلائف دبوس شعر داخلية مفردة (ss) من miRNAs تسمى pre-miRNAs11. يشكل ما قبل miRNA بنية تشبه دبوس الشعر حيث يتم طي حبلا واحد في هيكل مزدوج تقطعت به السبل لاستئصال miRNA مزدوج (miRNA / miRNA *)13. يقطع البروتين الشبيه ب Dicer كلا شريطي miRNA / miRNA * على الوجهين ، تاركا 2-nucleotide 3'-overlands14,15. يتم ميثيل miRNA المزدوج داخل النواة ، مما يحمي الطرف 3'-من miRNA من التدهور ونشاط اليوريديل16,17. تقوم طائرة هليكوبتر بفك دوبلكس miRNA الميثيلي بعد التصدير وتعرض miRNA الناضج لمجمع الإسكات الناجم عن الحمض النووي الريبي (RISC) في السيتوسول18. أحد حبلا الوجهين هو miRNA ناضج مدمج في RISC ، في حين أن الشريط الآخر ، miRNA * ، متحلل. يرتبط مركب miRNA-RISC بالتسلسل المستهدف مما يؤدي إما إلى تدهور mRNA في حالة التكامل الكامل أو القمع الانتقالي في حالة التكامل الجزئي13.

استنادا إلى ميزات التعبير والتكوين الحيوي ، تم وصف إرشادات التعليق التوضيحي miRNA15,19. مع المبادئ التوجيهية المحددة ، طور لوكاس وبوداك خط أنابيب SUmir لإجراء تماثل قائم على تحديد السيليكو ميرنا في النباتات9. يتكون خط أنابيب SUmir من نصين: SUmirFind و SUmirFold. تقوم SUmirFind بإجراء عمليات بحث عن التشابه مقابل مجموعات بيانات miRNA المعروفة من خلال فحص أداة بحث المحاذاة المحلية الأساسية (BLAST) التابعة للمركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) مع المعلمات المعدلة لتضمين النتائج التي تحتوي على 2 فقط أو أقل من حالات عدم التطابق ولتجنب التحيز نحو النتائج الأقصر (blastn-short -unapped -penalty -1 -reward 1). يقوم SUmirFold بتقييم البنية الثانوية لتسلسلات miRNA المفترضة من نتائج BLAST20 باستخدام UNAfold21. يميز SUmirFold miRNAs عن الحمض النووي الريبي الصغير المتداخل من خلال تحديد خصائص بنية دبوس الشعر. علاوة على ذلك ، فإنه يميز miRNAs عن ssRNAs الأخرى مثل tRNA و rRNA من خلال المعلمات ، والحد الأدنى لمؤشر طاقة الطي > 0.67 ومحتوى GC من 24-71٪. تم تحديث خط الأنابيب هذا مؤخرا بإضافة خطوتين إضافيتين إلى (i) زيادة الحساسية ، (ii) زيادة دقة التعليقات التوضيحية ، و (iii) توفير التوزيع الجيني لجينات miRNA المتوقعة22. نظرا للحفظ العالي لتسلسل miRNA النباتي23 ، تم تصميم خط الأنابيب هذا في الأصل للتنبؤ ب miRNA القائم على التماثل. ومع ذلك ، لا يمكن تحديد miRNAs الجديدة بدقة من خلال تحليل المعلوماتية الحيوية هذا لأنه يعتمد بشكل كبير على الحفاظ على تسلسل miRNAs بين الأنواع ذات الصلة الوثيقة.

تقدم هذه الورقة خط أنابيب miRNA جديدا ومؤتمتا بالكامل ، mirMachine يمكنه 1) تحديد miRNAs المعروفة والجديدة بشكل أكثر دقة (على سبيل المثال ، يستخدم خط الأنابيب الآن تنبؤات miRNA الجديدة المستندة إلى sRNA-seq بالإضافة إلى تحديد miRNA القائم على التماثل) و 2) مؤتمت بالكامل ومتاح مجانا. تضمنت المخرجات أيضا التوزيعات الجينومية ل miRNAs المتوقعة. تم اختبار mirMachine لكل من التنبؤات القائمة على التماثل والتنبؤات القائمة على sRNA-seq في جينومات القمح والأرابيدوبسيس . على الرغم من إصداره في البداية كبرنامج حر ، إلا أن UNAfold أصبح برنامجا تجاريا في العقد الماضي. مع هذه الترقية ، تم تحويل أداة التنبؤ بالهيكل الثانوي من UNAfold إلى RNAfold بحيث يمكن أن تكون mirMachine متاحة مجانا. يمكن للمستخدمين الآن تنفيذ برنامج نصي قصير للإرسال لتشغيل خط أنابيب mirMachine المؤتمت بالكامل (يتم توفير أمثلة في https://github.com/hbusra/mirMachine.git).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. تبعيات البرامج وتثبيتها

  1. قم بتثبيت تبعيات البرامج من موقعهم الرئيسي أو باستخدام conda.
    1. قم بتنزيل Perl وتثبيته ، إذا لم يكن مثبتا بالفعل ، من موقعه الرئيسي (https://www.perl.org/get.html).
      ملاحظة: تم توقع النتائج الممثلة باستخدام Perl v5.32.0.
    2. قم بتنزيل Blast+ ، وهو برنامج محاذاة ، من موقعه الرئيسي (https://www.ncbi.nlm.nih.gov/books/NBK279671/) كملف قابل للتنفيذ وكشفرة مصدر.
      ملاحظة: تم توقع النتائج الممثلة باستخدام BLAST 2.6.0+.
    3. قم بتثبيت حزمة مترجمة مسبقا من RNAfold من https://www.tbi.univie.ac.at/RNA/.
    4. بدلا من ذلك ، قم بتثبيت هذه البرامج باستخدام conda التالية: i) conda install -c bioconda blast. ب) كوندا تثبيت -C بيوكوندا فيينارنا.

2. إعداد واختبار mirMachine

  1. قم بتنزيل أحدث إصدار من البرامج النصية mirMachine والبرنامج النصي لإرسال mirMachine من GitHub، https://github.com/hbusra/mirMachine.git، ثم قم بتعيين مسار البرامج النصية في PATH.
  2. استخدم بيانات الاختبار المتوفرة في GitHub للتأكد من تنزيل mirMachine مع جميع تبعياته بشكل صحيح.
  3. قم بتشغيل mirMachine على بيانات الاختبار الموضحة أدناه.
    باش mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    ملاحظة: اضبط الخيار -n على 10 لأن بيانات الاختبار تحتوي على كروموسوم واحد فقط من جينوم القمح. في الإعدادات الافتراضية ، يتم تعيين الخيار -n إلى 20.
  4. تحكم في ملفات إخراج hairpins.tbl.out.tbl ل miRNAs الناضجة المتوقعة وسلائفها المتوقعة ومواقعها على الكروموسومات.
  5. تحقق من ملفات السجل لمخرجات البرنامج والتحذيرات.

3. تحديد miRNA القائم على التماثل

  1. قم بتشغيل mirMachine باستخدام البرنامج النصي bash الموضح أدناه:
    باش mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. تحقق من miRNAs المتوقعة. ابحث عن ملف الإخراج المسمى $input_file.results.tbl.hairpins.tbl.out.tbl ل miRNAs المتوقعة. ابحث عن ملف الإخراج المسمى $input_file.results.tbl.hairpins.fsa لتسلسلات ما قبل miRNA FASTA. ابحث عن ملف الإخراج المسمى $input_file.results.tbl.hairpins.log لملف سجل دبوس الشعر.

4. تحديد الرواية miRNA

  1. قم بمعالجة ملفات sRNA-seq FASTQ مسبقا بتنسيق FASTA المناسب. قم بقص المحولات إذا لزم الأمر. لا تقم بقص القراءات منخفضة الجودة ؛ بدلا من ذلك ، قم بإزالتها. إزالة القراءات التي تحتوي على N. تحويل ملف FASTQ إلى ملف FASTA ($input_file).
  2. قم بتشغيل mirMachine باستخدام البرنامج النصي bash الموضح أدناه.
    باش mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    ملاحظة: تم تعيين $mismatches إلى 0 للتنبؤات المستندة إلى sRNA-seq.
  3. تحقق من miRNAs المتوقعة. ابحث عن ملف الإخراج المسمى $input_file.results.tbl.hairpins.tbl.out.tbl ل miRNAs المتوقعة. ابحث عن ملف الإخراج المسمى $input_file.results.tbl.hairpins.fsa لتسلسلات ما قبل miRNA FASTA. ابحث عن ملف الإخراج المسمى $input_file.results.tbl.hairpins.log لملف سجل دبوس الشعر.

5. المعلمات المتقدمة

ملاحظة: يتم تعريف الإعدادات الافتراضية لجميع المعلمات باستثناء ملف الجينوم وملف miRNA المدخل.

  1. قم بتعيين الخيار -db إلى قاعدة بيانات انفجار لتخطي قاعدة بيانات مرجع المبنى داخل خط الأنابيب.
  2. اضبط الخيار -m على عدد حالات عدم التطابق المسموح بها.
    ملاحظة: في الإعدادات الافتراضية، تم تعيين الخيار - m إلى 1 للتنبؤات المستندة إلى التماثل و0 للتنبؤات المستندة إلى sRNA-seq.
  3. اضبط -n على عدد الزيارات المراد حذفها بعد المحاذاة (الافتراضي إلى 20). تغيير هذا على أساس الأنواع.
  4. استخدم -long لتقييم الهياكل الثانوية لقائمة المشتبه بهم.
  5. استخدم - s لتنشيط تنبؤ miRNA الجديد بناء على بيانات sRNA-seq.
  6. اضبط الخيار - lmax على الحد الأقصى لطول قراءات sRNA-seq لتضمينها في الفحص.
  7. اضبط الخيار - lmax على الحد الأدنى لطول قراءات sRNA-seq لتضمينها في الفحص.
  8. استخدم الخيار -rpm لتعيين حد عمليات القراءة لكل مليون (RPM).
    ملاحظة: بالنسبة للمعلمات المتقدمة مثل طول pri-miRNAs / pre-miRNAs ، يتم تشجيع المستخدمين ذوي الخبرة على تعديل البرامج النصية لأبحاثهم ذات الاهتمام. بالإضافة إلى ذلك ، إذا كان المستخدمون يعتزمون تخطي بعض الخطوات أو يفضلون استخدام المخرجات المعدلة ، فيمكن تعديل البرنامج النصي للإرسال ببساطة عن طريق إضافة # في بداية الأسطر لتخطي تلك الأسطر.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

تم تطبيق خط أنابيب miRNA ، mirMachine ، الموصوف أعلاه على بيانات الاختبار للتقييم السريع لأداء خط الأنابيب. تم فحص فقط miRNAs النباتية عالية الثقة المودعة في miRBase v22.1 مقابل الكروموسوم 5A من جينوم القمح IWGSC RefSeq v224. أعاد mirMachine_find 312 زيارة للقائمة غير المتكررة المكونة من 189 miRNAs عالية الثقة بحد أقصى واحد من عدم التطابق المسموح به (الجدول 1). mirMachine_fold تصنيف 49 منها على أنها miRNAs مفترضة اعتمادا على تقييم الهيكل الثانوي. كانت المجموعة الأعلى تمثيلا من miRNAs هي miR9666 مع ما مجموعه 18 miRNAs المحددة (الشكل 1). تشترك بعض miRNAs في نفس miRNA الناضج ، ولكن تتم معالجتها من تسلسل مختلف قبل miRNA. تمت إعادة تسمية هذه miRNAs باسم عائلة miRNA متبوعا برقم فريد ، على سبيل المثال ، miR156-5p-1 و miR156-5p-2. من بين 49 miRNAs المفترضة ، تم تحديد 20 تسلسل miRNA ناضج غير زائد عن الحاجة. يمكن نسخ بعض miRNAs من أكثر من موضع واحد مما يؤدي إلى تمثيل عدد أكبر من miRNAs. في بيانات الاختبار ، تم تمثيل miR9666-3p-5 مرتين: أحدهما على حبلا الإحساس (عند 602887137) والآخر على الشريط المضاد (عند 542053079). يتم توفير جميع المواقع في GitHub ضمن ملف إخراج TestData المسمى mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

أدلة التعبير في جينوم نباتي واحد كافية ، بالنظر إلى الحفاظ على miRNAs في النباتات. ومع ذلك ، فإن مجموعة بيانات miRNA عالية الثقة لا توفر سوى كمية محدودة من البيانات. لذلك ، يفضل المستخدم استخدام miRNAs عالية الثقة و / أو التي تم التحقق من صحتها تجريبيا كمجموعة بيانات مرجعية وتخطي خطوة التحقق من صحة التعبير ، أو استخدام جميع miRNAs النباتية المتاحة كمجموعة بيانات مرجعية والبحث عن دليل التعبير بعد ذلك. هنا ، نظرا لاستخدام miRNAs عالية الثقة كمجموعة مرجعية ، والتي تم التحقق من صحتها تجريبيا في أحد جينومات النبات ، تم تخطي خطوة التحقق من صحة التعبير لبيانات الاختبار.

تم قياس أداء mirMachine باستخدام نباتات أحادية الفلقة وثنائية الفلقة بما في ذلك Arabidopsis thaliana (Arabidopsis ، إصدار TAIR10) و Triticum aestivum (القمح ، IWGSC RefSeq v2). تم تقييم أداء التنبؤات القائمة على التماثل والتنبؤات القائمة على sRNA-seq ، وتمت مقارنة النتائج مع miRDP225 ، وهي أداة تنبؤ miRNA قائمة على NGS. تم تنفيذ التنبؤات القائمة على التماثل باستخدام القائمة غير الزائدة عن تسلسلات miRNA الناضجة للنبات المودعة في miRbase v2226. تم تنفيذ التنبؤات المستندة إلى sRNA-seq باستخدام مجموعات البيانات المتاحة للجمهور ؛ GSM2094927 للأرابيدوبسيس و GSM1294661 للقمح. بالإضافة إلى النتائج الأولية ، تمت تصفية التنبؤات القائمة على التماثل للحصول على دليل تعبيري لتسلسل نجوم miRNA و miRNA الناضجة باستخدام نفس مجموعات بيانات sRNA-seq.

يوضح الشكل 2 أداء كل أداة وإعدادات mirMachine على النوعين. تم حساب الحساسية على أنها العدد الإجمالي ل miRNAs المعروفة المحددة مقسومة على العدد الإجمالي ل miRNAs المحددة. أظهرت النتائج أن أداء mirMachine تفوق على miRDP2 من حيث الحساسية والتنبؤات الإيجابية الحقيقية في بيانات Arabidopsis . بالنسبة لبيانات القمح ، قدم التنبؤ القائم على التماثل mirMachine ، المدعوم بأدلة التعبير ، حساسية أفضل من miRDP2. بالنسبة لكلا الجينومين ، تنبأ miRDP2 بعدد أكبر من الإيجابيات الحقيقية مقارنة بالتنبؤات القائمة على mirMachine sRNA-seq والتنبؤات القائمة على التماثل مع أدلة التعبير. وتجدر الإشارة إلى أن miRDP2 يخفض عتبة التعبير (RPM ، يقرأ لكل مليون) من 10 إلى 1 للتنبؤ ب miRNAs المعروفة ، مما يؤدي إلى تنبؤات إيجابية حقيقية أعلى. بشكل عام ، يمكن استخدام mirMachine لتحديد كل من miRNAs الجديدة والمعروفة. تتمثل إحدى مزايا mirMachine في قدرتها على التنبؤ بالتوزيع على مستوى الجينوم ل miRNAs المفترضة دون تقييد أنسجة وظروف معينة. أخيرا ، فإن mirMachine سهل الاستخدام ويوفر المرونة لضبط المعلمات مثل عدد الزيارات وعدم التطابق وطول miRNAs و RPMs لأغراض بحثية محددة. مجتمعة ، توفر mirMachine تنبؤات دقيقة ل miRNAs المفترضة في النسخ وجينومات النباتات.

Figure 1
الشكل 1: توزيع عائلات miRNA المحددة من الكروموسوم 5A من الجينوم المرجعي للقمح IWGSC v2. تظهر تسميات البيانات عائلة miRNA وعدد miRNAs التي تنتمي إلى كل عائلة miRNA. الاختصارات: miRNA = microRNA ؛ IWGSC = الاتحاد الدولي لتسلسل جينوم القمح. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الشكل.

Figure 2
الشكل 2: تقييم أداء mirMachine. يتم عرض مقارنات بين الحساسية والعدد الإجمالي ل miRNAs المعروفة المتوقعة (الإيجابيات الحقيقية) ل mirMachine مع التنبؤات القائمة على التماثل والقائمة على sRNA-seq وبرنامج miRDP2. اختصار: miRNA = microRNA. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الشكل.

الجينوم حجم الجينوم مجموعة بيانات miRNA المرجعية mirMachine_find الزيارات mirMAchine_fold الزيارات # من عائلات miRNA
بيانات الاختبار ~ 0.7 جيجابايت 189 312 49 9
Chr5A

الجدول 1: إحصائيات الميرماشين. بيانات الاختبار مأخوذة من الكروموسوم 5A من الجينوم المرجعي للقمح IWGSC v2. الاختصارات: miRNA = microRNA ؛ IWGSC = الاتحاد الدولي لتسلسل جينوم القمح.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

تم استخدام خط أنابيب miRNA الخاص بنا ، SUmir ، لتحديد العديد من miRNAs النباتية على مدار العقد الماضي. هنا ، قمنا بتطوير خط أنابيب جديد ومؤتمت بالكامل ومتاح مجانا لتحديد miRNA والتعليق التوضيحي ، mirMachine. وعلاوة على ذلك، كان عدد من خطوط أنابيب تحديد هوية الحمض النووي الريبوزي المرسال، بما في ذلك، على سبيل المثال لا الحصر، خط الأنابيب السابق، يعتمد على برنامج UNAfold21، الذي أصبح برنامجا تجاريا بمرور الوقت، على الرغم من أنه كان متاحا مجانا في السابق. لم تعد هذه الآلة الجديدة والمؤتمتة بالكامل تعتمد على UNAfold. بدلا من ذلك ، يتم استخدام RNAfold المتاح مجانا من حزمة ViennaRNA27 للتنبؤ بالهيكل الثانوي. بالإضافة إلى ذلك ، تم جمع جميع البرامج النصية ل mirMachine في برنامج نصي bash مع معلمات قابلة للتعديل لجعل mirMachine أداة تنبؤ وتعليق miRNA مؤتمتة بالكامل ومتاحة مجانا.

استفادت mirMachine من خصائص miRNAs النباتية وتكوينها الحيوي. على عكس ما قبل miRNAs الحيوانية ، فإن ما قبل miRNAs النباتية متغيرة في الطول والسمات الهيكلية15. وبالتالي ، تم وضع معيار لتحديد miRNAs النباتية اعتمادا على خصائص miRNAs وتكوينها الحيوي15. لم يتم تحديد حد فاصل لطول ما قبل miRNA لأن طول ما قبل miRNAs النباتية يمكن أن يختلف بشكل ملحوظ ويمكن أن يكون مئات النيوكليوتيدات طويلة. بدلا من ذلك ، تم تقييم طي هيكل pri-miRNA ، والذي كان يقتصر على ~ 700 نقطة أساس في الطول ، لأول مرة. في وقت لاحق ، تم توقع تسلسل ما قبل miRNA من تسلسلات pri-miRNA المرشحة وتقييمها للحصول على إحصائيات قابلة للطي مناسبة.

تمتلك العديد من الجينومات النباتية ، وخاصة الحبوب المهمة زراعيا مثل القمح والشعير ، جينومات متكررة للغاية28،29،30. بخلاف المحتوى عالي التكرار ، لوحظ تعدد الصبغيات في بعض هذه النباتات24 ، مما أدخل تعقيدات إضافية على تحديد السيليكو وتوصيف هياكل miRNA. تعد التكرارات مصدرا رئيسيا لإنتاج siRNAs31 ، والتي تشبه miRNAs في أشكالها الناضجة. ومع ذلك ، فإنها تختلف في التكوين الحيوي والوظيفة32,33. من الصعب للغاية إزالة siRNAs من قوائم miRNA المرشحة. في الواقع ، تم الإبلاغ عن أن قاعدة بيانات miRNA الأكثر استخداما ، miRBase26 ، تحتوي على أعداد كبيرة من siRNAs المشروحة بشكل خاطئ باسم miRNAs34,35. بناء على الاختلافات في تكوينها الحيوي ، تقوم mirMachine بتصفية الحمض النووي الريبي الصغير الذي يشكل زوجا مثاليا مع الشريط المضاد للحساسية مثل siRNAs ويضع هذه التسلسلات في الجدول المشتبه به. بالإضافة إلى ذلك ، يحتوي mirMachine على الخيار -n ، والذي يحدد الحد الأقصى لعدد الزيارات لتصفية الحمض النووي الريبي المرشح على أنه siRNAs.

مطلوب دليل التعبير للتحقق من صحة جميع miRNAs المتوقعة في silico. نظرا لأن miRNAs محفوظة بشكل كبير بين جينومات النبات ، يجب أن تكون أدلة التعبير في أحد جينومات النبات كافية لتأكيد صحة miRNA المتوقع. إن استخدام تسلسلات miRNA عالية الثقة والناضجة في عملية الفرز الأولية له ميزة توفير أدلة التعبير لجميع miRNAs المتوقعة. ومع ذلك ، فإن القائمة المختصرة لمجموعة بيانات miRNA الأولية تحد من التنبؤ بمجموعة شاملة من miRNAs في الجينوم. بدلا من ذلك ، يمكن استخدام مجموعة كاملة من miRNAs النباتية المودعة في قاعدة بيانات miRBase كمجموعة بيانات أولية بدلا من التصفية ل miRNAs عالية الثقة. ينصح المستخدمون بالبحث عن أدلة التعبير من خلال علامات التسلسل المعبر عنها أو المصفوفات الدقيقة miRNA أو بيانات تسلسل الحمض النووي الريبي الصغيرة لواحد على الأقل من جينومات النبات إذا لم تتوفر أي بيانات تعبير للأنواع ذات الاهتمام.

يمكن أن تساعد تنبؤات miRNA القائمة على التماثل في توضيح التوزيع على مستوى الجينوم لعائلة miRNAs المعروفة. من المحتمل أن يتم التعبير عن هذه miRNAs في أنسجة وظروف معينة. عيب التنبؤات القائمة على التماثل هو عدم القدرة على تحديد عائلات miRNA الجديدة. في المقابل ، يمكن للتنبؤات المستندة إلى sRNA-seq تحديد miRNAs الجديدة بتكلفة عدد كبير من الإيجابيات الخاطئة. لذلك ، فإن اختيار أفضل نهج متروك للمستخدمين والبحث محل الاهتمام. يمكن أن يساعد mirMachine المقدم هنا في تحديد miRNAs بناء على التماثل مع miRNAs المعروفة أو تسلسل sRNA.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

علم الأحياء، العدد 171،
mirMachine: متجر شامل لشرح miRNA للنبات
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter