Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

خط أنابيب المعلوماتية الحيوية لتحليل بدقه وكفاءه الناسخ ميكرورنا في النباتات

Published: January 21, 2020 doi: 10.3791/59864
* These authors contributed equally

Summary

وهناك خط أنابيب المعلوماتية الحيوية ، وهي miRDeep-P2 (miRDP2 لفتره قصيرة) ، مع تحديث معايير ميرنا النبات وخوارزميه إصلاحها ، يمكن بدقه وكفاءه تحليل ميكرورنا النصوص في النباتات ، وخاصه بالنسبة للأنواع مع الجينوم المعقدة والكبيرة.

Abstract

ميكرورناس (miRNAs) هي من 20 إلى 24-النيوكليوتيد (nt) RNAs الصغيرة الذاتية (sRNAs) الموجودة علي نطاق واسع في النباتات والكائنات التي تلعب أدوارا قويه في تنظيم التعبير الجيني علي مستوي ما بعد النقل. وقد استخدمت علي نطاق واسع التسلسل المكتبات sRNA بواسطة أساليب تسلسل الجيل التالي (خ ع) لتحديد وتحليل المدونات ميرنا في العقد الماضي ، مما ادي إلى زيادة سريعة في اكتشاف ميرنا. ومع ذلك ، تنشا تحديين رئيسيين في التعليق التوضيحي الخاص بالنبات بسبب العمق المتزايد لمكتبات sRNA المتسلسلة وكذلك حجم وتعقيد الجينوم النباتي. أولا ، العديد من الأنواع الأخرى من sRNAs ، علي وجه الخصوص ، التداخل القصير RNAs (siRNAs) من مكتبات Srnas ، يتم بشكل خاطئ المشروح كما miRNAs بواسطة العديد من الاداات الحسابية. ثانيا ، فانه يصبح عمليه تستغرق وقتا طويلا لتحليل النسخ ميرنا في الأنواع النباتية مع الجينوم الكبيرة والمعقدة. للتغلب علي هذه التحديات ، قمنا مؤخرا بترقيه miRDeep-P (أداه شعبيه للتحليلات الناسخة ميرنا) إلى miRDeep-P2 (miRDP2 لفتره قصيرة) من خلال توظيف استراتيجية تصفيه جديده ، وإصلاح خوارزميه التهديف ودمج المصنع تحديث حديثا ميرنا معايير التعليق التوضيحي. اختبرنا miRDP2 ضد السكان المتسلسلين sRNA في خمسه مصانع تمثيليه مع زيادة تعقيد الجينوم ، بما في ذلك Arabidopsis والأرز والطماطم والذرة والقمح. وتشير النتائج إلى ان miRDP2 عالج هذه المهام بكفاءة عاليه جدا. الاضافه إلى ذلك ، تتفوق miRDP2 علي أدوات التنبؤ الأخرى فيما يتعلق بالحساسية والدقة. معا, تظهر نتائجنا miRDP2 كاداه سريعة ودقيقه لتحليل النباتات الناسخ ميرنا, التالي أداه مفيده في مساعده المجتمع أفضل التعليق miRNAs في النباتات.

Introduction

واحده من الاكتشافات الأكثر أثاره في العقدين الماضيين في علم الاحياء هو الدور المنتشر للأنواع sRNA في تنظيم وظائف متنوعة من الجينوم1. وعلي وجه الخصوص ، تشكل mirnas فئة هامه من 20 إلى 24-nt srnas في النواة ، وتعمل أساسا في مرحله ما بعد النقل كمنظمات الجينات البارزة في جميع مراحل تطوير دوره الحياة وكذلك في التحفيز والإجهاد الاستجابات2،3. في النباتات ، mirnas تنشا من النصوص الاوليه التي تسمي pri-mirnas ، والتي يتم نسخها بشكل عام من قبل الجيش النيبالي الريبي البلمره الثاني كوحدات الاستنساخ الفردية4،5. معالجتها عن طريق التطور آلات الخلوية المحفوظة (drosha rnase الثالث في الحيوانية ، مثل dicer في النباتات) ، والمؤسسة العامة-mirnas في السلائف الفورية ميرنا ، قبل mirnas ، والتي تحتوي علي متواليات تشكيل الجذعية داخل الجزيئية هياكل حلقه6،7. ثم تتم معالجه ما قبل mirnas في وسيطه مزدوجة تقطعت بهم السبل ، وهي ميرنا الدوبلكس ، تتالف من حبل وظيفية ، ميرنا ناضجه ، والشريك الوظيفي اقل في كثير من الأحيان ، ميرنا *2،8. بعد تحميلها في مجمع إسكات الناجمة عن الجيش الملكي النيبالي (risc) ، يمكن ان تعترف mirnas ناضجه أهدافهم mrna علي أساس التكامل تسلسل ، مما ادي إلى وظيفة التنظيمية السلبية2،8. mirnas يمكن اما زعزعه استقرار النسخ المستهدفة أو منع الترجمة المستهدفة ولكن الطريقة السابقة تهيمن في النباتات8,9.

منذ اكتشاف الصدفة من ميرنا الاولي في الديدان الخيطية caenorhabditis ايليتس10،11، وقد التزمت الكثير من البحوث لتحديد ميرنا وتحليلها الوظيفي ، وخاصه بعد توافر طريقه خ ع. وقد شجع التطبيق الواسع النطاق لأسلوب النظام المذكور علي استخدام الاداات الحسابية التي صممت للتقاط السمة الفريدة لmirnas ، مثل هيكل حلقه الجذعية من السلائف وتراكمها التفضيلي للتسلسل يقرا علي ميرنا ناضجه وميرنا *. ونتيجة لذلك ، حقق الباحثون نجاحا ملحوظا في تحديد miRNAs في الأنواع المختلفة. بناء علي نموذج الاحتمالات الموصوف سابقا12، قمنا بتطوير Mirdeep-P13، والذي كان أول أداه حسابيه لاكتشاف mirdeep المصنع من بيانات خ ع و. كان mirdeep-P تهدف علي وجه التحديد إلى قهر التحديات من النباتات الفك mirdeep يضم أكثر متغير طول السلائف والأسر بارالوجوس كبيره13,14,15. بعد الإفراج عنها, وقد تم تحميل هذا البرنامج آلاف المرات وتستخدم للتعليق علي المدونات ميرنا في أكثر من 40 الأنواع النباتية16. دفعت بواسطة الاداات المستندة إلى خ ع مثل miRDeep-P ، كانت هناك زيادة كبيره في عدد Mirdeep المسجلة في مستودع ميرنا العامة Mirdeep17، حيث يتم استضافتها أكثر من 38,000 ميرنا البنود حاليا (الإفراج عن 22.1) بالمقارنة فقط ~ 500 ميرنا البنود (الإفراج 2.0) في 200818.

ومع ذلك ، نشات تحديين جديدين من التعليق التوضيحي لنبات ميرنا. أولا, نسب عاليه من الإيجابيات كاذبه وقد أثرت بشكل كبير علي نوعيه النباتات ميرنا التعليقات التوضيحية16,19 للأسباب التالية: 1) وقد تم بشكل خاطئ تعليق الطوفان من rnas التداخل الذاتية الداخلية (sirnas) من مكتبات srna التابعة لشركه الطيران الخاصة. 2) بالنسبة للأنواع دون المعلومات المسبقة ميرنا ، من الصعب التخلص من الإيجابيات كاذبه استنادا إلى بيانات خ ع و. باستخدام miRBase كمثال, تايلور وآخرون20 وجدت ثلث مدخلات النبات ميرنا في مستودع العام21 (الإصدار 21) تفتقر إلى أدله داعمه مقنعه وحتى ثلاثه أرباع الأسر ميرنا النبات كانت مشكوك فيها. ثانيا ، يصبح عمليه تستغرق وقتا طويلا للتنبؤ النباتات miRNAs مع الجينوم الكبيرة والمعقدة16. للتغلب علي هذه التحديات ، قمنا بتحديث miRDeep-P عن طريق أضافه استراتيجية تصفيه جديده ، وإصلاح خوارزميه التهديف ودمج معايير جديده لشرح ميرنا النبات ، وأصدرت النسخة الجديدة miRDP2. الاضافه إلى ذلك ، اختبرنا miRDP2 باستخدام مجموعات البيانات الخاصة بالجينات التي تزيد تدريجيا من احجام الجينوم: Arabidopsis والأرز والطماطم والذرة والقمح. بالمقارنة مع الاداات الخمس الأخرى المستخدمة علي نطاق واسع والإصدار القديم ، miRDP2 تحليل هذه البيانات sRNA وتحليلها النسخ ميرنا أسرع مع تحسين الدقة والحساسية.

محتويات حزمه miRDP2
حزمه miRDP2 يتكون من سته مخطوطات بيرل الموثقة التي ينبغي تشغيلها بالتعاقب من قبل النصي باش المعدة. ومن بين النصوص الستة ، ورثت ثلاثه (convert_bowtie_to_blast، filter_alignments pl، و excise_candidate) من mirdeep-P. يتم تعديل البرامج النصية الأخرى من الإصدار الأصلي. وفيما يلي وصف لوظائف البرامج النصية الستة:

preprocess_reads. pl مرشحات الإدخال يقرا ، بما في ذلك القراءات التي هي طويلة جدا أو قصيرة جدا (< 19 nt أو > 25 nt) ، ويقرا مرتبطة مع تسلسل Rfam ncRNA ، فضلا عن يقرا مع RPM (يقرا لكل مليون) اقل من 5. البرنامج النصي ثم يسترد القراءات المرتبطة بتسلسل الناضجة ميرنا المعروفة. الملفات المدخلة هي القراءة الاصليه في شكل FASTA/FASTA و bowtie2 الإخراج من يقرا تعيين لتسلسل ميرنا و ncRNA.

صيغه لحساب RPM كما يلي:

Equation 1

convert_bowtie_to_blast. pl يغير شكل ربطه إلى شكل تحليل الانفجار. تنسيق تحليل الانفجار هو تنسيق جدولي مفصوله مخصصه مشتقه من تنسيق الإخراج البدائية NCBI القياسية.

filter_alignments. pl مرشحات محاذاة التسلسل العميق يقرا إلى الجينوم. وهو يقوم بتصفية المحاذاة الجزئية وكذلك القراءات المتعددة المحاذاة (قطع التردد المحدد من قبل المستخدم). الإدخال الأساسي هو ملف في تنسيق تحليل الانفجار.

excise_candidate. pl يقطع تسلسل السلائف المحتملة من تسلسل مرجعي باستخدام محاذاة يقرا كمبادئ توجيهيه. الإدخال الأساسي هو ملف في تنسيق تحليل الانفجار وملف FASTA. الإخراج هو كل تسلسل السلائف المحتملة في شكل FASTA.

mod-miRDP.pl يحتاج إلى ملفين الإدخال ، ملف التوقيع وهيكل الملف ، والتي يتم تعديلها من خوارزميه Mirdeep-P الاساسيه عن طريق تغيير نظام التهديف مع معلمات محدده المصنع. الملفات المدخلة هي نقطه قوس الهيكل السلائف ويقرا ملف توقيع التوزيع.

وزاره الدفاع-rm_redundant_meet_plant يحتاج إلى ثلاثه ملفات الإدخال: الchromosome_length والسلائف والoriginal_prediction التي تنتجها mod-miRDP.pl. فانه يولد اثنين من ملفات الإخراج, غير زائده عن الحاجة الملف المتوقع والملف المتوقع تصفيتها من قبل تحديثها حديثا معايير ميرنا النبات. يتم وصف تفاصيل حول تنسيق ملف الإخراج في القسم 1.4.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. التركيب والاختبار

  1. تحميل التبعيات المطلوبة: Bowtie222 و RNAfold23. الحزم المترجمة مستحسنه.
    1. تحميل Bowtie2 ، أداه لتعيين القراءة ، من موقعها الرئيسي (http://bowtie-bio.sourceforge.net/bowtie2/index.shtml).
    2. تحميل RNAfold, أداه من حزمه فيينا تستخدم للتنبؤ الهيكل الثانوي RNA, من http://www.tbi.univie.ac.at/~ivo/RNA/.
    3. قبل تثبيت miRDP2 ، تاكد من تثبيت هذين التبعيتين بشكل صحيح ، وتخصيص ملف بيئة باش (علي سبيل المثال ، .bashrc) لتعيين مسار صحيح لهذين التبعيتين.
      ملاحظه: أدوات الرسم الأخرى مثل Bowtie24 هي أيضا مناسبه لmiRDP2; اما Bowtie أو Bowtie2 يمكن استخدامها بعد الإصدار 1-1-3.
  2. لتحميل حزمه miRDP2 ، انتقل إلى https://sourceforge.net/projects/mirdp2/files/latest_version/ وجلب ملفات قطران.
  3. قبل تثبيت miRDP2 ، تاكد من ان بيرل في المسار. لتثبيت miRDP2 ، قم باستخراج كافة محتويات ملف قطران الذي تم تحميله إلى مجلد واحد (أسطر الأوامر كما في الشكل 1) ، ثم اضبط مسار المجلد في path.
    ملاحظه: يتم المستحسن كمبيوتر أو عقده الحوسبة مع ذاكره الوصول العشوائي 8 غيغابايت علي الأقل و 100 غيغابايت التخزين لتشغيل miRDP2.
  4. اختبار خط أنابيب MiRDP2.
    1. لاختبار ما إذا كان قد تم تثبيت miRDP2 بشكل صحيح ، استخدم بيانات الاختبار والإخراج المتوقع الموجود في https://sourceforge.net/projects/mirdp2/files/TestData/. تحتوي بيانات الاختبار علي ملف تسلسل GSM منسق واحد وملف جينوم واحد Arabidopsis thaliana .
    2. نقل كافة الملفات التي تم تنزيلها إلى دليل العمل الحالي:
      mv MiRDP2-v* testdata. tar ncRNA_rfam < user_selected_folder ال> الخاصة بها
      < cd user_selected_folder >
    3. استخراج الملفات المضغوطة قطران:
      tar -xvzf miRDP2-v*
      tar -xvzf testdata. tar. gz
      tar -xvzf ncRNA_rfam.
    4. بناء الفهرس المرجعي لجينوم Arabidopsis:
      bowtie2-البناء -f./testdata/TAIR10_genome./testdata/TAIR10_genome
    5. إنشاء فهرس مرجع ncRNA:
      bowtie2-البناء -f./ncRNA_rfam/1.1.3/script/index/rfam_index
    6. تشغيل خط أنابيب miRDP2:
      باش ./1.1.3/mirdp2-v1.1.3_pipeline-g./testdata/TAIR10_genome. fa./testdata/tair 10_genome-f./Testdata/gsm2094927.fa-o...
      ملاحظه: أوامر Linux المستخدمة في خطوط غامقه ومائله ، مع خيارات سطر الأوامر بخط مائل. * يشير إلى إصدار miRDP2 (الإصدار الحالي هو 1-1-3). يجب ان يستغرق الأمر bowtie2 10 دقائق تقريبا ، ويجب ان ينتهي خط أنابيب miRDP2 خلال عده دقائق
  5. تحقق من اختبار المخرجات.
    1. لاحظ ان المجلد المسمي ' GSM2094927-0-10 ' يتم إنشاؤه تلقائيا في < user_selected_folder >، ويحتوي علي كافة الملفات الوسيطة والنتائج.
    2. تحقق من ان ملف الإخراج المحدد بعلامات جدوله GSM2094927-0-10_filter_P_prediction ، الإخراج النهائي لmirnas المتوقع ، يحتوي علي أعمده تشير إلى معرف الكروموسوم ، اتجاه الحبل ، الممثل يقرا المعرف ، معرف السلائف ، موقع ميرنا ناضجه ، السلائف الموقع ، تسلسل ناضجه ، وتسلسل السلائف. لاحظ ملف السرير الإضافي المشتق من هذا الملف لتسهيل المزيد من التحليل.
    3. تحقق من الملف "progress_log" ، الذي يوفر معلومات حول الخطوات النهائية ، والملفات "script_log" و "script_err" ، التي تحتوي علي إخراج البرنامج والتحذيرات.
      ملاحظه: حاليا ، لقد اختبرنا miRDP2 علي منصات لينكس اثنين ، بما في ذلك CentOS الإصدار 6.5 علي ملقم كتله ، و Cygwin 2.6.0 علي نظام الكمبيوتر ويندوز ، و miRDP2 يجب ان تعمل علي أنظمه مماثله التي تدعم بيرل.

2. تحديد الرواية miRNAs

  1. قبل تشغيل خط الأنابيب ، تاكد من ان يقرا الإدخال تتم معالجته مسبقا في التنسيق المناسب.
    ملاحظه: يمكن ان يقبل الإصدار الجديد 1-1-3 من miRDP2 ملفات التنسيق FASTQ الأصلي كادخالات ، علي الرغم من ان تتم عمليه القراءة التنسيق كما في الإصدارات السابقة.
    1. أولا ، أزاله محولات من 5 ' و 3 ' ينتهي من التسلسل العميق يقرا (إذا كان موجودا).
    2. ثانيا ، تحليل التسلسل العميق يقرا في شكل FASTA.
    3. ثالثا ، أزاله التكرار مثل ان يقرا مع تسلسل متطابقة يتم تمثيل مع إدخال FASTA واحد وفريدة من نوعها.
    4. وأخيرا ، تاكد من ان كافة معرفات FASTA فريدة. يجب ان ينتهي كل معرف تسلسل باستخدام ' _x ' وعدد صحيح ، مع الاشاره إلى رقم النسخة الخاص بالتسلسل الدقيق الذي تم استرداده في مجموعات بيانات التسلسل العميق. أحدي الطرق لضمان معرف FASTA الفريد هو تضمين رقم قيد التشغيل في المعرف. للرجوع اليها ، راجع الملف GSM2094927 في بيانات الاختبار (https://sourceforge.net/projects/mirdp2/files/TestData/).
    5. راجع ما يلي للحصول علي أمثله القراءات المنسقة بشكل صحيح:

      > read0_x29909
      في التي
      > read1_x36974
      المجموعة الانجليزيه
      > read2_x32635
      الاتحاد الانجليزيه
  2. إنشاء المؤشرات المرجعية.
    1. للحصول علي مرجع الجينوم ، لتوفير الوقت ، قم بتنزيل ملفات فهرس Bowtie2 من موقع iGenomes (https://support.illumina.com/sequencing/sequencing_software/igenome.html) إذا تمت فهرسه تسلسلات الجينوم للأنواع ذات الفائدة. والا ، فهرس المستخدمين تسلسل مرجع والاحتفاظ ملف الفهرس لفتره من الوقت حتى يتم الانتهاء من المشروع منذ تسلسل الجينوم قد تحتاج إلى أعاده فهرسه. يتم تضمين تفاصيل حول كيفيه فهرسه مرجع الجينوم في دليل bowtie2 (http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml).
    2. وهناك حاجه أيضا إلى مؤشر آخر غير ميرنا ncRNA لتصفيه متواليات صاخبه من غيرها من شظايا الحمض الريبي النيبالي غير الترميز. الملف هو مجموعه من متواليات ncRNA الرئيسية من Rfam ، بما في ذلك rRNA ، tRNA ، snRNA ، وشمنا. لبناء هذا الفهرس ، يرجى الرجوع إلى الجزء 1.4 ، كما يجب وضع الفهرس وتسميته بشكل صحيح ، اي < miRDP2_version >/script/index/rfam_index.
  3. تشغيل miRDP2.
    1. لاستخدام miRDP2 للكشف عن miRNAs الجديدة من بيانات التسلسل العميق ، قم بتشغيل البرنامج النصي باش في الحزمة لبدء خط أنابيب التحليل (يمكن العثور علي مثال في الخطوة 1.4):
      < path_to_miRDP2_folder >/miRDP2 *. * _pipeline باش -ز < genome_file >-i < path_to_index/index_prefix >-f < seq_file >-o < output_folder >
      حيث * يشير إلى إصدار خط الأنابيب باش النصي. هناك ثلاثه المعلمات التي يمكن تعديلها: 1) عدد المواقع المختلفة قراءه يمكن تعيين إلى ، 2) رقم عدم تطابق لتشغيل bowtie2 ، و 3) عتبه RPM (يقرا لكل مليون). تعديل هذه باستخدام-L ،-M ، و-R الخيارات ، علي التوالي. ويرد شرح مفصل في الفرع 3.1.
  4. تحقق من مخرجات miRDP2.
    1. لاحظ انه سيتم إنشاء مجلد الإخراج تلقائيا ضمن < output_folder > والمسمي ' < seq_file_name >-15-0-10 '; تشير الأرقام الثلاثة الاخيره إلى القيم (الافتراضية في هذه الحالة) للمعلمات 1 و 2 و 3 علي التوالي. يحتوي الملف < seq_file_name > _filter_P_prediction علي معلومات عن miRNAs النهائية المتوقعة تلبيه معايير التعليق التوضيحي ميرنا المصنع المحدثة حديثا. يتم وصف تفاصيل حول تنسيق ملف الإخراج في الجزء 1.4.

3. التعديلات والحذر باستخدام miRDP2

  1. المعلمات التي يمكن تعديلها
    1. استخدم الخيار '-L ' لتعيين الحد الأقصى لعدد المواقع التي يمكن تعيين القراءة اليها (المعلمة 1). قراءه التعيين إلى العديد من المواقع من المحتمل ان تقترن التسلسلات تكرار ، وليس من المحتمل ان miRNAs. الاعداد الافتراضي هو 15. لأنواع معينه ، إذا كانت هناك عائلات ميرنا مع العديد من الأعضاء ، يمكن زيادة المعلمة الاولي يدويا للتكيف مع المشهد الجينوم.
    2. استخدم الخيار '-M ' لتعيين التطابقات المسموح بها لربطه العنق (المعلمة 2). الاعداد الافتراضي هو 0.
    3. استخدم الخيار '-R ' لتعيين عتبه القراءة التي يحتمل ان تتطابق مع miRNAs الناضجة (المعلمة 3). لتقليل استهلاك الوقت والإيجابيات الزائفة ، يقرا الفلتر بواسطة RPM. فقط يقرا يتجاوز عتبه معينه RPM قد تمثل تسلسل ناضجه من miRNAs بدلا من الضوضاء في الخلفية ، سيتم الاحتفاظ لمزيد من التحليل. الاعداد الافتراضي هو 10 RPM.
    4. لاحظ ان تغيير هذه المعلمات من المحتمل ان يؤثر علي استهلاك الوقت والأداء. وبصفه عامه ، فان زيادة المعلمتين 1 و 2 وانخفاض المعلمة 3 سيولدان نتيجة اقل صرامة ووقتا أطول والعكس صحيح.
  2. التكرار و ميرنا *
    1. لاحظ ان الإخراج miRNAs من miRDP2 قد تختلف عن miRNAs المعروفة. وجدنا ان هذا يرجع أساسا إلى واحد من سببين: عدم تجانس miRNAs ناضجه أو وفره نسبي من ميرنا وميرنا *. وجدنا ان هذا لا يؤثر علي اختيار طول الأمثل من السلائف والتنميط من الجينات ميرنا المعروفة.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

يتم تطبيق خط أنابيب الشرح ميرنا ، miRDP2 ، الموصوفة هنا إلى 10 العامة srna-seq المكتبات من 5 أنواع النباتات مع زيادة تدريجيا طول الجينوم ، بما في ذلك Arabidopsis thaliana، اوريزا ساتيفا (رايس) ، سولانوم ليكوبرزيكوم (الطماطم) ، زي ميس (الذرة) و triticum استيفوم (الشكل 1ا). وعموما ، بالنسبة لكل نوع من الأنواع ، تتم معالجه مكتبتين تمثيليتين من الانسجه المختلفة (مطوية في القراءات الفريدة ، والتفاصيل في قسم البروتوكول) وتتابع الجينوم المفهرس الخاص بها كمدخلين (الجدول 1). واختيرت خمس أدوات التنبؤ الحسابي ميرنا (miRDeep-P13، mirdeep25، مير-تفضل26، ميرا27، mirena28) لجعل المقارنة.

تشغيل اختبار الوقت
لمقارنه وقت التشغيل والأداء من miRDP2 وغيرها من الاداات الخمس ، قمنا بتثبيت خمس أدوات (miRDP2 ، miRDeep-P ، مير-تفضل ، ميرا ، وميرينا) في خادم الكتلة مع المائة نظام التشغيل الإصدار 6.5. تم تشغيل هذه البرامج باستخدام نفس ملفات الإدخال والاجهزه والموارد (التفاصيل في الملف التكميلي 1). خاصه ، يتم التحكم في miRPlant من واجهه المستخدم الرسوميه مكتوبه في جافا ولم يكن قادرا علي تشغيل علي الخادم. بدلا من ذلك ، اختبرنا miRPlant علي جهاز كمبيوتر مع ويندوز 10 بينما لدينا أيضا اختبار miRDP2 و Mirplant-P علي هذا الكمبيوتر (التفاصيل في ملف تكميلي 1).

لأنواع الجينوم الصغيرة كما Arabidopsis thaliana، اوريزا ساتيفا، و solanum ليكوبيرسيوم، ركض جميع البرامج بشكل صحيح. ومع ذلك ، بالنسبة للأنواع الجينية الكبيرة مثل زي ميس و triticum استيفوم (بما في ذلك سولانوم ليكوبيرسيوم لميرا) ، استنفدت بعض البرامج جميع الموارد الحاسوبية وانهارت في منتصف الطريق. علي سبيل المثال, miReNA, ميرا, و مير-تفضل فشل في توليد النتائج, ربما بسبب نقص الذاكرة اثناء التعامل مع ملفات سام كبيره أو الملفات المتوسطة. علي وجه الخصوص ، miRPlant الملفات المؤقتة تستهلك مساحة كبيره جدا ، والنتيجة لم تكن قادره علي تشغيل علي جهاز الكمبيوتر عند التعامل مع الأنواع الجينوم الكبيرة. miRDP2 الانتهاء من هذه العمليات التنبؤ في وقت قصير جدا ، من دقائق إلى ساعات (الشكل 1ب). التالي ، بالمقارنة مع النسخة القديمة وغيرها من الاداات ، تم تقصير وقت تشغيل miRDP2 بشكل ملحوظ.

اختبار الحساسية والدقة
منذ miRNAs في Arabidopsis ودرست بشكل مكثف ، ونحن الاستفادة من miRNAs المعروفة في Arabidopsis في Mirnas21 (الإصدار 22.1) لتقييم miRDP2 ، وجعلت المقارنة مع الاداات الأخرى. كما ذكر سابقا19،26، يتم استخدام الصيغ التالية لحساب الحساسية والدقة:

Equation 2

Equation 3

MiRNAs المعروفة هي تلك المشروحة في Mirnas. ويتم تعيين ميرنا كما أعرب عنه إذا متواليات ناضجه لديها أكثر من 5 دوره في الدقيقة ، و ≥ 75 ٪ يقرا علي السلائف التي تم تعيينها لتنضج ونجوم ميرنا متواليات. تم استخدام مكتبين sRNA متسلسلين من Arabidopsis (الجدول 1) لاجراء الاختبار. miRDP2 (الشكل 1ج ، د) أداء أفضل في كل من الحساسية والدقة بالمقارنة مع الاداات الأخرى.

معا, هذه النتائج تثبت ان miRDP2 هو أداه سريعة ودقيقه لتحليل الناسخ ميرنا في النباتات.

Figure 1
الشكل 1: أداء miRDP2. (ا) حجم المجين (بالغيغابايت) Arabidopsis ثاليانا (Ath) ، اوريزا ساتيفا (Osa) ، سولانوم ليكوبرزيكوم (خبيث) ، زي ميس (zma) ، تريتيكوم استيفوم (تاي). (ب-د) مقارنه بين وقت التشغيل والحساسية ودقه miRDP2 والاداات الخمس الأخرى. نقطتين المقابلة لكل أداه تشير إلى اثنين من الاختبارات التي تم اجراؤها من قبل كل أداه. وقد تم تكييف هذا الرقم من كوانغ وآخرون16. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

الأنواع (abb.) إصدار الجينوم مكتبات sRNA
معرف المكتبة حجم الملف مجموع القراءات القراءة الفريدة الانسجه
Arabidopsis thaliana (Ath) الإصدار 10 GSM2094927 24.9 ميغابايت الام 9.7 متر ورقه الكبار
GSM2412287 29.5 ميغابايت الام 11.1 متر ورقه
اوريزا ساتيفا (Osa) الإصدار 7 GSM2883136 44.2 ميغابايت الام 16.3 متر الشتلات
GSM3030848 34.7 ميغابايت 79 مليون متر الام فلليف
سولانوم ليكوبرزيكوم (خبيث) الإصدار 3 GSM1213985 205.4 ميغابايت 161.5 m محمد الصباح ورقه
GSM1976413 118.5 ميغابايت 139.3 m الصباح الجذر
زي ميس (زمه) الإصدار 4 GSM1277437 158.4 ميغابايت 266.1 m 5 مليون متر الشتلات
GSM1428531 144.1 ميغابايت 172.5 m الام البذور
Triticum استيفوم (تاي) المركز الأول GSM1294660 76.1 ميغابايت التي 29.6 متر اطلاق النار
GSM1294661 113.6 ميغابايت 84.0 m الام ورقه

الجدول 1: الجينوم ومكتبات sRNA المستخدمة لاختبار miRDP2 وأداات أخرى. وقد تم تكييف هذا الجدول من كوانغ وآخرون16.

الملف التكميلي 1: مقارنه بين وقت التشغيل والحساسية ودقه miRDP2 والاداات الخمس الأخرى. الرجاء الضغط هنا لتحميل هذا الملف.

الملف التكميلي 2: أمثله من miRNAs أصيله مع بنيه ثنائيه البؤرة في الحلقات. الرجاء الضغط هنا لتحميل هذا الملف.

الملف التكميلي 3: المعايير المحدثة لشرح ومعايير ميرنا النباتية ل miRNAs 23-nt و 24-nt. الرجاء الضغط هنا لتحميل هذا الملف.

الملف التكميلي 4: مخطط سير العمل miRDP2. الرجاء الضغط هنا لتحميل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

ومع ظهور الرقم المرجعي (خ ع و) ، تم تحديد عدد كبير من الميرنا المكانية من الكمية المتزايدة باستمرار من بيانات تسلسل srna في مختلف الأنواع29و30. في قاعده بيانات المجتمع مركزيه miRBase21, وقد زادت البنود ميرنا المودعة تقريبا 100 مرات في العقد الماضي. ومع ذلك ، بالمقارنة مع mirnas في الحيوانية ، mirnas النبات لديها العديد من الميزات الفريدة التي تجعل من تحديد/الشرح أكثر تعقيدا13،14.

أولا ، السلائف من miRNAs النبات هي أكثر متغير في الطول والهيكل (الملف التكميلي 2)16. لا مثل الطول متسقة نسبيا من حيوانيه [ميرنا] سلائف حول 70-90 [نت], يتغير الطول من معمل سلائف بعده طيات واستطاع بلغت عده مئة [نتس]13,31. هذا الاختلاف يقدم الكثير من عدم اليقين عند التنبؤ بالبنية الثانوية للسلائف ميرنا علي الرغم من ان قطع طول السلائف عاده ما يتم تعيين تعسفا مثل لا تتجاوز 300 nt19 (تم تضمين هذه المعلمة في miRDP2 ، ويمكن للمستخدمين ذوي الخبرة من miRDP2 ضبط هذا بأنفسهم). [أين ديايشن], يحفظ معمل [ميرنا] أسرات يميلون ان يتلقى كثير أعضاء, والتباين طول من هذا أعضاء أيضا غالبا مهمة13. هذا هو السبب في miRDP2 لديه المعلمة – L, الذي يشير إلى أكبر الأسر المحتملة ميرنا في حجم العضو. معا ، فان تغاير السلائف ميرنا النبات يثير العديد من الصعوبات لشرحها دقيقه.

ثانيا ، من الصعب القضاء علي الضجيج أو الإيجابيات الزائفة التي قدمها siRNAs. والي جانب miRNAs ، تنتج أساليب المجموعات الخاصة أيضا طوفانا من siRNAs في مكتبات sRNA المتسلسلة. علي الرغم من ان sirnas يمكن فصلها عن mirnas من قبل التكوين الحيوي ووظائف32،33، فمن الصعب للغاية لتمييزها علي أساس تسلسل البيانات وأداات التعدين. وقد تدهورت قواعد البيانات العامة مثل mirbase ، التي جادل بها العديد من الباحثين ، بشكل حاد بالعدد الكبير من الإيجابيات كاذبه sirnas ، التي يتم المشروح خطا كما mirbase20،31. التالي ، الاداات المكررة مع مجموعه جديده وصارمة من المعايير لشرح ميرنا النبات مثل المعايير المحدثة حديثا25 (ملف تكميلي 3) ومن المرغوب فيه للغاية في خط أنابيب التعليق التوضيحي ميرنا/عمليه.

وأخيرا وليس أخرا ، فقد زاد الوقت الحسابي لتحليل مكتبات sRNA بشكل كبير عندما يتم زرع نفس الأسلوب من أنواع الجينوم صغيره الحجم إلى كبيره الحجم. الاداات الحسابية مثل miRDeep-P13 و مير-تفضل26، من خلال التقاط وتحديد الكمية التوزيع التوقيع من srna يقرا علي طول السلائف ميرنا ، وأصبحت طريقتين شعبيه وتستخدم علي نطاق واسع للتعليق mirdeep. وتتطلب استراتيجية رسم الخرائط ، وعمليه اعفاء المرشحين من السلائف ، والتنبؤ بالهيكل الثانوي اللاحق ، وقتا كبيرا للحوسبة16. عندما تستخدم هذه الاداات لتحليل البيانات من الجينوم حجم صغير مثل Arabidopsis إلى الكبيرة مثل الذرة ، يتم زيادة وقت معالجه البيانات من ساعات إلى أيام حتى أسابيع (الشكل 1B) ، مما ادي إلى انهيار متكرر للعملية. التالي فان الحاجة ماسه إلى ابتكار بشان القيود السالفة الذكر.

تم تصميم برنامج miRDP216 الجديد ، الذي تم تحديثه من Mirdeep-P13، للتغلب علي التحديات المذكورة أعلاه (الملف التكميلي 4). في هذا البرنامج ، استخدمنا استراتيجية تصفيه جديده ، والأمثل خوارزميه التهديف ، وأدرجت حديثا النباتات المحدثة ميرنا معايير التعليق التوضيحي. ونتيجة لهذه الميزات الجديدة ، تم تقصير فتره التشغيل بشكل ملحوظ عند اختبارها باستخدام عشر مكتبات sRNA من خمسه أنواع نباتيه مع زيادة حجم الجينوم. بالاضافه إلى ذلك ، بالمقارنة مع الاداات الأخرى ، miRDP2 عرض الأداء المتفوق في كل من الحساسية والدقة (الشكل 1). معا, هذه النتائج تثبت ان miRDP2 هو أداه سريعة ودقيقه لتحليل النسخ ميرنا في النباتات.

وينبغي التحذير من ان الفهم الحالي لخصائص ميرنا قد يحد من أداء اي أدوات حسابيه. وحتى معايير التعليق التوضيحي المحدثة حديثا لميرنا تستند إلى مجموعه محدوده من الامثله المدروسة جيدا. المعلومة يستنتج لذلك فقط تجريبية. في الواقع ، أظهرت ملامح فريدة من miRNAs ان توجد في أنواع النباتات المختلفة أو السلالات3. الاضافه إلى ذلك ، فان خصائص مثل هياكل المناطق المنبع والمصب من ميرنا/ميرنا * المزدوجة تلعب أيضا أدوارا حاسمه في ميرنا بيوجينيسيس34،35، والتي لا تؤخذ في الاعتبار في أدوات الشرح الحالية. مع تراكم الامثله مدروسه جيدا في المزيد من الأنواع النباتية ، فمن المرجح ان يتم تطوير أدوات الشرح حتى أكثر تقدما في المستقبل التي يمكن التقاط المزيد من التمييزات خفيه وتصنيف miRNAs مع درجه اعلي من الدقة من الأساليب الحالية. وهناك اتجاه جديد واعده التعليق التوضيحي ميرنا هو دمج نهج التعلم الألى36 كما ان نوعيه مجموعات البيانات التدريبية ومعايير الشرح تتطور باستمرار.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

وليس لدي المؤلفين ما يفصحون عنه.

Acknowledgments

وقد تم دعم هذا العمل من قبل اكاديميه بكين للعلوم الزراعية والحراجة (KJCX201917 ، KJCX20180425 ، و KJCX20180204) إلى XY والمؤسسة الوطنية للعلوم الطبيعية في الصين (31621001) إلى ليرة لبنانية.

Materials

Name Company Catalog Number Comments
Computer/computing node N/A N/A Perl is required; at least 8 GB RAM and 100 GB storage are recommended

DOWNLOAD MATERIALS LIST

References

  1. Ghildiyal, M., Zamore, P. D. Small silencing RNAs: an expanding universe. Nature Reviews Genetics. 10 (2), 94-108 (2009).
  2. Bartel, D. P. MicroRNAs: target recognition and regulatory functions. Cell. 136 (2), 215-233 (2009).
  3. Moran, Y., Agron, M., Praher, D., Technau, U. The evolutionary origin of plant and animal microRNAs. Nature Ecology Evolution. 1 (3), 27 (2017).
  4. Xie, Z., et al. Expression of Arabidopsis MIRNA genes. Plant Physiology. 138 (4), 2145-2154 (2005).
  5. Zhao, X., Zhang, H., Li, L. Identification and analysis of the proximal promoters of microRNA genes in Arabidopsis. Genomics. 101 (3), 187-194 (2013).
  6. Bologna, N. G., Mateos, J. L., Bresso, E. G., Palatnik, J. F. A loop-to-base processing mechanism underlies the biogenesis of plant microRNAs miR319 and miR159. EMBO JOURNAL. 28 (23), 3646-3656 (2009).
  7. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  8. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  9. Iwakawa, H. O., Tomari, Y. The Functions of MicroRNAs: mRNA Decay and Translational Repression. Trends in Cell Biology. 25 (11), 651-665 (2015).
  10. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  11. Wightman, B., Ha, I., Ruvkun, G. Posttranscriptional regulation of the heterochronic gene lin-14 by lin-4 mediates temporal pattern formation in C. elegans. Cell. 75 (5), 855-862 (1993).
  12. Friedlander, M. R., et al. Discovering microRNAs from deep sequencing data using miRDeep. Nature Biotechnology. 26 (4), 407-415 (2008).
  13. Yang, X., Li, L. miRDeep-P: a computational tool for analyzing the microRNA transcriptome in plants. Bioinformatics. 27 (18), 2614-2615 (2011).
  14. Meyers, B. C., et al. Criteria for annotation of plant MicroRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  15. Yang, X., Zhang, H., Li, L. Global analysis of gene-level microRNA expression in Arabidopsis using deep sequencing data. Genomics. 98 (1), 40-46 (2011).
  16. Kuang, Z., Wang, Y., Li, L., Yang, X. miRDeep-P2: accurate and fast analysis of the microRNA transcriptome in plants. Bioinformatics. , (2018).
  17. Kozomara, A., Birgaoanu, M., Griffiths-Jones, S. miRBase: from microRNA sequences to function. Nucleic Acids Research. 47 (1), 155-162 (2019).
  18. Griffiths-Jones, S., Saini, H. K., van Dongen, S., Enright, A. J. miRBase: tools for microRNA genomics. Nucleic Acids Research. 36, Database issue 154-158 (2008).
  19. Axtell, M. J., Meyers, B. C. Revisiting Criteria for Plant MicroRNA Annotation in the Era of Big Data. Plant Cell. 30 (2), 272-284 (2018).
  20. Taylor, R. S., Tarver, J. E., Hiscock, S. J., Donoghue, P. C. Evolutionary history of plant microRNAs. Trends in Plant Science. 19 (3), 175-182 (2014).
  21. Kozomara, A., Griffiths-Jones, S. miRBase: annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, Database issue 68-73 (2014).
  22. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9 (4), 357-359 (2012).
  23. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6, 26 (2011).
  24. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology. 10 (3), 25 (2009).
  25. An, J., Lai, J., Sajjanhar, A., Lehman, M. L., Nelson, C. C. miRPlant: an integrated tool for identification of plant miRNA from RNA sequencing data. BMC Bioinformatics. 15, 275 (2014).
  26. Lei, J., Sun, Y. miR-PREFeR: an accurate, fast and easy-to-use plant miRNA prediction tool using small RNA-Seq data. Bioinformatics. 30 (19), 2837-2839 (2014).
  27. Evers, M., Huttner, M., Dueck, A., Meister, G., Engelmann, J. C. miRA: adaptable novel miRNA identification in plants using small RNA sequencing data. BMC Bioinformatics. 16, 370 (2015).
  28. Mathelier, A., Carbone, A. MIReNA: finding microRNAs with high accuracy and no learning at genome scale and from deep sequencing data. Bioinformatics. 26 (18), 2226-2234 (2010).
  29. Zhu, Q. H., et al. A diverse set of microRNAs and microRNA-like small RNAs in developing rice grains. Genome Research. 18 (9), 1456-1465 (2008).
  30. Fahlgren, N., et al. MicroRNA gene evolution in Arabidopsis lyrata and Arabidopsis thaliana. Plant Cell. 22 (4), 1074-1089 (2010).
  31. Fromm, B., et al. A Uniform System for the Annotation of Vertebrate microRNA Genes and the Evolution of the Human microRNAome. Annual Review of Genetics. 49, 213-242 (2015).
  32. Blevins, T., et al. Identification of Pol IV and RDR2-dependent precursors of 24 nt siRNAs guiding de novo DNA methylation in Arabidopsis. Elife. 4, 09591 (2015).
  33. Zhai, J., et al. A One Precursor One siRNA Model for Pol IV-Dependent siRNA Biogenesis. Cell. 163 (2), 445-455 (2015).
  34. Werner, S., Wollmann, H., Schneeberger, K., Weigel, D. Structure determinants for accurate processing of miR172a in Arabidopsis thaliana. Current Biology. 20 (1), 42-48 (2010).
  35. Mateos, J. L., Bologna, N. G., Chorostecki, U., Palatnik, J. F. Identification of microRNA processing determinants by random mutagenesis of Arabidopsis MIR172a precursor. Current Biology. 20 (1), 49-54 (2010).
  36. Vitsios, D. M., et al. Mirnovo: genome-free prediction of microRNAs from small RNA sequencing data and single-cells using decision forests. Nucleic Acids Research. 45 (21), 177 (2017).

Tags

علم الوراثة إصدار 155 ميكرورنا (ميرنا) مصنع sRNA-seq miRDeep-P2 (miRDP2) الجيل التالي التسلسل معايير ميرنا النبات miRDeep-P (Mirdeep)
خط أنابيب المعلوماتية الحيوية لتحليل بدقه وكفاءه الناسخ ميكرورنا في النباتات
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wang, Y., Kuang, Z., Li, L., Yang,More

Wang, Y., Kuang, Z., Li, L., Yang, X. A Bioinformatics Pipeline to Accurately and Efficiently Analyze the MicroRNA Transcriptomes in Plants. J. Vis. Exp. (155), e59864, doi:10.3791/59864 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter