Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

خط أنابيب المعلوماتية الحيوية للتحقيق في التطور الجزيئي والتعبير الجيني باستخدام الحمض النووي الريبي-seq

Published: May 28, 2021 doi: 10.3791/61633

Summary

الغرض من هذا البروتوكول هو التحقيق في تطور والتعبير عن الجينات المرشحة باستخدام بيانات تسلسل الحمض النووي الريبي.

Abstract

غالبا ما يكون تقطير مجموعات البيانات الكبيرة والإبلاغ عنها، مثل الجينوم الكامل أو بيانات النسخ، مهمة شاقة. إحدى الطرق لكسر النتائج هي التركيز على عائلة جينية واحدة أو أكثر مهمة للكائن الحي والدراسة. في هذا البروتوكول، نحدد الخطوات المعلوماتية الحيوية لتوليد فيلوجيني وتحديد التعبير عن الجينات ذات الاهتمام. يمكن للأشجار النباتية إعطاء فكرة عن كيفية تطور الجينات داخل الأنواع وفيما بينها وكذلك الكشف عن علم الكائنات الحية. ويمكن تعزيز هذه النتائج باستخدام بيانات الحمض النووي الريبي-seq لمقارنة التعبير عن هذه الجينات في مختلف الأفراد أو الأنسجة. ويمكن أن تكشف دراسات التطور الجزيئي والتعبير عن أساليب التطور وحفظ وظيفة الجينات بين الأنواع. يمكن أن يكون توصيف عائلة الجينات بمثابة نقطة انطلاق للدراسات المستقبلية ويمكن أن يسلط الضوء على عائلة جينية مهمة في جينوم جديد أو ورقة نسخ.

Introduction

وقد سهل التقدم في تكنولوجيات التسلسل تسلسل الجينوم والنسخ من الكائنات الحية غير النموذجية. بالإضافة إلى زيادة جدوى تسلسل الحمض النووي والحمض النووي الريبي من العديد من الكائنات الحية ، وفرة من البيانات متاحة للجمهور لدراسة الجينات ذات الأهمية. الغرض من هذا البروتوكول هو توفير خطوات المعلوماتية الحيوية للتحقيق في التطور الجزيئي والتعبير عن الجينات التي قد تلعب دورا هاما في الكائن الحي ذات الاهتمام.

التحقيق في تطور الجينات أو الجينات الأسرة يمكن أن توفر نظرة ثاقبة في تطور النظم البيولوجية. عادة ما يتم تحديد أفراد عائلة الجينات من خلال تحديد الزخارف المحفوظة أو تسلسل الجينات المتجانسة. تم التحقيق في تطور عائلة الجينات سابقا باستخدام الجينوم من الكائنات الحية نموذج ذات الصلة البعيدة1. ويتمثل أحد القيود المفروضة على هذا النهج في أنه ليس من الواضح كيف تتطور هذه الأسر الجينية في الأنواع ذات الصلة الوثيقة ودور الضغوط البيئية الانتقائية المختلفة. في هذا البروتوكول، ونحن تشمل البحث عن homologs في الأنواع ذات الصلة الوثيقة. من خلال توليد فيلوجيني على مستوى الفيلوم، يمكننا أن نلاحظ الاتجاهات في تطور الأسرة الجينية مثل الجينات المحفوظة أو الازدواجية الخاصة بالنسب. على هذا المستوى، يمكننا أيضا التحقيق فيما إذا كانت الجينات هي تقويم العظام أو البارالوجات. في حين أن العديد من التجانسات تعمل على الأرجح بشكل مماثل لبعضها البعض ، إلا أن هذا ليس بالضرورة هو الحال2. دمج الأشجار النباتية في هذه الدراسات مهم لحل ما إذا كانت هذه الجينات المتجانسة هي تقويم العظام أم لا. في eukaryotes، العديد من تقويم العظام الاحتفاظ بوظائف مماثلة داخل الخلية كما يتضح من قدرة البروتينات الثدييات لاستعادة وظيفة تقويم العظام الخميرة3. ومع ذلك ، هناك حالات حيث يقوم جين غير تقويم العظام بوظيفة مميزة4.

تبدأ الأشجار النباتية في تحديد العلاقات بين الجينات والأنواع ، ومع ذلك لا يمكن تعيين الوظيفة فقط على أساس العلاقات الوراثية. توفر دراسات التعبير الجيني إلى جانب الشروح الوظيفية وتحليل الإثراء دعما قويا لوظيفة الجينات. الحالات التي يمكن فيها قياس التعبير الجيني ومقارنته عبر الأفراد أو أنواع الأنسجة يمكن أن تكون أكثر دلالة على الوظيفة المحتملة. يتبع البروتوكول التالي الأساليب المستخدمة في التحقيق في جينات الأوبسين في Hydra vulgaris7، ولكن يمكن تطبيقها على أي نوع وأي عائلة جينية. وتوفر نتائج هذه الدراسات أساسا لمزيد من التحقيق في وظائف الجينات وشبكات الجينات في الكائنات غير النموذجية. على سبيل المثال ، فإن التحقيق في فيلوجيني من opsins ، وهي البروتينات التي تبدأ سلسلة نقل ضوئي ، يعطي سياقا لتطور العينين والكشف عن الضوء8و9و10و11. في هذه الحالة ، يمكن للكائنات غير النموذجية وخاصة الأنواع الحيوانية القاعدية مثل cnidarians أو ctenophores توضيح الحفظ أو التغيرات في سلسلة النقل الضوئي والرؤية عبر clades12و13و14. وبالمثل، فإن تحديد البيلوجيني والتعبير وشبكات عائلات الجينات الأخرى سيخبرنا بالآليات الجزيئية الكامنة وراء التكيفات.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

يتبع هذا البروتوكول إرشادات رعاية الحيوانات في جامعة كاليفورنيا في إيرفين.

1. إعداد مكتبة RNA-seq

  1. عزل الجيش الملكي النيبالي باستخدام الطرق التالية.
    1. جمع العينات. إذا كان الجيش الملكي النيبالي هو أن يتم استخراجها في وقت لاحق، فلاش تجميد العينة أو مكان في حل تخزين الجيش الملكي النيبالي15 (جدول المواد).
    2. القتل الرحيم وتشريح الكائن الحي لفصل الأنسجة ذات الأهمية.
    3. استخراج إجمالي الحمض النووي الريبي باستخدام عدة استخراج وتنقية الجيش الملكي النيبالي باستخدام عدة تنقية الحمض النووي الريبي(جدول المواد)
      ملاحظة: هناك بروتوكولات ومجموعات التي قد تعمل بشكل أفضل لأنواع مختلفة من الأنسجة والأنواع16،17. لقد استخلصنا الحمض النووي الريبي من أنسجة الجسم المختلفة لفراشة18 وهيدراالجيلاتينية19 (انظر المناقشة).
    4. قياس تركيز وجودة الحمض النووي الريبي لكل عينة (جدول المواد). استخدم عينات مع أرقام تكامل الحمض النووي الريبي (RIN) أعلى من 8 ، وهو أقرب إلى 920 لإنشاء مكتبات cDNA.
  2. إنشاء مكتبة cDNA وتسلسلها كما يلي.
    1. بناء مكتبات cDNA وفقا لدليل التعليمات الإعدادية للمكتبة (انظر المناقشة).
    2. تحديد تركيز و جودة cDNA (جدول المواد).
    3. تعدد المكتبات وتسلسلها.

2. الوصول إلى نظام مجموعة كمبيوتر

ملاحظة: تحليل RNA-seq يتطلب التلاعب في الملفات الكبيرة ويتم أفضل على مجموعة الكمبيوتر(جدول المواد).

  1. تسجيل الدخول إلى حساب نظام المجموعة الكمبيوتر باستخدام الأمر username@clusterlocation ssh على محطة طرفية (ماك) أو PuTTY (ويندوز) إطار التطبيق.

3. الحصول على RNA-seq يقرأ

  1. الحصول على قراءات RNA-seq من مرفق التسلسل أو، للبيانات التي تم إنشاؤها في منشور، من مستودع البيانات حيث تم إيداعه (3.2 أو 3.3).
  2. لتنزيل البيانات من مستودعات مثل ArrayExpress قم بما يلي:
    1. ابحث في الموقع باستخدام رقم الانضمام.
    2. ابحث عن الرابط لتنزيل البيانات، ثم انقر بزر الماوس الأيسر وحدد نسخ الارتباط.
    3. على الإطار الطرفي اكتب wget وحدد لصق الارتباط لنسخ البيانات إلى الدليل للتحليل.
  3. لتنزيل بيانات أرشيف القراءة القصيرة NCBI (SRA) اتبع الخطوات البديلة التالية:
    1. على محطة تحميل مجموعة أدوات SRA v. 2.8.1 باستخدام wget.
      ملاحظة: تحميل وتثبيت البرامج إلى كتلة الكمبيوتر قد تتطلب الوصول الجذر اتصل بمسؤول نظام المجموعة الكمبيوتر إذا فشل التثبيت.
    2. الانتهاء من تثبيت البرنامج عن طريق كتابة القطران -xvf $TARGZFILE.
    3. البحث NCBI لرقم الانضمام SRA للعينات التي تريد تحميلها، يجب أن يكون تنسيق SRRXXXXXX.
    4. الحصول على البيانات RNA-seq بكتابة [موقع sratoolkit] / بن / الجلب المسبق SRRXXXXXXXX في نافذة المحطة الطرفية.
    5. لنوع الملفات ذات الطرفين [موقع sratoolkit] / بن / fastq تفريغ -- تقسيم الملفات SRRXXXXXX للحصول على اثنين من الملفات fastq (SRRXXXXXX_1.FASTQ و SRRXXXXXX_2.FASTQ).
      ملاحظة: للقيام بتجميع Trinity de novo استخدم الأمر [موقع sratoolkit]/bin/fastq-dump -defline-seq '@$sn[_$rn]/$ri' --ملفات الانقسام SRRXXXXXXXX

4. تقليم المحولات ومنخفضة الجودة يقرأ (اختياري)

  1. تثبيت أو تحميل Trimmomatic21 v. 0.35 على نظام المجموعة الحوسبة.
  2. في الدليل حيث توجد ملفات البيانات RNA-seq اكتب الأمر الذي يتضمن موقع ملف جرة trimmomatic ملفات FASTQ الإدخال ملفات FASTQ الإخراج والمعلمات الاختيارية مثل طول القراءة والجودة.
    ملاحظة: يختلف الأمر حسب جودة القراءة الخام والمطلوبة وطولها. لIllumina 43 bp يقرأ مع التمهيديات Nextera، استخدمنا: جافا -جرة / البيانات / تطبيقات / trimmomatic/0.35/trimmomatic-0.35.jar PE $READ 1. فاست كيو $READ 2. paired_READ1 فاست كيو. unpaired_READ1 فاست كيو. paired_READ2 فاست كيو. unpaired_READ2 فاست كيو. FASTQ ILLUMINACLIP:محولات.fa:2:30:10 الرائدة:20 زائدة:20 انزلاقWINDOW:4:17 مينلين:30.

5. الحصول على التجميع المرجعي

  1. البحث جوجل، EnsemblGenomes، وNBI الجينوم وNocleotide TSA (Transcriptome بندقية الجمعية) للحصول على الجينوم المرجعي أو transcriptome تجميعها للأنواع ذات الاهتمام (الشكل 1).
    ملاحظة: إذا لم يكن الجينوم المرجعي أو النسخ متوفرا أو منخفض الجودة، انتقل إلى STEP 6 لإنشاء تجميع de novo.
  2. إذا كان هناك جينوم مرجعي أو نسخة مجمعة، فقم بتنزيله كملف fasta إلى حيث سيتم إجراء التحليل باتباع الخطوات أدناه.
    1. العثور على الرابط لتحميل الجينوم، انقر على اليسار ونسخ الارتباط.
    2. على الإطار الطرفي اكتب wget ولصق عنوان الارتباط. إذا كان متوفرا، أيضا نسخ ملف GTF والبروتين FASTA ملف للجينوم المرجعي.

6. إنشاء تجميع دي نوفو (بديل الخطوة 5)

  1. الجمع بين RNA-seq READ1 و READ2 ملفات fastq لجميع العينات عن طريق كتابة القط * READ1. فاست كيو > $all_READ1. FASTQ والقط * READ2. > all_READ2 فاست كيو. FASTQ على نافذة المحطة الطرفية.
  2. تثبيت أو تحميل الثالوث22 v.2.8.5 على نظام المجموعة الحوسبة.
  3. إنشاء وتجميع عن طريق الكتابة على المحطة الطرفية: Trinity --seqType fq --max_memory 20G --اليسار $all_READ1. FASTQ --الحق $all_READ2. فاست كيو.

7. خريطة يقرأ إلى الجينوم (7.1) أو دي نوفو transcriptome (7.2)

  1. تقرأ الخريطة الجينوم المرجعي باستخدام STAR23 v. 2.6.0c و RSEM24 ضد 1.3.0.
    1. تثبيت أو تحميل STAR v. 2.6.0c. و RSEM v. 1.3.0 إلى كتلة الحوسبة.
    2. فهرسة الجينوم عن طريق كتابة rsem- إعداد المرجع -gtf $GENOME. GTF -- نجمة - ع 16 $GENOME. $OUTPUT فاستا.
    3. يقرأ الخريطة ويحسب التعبير لكل عينة بكتابة rsem-calculate-expression -p 16 --star --المقترنة-end $READ 1. فاست كيو $READ 2. $INDEX $OUTPUT فاست كيو.
    4. إعادة تسمية ملف النتائج إلى شيء وصفي باستخدام mv RSEM.genes.results $sample.genes.results.
    5. إنشاء مصفوفة من جميع التهم عن طريق كتابة rsem توليد البيانات مصفوفة * [الجينات / isoforms.results] > $OUTPUT.
  2. خريطة RNA-seq إلى جمعية ترينيتي دي نوفو باستخدام RSEM وbowtie.
    1. تثبيت أو تحميل الثالوث22 v.2.8.5، Bowtie25 ضد 1.0.0، و RSEM ضد 1.3.0.
    2. تقرأ الخريطة التعبير وتحسبه لكل عينة عن طريق كتابة [trinity_location]/align_and_estimate_abundance.pl -المرجع الإعدادي - النصوص $TRINITY. FASTA --seqType fq -- يسار $READ 1. FASTQ -- الحق $READ 2. فاست كيو -- est_method RSEM -- aln_method bowtie -- trinity_mode -- output_dir $OUTPUT.
    3. إعادة تسمية ملف النتائج إلى شيء وصفي باستخدام mv RSEM.genes.results $sample.genes.results.
    4. إنشاء مصفوفة من جميع التهم عن طريق كتابة [trinity_location]/abundance_estimates_to_matrix.pl --est_method RSEM *[الجينات / isoforms].results

8. تحديد الجينات ذات الاهتمام

ملاحظة: يمكن القيام بالخطوات التالية مع ملفات النيوكليوتيد أو البروتين FASTA ولكنها تعمل بشكل أفضل وأكثر مباشرة مع تسلسل البروتين. عمليات البحث BLAST باستخدام البروتين إلى البروتين هو أكثر عرضة لإعطاء نتائج عند البحث بين أنواع مختلفة.

  1. للحصول على جينوم مرجعي، استخدم ملف FASTA البروتيني من الخطوة 5.2.2 أو راجع المواد التكميلية لإنشاء ميزة جينية مخصصة GTF.
  2. للحصول على نسخة من دي نوفو، قم بإنشاء بروتين FASTA باستخدام TransDecoder.
    1. تثبيت أو تحميل TransDecoder v. 5.5.0 على الكمبيوتر cluser.
    2. العثور على أطول إطار القراءة المفتوحة وتسلسل الببتيد المتوقعة عن طريق كتابة [موقع Transdecoder]/TransDecoder.LongOrfs-t $TRINITY. فاستا، فاستا.
  3. ابحث NCBI Genbank عن التجانس في الأنواع ذات الصلة الوثيقة.
    1. افتح نافذة متصفح إنترنت واذهب إلى https://www.ncbi.nlm.nih.gov/genbank/.
    2. على شريط البحث اكتب اسم الجين من الفائدة واسم الأنواع ذات الصلة الوثيقة التي تم تسلسل أو جنس أو phylum. على يسار شريط البحث حدد البروتين ثم انقر فوق البحث.
    3. استخراج تسلسلات بالنقر فوق إرسال إلى ثم حدد ملف. ضمن تنسيق، حدد FASTA ثم انقر فوق إنشاء ملف.
    4. نقل FASTA ملف homologs إلى كتلة الكمبيوتر بكتابة scp $FASTA username@clusterlocation:/$DIR على إطار محطة طرفية محلية أو استخدام FileZilla لنقل الملفات من وإلى الكمبيوتر والكتلة.
  4. البحث عن الجينات المرشحة باستخدام BLAST +26.
    1. تثبيت أو تحميل BLAST + v. 2.8.1 على نظام المجموعة الكمبيوتر.
    2. على كتلة الكمبيوتر ، وجعل قاعدة بيانات BLAST من الجينوم أو transcriptome ترجمة البروتين FASTA عن طريق كتابة [BLAST + الموقع] / makeblastdb في $PEP. FASTA -dbtype بروت التدريجي $OUTPUT
    3. BLAST تسلسل الجينات متجانسة من NCBI إلى قاعدة بيانات الأنواع ذات الاهتمام عن طريق كتابة [BLAST + الموقع] / blastp -db $DATABASE -query $FASTA -evalue 1e-10 -outfmt 6 -max_target_seqs 1-out $OUTPUT.
    4. عرض ملف الإخراج باستخدام الأمر أكثر. نسخ معرفات جينية فريدة من نوع الاهتمام إلى ملف نصي جديد.
    5. استخراج تسلسل الجينات المرشحة عن طريق كتابة بيرل -ne 'إذا(/^>(\S+)/){$c=$i{$1}}$c?طباعة:chomp;$i{$_}=1 إذا @ARGV' $gene_id.txt $PEP. > $OUTPUT فاستا.
  5. تأكيد التعليقات التوضيحية الجينية باستخدام BLAST المتبادل.
    1. على متصفح الإنترنت انتقل إلى https://blast.ncbi.nlm.nih.gov/Blast.cgi.
    2. حدد tblastn، ثم الصق تسلسلات المرشحين، وحدد قاعدة بيانات تسلسل البروتين غير المتكررة وانقر فوق BLAST.
  6. تحديد جينات إضافية من خلال شرح جميع الجينات في الجينوم أو النسخ باستخدام مصطلحات علم الجينات (GO) (انظر المناقشة).
    1. نقل البروتين FASTA إلى الكمبيوتر المحلي.
    2. تحميل وتثبيت Blast2GO27،28،29 ضد 5.2 إلى الكمبيوتر المحلي.
    3. فتح Blast2GO، انقر فوق ملف، انتقل إلى تحميل، انتقل إلى تحميل تسلسلات، انقر فوق تحميل Fasta ملف (fasta). حدد الملف FASTA وانقر فوق تحميل.
    4. انقر على الانفجار، اختر NCBI انفجار،وانقر فوق التالي. تحرير المعلمات أو انقر فوق التالي، تحرير المعلمات وانقر فوق تشغيل للعثور على وصف الجينات الأكثر تشابها.
    5. انقر فوق تعيين ثم انقر فوق تشغيل للبحث في التعليقات التوضيحية علم الجينات عن البروتينات مماثلة.
    6. انقر فوق interproالتالي ، حدد EMBL-EBI InterPro، وانقر فوق التالي. تحرير المعلمات أو انقر فوق التالي، ثم انقر فوق تشغيل للبحث عن توقيعات من العائلات والمجالات الجينية المعروفة.
    7. تصدير التعليقات التوضيحية بالنقر فوق ملف، حدد تصدير، انقر فوق تصدير جدول. انقر فوق استعراض، واسم الملف ، انقر فوق حفظ، انقر فوق تصدير.
    8. ابحث في جدول التعليقات التوضيحية عن شروط GO المثيرة للاهتمام لتحديد جينات المرشح الإضافية. استخراج التسلسلات من الملف FASTA (الخطوة 8.4.5)

9. الأشجار النباتية

  1. تحميل وتثبيت MEGA30 v. 7.0.26 إلى الكمبيوتر المحلي.
  2. فتح MEGA، انقر على محاذاة،انقر فوق تحرير / بناء المحاذاة،حدد إنشاء محاذاة جديدة انقر فوق موافق،حدد البروتين.
  3. عندما تفتح نافذة المحاذاة، انقر فوق تحرير، انقر فوق إدراج تسلسلات من الملف وحدد FASTA مع تسلسل البروتين من الجينات المرشحة والتجانس المحتمل.
  4. حدد كافة التسلسلات. العثور على رمز الذراع وتحوم فوقه. وينبغي أن أقول محاذاة تسلسل باستخدام خوارزمية MUSCLE31. انقر على رمز الذراع ثم انقر فوق محاذاة البروتين لمحاذاة التسلسلات. تحرير المعلمات أو انقر فوق موافق لمحاذاة باستخدام المعلمات الافتراضية.
  5. فحص بصريا وإجراء أي تغييرات يدوية ثم حفظ وإغلاق إطار المحاذاة.
  6. في النافذة الرئيسية MEGA، انقر على نماذج،انقر فوق البحث عن أفضل نماذج الحمض النووي / البروتين (ML)،حدد ملف المحاذاة وحدد المعلمات المقابلة مثل: تحليل: اختيار النموذج (ML)، شجرة لاستخدام: التلقائي (الجار الانضمام شجرة)، الأسلوب الإحصائي: أقصى احتمال، نوع الاستبدال: الأحماض الأمينية، الفجوة / علاج البيانات في عداد المفقودين: استخدام جميع المواقع، تصفية موقع فرع: لا شيء.
  7. بمجرد تحديد أفضل طراز للبيانات، انتقل إلى النافذة الرئيسية MEGA. انقر فوق Phylogeny وانقر فوق Contruct / اختبار شجرة الاحتمال الأقصى ثم حدد المحاذاة، إذا لزم الأمر. حدد المعلمات المناسبة للشجرة: الطريقة الإحصائية: أقصى احتمال، اختبار Phylogeny: أسلوب Bootstrap مع 100 يكرر، نوع الاستبدال: الأحماض الأمينية، نموذج: LG مع Freqs. (+F)، المعدلات بين المواقع: جاما موزعة (G) مع 5 فئات غاما منفصلة، الفجوة / علاج البيانات المفقودة: استخدام جميع المواقع، ML أسلوب الاستدلال: أقرب الجار التبادل (NNI).

10. تصور التعبير الجيني باستخدام TPM

  1. بالنسبة الثالوث، على نظام المجموعة الكمبيوتر انتقل إلى الدليل حيث تم تشغيل abundance_estimates_to_matrix.pl وينبغي أن يكون أحد المخرجات مصفوفة. TPM.not_cross_norm نقل هذا الملف إلى الكمبيوتر المحلي.
    ملاحظة: راجع المواد التكميلية لتطبيع العينة المتقاطعة.
  2. بالنسبة ل TPMs من تحليل الجينوم اتبع الخطوات أدناه.
    1. على نظام مجموعة أجهزة الكمبيوتر، انتقل إلى موقع التثبيت RSEM. نسخ rsem-توليد-البيانات-مصفوفة بكتابة scp rsem-توليد-مصفوفة البيانات-rsem-توليد-TPM-مصفوفة. استخدام نانو لتحرير الملف الجديد وتغيير "بلدي $offsite = 4" من 4 إلى 5 لTPM ، فإنه ينبغي أن تقرأ الآن "بلدي $offsite = 5".
  3. انتقل إلى الدليل حيث ملفات الإخراج RSEM .genes.results هي والآن استخدام rsem-generate-TPM-matrix *[genes/isoforms.results] > $OUTPUT لإنشاء مصفوفة TPM. نقل النتائج إلى كمبيوتر محلي.
  4. تصور النتائج في ggplot2.
    1. تحميل R v. 4.0.0 و RStudio v. 1.2.1335 إلى كمبيوتر محلي.
    2. افتح RStudio على يمين الشاشة انتقل إلى علامة التبويب الحزم وانقر فوق تثبيت. اكتب ggplot2 وانقر فوق تثبيت.
    3. على إطار البرنامج النصي R قراءة في الجدول TPM بكتابة البيانات<-read.table("$tpm.txt"، رأس = T)
    4. بالنسبة للرسوم البيانية الشريطية المشابهة للرسم البياني الشكل 4 اكتب شيئا مشابها لما يلي: p<-ggplot() + geom_bar(aes (y=TPM، x=Symbol، fill=Tissue)، البيانات=البيانات، stat="identity")
      تعبئة<-c("#d7191c"،"#fdae61"، "#ffffbf"، "#abd9e9"، "#2c7bb6")
      p<-p+scale_fill_manual(القيم=التعبئة)
      p + السمة (axis.text.x = element_text(الزاوية = 90))

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

تم تلخيص الطرق المذكورة أعلاه في الشكل 1 وتم تطبيقها على مجموعة بيانات من أنسجة هيدرا فولغاريس. H. vulgaris هو اللافقاريات المياه العذبة التي تنتمي إلى Cnidaria فيلوم الذي يشمل أيضا الشعاب المرجانية، قناديل البحر، شقائق النعمان البحر. H. vulgaris يمكن أن تتكاثر لا جنسي عن طريق الناشئة وأنها يمكن أن تجدد رؤوسهم وقدمهم عند تقسيمها. في هذه الدراسة، ونحن تهدف إلى التحقيق في تطور والتعبير عن الجينات أوبسين في هيدرا7. في حين تفتقر هيدرا إلى العيون ، فإنها تظهر سلوكا يعتمد على الضوء32. تقوم جينات Opsin بترميز البروتينات المهمة في الرؤية للكشف عن أطوال موجية مختلفة من الضوء وبدء سلسلة النقل الضوئي. التحقيق في التطور الجزيئي والتعبير عن هذه العائلة الجينية في الأنواع القاعدية يمكن أن توفر نظرة ثاقبة في تطور العينين والكشف عن الضوء في الحيوانات.

لقد قمنا بإنشاء تجميع موجه باستخدام الجينوم المرجعي Hydra2.0 33 وبيانات RNA-seq المتاحة للجمهور (انضمام GEO GSE127279) الشكل 1. استغرقت هذه الخطوة حوالي 3 أيام. على الرغم من أننا لم تولد نسخة دي نوفو في هذه الحالة، يمكن أن يستغرق تجميع الثالوث ما يصل إلى 1 أسبوع لتوليد وكل مكتبة يمكن أن يستغرق بضع ساعات لقراءة رسم الخرائط اعتمادا على مخطط. تم شرح تجميع هيدرا المدمج (~ 50،000 نسخة) باستخدام Blast2GO الذي استغرق حوالي أسبوع واحد الشكل 1. تم استخراج تسلسل الجينات المرتبطة opsin في ملف فاستا. كما تم استخراج تسلسل لجينات الأوبسين من الأنواع الأخرى من بنك NCBI GenBank. استخدمنا opsins من cnidarians Podocoryna كارنيه, Cladonema radiatum, تريبيديليا cystophora, وNematostella vectensis, ونحن شملت أيضا outgroups Mnemiopsis leidyi, Trichoplax adhaerens, Drosophila melanogaster والإنسان العاقل. تم محاذاة الجينات أوبسين في الشكل MEGA7 2. من خلال عرض المحاذاة ، تمكنا من تحديد هيدرا opsins التي كانت في عداد المفقودين حمض أميني ال ليسين المحفوظة اللازمة لربط جزيء حساس للضوء. بعد الفحص البصري، حددنا أفضل نموذج من خلال إجراء تحليل اختيار النموذج. لقد قمنا بتوليد شجرة أقصى احتمال باستخدام نموذج LG + G + F مع قيمة bootstrap من 100 الشكل 3. ل149 الجينات أوبسين، تم الانتهاء من شجرة في حوالي 3 أيام. يشير الفيلوجيني إلى أن جينات الأوبسين تتطور حسب الازدواجية الخاصة بالنسب في cnidarians وربما عن طريق الازدواجية جنبا إلى جنب في H. vulgaris7.

قمنا بتحليل التعبير التفاضلي في edgeR ونظرنا إلى التعبير المطلق عن جينات الأوبسين. افترضنا أن واحد أو أكثر من opsins سيتم upregulated في الرأس (hypostome) وأجرى مقارنات الزوج الحكيم من hypostome مقابل عمود الجسم، والمنطقة الناشئة، والقدم ومخالب. وكمثال على المقارنة بين الزوج والحكمة، تم التعبير عن 1774 نسخة بشكل متفاوت بين الهيبوستوم وعمود الجسم. حددنا الجينات التي تم تنظيمها عبر مقارنات متعددة وفعل الإثراء الوظيفي في Blast2GO الجدول 1. وشمل تجميع نشاط مستقبلات البروتين G-البروتين المقترن جينات الأوبسين. وأخيرا، نظرنا إلى التعبير المطلق لجينات الأوبسين في أنسجة مختلفة، أثناء الناشئة وأثناء التجديد من خلال رسم قيم TPM الخاصة بهم باستخدام الشكل ggplot 4. باستخدام الأساليب المبينة هنا ، حددنا 2 جينات opsin التي لم تجمع مع opsins الأخرى في الفيلوجيني ، ووجدنا أحد الأوبسين الذي تم التعبير عنه أكثر من 200 مرة تقريبا من الآخرين ، ووجدنا بعض جينات opsin التي تم التعبير عنها مع جينات النقل الضوئي التي يمكن استخدامها للكشف عن الضوء.

Figure 1
الشكل 1: تخطيط سير العمل. البرامج المستخدمة لتحليل البيانات على كتلة الكمبيوتر هي باللون الأزرق، في أرجواني هي تلك التي استخدمناها على جهاز كمبيوتر محلي والبرتقالي هو برنامج على شبكة الإنترنت. (1) تريم RNA-seq يقرأ باستخدام trimmomatic v. 0.35. إذا كان الجينوم متوفرا ولكن نماذج الجينات مفقودة، قم بإنشاء تجميع موجه باستخدام STAR v. 2.6.0c و StringTie v. 1.3.4d. (اختياري انظر المواد التكميلية) (2) بدون الجينوم المرجعي، استخدم قراءات مشذبة لإجراء تجميع دي نوفو باستخدام الثالوث v 2.8.5. (3) لقياس التعبير الجيني باستخدام جينوم مرجعي، تقرأ الخريطة باستخدام STAR وتحديد كميا باستخدام RSEM v. 1.3.1. استخراج TPMs باستخدام RSEM وتصور لهم في RStudio. (4) يمكن استخدام Bowtie و RSEM لرسم خريطة وتحديد عدد القراءات التي تم تعيينها إلى نص الثالوث. يمكن استخدام برنامج نصي الثالوث لإنشاء مصفوفة TPM لتصور التهم في RStudio. (5) استخدام شبكة الإنترنت NCBI BLAST وقيادة خط BLAST + للبحث عن تسلسل متجانسة وتأكيد استخدام BLAST المتبادلة. إضافة تعليقات توضيحية على الجينات باستخدام Blast2GO. استخدام MEGA لمحاذاة الجينات وتوليد شجرة phylogenetic باستخدام النموذج الأنسب. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 2
الشكل 2: مثال على الجينات المنحازة. لقطة يظهر جزء من الجينات هيدرا أوبسين الانحياز باستخدام MUSCLE. يشير السهم إلى موقع ليسين محفوظ ملزم للشبكية. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 3
الشكل 3: Cnidarian opsin شجرة نباتية. شجرة أقصى احتمال ولدت في MEGA7 باستخدام تسلسل أوبسين من هيدرا vulgaris, Podocoryna كارنيه, Cladonema radiatum, تريبيديليا cystophora, نيماتوستيلا vectensis, Mnemiopsis leidyi, Trichoplax adhaerens, Drosophila melanogaster والإنسان العاقل. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 4
الشكل 4: التعبير عن الجينات أوبسين في هيدرا فولغاريس(أ) التعبير في النصوص لكل مليون (TPM) من الجينات هيدرا vulgaris أوبسين في عمود الجسم، والمنطقة الناشئة، والقدم، و hypostome ومخالب. (ب) التعبير عن الجينات أوبسين خلال مراحل مختلفة من هيدرا في مهدها. (ج) التعبير عن الجينات أوبسين من hypostome هيدرا خلال نقاط زمنية مختلفة من التجديد. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

معرف GO اسم GO فئة GO FDR
GO:0004930 G-البروتين مقرونة نشاط مستقبلات دالة جزيئية 0.0000000000704
GO:0007186 G-البروتين إلى جانب مستقبلات مسار الإشارات العملية البيولوجية 0.00000000103
GO:0016055 Wnt مسار الإشارات العملية البيولوجية 0.0000358
GO:0051260 بروتين المثلية العملية البيولوجية 0.000376
GO:0004222 نشاط ميتالويندوببتيداز دالة جزيئية 0.000467
GO:0008076 مجمع قناة البوتاسيوم ذات بوابات الجهد المكون الخلوي 0.000642
GO:0005249 نشاط قناة البوتاسيوم ذات بوابات الجهد دالة جزيئية 0.00213495
GO:0007275 تطوير الكائنات الحية متعددة الخلايا العملية البيولوجية 0.00565048
GO:0006813 نقل أيون البوتاسيوم العملية البيولوجية 0.01228182
GO:0018108 بيبتيديل التيروزين الفوسفور العملية البيولوجية 0.02679662

الجدول 1: الإثراء الوظيفي للجينات الأعلى تنظيما في الهبوستوتوم

المواد التكميلية. يرجى الضغط هنا لتحميل هذه المواد.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

الغرض من هذا البروتوكول هو تقديم مخطط تفصيلي للخطوات اللازمة لوصف عائلة الجينات باستخدام بيانات الحمض النووي الريبي-seq. وقد ثبت أن هذه الأساليب تعمل لمجموعة متنوعة من الأنواع ومجموعات البيانات4و34و35. وقد تم تبسيط خط الأنابيب الذي أنشئ هنا وينبغي أن يكون سهلا بما فيه الكفاية ليتبعه مبتدئ في المعلوماتية الحيوية. أهمية البروتوكول هو أنه يحدد جميع الخطوات والبرامج اللازمة لإكمال تحليل قابل للنشر. خطوة حاسمة في البروتوكول هو وجود تجميعها بشكل صحيح كامل طول النصوص ، وهذا يأتي من الجينوم عالية الجودة أو transcriptomes. للحصول على النصوص المناسبة ، يحتاج المرء إلى الحمض النووي الريبي عالي الجودة و / أو الحمض النووي وشروح جيدة تناقش أدناه.

لإعداد مكتبة RNA-seq ، نقوم بتضمين مجموعات القائمة التي عملت لأجزاء الجسم الصغيرة من Hydra19 والفراشات18 (جدول المواد). نلاحظ أنه بالنسبة لانخفاض المدخلات الجيش الملكي النيبالي استخدمنا نهج بروتوكول تعديل36. تمت مقارنة طرق استخراج الحمض النووي الريبي في أنواع عينات متعددة بما في ذلك خلايا الخميرة17، الورم الأرومي العصبي37، النباتات38، ويرقات الحشرات16 على سبيل المثال لا الحصر. نوصي القارئ الحصول على بروتوكول يعمل لأنواعها من الاهتمام، إذا وجدت، أو استكشاف الأخطاء وإصلاحها باستخدام مجموعات المتاحة تجاريا عادة لبدء. من أجل تحديد كمي للجينات بشكل صحيح، نوصي بمعالجة عينة الحمض النووي الريبي مع DNase. وجود الحمض النووي سيؤثر على التحديد الكمي الجيني الصحيح. نوصي أيضا باستخدام مجموعة إعدادية لمكتبة cDNA تتضمن تحديد ذيل متعدد الأضلاع لتحديده ل mRNA الناضج. في حين أن استنفاد rRNA يؤدي إلى عمق قراءة أكثر ، فإن النسبة المئوية لتغطية exon أقل بكثير من تغطية exon من الحمض النووي الريبي باستخدام اختيار polyA +39. وأخيرا، عندما يكون ذلك ممكنا فمن الأفضل استخدام نهاية المقترنة وتقطعت بهم السبل40،41. في البروتوكول أعلاه قراءة تعيين الأوامر يجب أن يكون تعديل عند استخدام يقرأ نهاية واحدة.

وكما ذكر أعلاه، من المهم أن نكون قادرين على تحديد الجينات ذات الأهمية، وكذلك التمييز بين الازدواجية الجينية الحديثة، والربط البديل، والأنماط الهابلوتية في التسلسل. في بعض الحالات، يمكن أن يساعد وجود جينوم مرجعي من خلال تحديد مكان وجود الجينات والإكسونات نسبة إلى بعضها البعض. شيء واحد هو أن نلاحظ أنه إذا تم الحصول على transcriptome من قاعدة بيانات عامة وليس ذات جودة عالية ، قد يكون من الأفضل لتوليد باستخدام الثالوث42 والجمع بين المكتبات RNA - seq من الأنسجة ذات الاهتمام. وبالمثل، إذا لم يكن الجينوم المرجعي يحتوي على نماذج جينية جيدة، يمكن استخدام مكتبات RNA-seq لتوليد GTFs جديدة باستخدام StringTie43 (انظر المواد التكميلية). وبالإضافة إلى ذلك، في الحالات التي تكون فيها الجينات غير مكتملة ويكون هناك إمكانية للوصول إلى الجينوم، يمكن تحرير الجينات يدويا باستخدام تسلسلات التجانس ثم محاذاتها إلى الجينوم باستخدام الأرومة. يمكن استخدام إخراج BLAST لتحديد التسلسل الفعلي، والذي قد يكون مختلفا عن التصحيح الذي تم باستخدام التجانس. إذا لم يكن هناك تطابق، اترك التسلسل كما كان في الأصل. عند التحقق من الإخراج إيلاء الاهتمام لإحداثيات الجينوم للتأكد من exon في عداد المفقودين هو في الواقع جزء من الجين.

على الرغم من أننا نركز على البرامج والبرامج التي استخدمناها ، إلا أن التعديلات على هذا البروتوكول موجودة بسبب العديد من البرامج المتاحة التي قد تعمل بشكل أفضل لمجموعات البيانات المختلفة. على سبيل المثال، نعرض أوامر لرسم الخرائط يقرأ إلى transcriptome باستخدام bowtie و RSEM، ولكن الثالوث لديه الآن خيار لمحاذاة أسرع بكثير مثل kallisto44 والسلمون45. وبالمثل ، فإننا نصف التعليقات التوضيحية باستخدام Blast2GO (الآن OmicsBox) ولكن هناك أدوات أخرى للتخطيط يمكن العثور عليها مجانا وعلى الإنترنت. بعض التي حاولنا تشمل: GO FEAT46، eggNOG- مخطط47،48، و بانزر49محاذاة سريعة جدا . لاستخدام هذه الأدوات على شبكة الإنترنت التعليق التوضيحي ببساطة تحميل الببتيد FASTA وتقديم. إصدارات مستقلة PANNZER و eggNOG-مخطط تتوفر أيضا ليتم تحميلها على كتلة الكمبيوتر. تعديل آخر هو أننا استخدمنا MEGA و R على جهاز كمبيوتر محلي واستخدمنا أداة NCBI BLAST عبر الإنترنت للقيام ب BLASTs المتبادلة ولكن يمكن استخدام جميع هذه البرامج على نظام مجموعة الكمبيوتر عن طريق تنزيل البرامج وقواعد البيانات اللازمة. وبالمثل، يمكن استخدام المحاذاة kallisto والسلمون على جهاز كمبيوتر محلي طالما أن المستخدم لديه ما يكفي من ذاكرة الوصول العشوائي والتخزين. ومع ذلك، FASTQ وملفات FASTA تميل إلى أن تكون كبيرة جدا، ونحن نوصي بشدة باستخدام نظام مجموعة الكمبيوتر لسهولة وسرعة. بالإضافة إلى ذلك ، في حين أننا نقدم تعليمات وروابط لتحميل البرامج من مطوريها ، يمكن تثبيت العديد منها من bioconda: https://anaconda.org/bioconda.

مشكلة شائعة تواجه عند القيام التحليلات المعلوماتية الحيوية هو فشل البرامج النصية قذيفة. يمكن أن يكون هذا بسبب مجموعة متنوعة من الأسباب. إذا تم إنشاء ملف خطأ، يجب التحقق من ملف الخطأ هذا قبل استكشاف الأخطاء وإصلاحها. وهناك عدد قليل من الأسباب الشائعة لخطأ هي الأخطاء المطبعية، والمعلمات الرئيسية المفقودة، وقضايا التوافق بين إصدارات البرامج. في هذا البروتوكول، نقوم بتضمين معلمات للبيانات، ولكن يمكن أن توفر أدلة البرامج إرشادات أكثر تفصيلا للمعلمات الفردية. بشكل عام ، من الأفضل استخدام أحدث إصدارات البرامج والرجوع إلى الدليل المقابل لتلك النسخة.

وتشمل التحسينات على هذا البروتوكول إجراء تحليل التعبير التفاضلي على نطاق النسخ وتحليل الإثراء الوظيفي. نوصي edgeR50 لتحليل التعبير التفاضلي حزمة متوفرة في الموصل الحيوي. لتحليل الإثراء الوظيفي ، استخدمنا Blast2GO29 و DAVID51،52على شبكة الإنترنت. نوصي أيضا بالمزيد من تحرير phylogeny عن طريق استخراجه كملف newick واستخدام iTOL53على الويب. وعلاوة على ذلك، في حين أن هذا البروتوكول سوف يحقق في التطور الجزيئي وأنماط التعبير عن الجينات، يمكن استخدام تجارب إضافية للتحقق من صحة مواقع ووظائف الجينات أو البروتين. يمكن تأكيد تعبير mRNA بواسطة RT-qPCR أو التهجين في الموقع. يمكن توطين البروتينات باستخدام الكيمياء المناعية. اعتمادا على الأنواع، يمكن استخدام تجارب خروج المغلوب لتأكيد وظيفة الجينات. يمكن استخدام هذا البروتوكول لمجموعة متنوعة من الأهداف بما في ذلك ، كما هو موضح أعلاه ، لاستكشاف عائلة جينية ترتبط عادة بالتقبل الضوئي في النوع القاعدي7. وثمة تطبيق آخر لهذه الأساليب هو تحديد التغيرات في مسار محفوظ تحت ضغوط انتقائية مختلفة. على سبيل المثال ، تم استخدام هذه الطرق لاكتشاف الاختلاف في التعبير عن القنوات المحتملة لمستقبلات الرؤية العابرة بين الفراشات النهارية والعث الليلي34.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

وليس لدى صاحبي البلاغ ما يكشفان عنه.

Acknowledgments

نشكر أدريانا بريسكو وجيل سميث ورابي مراد وألين ج. رانجيل على المشورة والتوجيه في دمج بعض هذه الخطوات في سير العمل لدينا. كما أننا ممتنون لكاثرين ويليامز، وإليزابيث ريبواه، وناتاشا بيتشياني على تعليقاتهم على المخطوطة. وقد دعم هذا العمل جزئيا من قبل مؤسسة جورج هيويت لزمالة البحوث الطبية إلى A.M.M.

Materials

Name Company Catalog Number Comments
Bioanalyzer-DNA kit Agilent 5067-4626 wet lab materials
Bioanalyzer-RNA kit Agilent 5067-1513 wet lab materials
BLAST+ v. 2.8.1 On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC) On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0 On computer cluster
Bowtie v. 1.0.0 On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended) NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1 On computer cluster
edgeR v. 3.26.8 (in R) In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0 On computer cluster
Java v. 11.0.2 On computer cluster
MEGA7 (on your PC) On local computer
https://www.megasoftware.net
MEGAX v. 0.1 On local computer
https://www.megasoftware.net
NucleoSpin RNA II kit Macherey-Nagel 740955.5 wet lab materials
perl 5.30.3 On computer cluster
python On computer cluster
Qubit 2.0 Fluorometer ThermoFisher Q32866 wet lab materials
R v.4.0.0 On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlater ThermoFisher AM7021 wet lab materials
RNeasy kit Qiagen 74104 wet lab materials
RSEM v. 1.3.0 Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335 On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3 Computer software
SRA Toolkit v. 2.8.1 On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0c On computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4d On computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0 On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35 On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5 On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzol ThermoFisher 15596018 wet lab materials
TruSeq RNA Library Prep Kit v2 Illumina RS-122-2001 wet lab materials
TURBO DNA-free Kit ThermoFisher AM1907 wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

DOWNLOAD MATERIALS LIST

References

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology - B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra's periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. edgeR differential expression analysis of digital gene expression data User's Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

Tags

علم الأحياء، العدد 171، المعلوماتية الحيوية، التوسعات الجينية، BLAST، النسخ، الجينوم، MEGA
خط أنابيب المعلوماتية الحيوية للتحقيق في التطور الجزيئي والتعبير الجيني باستخدام الحمض النووي الريبي-seq
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Macias-Muñoz, A., Mortazavi, A. More

Macias-Muñoz, A., Mortazavi, A. A Bioinformatics Pipeline for Investigating Molecular Evolution and Gene Expression using RNA-seq. J. Vis. Exp. (171), e61633, doi:10.3791/61633 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter