باستخدام تحليل النشوء والتطور للتحقيق التوكسينات الجينات الأصل

* These authors contributed equally
Immunology and Infection

Your institution must subscribe to JoVE's Immunology and Infection section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

يتم وصف أسلوب بناء شجرة النشوء والتطور استناداً إلى تسلسل التماثل من الحلويات من حقيقيات النوى وسيميسويتس من بدائيات النوى. تحليل النشوء والتطور أداة مفيدة لشرح شمولية التطورية بين البروتينات المتجانسة أو الجينات من مجموعات مختلفة من الكائنات الحية.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L. Q., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

يستخدم تحليل النشوء والتطور النوكليوتيدات أو سلاسل الأحماض الأمينية أو معايير أخرى، مثل تسلسل المجال وهيكل ثلاثي الأبعاد، لإنشاء شجرة لإظهار العلاقة التطورية بين الأنواع المختلفة (وحدات التصنيف) في الجزيئية المستوى. يمكن أيضا استخدام تحليل النشوء والتطور للتحقيق في مجال العلاقات داخل الأصناف فردية، لا سيما لتغيير الكائنات الحية التي خضعت لكبيرة في مورفولوجيا وفسيولوجيا، ولكن للباحثين التي تفتقر إلى الأدلة الأحفورية نظراً تاريخ طويل من تطور الكائنات الحية أو ندرة التحجر.

ويرد في هذا النص، بروتوكول مفصل لاستخدام أسلوب النشوء والتطور، بما في ذلك الأحماض الأمينية تسلسل المحاذاة باستخدام أوميغا كلوستال، وبناء شجرة النشوء والتطور اللاحق باستخدام كلا أقصى احتمال (ML) علم "الوراثة الجزيئية التطورية" تحليل (ميجا) واستدلال النظرية الافتراضية عن طريق مرباييس. للتحقيق في أصل الجينات السكريات ستقوم في نهاية المطاف أن "الناقلين المصدرة" (الحلو) حقيقية النواة، حللت 228 الحلويات بما في ذلك البروتينات حلوة 35 من حقيقيات النوى أحادي الخلية والبروتينات سيميسويت 57 من بدائيات النوى. من المثير للاهتمام، تم العثور على سيميسويتس في بدائيات النوى، ولكن تم العثور على الحلويات في حقيقيات النوى. واقترح اثنين من الأشجار النشوء والتطور التي شيدت باستخدام أساليب متميزة من الناحية النظرية دائماً أن الجينات الحلوة حقيقية النواة الأولى قد تنبع من الانصهار من جين سيميسويت بكتيرية وجين سيميسويت أرتشايال. تجدر الإشارة إلى أن أحد يجب أن تكون حذرة لاستخلاص النتائج استناداً فقط إلى تحليل النشوء والتطور، على الرغم من أنها مفيدة لتوضيح العلاقة الأساسية بين الأنواع المختلفة، التي من الصعب أو حتى من المستحيل نستشف من خلال الوسائل التجريبية .

Introduction

تسلسل الحمض النووي الريبي أو تحمل المعلومات الوراثية لتعمل الكامنة التي يمكن تحليلها من خلال الأساليب الفسيولوجية والبيوكيميائية أو لاحظت من خلال أدلة المورفولوجية والوقود الأحفوري. بمعنى، المعلومات الجينية أكثر موثوقية من تقييم خارجي تعمل لأن السابق هو الأساس لهذا الأخير. وفي دراسة تطورية، الأدلة الأحفورية مباشرة ومقنعة جداً. ومع ذلك، العديد من الكائنات الحية، مثل الكائنات المجهرية، لديهم فرصة ضئيلة لتشكيل الأحفوري خلال العصور الجيولوجية منذ فترة طويلة. ولذلك، المعلومات الجزيئية مثل تسلسل النوكليوتيدات وسلاسل الأحماض الأمينية من الكائنات الموجودة ذات الصلة ذات قيمة لاستكشاف العلاقات التطورية1. في هذه الدراسة، وقدمت مقدمة بسيطة من المعارف الأساسية في النشوء والتطور وبروتوكولا سهلة لتعلم للقادمين الجدد الذين هم بحاجة إلى بناء شجرة النشوء والارتقاء بأنفسهم.

يمكن استخدام الحمض النووي (النوكليوتيدات) وتسلسل البروتين (الأحماض الأمينية) استنتاج العلاقات النشوء والتطور بين الجينات مثلى أو العضيات، أو حتى الكائنات الحية2. تسلسل الحمض النووي من المرجح أن تتأثر بالتغييرات أثناء تطور. وفي المقابل، سلاسل الأحماض الأمينية أكثر استقرارا نظراً لأن الطفرات مترادفين في تسلسل النوكليوتيدات لا تسبب طفرات في سلاسل الأحماض الأمينية. نتيجة لذلك تسلسل الحمض النووي مفيدة لمقارنة الجينات مثلى من الكائنات ذات صلة وثيقة، في حين سلاسل الأحماض الأمينية المناسبة للجينات مثلى من الكائنات ذات الصلة بعيد3.

يبدأ تحليل النشوء والتطور مع المحاذاة للأحماض الأمينية أو النوكليوتيدات تسلسل4 تم استردادها من جينوم مشروح تسلسل قاعدة بيانات5 المدرجة في تنسيق فاستا، أي، البروتين المفترضة أو أعربت عن تسلسل، تسلسل الحمض النووي الريبي ، أو تسلسل الحمض النووي. تجدر الإشارة إلى أن من الأهمية بمكان لجمع متواليات عالية الجودة للتحليل، ويمكن استخدام تسلسل فقط مثلى لتحليل العلاقات النشوء والتطور. العديد من منصات مختلفة مثل W كلوستال، س كلوستال، العضلات، تي-القهوة، مفت، يمكن أن تستخدم لمحاذاة التسلسل. الأكثر استخداماً هو أوميغا كلوستال6،7 (http://www.ebi.ac.uk/Tools/msa/clustalo/)، التي يمكن استخدامها على الإنترنت أو يمكن تحميلها مجاناً من التهمة. أداة المحاذاة لها العديد من المعلمات التي يمكن للمستخدم ضبط قبل البدء المحاذاة، ولكن المعلمات الافتراضية تعمل جيدا في معظم الحالات. بعد الانتهاء من هذه العملية، يجب حفظ تسلسل تمت محاذاته بالشكل الصحيح للخطوة التالية. أنها ينبغي أن تكون ثم تحريرها أو قلصت استخدام برامج تحرير، مثل بيوديت، لأنه يتطلب بناء شجرة النشوء والتطور من ميجا في التسلسل تكون متساوية الطول (بما في ذلك الاختصارات من الأحماض الأمينية والواصلات. وفي التسلسل الذي تمت محاذاته، تمثل أي موقف دون الأحماض الأمينية أو النوكليوتيدات واصلة "-"). عموما، يجب إزالة كافة الأحماض الأمينية بارزة أو النيوكليوتيدات على حد سواء للمحاذاة. وبالإضافة إلى ذلك، يمكن حذف الأعمدة التي تحتوي على تسلسلات الانحياز سيئة في المحاذاة لأنها تنقل سوى القليل من المعلومات القيمة، ويمكن في بعض الأحيان إعطاء معلومات كاذبة أو الخلط بين3. يمكن حذف الأعمدة التي تحتوي على واصلات واحد أو أكثر في هذا الوقت أو في مرحلة لاحقة بناء شجرة. وبدلاً من ذلك، يمكن استخدامها لحساب النشوء والتطور. عند الانتهاء من تسلسل المحاذاة والتشذيب، يجب حفظ تسلسل المنحازة في شكل فاستا، أو بالشكل المرغوب فيه، لاستخدامها في وقت لاحق.

توفير منصات البرمجيات العديد من مهام بناء شجرة باستخدام أساليب مختلفة أو خوارزميات. وبصفة عامة، يمكن تصنيف الأساليب كأساليب مصفوفة المسافة أو أساليب البيانات المنفصلة. أساليب مصفوفة مسافة بسيطة وسريعة لحساب، بينما أساليب البيانات المنفصلة معقدة وتستغرق وقتاً طويلاً. للأصناف المتصلة بشكل وثيق جداً مع درجة عالية من تقاسم هوية تسلسل الأحماض الأمينية أو النوكليوتيدات، أسلوب مصفوفة مسافة (الانضمام إلى جاره: نيوجيرسي؛ أسلوب المجموعة زوج مرجحة مع الوسط الحسابي: أوبجما) هو مناسب؛ للأصناف ذات الصلة بعيد، أسلوب بيانات منفصلة (الحد الأقصى لاحتمال: مل؛ الحد الأقصى من التقتير: بروتوكول مونتريال؛ استدلال النظرية الافتراضية) هو الأمثل3،8. في هذه الدراسة، طبقت أساليب مل في ميجا (6.0.6) واستدلال النظرية الافتراضية (3.2 مرباييس) لبناء9من أشجار النشوء والتطور. ومن الناحية المثالية، عند استخدام النموذج المناسب والمعلمات، قد تكون النتائج المستمدة من الأساليب المختلفة متسقا، وهم لذلك أكثر موثوقة ومقنعة.

لشجرة مل النشوء والتطور التي شيدت باستخدام ميجا10، يجب تحميل الملف تسلسل تمت محاذاته بتنسيق فاستا في البرنامج. ثم الخطوة الأولى لتحديد النموذج البديل الأمثل للبيانات الذي تم تحميله. تتم مقارنة جميع النماذج البديلة المتاحة استناداً إلى التسلسل الذي تم تحميله، وسيظهر نتائجهم النهائية في جدول نتائج. حدد النموذج مع نقاط معيار المعلومات النظرية الافتراضية (BIC) أصغر (سرد أولاً في الجدول) وتعيين معلمات مل وفقا لنموذج الموصى بها وبدء العملية الحسابية. حساب الوقت يختلف من عدة دقائق إلى عدة أيام، اعتماداً على مدى تعقيد البيانات المحملة (طول تسلسل وعدد الأصناف) وأداء جهاز الكمبيوتر الذي يتم تشغيل البرامج. عند الانتهاء من العملية الحسابية، سيظهر شجرة النشوء والتطور في نافذة جديدة. احفظ الملف ك "FileName.mat". بعد إعداد المعلمات تحديد مظهر الشجرة، حفظ مرة أخرى. باستخدام هذا الأسلوب، يمكن أن تولد ميجا المنشور الصف أرقام شجرة النشوء والتطور.

لبناء شجرة مع مرباييس11، هو الخطوة الأولى لتحويل التسلسل الذي تمت محاذاته، التي ترد عادة في شكل فاستا، في العلاقة بين (.nex كنوع الملف). تحويل ملفات فاستا إلى تنسيق العلاقة يمكن معالجتها في ميجا. المقبل، يمكن تحميل التسلسل الذي تمت محاذاته بتنسيق العلاقة بين إلى مرباييس. عندما يتم تحميل الملف بنجاح، تحديد معلمات مفصلة لحساب شجرة. هذه المعلمات تتضمن تفاصيل مثل نموذج استبدال حمض أميني، معدلات التغير، وعدد سلسلة لسلسلة ماركوف مونتي كارلو (MCMC) اقتران، عدد ngen، متوسط الانحراف المعياري لتقسيم الترددات، وهلم جرا. بعد أن تم تحديد هذه المعلمات، البدء في العملية الحسابية. وفي النهاية، سيتم عرض الرقمين شجرة في التعليمات البرمجية الثاني ASC ومصداقية طور عرض واحد وأطوال فرع أخرى تظهر، على الشاشة.

سيتم حفظ ثمرة شجرة تلقائياً ك "FileName.nex.con". يمكن فتح هذا الملف شجرة وحرره التين، ويمكن تعديل هذا الرقم المعروض في التين كذلك لجعله أكثر ملاءمة للنشر.

في هذه الدراسة، تم تحليل البروتينات الحلو 228، بما في ذلك 35 من حقيقيات النوى أحادي الخلية وحلويات سيميسويتس 57 من بدائيات النوى، كمثال. الحلويات وسيميسويتس على السواء وصفت بأنها الغلوكوز أو سكر السكروز الناقلين عبر أغشية12،13. ويوحي تحليل النشوء والتطور أن المجالين MtN3/اللعاب الذي يحتوي على حلويات قد تكون مستمدة من انصهار تطوري سيميسويت البكتيرية، وأرتشايون14.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1-تسلسل المحاذاة

  1. جمع سلاسل الأحماض الأمينية حلوة حقيقية النواة وبدائية النواة سيميسويت في وثائق منفصلة وقائمة لهم في شكل FASTA. تحميل تسلسل من المركز الوطني لمعلومات التكنولوجيا الحيوية (نكبي)، ومختبر علم الأحياء الجزيئي الأوروبي (EMBL)، و "مصرف بيانات الحمض النووي" لليابان (دبي) قواعد البيانات بالبحث عن التشابه مع الأداة الأساسية المحلية المحاذاة البحث أداة (الانفجار).
    1. في ملفات المثال، جمع 228 المفترضة الحلوة البروتين تسلسل تملك مجالات MtN3/اللعاب اثنين (7 transmembrane لوالب) حقيقيات النوى وتسلسل البروتين SemiSWEET 57 امتلاك مجال MtN3/لعاب مفرد (3 لوالب transmembrane) من بدائيات النوى 13.
    2. لتبسيط هذه العملية، حدد 35 مرشح الحلوة البروتين من الكائنات الحية حقيقية النواة أحادي الخلية بين 228 الحلويات المفترضة لبناء شجرة النشوء والتطور. يتم إرفاق هذه التسلسلات حتى أن القارئ قد تمارس على مجموعة البيانات حقيقية.
  2. قم بمحاذاة تسلسلات الحلو 35 بإدخال لهم في كلوستال أوميغا (http://www.ebi.ac.uk/Tools/msa/clustalo/).
    1. نسخ ولصق في تسلسل البروتين في تنسيق FASTA في مربع الإدخال أو تحميل ملف تسلسل في تنسيق FASTA. تحديد أن هم تسلسل الأحماض الأمينية بواسطة النقر فوق الرمز ضمن القائمة المنسدلة في المقطع 'الخطوة 1'.
    2. تحديد تنسيق الإخراج وغيرها من المعالم في المقطع "الخطوة 2"، إذا لزم الأمر. لهذه الدراسة، تعيين تنسيق الإخراج ك "كلوستال ث/س عدد"، وترك المعلمات الأخرى في الإعدادات الافتراضية. في معظم الحالات، العمل المحددات الافتراضية أيضا دون أي تحديد.
  3. تقديم وتشغيل المحاذاة في المقطع 'الخطوة 3'. قد يستغرق في أي مكان من بضع ثوان إلى دقائق حتى يتم الانتهاء من المحاذاة. في لوحة "ملخص نتائج"، زر الماوس الأيمن فوق الارتباط الموجود أسفل "المحاذاة في تنسيق كلوستال" وحفظ تسلسل محاذاة ك "35.clustal" (الشكل 1).
  4. فتح الملف نتيجة المحاذاة في بيوديت.
    1. على اللوحة الرئيسية بيوديت، انقر فوق "التسلسل" واختر "تحرير المزاج" في القائمة المنسدلة الأولى، ثم انقر فوق "تحرير مخلفات" في القائمة الفرعية (الشكل 2).
    2. حدد تسلسل بارزة على الجانب الأيسر للمحاذاة مع المؤشر (سيظهر التسلسل المحدد باللون الأسود) وانقر فوق أيقونة "حذف" ضمن القائمة "تحرير" لإزالة التسلسل المحدد (الشكل 3).
    3. حدد حذف تسلسل بارزة على الجانب الأيمن من المجال MtN3/اللعاب الأولى وحفظ تسلسل المجال MtN3/اللعاب التي قلصت الأولى ك 35-I.fas (الشكل 4). وبالمثل، حذف الجانب الأيسر والأيمن بارزة تسلسل المجال MtN3/اللعاب ثانية وحفظه ك 35-II.fas. الأولى وفي تسلسل المجال MtN3/اللعاب الثانية يمكن التنبؤ مع إيقاع (http://proteinformatics.charite.de/rhythm/inndex.php?site=helix) أو تمهمم (http://www.cbs.dtu.dk/services/TMHMM/) في وقت مبكر.
  5. فتح ملف 35-I.fas مع ميجا، وانقر فوق "محاذاة" عند مطالبتك بذلك. ضمن القائمة "تحرير"، انقر فوق "تحديد الكل"، ثم انقر فوق "اختيار Sequence(s)"؛ سيتم تحديد أسماء وتسلسلات من الأصناف باللون الأسود (الشكل 5).
    1. اختر "نسخ" من قائمة "تحرير" لنسخ التسلسل إلى الحافظة ثم قم بلصق في تسلسل تم نسخها إلى ملف doc.
    2. في ملف doc، يحل محل جميع "#" مع">"، ثم قم بحذف أية أحرف غير ذات صلة لتحويلها إلى تنسيق FASTA. إضافة "--أنا" في نهاية كل اسم الصنف وضع علامة عليها كتسلسل المجال MtN3/اللعاب الأولى. عملية تسلسل المجال الثاني MtN3/اللعاب اتباع نفس الأسلوب، وإضافة "-ثانيا" بعد كل اسم الصنف.
  6. الجمع بين الأولى والثانية MtN3/اللعاب تسلسل المجال في تنسيق FASTA في ملف doc.
    1. تحميل متواليات مجتمعة إلى أوميغا كلوستال مرة أخرى ومحاذاة التسلسل كما هو موضح أعلاه. حفظ النتيجة ك "35 realigned.clustal".
    2. افتح الملف "35 realigned.clustal" في بيوديت وحذف مخلفات الأحماض الأمينية (بارزة) متفاوتة أما في نهاية تسلسل محاذاة ثم حفظ التسلسل ك "35 realigned.fas". انقر فوق "نعم" عندما حذر من أنه لا يمكن حفظ بعض الأحرف غير قياسي.

2-حساب شجرة النشوء والتطور

  1. فتح "35 realigned.fas" في ميجا.
    1. انقر فوق القائمة "بيانات"، واختر "تصدير المحاذاة"، وحفظ المحاذاة في تنسيق بوب (الرابطة) ك "35.nex" لاستخدامها لاحقاً في مرباييس (الشكل 6).
    2. ومن ناحية أخرى، انقر فوق رمز "نماذج" على اللوحة الرئيسية ميجا، اختر "البحث عن أفضل الحمض النووي/البروتين نماذج (ML)"، وانقر فوق "موافق" في إطار منبثق. انقر فوق "حساب" للبدء بنموذج البحث العملية (الشكل 7). سيتم فتح لوحة جديدة من تقدم؛ تستغرق هذه العملية عدة دقائق لعدة أيام، تبعاً لدرجة تعقيد في تسلسل محملة وأداء الكمبيوتر.
      ملاحظة: جدول يبين النتائج التي ستفتتح بعد الانتهاء من عملية البحث عن نموذج ( الشكل 8). سيتم سرد نقاط BIC أصغر أولاً، متبوعاً بسلسلة من نماذج مختلفة مع تزايد عشرات BIC تدريجيا. النموذج الأول "ال جي + G + F" مع نقاط BIC أصغر هو النموذج الموصى به لشجرة مل يستند إلى ملف "35 realigned.fas".
  2. انقر فوق رمز "نسأله" على اللوحة الرئيسية ميجا وانقر فوق "بناء/اختبار أقصى احتمال الشجرة" ثم انقر فوق "نعم" على اللوحة المنبثقة. سيتم فتح نافذة جديدة تبين مختلف المعلمات التي يجب أن تكون محددة (الشكل 9).
    1. أولاً، يتم تعيين القيمة bootstrap في اختبار مربع نسأله؛ 500 أو 1000 كافية في معظم الحالات. إطار نموذج الاستبدال، اختر "الأحماض الأمينية" كنوع الاستبدال. والغرض من اختيار نموذج استبدال تقدير الفرق الحقيقي بين تسلسلات استناداً إلى تلك الدول الحالية3.
    2. حدد "ال جي مع Freqs. نموذج (+F) "(جي + F) في المربع نموذج/الأسلوب. في معدلات والمربع نمط، حدد "توزيع غاما" (ز) لوصف التغيرات في سعر عبر المواقع، أي.، يعطي وزنا أكبر للتغيرات في تتطور ببطء المواقع3. في المربع مجموعة فرعية "البيانات"، حدد "إكمال حذف" لإزالة كافة الأعمدة التي تحتوي على واصلات.
    3. الاحتفاظ بكافة المعلمات الأخرى في حالاتها الافتراضية (الشكل 9). وبعد تحديد هذه المعلمات، انقر فوق رمز "حساب" لبدء الحساب.

3-عرض شجرة النشوء والتطور

ملاحظة: سيعرض شجرة مل النشوء والتطور عند الانتهاء من العملية الحسابية باستخدام ميجا (الشكل 10).

  1. ضمن القائمة المنسدلة رمز "ملف" على لوحة شجرة، اختر "حفظ الدورة الحالية" حفظ النتيجة (.mas هو نوع الملف الافتراضي). في هذه الدراسة، تم حفظها النتيجة ك "35.mas". على لوحة شجرة، العديد من المعلمات بما في ذلك طول طور، نمط شجرة وشجرة طوبولوجيا، الخط اسم الصنف والحجم، واللون، ويتم عرضها ويمكن تعيين خيارات مختلفة.
  2. حفظ الملف النهائي الشجرة بواسطة النقر فوق رمز صورة، وحفظ الرقم بتنسيقات مختلفة أو نسخ الصورة كالمصدر لتحرير الصور.

4-تحليل العلاقة بين سيميسويتس باستخدام تسلسل المحاذاة وحلويات

ملاحظة: هذه الخطوة قد لا يلزم في تحليل التسلسل العادي.

  1. قم بمحاذاة الحلويات التوكسينات 228 و 57 سيميسويتس بدائية في أوميغا كلوستال كما هو موضح أعلاه. يمكن أن تظهر نتائج المحاذاة في جالفيو، وهي متكاملة في أوميغا كلوستال، ونسخ لحفظ في محرر صور (الشكل 11).
    ملاحظة: في محاذاة المثال، بعض سيميسويتس من α-بروتيوباكتيريا تتماشى مع المجال MtN3/اللعاب أول تسلسل الحلو، بينما سيميسويتس من ميثانوباكتيريا (العتيقات) تتماشى مع المجال MtN3/اللعاب الثانية من التسلسلات الحلو.

5-بناء شجرة النشوء والتطور مع مرباييس

  1. "الاستدلالات النظرية الافتراضية" مع مرباييس، افتح الملف القابل للتنفيذ مرباييس وواجهة دوس سوف يأتي في إطار جديد. الخطوة الأولى قراءة file البيانات المترابطة. إدخال "تنفيذ 35.nex" بعد الموجه (تذكر لحفظ الملف التنفيذ الوطني 35 في نفس الدليل للملف القابل للتنفيذ مرباييس، أو الإشارة إلى المسار للملف قبل تحميله). سيظهر رسالة "مصفوفة قراءة ناجحة" بعد آخر الأصناف المدرجة في القائمة (الشكل 12). أعد الملف التنفيذ الوطني 35 وحفظها في ميجا (انظر 2-1 أعلاه).
  2. تعيين نموذج تطورية.
    1. بعد الموجه، اكتب "برست آموديلبر = fixed(lg)؛ معدلات لسيت = ز ". "ال جي" و "g" تتوافق مع نموذج "ال جي" و "G" التي تم تعيينها في ميجا. بعد تعيين هذا النموذج بنجاح، اكتب "نتشاينس mcmc = 4 ngen = 5,000,000" بعد الموجه. استخدام "نتشاينس = 4" يعني إدخال عدد إجمالي من سلسلة التبريد واحدة وثلاث سلاسل الساخنة لاقتران حاضرة. "منشئ الصورة الأصلية = 5,000,000" يعني لتشغيل 5,000,000 أجيال اقتران حاضرة للتقارب بين سلاسل الباردة والساخنة. في هذه الدراسة، كان يعتبر متوسط الانحراف المعياري لتقسيم ترددات تقل عن 0.01 تقارب السلاسل الساخنة والباردة.
    2. علما بأن عدد ngen لا يمكن التنبؤ بدقة في بداية العملية، وعادة ما يحتاج إلى تعديل بناء على التغير في متوسط الانحراف المعياري لتقسيم الترددات. وبالإضافة إلى ذلك، عدد ngen للتقارب قد تكون مختلفة في كل مرة عند تشغيل البرنامج يستند إلى نفس البيانات.
  3. تشغيل التحليل: تستغرق هذه الخطوة من عدة دقائق لعدة أيام، تبعاً للطابع المعقد لإدخال البيانات وأداء جهاز الكمبيوتر. بعد الانتهاء من العملية الحسابية مسبقاً، سيسألك موجه "تواصل مع تحليل (نعم/لا)؟" إذا كان "لا" يتم كتابتها بعد الموجه، ستتوقف الحوسبة (الشكل 13)، خلاف ذلك سوف تواصل حساب بعد إدخال العدد من المزيد من الأجيال. عند الانتهاء من العملية الحسابية (مع متوسط انحراف المعياري لتقسيم الترددات < 0.05 أو 0.01)، إيقاف العملية الحسابية بكتابة "لا" بعد موجه التحقيق.
    ملاحظة: 0.01 معيار صارم، 0.05 معتدلة وعادة ما تكون كافية.
  4. تلخيص هذه العينات: اكتب "مستنقع" بعد موجه لتلخيص عينات معالم النموذج (الشكل 14). ثم اكتب "ريلبورنين سومة بورنينفراك نعم = = 0.25" بعد موجه لتلخيص عينات شجرة. سيتم عرض معلومات مفصلة حول بناء شجرة النشوء والتطور كما هو الحال في الرقم 15، تليها الرقمين الشجرة التي تظهر في التعليمات البرمجية الثاني ASC على الشاشة وعرض واحد طور المصداقية وأطوال فرع عرض أخرى. في الوقت نفسه، سيتم تلقائياً حفظ شجرة ملف باسم "35.nex.con".
  5. لتحسين عرض الشجرة النشوء والتطور، افتح الملف شجرة "35.nex.con" باستخدام أداة التين (http://tree.bio.ed.ac.uk/software/figtree/)، حدد نمط أو الحجم لعرض النتيجة (الشكل 16)، أو حتى تحريره في محرر صور لجعلها أكثر ملاءمة للقارئ.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

أشجار النشوء والتطور تظهر كافة المجالات MtN3/اللعاب أول تسلسل حلوة 35 متفاوت كطور واحد والمجالات MtN3/اللعاب الثانية تسلسل الحلو متفاوت المسافات كطور آخر. وبالإضافة إلى ذلك، المحاذاة الحلويات وسيميسويتس وتظهر النتائج أن بعض سيميسويتس من α-بروتيوباكتيريا تتماشى مع المجال MtN3/اللعاب أول تسلسل الحلو، بينما سيميسويتس من ميثانوباكتيريا (العتيقات) تتماشى مع MtN3 الثاني/اللعاب المجال تسلسل الحلو. وتوحي هذه النتائج معا أن المجالين MtN3/اللعاب الذي يحتوي على حلويات قد تكون مستمدة من انصهار تطوري سيميسويت البكتيرية، وأرتشايون14.

Figure 1
الشكل 1 : حفظ تسلسل محاذاة الحلويات التوكسينات المفترضة 35 ك "35.clustal" عن طريق أوميغا كلوستال. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 2
الشكل 2 : تحديد المسار في بيوديت تقليم تسلسل محاذاة "35.clustal"، الذي تم إعداده في أوميغا كلوستال. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 3
الشكل 3 : تحديد وحذف تسلسلات متفاوتاً في الجانب الأيسر من تسلسل المجال الأولى التي MtN3/اللعاب الحلويات التوكسينات المفترضة 35 في بيوديت- الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 4
الشكل 4 : تسلسل قلصت المجال MtN3/اللعاب أول من 35 الحلويات التوكسينات المفترضة في بيوديت- الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 5
الشكل 5 : تحديد ونسخ تسلسل المجال الأولى التي MtN3/اللعاب الحلويات التوكسينات المفترضة 35 في ميجا- سيتم لصق في تسلسل تم نسخها في ملف doc للتحرير. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 6
الرقم 6 : تحويل "35 realigned.fas" إلى "35.nex" (تنسيق بوب) لاستنتاج النظرية الافتراضية في مرحلة لاحقة- الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 7
الشكل 7 : البحث عن القانون النموذجي استبدال تناسبا الضخمة لبناء شجرة النشوء والتطور احتمال الحد الأقصى (ML) يستند إلى ملف "35 realigned.fas"- الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 8
الشكل 8 : جدول نموذج استبدال تناسبا المحسوبة لشجرة مل يستند إلى ملف "35 realigned.fas"- الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 9
الرقم 9 : تحديد المعلمات لمل شجرة عملية حسابية استناداً إلى نموذج استبدال تناسبا "realigned.fas 35" في ميجا- الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 10
الرقم 10 : شجرة مل الأصلي التي شيدت قبل ميجا استناداً إلى "35 realigned.fas". في هذه المرحلة، والعديد من الخيارات لنمط الشكل، الحجم، اللون، إلخ.، وتتوفر. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 11
الرقم 11 : محاذاة الحلويات التوكسينات 228 و 57 سيميسويتس بدائية من أوميغا كلوستال. وعرضت النتائج في جالفيو، تدمج أوميغا كلوستال. في المحاذاة، سيميسويتس بعض من α-بروتيوباكتيريا تتمشى مع المجال MtN3/اللعاب أول تسلسل الحلو، بينما سيميسويتس من ميثانوباكتيريا (العتيقات) تتمشى مع المجال MtN3/اللعاب الثانية من التسلسلات الحلو. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 12
الرقم 12 : تحميل الملف "35.nex" في مرباييس في نافذة دوس. من أجل إظهار النتائج العامة، تم حذف المحتوى الذي كان مماثلاً للحد من طول الرقم. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 13
الرقم 13 : المعلومات المعروضة على الشاشة بعد حساب الملف "35.nex" باستخدام مرباييس- لإظهار النتائج العامة، تم حذف المحتوى الذي كان مماثلاً للحد من طول الرقم. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 14
الرقم 14 : موجز لعينات معلمات نموذج للملف "35.nex"- الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 15
الرقم 15 : تلخيص عينات شجرة الملف "35.nex"- لإظهار النتائج العامة، تم حذف المحتوى الذي كان مماثلاً للحد من طول الرقم. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 16
الرقم 16 : شجرة النشوء والتطور من "35.nex.con" المعروضة بواسطة التين. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Subscription Required. Please recommend JoVE to your librarian.

Discussion

تزداد شعبية في البحوث البيولوجية لجعل شجرة النشوء والتطور على أساس النوكليوتيدات أو الأحماض الأمينية تسلسل8. عموما، هناك ثلاث مراحل حاسمة من هذه الممارسة، بما في ذلك تسلسل المحاذاة، تقييم تسلسل محاذاة مع الأسلوب السليم أو خوارزمية، والتصور للنتيجة الحسابية كشجرة النشوء والتطور. وفي الدراسة المقدمة، أجريت ثلاث جولات من تسلسل المحاذاة: أولاً، محاذاة تسلسلات الحلوة البروتين، بما في ذلك المجال MtN3/اللعاب الأولى والثانية،؛ وثانيا، كل من تسلسل المجال MtN3/اللعاب الفردية من الحلويات الأصناف مستقلة جمعت والانحياز معا؛ وأخيراً، متواليات سيميسويت وتسلسل الحلو تتمشى معا. جولة واحدة فقط من محاذاة التسلسل المسبق عادة لبناء شجرة فيلوجينيك.

في المرحلة الأولى، يمكن تحميل متواليات مثلى من نكبي أو غيرها من قواعد البيانات. قد تحتاج هذه التسلسلات التي تم تنزيلها إلى فحص إذا لم يتم مشروحة جيدا. في المرحلة الأولى والثانية، يتعذر بدء المحاذاة والحساب إذا كان تنسيق التسلسل غير صحيح. على سبيل المثال، أوميغا كلوستال سوف ترفض أي خروج عن الشكل فاستا في ملف تسلسل. في هذه المرحلة الحسابية، لاحظ أن أطوال تسلسل بما في ذلك كل من الأحماض الأمينية أو النيوكليوتيدات والواصلات مطلوبة لتكون متساوية قبل أن يتم تقييمه ميجا.

وعلى الرغم من الثروة من أساليب ونماذج لبناء شجرة المتوفرة، أي منهم مضمونة. نتائج قوية ومقنعة هي تلك التي تنسجم مع بعضها البعض عندما تستخدم خوارزميات مختلفة أو نماذج لتقييم البيانات نفسه15. في أسلوب مل، موثوقية طبولوجيا شجرة يعتمد إلى حد كبير على قيمة bootstrap كل طور؛ ويعتبر عموما موثوقة بقيمة bootstrap 70 أو أكبر. في هذه الدراسة، وكل تسلسل المجال الأول MtN3/اللعاب متفاوت المسافات كطور كبير بقيمة 83 bootstrap. ومع ذلك، كان قيمة طور الأخرى التي تحتوي على كافة تسلسل MtN3/اللعاب الثانية المجال، سوى 6 (الشكل 10). للتحقق من بنية شجرة، مرباييس، الذي يعمل طريقة مختلفة تماما من مل16 ، استخدمت لتحليل العلاقة بين الأصناف. كانت الاحتمالات الخلفي16 من أطوار المجال الأول والثاني التي تم الحصول عليها من مرباييس 100 و 68، على التوالي (الشكل 16).

قيد آخر مل وحساب مرباييس أن كلاهما تستغرق وقتاً طويلاً للتشغيل. استخدام جهاز كمبيوتر متعدد المعالجات ووحدات معالجة الرسومات (GPU) مفيد لتحسين الأداء الحسابي وسرعة17،18. لتشغيل مرباييس، يمكنك تسريع جهاز كمبيوتر مع بطاقة رسومات منفصلة وبرامج التشغيل المناسبة كودا إلى حد كبير في حسابات احتمال11.

من الصعب تحديد نموذج مناسب لحساب شجرة النشوء والتطور لذوي خبرة قليلة. وفي هذا الصدد، يوفر ميجا طريقة سهلة للعثور على أفضل نموذج عن طريق مقارنة عشرات BIC نماذج المرشح. وباﻹضافة إلى ذلك، يدمج 6.0 ميجا تمت ترقيته مؤخرا عدة تسلسل أدوات المحاذاة مثل العضلات و W كلوستال10، ومريحة جداً للاستخدام. كما يوفر كل تسلسل التحرير ووظيفة بناء شجرة النشوء والتطور. هذه الميزات يفسر جزئيا لماذا هكذا شعبية هذا البرنامج في مجال التطور الجزيئي الحسابي. أما بالنسبة مرباييس، ميزة كبيرة لهذه الأداة فإنه يمكن معالجة أنواع بيانات مختلطة معا (على سبيل المثال-، البيانات الجزيئية والمورفولوجية)11، ومن ثم النتائج التي أكثر شمولاً.

وفي الختام، هذه الدراسة يوفر طريقة لتحليل أصل الجزيئية للجينات ترميز البروتين التي خضعت للاختلاف معقدة مثل الانصهار بعد الازدواجية أو نقل الجينات الأفقي (حجة) أثناء تطور. ونأمل أن سيتم الكشف عن المزيد من النتائج التي توصل إليها مع تطبيق تحليل النشوء والتطور في ميدان البحوث التطورية على نطاق واسع.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

الكتاب ليس لها علاقة بالكشف عن.

Acknowledgments

وكان يدعمها هذا العمل في مؤسسة العلوم الطبيعية الوطنية الصينية (31371596) ومركز بحوث التكنولوجيا الحيوية وجامعة الصين للخوانق الثلاثة (2016KBC04) ومؤسسة العلوم الطبيعية في مقاطعة جيانغسو، الصين (BK20151424).

Materials

Name Company Catalog Number Comments
Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group - Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4 GB memory, Core 2 or above CPU. Windows 7, Windows 10

DOWNLOAD MATERIALS LIST

References

  1. Nei, M., Kumar, S. Molecular Evolution and Phylogenetics. Oxford University Press. Oxford. (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics