Waiting
Traitement de la connexion…

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Behavior

إنشاء وتطبيق مرجع لتسهيل المناقشة وتصنيف البروتينات في مجموعة متنوعة

Published: August 16, 2017 doi: 10.3791/56107

Summary

والهدف من هذا البروتوكول هو وضع مرجع للبروتينات المختلفة في مجموعة التي تفتقر إلى معايير متسقة للتسمية والتصنيف. هذا المرجع سوف تيسر تحليل ومناقشة للمجموعة ككل ويمكن استخدامها بالإضافة إلى أسماء ثابتة.

Abstract

البروتينات ذات الصلة التي درست في مختبرات مختلفة باستخدام الكائنات المختلفة قد تفتقر إلى نظام موحد للتسمية والتصنيف، مما يجعل من الصعب مناقشة المجموعة ككل ووضع تسلسل جديد في السياق المناسب. وضع إشارة أن يعطي الأولوية لميزات تسلسل هامة تتعلق بهيكل و/أو يمكن استخدام النشاط بالإضافة إلى أسماء ثابتة لإضافة بعض الاتساق إلى مجموعة متنوعة من البروتينات. يستخدم هذا الورق سيستين استقرت فوق (CS-αβ) الحلزون ألفا عائلة كمثال لإظهار كيف مرجع الذي تم إنشاؤه في برنامج جدول بيانات يمكن توضيح العلاقات بين البروتينات الموجودة في فوق عائلة، فضلا عن تسهيل الإضافة جديدة تسلسل. ويبين أيضا كيف يمكن أن تساعد الإشارة صقل تسلسل التحالفات التي تم إنشاؤها في برامج شائعة الاستخدام، مما يؤثر في صحة تحليلات النشوء والتطور. استخدام مرجع سيكون مفيداً للغاية للبروتين المجموعات التي تتضمن متواليات متباينة جداً من مجموعة واسعة من الأصناف، مع الميزات التي لم يتم التقاطها بشكل كاف بالتحليلات الجزيئية على الأرجح.

Introduction

يجب أن تعكس اسم البروتين خصائصها وعلاقتها بغيرها من البروتينات. ولسوء الحظ، يتم تعيين أسماء عموما في وقت اكتشاف، ويستمر البحث، قد تغير فهم السياق الأوسع. وهذا يمكن أن يؤدي إلى أسماء متعددة إذا كان بروتين بشكل مستقل وحددت أكثر من مختبر، والتغييرات في التسمية أو في خصائص الفكر أن تكون نهائية عند تعيين الاسم، واسم التفريق لم يعد بما فيه الكفاية البروتين من الآخرين.

ديفينسينس اللافقاريات تقدم مثالاً جيدا للانحطاط في التسمية والتصنيف. أبلغ defensins اللافقارية أول من الحشرات، واقترح اسم "حشرة ديفينسين" استناداً إلى التماثل المتصورة للثدييات ديفينسينس1،2. ديفينسين الأجل يزال يستخدم، على الرغم من أن من الواضح الآن أن defensins اللافقاريات والثدييات لا نشاطر جد مشترك3،4. تبعاً للأنواع، قد اللافقاريات "ديفينسين" سيستينيس ستة أو ثمانية (التي تشكل ثلاثة أو أربعة سندات ثنائي كبريتيد) ومجموعة متنوعة من الأنشطة المضادة للميكروبات. إلى تعقيد الوضع، البروتينات مع نفس الخصائص كما تسمى "ديفينسينس،" ليس دائماً defensins مثل كريميسينس التي تم تحديدها مؤخرا من ريماني كاينورهابديتيس5. وباﻹضافة إلى ذلك، اللافقاريات ديفينسينس كبيرة من المرجح أن تقحم تتصل بالفقاريات β-ديفينسينس من ديفينسينس اللافقاريات الأخرى6. وبالرغم من ذلك، في بعض الأحيان الباحثين الاعتماد على الاسم "ديفينسين" عند تحديد تسلسلات التي ينبغي أن تدرج في تحليل.

كشفت دراسات الهيكلية التشابه بين ديفينسينس الحشرات و السموم العقرب7، وإضعاف CS αβ أنشئ فيما بعد كسمة مميزة الهيكلي للحشرات ديفينسينس8. إضعاف هذا يعرف العقرب مثل السمية (CS-αβ) فوق عائلة في تصنيف البروتينات الهيكلية (SCOP) قاعدة بيانات9، التي تضم حاليا الأسر الخمس: defensins الحشرات والسموم العقرب سلسلة قصيرة والسموم العقرب سلسلة طويلة، 1 مليون جالون يوميا (من الرخوي)، ومصنع ديفينسينس. هذا فوق عائلة مرادف لوصف مؤخرا رابطة الدول المستقلة-ديفينسينس4 وفوق عائلة 3.30.30.10 في10،11قاعدة بيانات ثلاثية الأبعاد قسطرة/الجينات. دراسات من مجموعة متنوعة من الأنواع اللافقارية والنباتات والفطريات وتظهر أن أسماء البروتينات التي تحتوي على إضعاف هذا لا وضوح تتصل بعدد سيستين أو نمط الترابط، ونشاط مضادات الميكروبات، أو التاريخ التطوري12.

الافتقار إلى الاتساق ومعايير واضحة تجعل من التحدي لتسمية وتصنيف تسلسل المحددة حديثا في هذا فوق عائلة. يشكل عقبة رئيسية أمام مقارنة البروتينات في هذا فوق عائلة هو أن يتم ترقيم سيستينيس فيما يتعلق بكل فردية التسلسل (سيستين الأولى في كل تسلسل C1)، مع عدم وجود طريقة لحساب الدور الهيكلي. وهذا يعني أنه يمكن مقارنة تسلسل فقط مع نفس العدد من سيستينيس. وهناك القليل حفظ تسلسل خلاف سيستينيس تشكيل إضعاف CS αβ، مما يجعل من الصعب التحالفات وتحليلات النشوء والتطور. بوضع نظام ترقيم الذي يعطي الأولوية للسمات الهيكلية، يمكن بسهولة أكثر مقارنة تسلسل فوق عائلة والانحياز. ميزات مصانة، فضلا عن تلك التي تحدد فئات فرعية، يمكن تصور بسرعة، وتسلسل جديد يمكن وضعها بسهولة أكبر في السياق المناسب.

تستخدم هذه الورقة برنامج جدول بيانات (مثل Excel) لتوليد إشارة ترقيم نظام لفوق عائلة CS αβ. ويبين كيف هذا يوضح المقارنات بين متواليات ويطبق على تسلسلات CS-αβ الجديدة المحددة من تارديجراديس. استخدام فوق عائلة αβ CS--على سبيل مثال، كتب في البروتوكول لتوفير التوجيه عند استخدام تسلسل اهتمام؛ ومع ذلك، فليس المقصود على وجه التحديد هذا فوق عائلة أو تسلسلات سيستين الغنية. هذا الأسلوب سيكون على الأرجح الأكثر فائدة لمجموعات من البروتينات التي قد تم بحثها بشكل مستقل في الأنواع المختلفة و/أو لديها القليل من عموما تسلسل التماثل، مع خصائص منفصلة قد لا يسهل التعرف عليه بواسطة برنامج التحليل الجزيئي. يتطلب هذا الأسلوب بعض القرارات مسبقاً فيما يتعلق بالميزات الهامة، حيث أنها ستكون ذات فائدة محدودة إذا تم تحديد لا من السمات الهامة. والهدف الأساسي لإظهار كيف يمكن أن يتحقق تصور بسيط لعلاقات التسلسل. يمكن ثم استخدام هذا لإعلام تسلسل المحاذاة وتحليل، ولكن إذا كانت المحاذاة وتحليل الأهداف الأولية، طريقة باركود سيكون بديل مناسب له قدرة أكبر لأتمتة13. الطريقة الحالية لعرض ميزات كل الببتيد في شكل خطي، حيث أنها لن تكون مفيدة للتصور مباشرة من بنية ثلاثية الأبعاد.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1-تحديد "ملامح تعريف" مجموعة البروتين الفائدة

  1. راجع المنشورات السابقة لتحديد ما إذا كان هناك توافق في آراء فيما يتعلق بالميزات التي تعتبر ضرورية لأن تعتبر جزءا من المجموعة. يحيط علما بأي تناقضات أو اختلافات في الرأي بين المجموعات البحثية، وتشمل الخصائص التي قد تستخدم للتمييز بين مجموعة فرعية واحدة من آخر-
  2. إذا كان لا يتناول المؤلفات السابقة المميزة، استخدام تسلسلات التي تعتبر ممثل المجموعة كنقطة انطلاق لتحديد ميزات المصانة.

2. جمع "متواليات ذات الصلة"

  1. إذا كان قد تم كتابة الاستعراضات التي تتضمن تحليلات لمتواليات التي تمثل المجموعة، وتشمل هذه التسلسلات في مجموعة البيانات الخام. استرداد تسلسل استخدام أرقام الانضمام المشار إليها في الأدب وحفظ في تسلسل قياسية برنامج تحرير (مثلاً، اديتسيق في جناح لاسيرجيني أو واحد من كثير متاح لمجانية على الإنترنت)-
  2. إذا تم تعريف المجموعة المعنية في إحدى قواعد البيانات الهيكلية، تشمل تسلسل قاعدة بيانات قوائم تسلسل استرداد باستخدام أرقام الانضمام المنصوص عليها في قاعدة البيانات كجزء من المجموعة. وحفظ في تسلسل القياسية التحرير البرنامج، كما هو وارد أعلاه.
    ملاحظة: على سبيل المثال، تسلسل التي تصنف في فوق عائلة CS-αβ (العقرب مثل السمية) في قاعدة بيانات الشركة العامة ويمكن الاطلاع على هنا: http://scop.mrc-lmb.cam.ac.uk/scop/data/scop.b.h.c.h.html-
  3. "أداء الأساسية المحلية" محاذاة أداة البحث (الانفجار) 14 عمليات البحث في قواعد البيانات العامة، وعلى شبكة الإنترنت متاحة من خلال المركز الوطني لمعلومات التكنولوجيا الحيوية (نكبي) للعثور على تسلسلات التي ربما لم تدرج في الأدب أو الهيكلية قواعد البيانات. لمعظم استكمال النتائج واستخدام كلا البروتين الانفجار (بلاستب) وترجمة الانفجار مع البروتين البرامج الاستعلام (تبلاستن)؛ هذه، وكلاهما متاح في: https://blast.ncbi.nlm.nih.gov/Blast.cgi-
    1. تسلسل الاستخدام المعروفة لتكون جزءا من المجموعة الفوائد كسلاسل الاستعلام. نسخ ولصق بالتسلسل في مربع البحث في الجزء العلوي، أو توفير بنك الجينات انضمام عدد أو غي معرفاً، إذا كانت متوفرة.
    2. اختر قاعدة البيانات من القائمة المنسدلة. اختر تسلسل البروتين غير زائدة (nr) بلاستب، وأعرب عن تسلسل العلامات تبلاستن.
    3. البحث عن النتائج في الأصناف المحددة في الكائن الحي الإعداد بواسطة كتابة اسم الصنف أو الكائن الحي، واختيار من القائمة التي تظهر أثناء الكتابة. لإضافة الأصناف استبعاد أو الكائنات الإضافية، انقر فوق " + " سوف يظهر زر وحقل آخر. استبعاد أي الأصناف غير المرغوب فيها في مربع الكائن بكتابة اسم الكائن أو أصنوفة، اختيار من القائمة التي تظهر أثناء الكتابة، والتدقيق " استبعاد " المربع اليمين.
    4. الوصول إلى معلمات إضافية بالنقر فوق " معلمات خوارزمية " بالقرب من الجزء السفلي من الصفحة. ترك في الافتراضي ما لم يكن هناك مبرر لتغيير معلمة.
    5. فوق " انفجار " الزر لتشغيل التحليل؛ وقد يستغرق الأمر بعض الوقت لأن تظهر النتائج. وبصفة عامة، استرداد يضرب بقيمة نتوقع (أو قيمة ه) من "-05 " أو أفضل وحفظ في تسلسل قياسية برنامج تحرير.
      1. إذا كان يضرب كل هذه العتبة، أعد تشغيل البحث مع عدد متزايد من التسلسلات مستهدفة (في المقطع معلمات خوارزمية) للحصول على كافة تسلسل ذات الصلة-
  4. إذا لزم الأمر، تقليم في تسلسل لاستبعاد المعلومات غير ذات صلة (مثل حظيرة CS αβ لا ينطبق إلا على الببتيد ناضجة). تحديد إشارة الببتيدات وبرو-الببتيدات لإزالة استخدام الدعامة 15 (متاح على شبكة الإنترنت)، أو سيجنالب ل التنبؤ الببتيد إشارة أكثر تطورا 16 (المتاحة على الإنترنت).

3. توليد إشارة في على "جدول البيانات تستند" أهمية الميزات أن حددت

  1. تحديد الخصائص المميزة للمجموعة الفوائد. على سبيل المثال، استخدام حظيرة CS αβ المنشأة نهائياً ببنية الحل للحشرات ديفينسين أ من ترانوفا فورميا ( الشكل 1) 8-
    1. إضعاف هذا يتضمن فكرة أصغر يسمى الحلزون استقرت سيستين (CSH) 17؛ وتحديد هذا الحافز ككسكسسك (حيث X أي حمض أميني) المنبع للامتحانات التي تشكل هما ثنائي كبريتيد السندات ( الرقم 1 الصلبة الوردي خطوط)-
      ملاحظة: لإكمال عزر CS αβ، تتشكل سند ثنائي كبريتيد ثالثة من سيستينيس إضافية توضع قبل كل نصف من عزر CSH ( الشكل 1، منقط خطوط الوردي)-
  2. بإدخال هذه تحديد الميزات في جدول بيانات. انظر الشكل 2-
    1. استخدام الأعمدة للميزات المصانة وتمثل المسافات بين هذه الميزات. تبقى الأعمدة عريضاً بما يكفي احتواء الأرقام والتأكد من إمكانية عرض متسقة. تعيين استخدام العرض " تنسيق | عرض العمود " الدالة ( الشكل 2، السهم الوردي)-
    2. استخدام الصفوف لتسلسل أسماء-
    3. عند تسلسل يحتوي على ميزة، ملء المربع باستخدام الدالة تعبئة ( الشكل 2، ساحة الوردي). تباعد بين الميزات، قم بإدخال عدد الأحماض الأمينية في المربع الموجود بين وتركها شاغرة. على سبيل المثال، استخدام الحشرة ديفينسين تسلسل يعطي مرجع يحتوي على ستة سيستينيس، مع تعريف المباعدة بين C2 و C3 وبين C5 و C6-
  3. إضافة تسلسلات التمثيلية التي تم إنشاؤها مسبقاً كأعضاء في الفريق على أساس قواعد البيانات الهيكلية والأدب.
    ملاحظة: على سبيل المثال، المؤلفات السابقة وقاعدة بيانات "سكوب" تحديد مجموعات عدة لإدراج: defensins الحشرات والسموم العقرب سلسلة قصيرة والسموم العقرب سلسلة طويلة، 1 مليون جالون يوميا، ومصنع defensins، ديدان أسطوانية أبفس، دروسوميسينس من المورفولوجية، و ماسينس. كما يحدد الأدب تسلسل بكتيرية مع أربعة فقط سيستينيس التي قد تمثل الجد من هذا فوق عائلة 18. إضافة هذه التسلسلات يزيد من عدد سيستينيس في المرجع من ستة إلى عشرة ولكن يحافظ على المواءمة بين السمات الهيكلية الهامة ( الشكل 3).
    1. لإضافة ميزة التي من المرجح أن تحدد فئة فرعية تسلسل (على سبيل المثال، سيستين إضافي)، استخدم " إدراج " الدالة ( الشكل 3، السهم الوردي)-
    2. إذا كان هناك ميزات مفقودة من تسلسل معين، اترك المربع شاغرة ودمجها مع صناديق تمثل الأحماض الأمينية الفاصلة. إذا لزم الأمر، قم بدمج الخلايا باستخدام ميزة دمج وتوسيط ( الشكل 3، المربع الوردي)-
  4. متابعة إضافة تسلسلات للمجموعات للحصول على صورة أفضل للتباين في كل مجموعة من فوق عائلة أكبر. تلخيص خصائص المجموعة تيسير إجراء المقارنات ( الشكل 4).
    1. عندما يختلف عدد الأحماض الأمينية بين السمات الرئيسية، استخدم واصلة للإشارة إلى مجموعة، مثل 6-12 (الأحماض الأمينية 6 إلى 12)، وخط مائل للإشارة إلى أما/أو، مثل 7/10 (7 أو 10 من الأحماض الأمينية).
    2. اختر طريقة لإضافة تعليق توضيحي ميزات تسلسلات التي قد تكون ذات صلة ولكن لم يحدث ما يكفي في كثير من الأحيان لتشمل في المرجع. على سبيل المثال، وحيث الهامة في هذا فوق عائلة سيستينيس، تسمية إضافية سيستينيس ( الشكل 4 خانات الوردي)-
  5. إضافة نولص-وحدد تسلسل إلى جدول البيانات باستخدام تسلسل المنشأة كدليل. على سبيل المثال، إضافة تسلسلات من تارديجراديس (أصفر) يبين أن تسلسل tardigrade تنقسم إلى عدة مجموعات مختلفة من فوق عائلة (يبين الشكل 5 ملخصات بدلاً من صف كل تسلسل لأغراض الفضاء)-
  6. إظهار التباين داخل مجموعة تصنيفية بإعادة ترتيب الصفوف ( الشكل 6).

4. استخدم الإشارة إلى "صقل التحالفات من الأحماض الأمينية"

ملاحظة: هناك العديد من البرامج التي يمكن استخدامها للتحالفات تسلسل متعددة، ولكن هذه المظاهرة سوف تستخدم "التحليل علم الوراثة الجزيئي التطورية" (MEGA6) 19 لأنها متوفرة للتحميل مجاناً-

  1. تحميل وتثبيت البرنامج-
  2. تبدأ محاذاة جديدة في ميجا عن طريق تحديد " "محاذاة" تحرير/إنشاء " تحت علامة التبويب محاذاة تحديد " إنشاء محاذاة جديدة " في المربع الذي يظهر، وانقر فوق " موافق. " ثم حدد " البروتين. "
  3. تحديد " "إدراج تسلسل" من الملف " في " تحرير " القائمة استيراد التسلسل.
    ملاحظة: سوف تحتاج إلى تسلسل في تنسيق فاستا لاستيراد الضخمة. وتستخدم ألوان الخلفية التي تعبر عن أنواع مختلفة من الأحماض الأمينية بشكل افتراضي، ولكن يمكنك إيقاف تشغيل هذا الخيار تحت " عرض " القائمة.
  4. حالما يتم إدخال كافة تسلسل، انقر فوق رمز الذراع فليكسينج ومن ثم " "البروتين محاذاة" " محاذاة تسلسلات استخدام خوارزمية العضلات 20.
    ملاحظة: كلوستالو أيضا متاح.
    1. في حالة ظهور رسالة تفيد بأن لا شيء كان الملوثات العضوية الثابتة المحددة حتى ويسألك لتحديد الكل، انقر فوق " موافق. "
    2. ملاحظة: وهذا يفتح نافذة أن يسمح أحد لتغيير بعض المعلمات، ولكن يجب تغيير هم فقط هناك سبب للقيام بذلك. يستخدم هذا التحليل مجموعة فرعية من تسلسل التي تم تحليلها في ورقة سابقة 12-
  5. الاختيار المحاذاة استناداً إلى الميزات الهامة؛ وحفظت علما بأن الشريط العلوي فوق التسلسل سوف تظهر أية أعمدة حيث الأحماض الأمينية تماما (*). انظر رقم 7. نرى أن المحاذاة الأولى يظهر ثلاثة فقط من سيستينيس حفظت الأربعة ( الشكل 7، مربعات الوردي)؛ ابحث أسفل العمود، تسلسل الكرب هو وضوح المنحرفة ( الشكل 7، السهم الوردي)-
  6. للتخلص من الفجوة الكبيرة بين الأول وجيم مصانة، تبرز شرطات والصحافة " حذف " المفتاح. لم تبرز أي الأحماض الأمينية، أو أنها سوف تحذف كذلك.
  7. لنقل الأحماض الأمينية إلى اليمين، وإبراز واضغط على شريط الفضاء
    1. علما بأن الكرب أصبح سيستينيس الهيكلية الانحياز وأن ج الأخير لفكرة ككسكسسك هو المحافظة في جميع أنحاء المحاذاة ( الشكل 8). ضبط المحاذاة عند الضرورة لتحديد أولويات الميزات الأكثر أهمية من التسلسلات.

5. مقارنة "الفئات المحددة استخدام" المرجع مع النتائج من "تحليلات النشوء والتطور"

  1. من التحالفات الأولية، تحديد تسلسلات التي ينبغي أن تدرج في تحليل النشوء والتطور؛ لعدد صغير من تسلسل، وهذه الخطوة قد تكون غير ضرورية.
    1. إبقاء ملف محاذاة تتضمن كافة تسلسل، ولكن تحليل النشوء والتطور، إزالة تسلسلات مكررة ( الشكل 9، وردي مربعات تظهر أزواج من تسلسلات مكررة).
    2. إذا كانت مجموعة البيانات يتضمن عدد كبير من تسلسلات، تشغيل تحليل أولى وتحديد ممثلين من مجموعات تشكل دائماً طور-
  2. تحديد أفضل نموذج استبدال الحمض الأميني.
    1. التصدير المحاذاة في تنسيق ميجا (ضمن علامة التبويب بيانات)-
    2. اذهب إلى قائمة نماذج وحدد " نموذج البحث عن أفضل الحمض النووي/البروتين. " اختر ملف مجرد حفظها وفتحها؛ وسيؤدي هذا إلى فتح إطار يحتوي على بعض المعلمات التي يمكن تغييرها.
    3. استخدام المعلمات الافتراضية إلا إذا كان هناك سبب لتغييرها. انقر فوق " حساب " لبدء التحليل.
  3. تشغيل تحليل الحد أقصى لاحتمال (ML) في ميجا-
    1. اختر " بناء/اختبار "أقصى احتمال شجرة" " من قائمة ونساله.
    2. اختر النموذج مصمم على أن الاحتواء الأفضل للبيانات من الخطوة 5، 2 (الإخراج سيتم إعطاء نموذج استبدال فضلا عن الأفضل " معدلات بين المواقع " المعلمة).
    3. Bootstrap 1,000 اختيار وإنشاء نسخ متماثلة للحصول على تدابير الدعم للشجرة-
    4. انقر فوق " حساب " لتشغيل التحليل؛ الضخمة وقد " Explorer شجرة " لتصور الشجرة.
  4. تشغيل تحليل بايزي في برمجيات المصدر المفتوح مرباييس 21-
    ملاحظة: دليل مرباييس يتوفر أيضا من هذا الموقع. وهذا يهدف إلى توفير الخطوات الأساسية وليس دليل شامل لإجراء تحليل بايزي النشوء والتطور.
    1. التصدير المحاذاة الضخمة في شكل بوب (الرابطة) في نفس المجلد مثل برنامج مرباييس-
    2. "مرباييس مفتوحة" ونوع " exe اسم الملف " (مثلاً، " إكس Alignment.nex ")-
    3. تحديد معلمات النموذج والتحليل. اختر أما النموذج المحدد في الخطوة 5، 2 أو اختر " المختلطة " الإعداد الذي سيحاول نماذج مختلفة وتقرير تواتر هذا النموذج في الأشجار مع أفضل الاحتمالات الخلفي (آموديلبر برسيت = مختلطة). نوع " شووموديل " تقرير الإعدادات النموذجية الحالية و " مساعدة mcmc " لعرض الإعدادات الحالية للمعلمة، مع شرح مختصر لكل.
    4. تعيين عدد الأجيال التي تستخدم " ngen مكمكب = " الأمر (1 مليون نموذجي).
    5. نوع " mcmc " لبدء التحليل.
    6. عند اكتمال عدد الأجيال، سيطلب البرنامج لإضافة مزيد من الأجيال. إذا كان متوسط الانحراف المعياري لتقسيم ترددات أقل من 0.1، اكتب لا. إذا كان أعلاه 0.1 أو التحليل الذي ينبغي أن يسمح لمواصلة أو يجب تغيير بعض المعلمات (انظر الدليل).
    7. استخدام " سومة " الأمر لإنشاء الملفات شجرة-
    8. بعد اكتمال التحليل، ويتم إنشاء شجرة إلى توافق في آراء، يمكن عرض الشجرة في التين (متاح على شبكة الإنترنت)-
  5. مقارنة الأشجار لنرى إذا كان بأساليب توليد نتائج متسقة.
    ملاحظة: بعض متواليات لا تقدم كثير من المعلومات: الأشجار قد لا يكون حل جيد والفروع قد يكون الحد الأدنى من الدعم ( الشكل 10).
  6. المقارنة بين الأشجار للفئات التي عرفت باستخدام المرجع لمعرفة إذا كانت تحليلات النشوء والتطور دعم هذه الجماعات-

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

يتم عرض مجموعات من تسلسل في فوق عائلة CS αβ ذكرت في الأدبيات في الشكل 4. وتوحي الازدواجات سيستين تستند إلى الترقيم لكل تسلسل المجموعات الخمس الأساسية (الجدول 1، العمود الأوسط). وقد المجموعة 1 سيستينيس الستة التي من ثنائي كبريتيد ثلاثة سندات ويشمل تسلسل من الحشرات والعناكب والرخويات، والديدان الخيطية والفطريات. لدى المجموعات 2 و 3 و 4 سيستينيس 8 التي تشكل أربعة ثنائي كبريتيد السندات. وتشمل المجموعة 2 عنكبوتى، والحشرات، وتسلسل النبات؛ وتشمل المجموعة 3 عنكب والرخوي وتسلسلات السلكية؛ وتضم المجموعة 4 متواليات من اللاسعات، أننيليدس، والرخويات، والفطريات. وتضم المجموعة 5 ماسينس سيستئين 10. بعض متواليات لا تتناسب تماما مع هذه الأنماط ولكن عموما أقرب إلى مجموعة واحدة من الآخرين.

المجموعات 1 و 2 ويبدو أن حصة السندات هما: C2-C5 و C6-C3؛ ومع ذلك، بداية ترقيم كل تسلسل مع به سيستين الأولى لا تعترف الإطار الهيكلي للسندات. C2-C5 في المجموعة 1 تسلسل أشكال أحدهما سندات في عزر CSH، بينما C2-C5 في تسلسل المجموعة 2 أشكال السندات النهائية اللازمة لتحقيق الاستقرار في حظيرة CS αβ. هو السند مثلى للمجموعة 1 C2-C5 C3 Group2-C6، التي ليس من الواضح من الترقيم. كما ليس من الواضح أن السندات C2-C6 في المجموعة 3، يلعب نفس الدور الهيكلي.

استخدام تسلسلات من الأدب إنشاء مرجع مع مجموعة من عشرة سيستينيس. عزر CSH يتكون من سندات C3 C8 و C4-C9، مع C2-C6 إنجاز حظيرة CS αβ. إعادة ترقيم أزواج سيستين استناداً إلى الأرقام المرجعية يوضح الروابط موجودة في كل تسلسل (الجدول 1، العمود الأيمن). من الواضح الآن أن جميع التسلسلات C2-C6 و C3-C8 C4-C9، مما يعكس إضعاف الهيكلية التي تعرف فوق عائلة. يسمح استخدام مرجع للمقارنة سهلة بين تسلسلات التي لها التسمية لا تتفق ومعايير تصنيف غامضة. يمكن أيضا أن يساعد على تحديد الميزات التي تقوم بتعريف مجموعة فرعية تسلسل. على سبيل المثال، قد تميز بوند C1 C7 ماسينس من أعضاء فوق عائلة أخرى، يجعلها مناسبة لتصنيف تسلسل مع هذه السندات ك "ماسينس" بدلاً من "ديفينسينس" (الجدول 1 و الشكل 4).

وكشف البحث في قواعد البيانات على شبكة الإنترنت العامة أمثال متواليات ستة عشر من تارديجراديس التي لديها وضوح CS-αβ، ثمانية من كل من دوجارديني هيبسيبيوس و تارديجرادوم ميلنيسيوم. أربعة من تسلسلات جديدة قد سيستينيس ستة وتسعة على ثمان، واحد لديه تسعة واثنين بعشرة. وهذا يعطي معلومات ضئيلة جداً، ولكن بمحاذاة التسلسلات للإشارة، يصبح من الواضح أن تسلسل تارديجرادي مع نفس العدد من سيستينيس لا تملك دائماً سيستينيس هيكلياً هاما في نفس المكان ضمن التسلسل ( 5 الرقم و الرقم 6). المحاذاة مع الإشارة يسمح أيضا للاستدلال من الترابط وأنماط (الجدول 2، الاستدلال على أنماط الترابط بين قوسين). ومن الواضح بعض التسلسلات tardigrade تناسب أنماط 1-4. البعض الآخر معظم مماثلة للجد البكتيرية المقترحة أو العقرب Cl-السمية أو عائلة من الفطريات مثل ديفينسين الببتيدات. قد يكون نمط 2 فريقين فرعيين، واحد يمثلها العقرب Na + السموم، دروسوميسين، ومصنع ديفينسينس، والأخرى بالعقرب Cl-السموم. يلزم المزيد من العمل تحقق وظيفة البروتينات تارديجرادي لتحديد إذا كان ينبغي أن يعتبر بعض السموم بدلاً من ديفينسينس.

كثيرا ما تستخدم تحليلات النشوء والتطور لدراسة كيفية قد تطورت مجموعة من البروتينات. التسلسل في فوق عائلة CS αβ قصيرة عموما ومتباينة جداً؛ غالباً ما تكون سيئة تحل الأشجار الناتجة عن ذلك وتقديم القليل من التبصر. كانت الأشجار مل والنظرية الافتراضية لمجموعة فرعية تسلسل تحليل هنا سيئة حلها، مع انخفاض الدعم للعديد من أطوار (الشكل 10، التكميلية الملفات 1-4). أنها ممارسة شائعة لإظهار مستويات bootstrap أكثر من 70 (أو الاحتمالات الخلفي على 0.7) فقط، ولكن الرقم 10 يحتفظ بجميع الأرقام لإظهار مستويات منخفضة عموما لدعم. تم دعم المجموعات الخمس أعلاه 70/0.7 في واحد على الأقل من الأشجار هما: (أ) ج 6 والسم عقرب ج 8؛ (ب) ماسينس؛ (ج) القراد والعقرب ديفينسينس؛ (د) النبات ديفينسينس؛ و defensins (ه) ج 6 من الحشرات والعناكب والرخويات. في الشجرة، ومل ه طور يشمل أيضا السم ج 8 و 8 ج ديفينسين تارديجرادي، ولكن الدعم كان منخفضا جداً (الشكل 10A). بشكل عام، هذه تعكس الفئات المحددة باستخدام الترقيم سيستين مرجع ولكن تبين أيضا أن تسلسل أرقام سيستين مختلفة داخل مجموعة تصنيفية كبيرة قد تكون ذات صلة أوثق من تسلسل مع نفس النمط من مجموعات مختلفة. حين سوى عدد صغير من تسلسلات استخدمت في هذه الدراسة، إجراء تحليل أوسع لتسلسل 250 لا يلغي عدم وجود قرار (تكميلية الملفات 5-8)12. قد توفر محاذاة جدول مرجع التصور أسهل من أوجه التشابه مع صلة هيكلية أو وظيفية بالمقارنة مع أشجار النشوء والتطور.

Figure 1
رقم 1: تحديد تسلسل والسمات الهيكلية لفوق عائلة CS-αβ. الأحماض الأمينية وهيكل ثلاثي الأبعاد تم تلوينها: حلقة (أزرق) وألفا-اللولب (الأخضر)، وبيتا-أوراق (الذهب) وثنائي كبريتيد السندات (الوردي). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 2
رقم 2: الأولية ستة-سيستين مرجع استناداً إلى التسلسل من الحشرات ديفينسين. تشير الأعمدة إلى سيستينيس مصانة (C1-C6)، عزر CSH، حفظت العدد الأمينية الأحماض بين سيستينيس. مربعات شغلها تشير إلى أن التسلسل سيستين معين والأرقام تشير إلى الأحماض الأمينية بين سيستينيس. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

الصفحة er.within = "1" >Figure 3
الشكل 3: المكرر مرجع 10-سيستين استناداً إلى تسلسل الممثلة للمجموعات من فوق عائلة CS αβ. تشير الأعمدة سيستينيس المصانة والأحماض الأمينية فيما بينهما. تتم تسمية سيستينيس المساهمة في عزر CSH (C3، C4، C8، و C9) وإلى حظيرة CS αβ (C2 و C6). تسلسلات مرمزة بالمجموعة التصنيفية: أراتشنيدا (برتقالي فاتح) والبكتيريا (أسود) ولاسعات (رمادي)، هيكسابودا (برتقالي)، رخويات (أزرق)، الوحدات (أرجواني) والاخمصيه (أخضر). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 4
الشكل 4 : ملخص لتسلسل فوق عائلة CS αβ تتماشى مع الإشارة بخصائص المجموعة. تشير الأعمدة سيستينيس المصانة والأحماض الأمينية فيما بينهما. تتم تسمية سيستينيس المساهمة في عزر CSH (C3، C4، C8، و C9) وإلى حظيرة CS αβ (C2 و C6). تسلسلات مرمزة بالمجموعة التصنيفية: أما في النصف الجنوبي (أحمر داكن)، أراتشنيدا (برتقالي فاتح) والبكتيريا (أسود)، لاسعات (رمادي)، الفطريات (الضوء الأخضر)، Hexapoda (برتقالي)، رخويات (أزرق)، الوحدات (أرجواني) والاخمصيه (الأخضر). وتشير أرقام مفصولة بواسطة واصلة إلى مجموعة من الأحماض الأمينية الفاصلة؛ وتمثل أرقام مفصولة بخط مائل أما/أو. يشير "C" سيستين إضافية التي لا تحدث بتواتر ما يكفي لتبرير، بالإضافة إلى الإشارة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 5
الشكل 5 : إضافة تسلسلات Tardigrade CS αβ للمحاذاة فوق عائلة مع الإشارة بخصائص المجموعة. تشير الأعمدة سيستينيس المصانة والأحماض الأمينية فيما بينهما. تتم تسمية سيستينيس المساهمة في عزر CSH (C3، C4، C8، و C9) وإلى حظيرة CS αβ (C2 و C6). تسلسلات مرمزة بالمجموعة التصنيفية: أما في النصف الجنوبي (أحمر داكن)، أراتشنيدا (برتقالي فاتح) والبكتيريا (أسود)، لاسعات (رمادي)، الفطريات (الضوء الأخضر)، Hexapoda (برتقالي)، رخويات (أزرق)، الوحدات (الأرجواني)، الاخمصية (الأخضر) وتارديجرادا (أصفر). وتشير أرقام مفصولة بواسطة واصلة إلى مجموعة من الأحماض الأمينية الفاصلة؛ وتمثل أرقام مفصولة بخط مائل أما/أو. يشير "C" سيستين إضافية التي لا تحدث بتواتر ما يكفي لتبرير، بالإضافة إلى الإشارة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 6
رقم 6: إضافة تسلسلات Tardigrade CS αβ للمحاذاة فوق عائلة مع مرجع من قبل المجموعة التصنيفية. تشير الأعمدة سيستينيس المصانة والأحماض الأمينية فيما بينهما. تتم تسمية سيستينيس المساهمة في عزر CSH (C3، C4، C8، و C9) وإلى حظيرة CS αβ (C2 و C6). تسلسلات مرمزة بالمجموعة التصنيفية: أما في النصف الجنوبي (أحمر داكن)، أراتشنيدا (برتقالي فاتح) والبكتيريا (أسود)، لاسعات (رمادي)، الفطريات (الضوء الأخضر)، Hexapoda (برتقالي)، رخويات (أزرق)، الوحدات (الأرجواني)، الاخمصية (الأخضر) وتارديجرادا (أصفر). وتشير أرقام مفصولة بواسطة واصلة إلى مجموعة من الأحماض الأمينية الفاصلة؛ وتمثل أرقام مفصولة بخط مائل أما/أو. يشير "C" سيستين إضافية التي لا تحدث بتواتر ما يكفي لتبرير، بالإضافة إلى الإشارة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 7
7 الرقم: استخدام تسلسل المنحرفة الآلي المحاذاة. الأحماض الأمينية في تسلسل جميع المشار إليها بواسطة * في الصف الموجود أعلى التسلسل الأول (المبينة في مربعات الوردي). الكرب المنحرفة. الفجوة يحتاج إلى إزالة لمحاذاة بشكل صحيح في ج (السهم الوردي). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 8
8 الرقم: الصقل اليدوي للمحاذاة يحافظ على السمات الهامة هيكلياً للتسلسل- تتم الآن محاذاة الكرب بشكل صحيح (السهم الوردي)، وعزر ككسكسسك هو يحافظ تماما لمتواليات (مربعات الوردي). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 9
الرقم 9 : تسلسلات مكررة في محاذاة. إذا كان هناك زوج من سلاسل متطابقة تقريبا (مربعات الوردي)، واحد يمكن إزالتها، حيث يرجح أن هذه المجموعة معا في دائماً وتساهم قليلاً إلى الطبولوجيا العامة من الشجرة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 10
الرقم 10 : مقارنة بين الأشجار التي تم إنشاؤها من تحليلات النشوء والارتقاء. (أ) الحد الأقصى يتطابق تحليل احتمال في ميجا، مع 1000 bootstrap استخدام المهرج + G + أنا النموذجي. (ب) تحليل بايزي مع الأجيال 1,000,000 باستخدام الإعداد النموذجي مختلطة. وتظهر أطوار معتمدة في 70/0.7 في خطوط الوردي الصلبة؛ وتبين الخطوط المتقطعة الوردي أطوار معتمدة في 70/0.7 في شجرة أخرى. (أ) ج 6 والسم عقرب ج 8؛ (ب) ماسينس؛ (ج) القراد والعقرب ديفينسينس؛ (د) النبات ديفينسينس؛ و defensins (ه) ج 6 من الحشرات والعناكب والرخويات. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Table 1
الجدول 1: المجموعات داخل فوق عائلة CS αβ استناداً إلى أنماط الاقتران سيستين. تظهر الأنماط الأساسية الخمس لتشكيل السندات باستخدام الأرقام الداخلية (العمود الأوسط) أو الأرقام المرجعية (العمود الأيمن). العقرب Cl-السموم، أسابف 6Cys-ألفا، ومجموعة من الببتيدات الفطرية توضع مع نمط هذا mتطابقاً مع معاهدة الفضاء الخارجي. سيستين غير المدرجة في المرجع هو المؤشرة مرتفع سيستينيس قبل/بعد (مثلاً، ج3/4 ما بين C3 و C4).

Table 2
الجدول 2: إضافة Tardigrade CS αβ تسلسل إلى نمط مجموعات الأقران سيستين. ديفينسينس تارديجرادي وماسينس (غامق) توضع في المجموعات المحددة سابقا حيثما كان ذلك ممكناً. قد تظهر بعض تسلسلات tardigrade نمط المجموعة على حدة. سيستين غير المدرجة في المرجع هو المؤشرة مرتفع سيستينيس قبل/بعد (مثلاً، ج3/4 ما بين C3 و C4). التدوين "ج 21" يشير إلى هناك سيستينيس هما المنبع لمرجع C1.

التكميلية الملف 1 (S1): محاذاة Dataset هذه في ميجا- اضغط هنا لتحميل هذا الملف.

ملف تكميلية 2 (S2): شجرة كحد أقصى-احتمال ميجا ملف dataset هذه. اضغط هنا لتحميل هذا الملف.

الملف التكميلي 3 (S3): المواءمة بين هذه البيانات في شكل العلاقة بين مرباييس- اضغط هنا لتحميل هذا الملف.

الملف التكميلي 4 (S4): توافق الملف من تحليل هذه البيانات مرباييس- اضغط هنا لتحميل هذا الملف.

الملف التكميلي 5 (S5): محاذاة تسلسلات CS αβ 250 في ميجا- اضغط هنا لتحميل هذا الملف.

التكميلية الملف 6 (S6): "الحد الأقصى لاحتمال" شجرة تسلسلات CS αβ 250. اضغط هنا لتحميل هذا الملف.

الملف التكميلي 7 (S7): محاذاة 250 تسلسل CS αβ في العلاقة بين تنسيق لمرباييس- اضغط هنا لتحميل هذا الملف.

الملف التكميلي 8 (S8): توافق الملف من تحليل مرباييس 250 CS αβ تسلسلات. اضغط هنا لتحميل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

ينبغي أن تكون المعايير المتعلقة بتسمية بروتين ضمن مجموعة واضحة، ولكن هذا ليس هو الحال دائماً. وقد درست تسلسلات التي لديها خدمات العملاء-αβ أمثال في مختبرات عديدة باستخدام مجموعة متنوعة من الكائنات الحية، وأسفر عن أنظمة مختلفة من التسميات، فضلا عن اختلاف مستويات توصيف. محاولة فرض إلى مصطلحات جديدة تماما ليس من المعقول، وسوف ينتج قدرا كبيرا من الارتباك عند استشارة المؤلفات السابقة. يمكن استخدام إشارة نظام الترقيم بالإضافة إلى اسم البروتين لتوضيح خصائصه بالنسبة فوق عائلة.

مجموعات من البروتينات مع معايير واضحة للتسمية والتصنيف من المرجح عدم الاستفادة من توليد إشارة في جدول بيانات، على الرغم من أنه قد يكون من المفيد لتلخيص عدد كبير من تسلسلات وتصور الخصائص الهامة. تسلسل التحالفات والشعارات هي مفيدة للتحقيق مستوى المحافظة في كل موقع، ولكن لا الأولوية بنشاط تسلسل ميزات هامة لهيكل أو دالة. المثال CS αβ يركز على الهيكل، ولكن يمكن أيضا إدراج محددة من الأحماض الأمينية التي تشكل موقع ملزمة كميزة حاسمة. كما يتم تحديد تسلسل الميزات التي تمنح أنشطة مضادات الميكروبات/سمية محددة من الببتيدات CS αβ، وهذه يمكن أن تضاف إلى الإشارة إلى توضيح المجموعات استناداً إلى النشاط. على الرغم من أن الببتيدات ناضجة المتوقعة فقط استخدمت في هذا المثال، إذا كان وجود الببتيد إشارة أو الببتيد المؤيدة المهم، يمكن إضافة هذه المعلومات لكل تسلسل. محددة الإدراج أو الحذف الأحداث، فضلا عن مواقع إنترون، كما يمكن تضمين إذا هم ظنوا أن تكون مفيدة. ويمكن تحليل استفادة من استخدام مرباييس لتحليل النشوء والتطور أنها لا تقتصر على أنها البيانات الجزيئية ترميز البيانات عن الخصائص الأخرى التي قد تكون أهمية تطورية. يمكن ترميز هذه كهذا أو غائبا، توفير معلومات أكثر من تسلسل وحدها.

جمع متواليات ذات الصلة خطوة حاسمة للبروتوكول. اعتماداً على نطاق الدراسة والتوزيع لأعضاء المجموعة، وهذا قد تمتد مجموعات تصنيفية واسعة النطاق. إذا كان الهدف هو فهم لمجموعة كاملة من البروتينات، والنظر في أنه يمكن الاطلاع على بعض تسلسلات خارج الأنواع التي أفادت التقارير أنهم عادة من. إذا كان الأصناف هو الفعل تمثيلاً وتسلسل إضافية غير المحتمل أو زائدة عن الحاجة، استبعادها من البحث قد يكون مناسباً. أساسية قاعدة من بين إبهام لاسترداد يضرب في البحث عن انفجار استخدام قطع من-05 ه-القيمة. ه-القيمة هي عدد الزيارات المتوقع عن طريق الصدفة. في حين أن هذا مناسبة لبعض الحالات، إذا كان هناك مجموعة من تسلسل غير متباينة جداً لكن أسهم الخصائص المحددة، يمكن أن يكون أقل موثوقة قد استرداد متواليات متشابهة ولكن لا يكون ميزات محددة مطلوبة، وقد لا إرجاع تسلسل التي تحتوي على الخصائص الرئيسية ولكنها متباينة جداً. وهناك بعض الطرق المحتملة لمعالجة هذه المسألة. الأول هو أن ننظر في تسلسل التي تم تحديدها في البحث التي تحت عتبة-05 لترى إذا استوفت معايير الاشتمال. ثانيا، إذا كان هناك ما يكفي من المعلومات، استخدام الخاصة بموقف "تكراره الانفجار" (الانفجار PSI)22 أو نمط--ضرب "الانفجار بدأت" (PHI-انفجار)23. يستخدم هذه المبادرة--انفجار النتائج من خلال بحث أولى لإنشاء نموذج جديد للجولة المقبلة، ويمكن في بعض الأحيان إيجاد تسلسل المتباينة التي لم تحدد البحث الأولية. انفجار PHI يتطلب نمطاً لتقديمها جنبا إلى جنب مع سلسلة الاستعلام. يقيد هذا تسلسل التي تم استردادها إلى تلك التي تحتوي على النمط الفائدة. هذا الأداة مفيدة بشكل خاص إذا كانت فكرة فريدة من نوعها للفريق يمكن أن تحدد بوضوح.

محاذاة دقيقة أمر بالغ الأهمية لتحليل النشوء والتطور؛ تفسيرات للأشجار صحيحة فقط إذا كانت يتم إنشاؤها باستخدام المحاذاة جيدة. استخدام المرجع لإعلام المواءمة تساعد على تجنب الأخطاء التي فقط واضحة عند النظر في هيكل أو النشاط. تكرار تسلسل ستحتاج إلى تعريف لهذا المشروع. قد لا تكون تسلسلين تبدو زائدة عن الحاجة لأغراض النشوء والتطور إذا كانت من الأصناف المتباينة على نطاق واسع أو متطابقة تقريبا في تسلسل ولكن لها خصائص هيكلية أو وظيفية مختلفة. إذا كان هناك غموض فيما يتعلق بأي تسلسل ينبغي إدراجها، يمكن إنشاء التحالفات المتعددة وتحليلها كل على حدة لمعرفة كيفية تغيير محاذاة تأثير استدلالات النشوء والتطور. الطريقة المعروضة هنا لا يلغي الحاجة إلى التعديل اليدوي من التحالفات، ولكن يمكن أن تساعد في توضيح كيفية التسلسل يجب محاذاة وربما يمكن استخدامها بالاقتران مع أسلوب المتوازية أكثر تطورا مما قد وصفت قبل13.

للإشارة إلى أن من المفيد، من المهم تحديد الخصائص المميزة التي ليست واضحة حاليا من تسلسل وحدها. على سبيل المثال، النظر في عدم القدرة على مقارنة سيستين الترابط وأنماط بين تسلسلات مع أرقام مختلفة من سيستينيس عندما يتم ترقيم كل تسلسل فيما يتعلق بذاته. الهدف تسهيل المقارنة والمناقشة، ولا إضافة طبقة أخرى من الارتباك. وهذا قد يتطلب عدة تكرارات للإشارة ويدعو الحكم في البت الذي يتميز تدرج. من المأمول أن يزداد اعتماد أسلوب مشترك لمناقشة متواليات متباينة في مجموعة فهم المجموعة ككل.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

ليس له علاقة بالكشف عن صاحب البلاغ.

Acknowledgments

البحوث الجارية الببتيد الميكروبات tardigrade يدعمه التمويل الداخلية من "مكتب بحوث جامعة الغرب الأوسط" ورعاية البرامج (أورسب). وقد أورسب أي دور في تصميم الدراسة أو جمع البيانات، والتحليل، وتفسير أو إعداد مخطوطة.

Materials

Name Company Catalog Number Comments
BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

DOWNLOAD MATERIALS LIST

References

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, (Database issue) 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, (Database issue) 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).

Tags

السلوك، 126 مسألة، فوق عائلة البروتين، البروتين التسميات، تصنيف البروتين، تسلسل المحاذاة، نسأله، defensins اللافقاريات، فوق عائلة CS αβ
إنشاء وتطبيق مرجع لتسهيل المناقشة وتصنيف البروتينات في مجموعة متنوعة
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Tarr, D. E. K. Creating and Applying More

Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter