Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Behavior

Создание и применение ссылку для облегчения обсуждения и классификации белков в различные группы

Published: August 16, 2017 doi: 10.3791/56107

Summary

Цель настоящего Протокола заключается в разработке ссылку для различных белков в группе, которой недостает согласованных критериев для классификации и номенклатуры. Эта ссылка будет способствовать анализа и обсуждения в группе в целом и может использоваться в дополнение к установленным имена.

Abstract

Похожие белки, которые были изучены в разных лабораториях с использованием различных организмов может отсутствие единой системы номенклатура и классификация, что делает его трудным для обсуждения группы в целом и поставить новые последовательности в соответствующий контекст. Разработка ссылку, приоритеты важную последовательность функций связанных с структурой и/или активности может использоваться в дополнение к установленным имена для добавления некоторых когерентности в группу различных белков. Этот документ использует надсемейства хвоща стабилизированный альфа спираль (CS-αβ) в качестве примера показать как ссылку в таблице программного обеспечения можно уточнить взаимоотношения между существующими белки суперсемейства, а также облегчить добавление новых последовательности. Он также показывает, как ссылка может помочь уточнить выравниваний последовательности в часто используемых программного обеспечения, которое влияет на действительность филогенетических анализов. Использование ссылки, вероятно, будет наиболее полезным для групп белков, которые включают в себя весьма различные последовательности от широкого спектра таксонов, с функциями, которые должным образом не захвачен молекулярного анализа.

Introduction

Белок название должно отражать характеристики и отношения с другими белками. К сожалению имена обычно назначаются во время обнаружения и, по мере исследования, понимание более широкого контекста может измениться. Это может привести к несколько имен, если белок самостоятельно был идентифицирован по более чем одной лаборатории, изменения в номенклатуре или характеристики, считается окончательным, назначая имя и на имя дифференцировать больше не достаточно белка от других.

Беспозвоночных дефензинов обеспечивают хороший пример дегенерации в номенклатуры и классификации. Первый беспозвоночных дефензинов поступили от насекомых, и название «насекомое дефенсина» было предложено основаны на предполагаемых гомологии млекопитающих дефензинов1,2. Дефенсина термин используется до сих пор, несмотря на то, что это теперь ясно, что беспозвоночных и млекопитающих дефензинов не разделяют общий предок3,4. В зависимости от вида беспозвоночных «дефенсина» могут иметь шесть или восемь которым (которые формируют три или четыре дисульфидными облигаций) и целый ряд антимикробной мероприятий. Чтобы осложнить ситуацию, белки с теми же характеристиками как дефензинов не всегда называют «дефензинов,» например, недавно выявленных cremycins от Caenorhabditis remanei5. Кроме того беспозвоночных большой дефензинов чаще эволюционно связаны с позвоночных β-дефензинов чем других беспозвоночных дефензинов6. Несмотря на это исследователи иногда полагаться на имя «дефенсина», при определении, какие последовательности должны быть включены в анализ.

Структурные исследования показали сходство между насекомых дефензинов и Скорпион токсинов7, и CS-αβ раза впоследствии был создан как структурное характерной насекомых дефензинов8. Этот раз определяет надсемейства (CS-αβ) токсин как Скорпион в классификации структурных белков (ГКНП) базы данных9, который в настоящее время включает в себя пять семей: насекомых дефензинов, короткоцепные Скорпион токсинов, длинноцепочечных Скорпион токсинов, МГД-1 (от моллюсков) и завод дефензинов. Этот надсемейства ассоциируется с недавно описан СНГ дефензинов4 и надсемейства 3.30.30.10 Кэт/ген 3D базы данных10,11. Исследования из целого ряда таксона беспозвоночных, растений и грибов показать, что имена белков, которые содержат этот раз хвоща номер или шаблон склеивание, антимикробной активности или эволюционной истории12четко не связаны.

Отсутствие последовательности и четких критериев сделать это сложно назвать и классифицировать недавно выявленные последовательности в этом надсемейства. Основным препятствием для сравнения белков в этом надсемейства — что которым нумеруются в отношении каждой индивидуальной последовательности (первый цистеина в каждой последовательности-C1), с никоим образом с учетом структурной роли. Это означает, что только последовательности с тем же числом, по которым можно сравнить. Существует мало сохранения последовательности помимо которым, образуя CS-αβ раза, что затрудняет рядов и филогенетический анализ. Путем разработки системы нумерации, которая определяет приоритеты структурные особенности, надсемейства последовательности может быть более легко по сравнению и выровнены. Сохранение функций, а также определения подгруппы, могут быть визуализированы быстро, и новой последовательности могут быть более легко помещены в соответствующий контекст.

Этот документ использует программное обеспечение электронной таблицы (например, Excel) для создания ссылка номерной системе для CS-αβ надсемейства. Он показывает, как это разъясняется сравнений между последовательностями и применяет его к новой последовательности CS-αβ определены от тихоходок. CS-αβ надсемейства используя в качестве примера, протокол был написан для обеспечения руководства при использовании последовательности интерес; Однако он не предназначен конкретно для этого надсемейства или хвоща богатых последовательностей. Этот метод, вероятно, будет наиболее полезным для групп белков, которые исследовали независимо в различных таксонов и/или имеют мало общего гомологии последовательности, с дискретной характеристиками, которые не могут быть легко признаны молекулярный анализ программного обеспечения. Этот метод требует некоторых априорных решения относительно важных особенностей, поэтому он будет иметь ограниченную полезность если не важные функции были определены. Основная цель заключается в том, чтобы показать, как простой визуализации последовательности отношений может быть достигнуто. Это может затем использоваться для информирования выравнивание последовательностей и анализа, но если выравнивание и анализ являются основными целями, штрих-код метода будет подходящей альтернативой, которая имеет больше возможностей для автоматизации13. Текущий метод отображает особенности каждого пептида в линейной форме, поэтому он не будет полезным для прямой визуализации 3D структуры.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. определить функции определения группы протеин интереса

  1. Consult предыдущих публикаций определить, если есть консенсус относительно особенностей, которые необходимо считать частью группы. Принять к сведению любые несоответствия или расхождения во мнениях между исследовательскими группами и включают в себя характеристики, которые могут служить для различения одной подгруппы от другой.
  2. Если предыдущие литература не определяющие характеристики, использовать последовательности, которые считаются представитель группы как отправной точки для определения сохранены функции.

2. Сбор соответствующих последовательностей

  1. Если Отзывы написали что включают анализ последовательностей, которые представляют группы, включают эти последовательности в наборе сырья. Извлечение последовательности с помощью присоединения цифры, указанные в литературе и сохранить в стандартной последовательности программы редактирования (например, EditSeq в Lasergene люкс или один из многих доступных для Бесплатные онлайн).
  2. Если этой группы был определен в одном из структурных баз данных, включают последовательности, база данных списки извлечения последовательности с помощью присоединения номеров, предоставленных в базе данных как часть группы. и сохранить в стандартной последовательности редактирования Программа, как указано выше.
    Примечание: например, последовательности, классифицированы в надсемейство CS-αβ (Скорпион токсин как) в базе данных "ГКНП" можно найти здесь: http://scop.mrc-lmb.cam.ac.uk/scop/data/scop.b.h.c.h.html.
  3. выполнять основные местные Выравнивание инструмент поиска (взрыв) 14 Поиск общественного, онлайн баз данных, доступных через Национальный центр биотехнологии информации (NCBI) чтобы найти последовательностей, которые могут не были включены в литературе или структурных баз данных. Для наиболее полные результаты, использовать оба белка взрыва (blastp) и перевод взрыв с белком запросов (tblastn) программы; они будут доступны на: https://blast.ncbi.nlm.nih.gov/Blast.cgi.
    1. Использования последовательности известно для быть частью группы интерес как последовательности запроса. Скопируйте и вставьте последовательность в поле поиска в верхней части или предоставить GenBank присоединения номер или gi идентификатор, если таковые имеются.
    2. Выберите базу данных из раскрывающегося меню. Выберите без избыточности белковых последовательностей (nr) для blastp и выразил последовательности теги для tblastn.
    3. Поиск для достижения результатов в конкретных таксонов в организме, установки, введя организма или таксон имя и выбрав из списка, который появляется при вводе. Чтобы добавить дополнительные организмов или таксонов исключить, нажмите кнопку " + " появятся кнопки и другое поле. Исключить любые нежелательные таксонов в поле организма, введя имя организма или Таксон, выбор из списка, который появляется во время ввода и проверки " исключить " поле справа.
    4. Доступ к дополнительным параметрам, нажав на " параметры алгоритма " вблизи в нижней части страницы. Оставьте по умолчанию, если нет оснований для изменения параметра.
    5. Нажмите " взрыва " кнопку, чтобы запустить анализ, это может занять некоторое время для того чтобы появиться результаты. В общем, получить хиты с ожидать значение (или e значение) " -05 " или лучше и сохранить в стандартной последовательности программы редактирования.
      1. Если все хиты выше этого порога, повторите поиск с увеличение числа последовательности (в разделе Параметры алгоритма) для получения всех соответствующих последовательностей.
  4. При необходимости обрезать последовательности, чтобы исключить ненужную информацию (например, CS-αβ раз применяется только к зрелой пептида). Определить сигнал пептидов и про пептиды для удаления с помощью ProP 15 (доступно онлайн), или SignalP для более сложного сигнала пептид предсказание 16 (доступно онлайн).

3. Создать ссылку в таблицы, основанные на важные что были определены особенности

  1. выявить определяющие характеристики группы интересов. Например, используйте CS-αβ складки окончательно установленным структуры решения насекомых дефенсина A Phormia terraenovae ( рис. 1) 8.
    1. Этот раз включает в себя меньше мотив под названием хвоща стабилизированный спирали (CSH) 17; идентифицировать этот мотив, CXXXC (где X — любое аминокислоты) вверх по течению от КЭС, которые формируют двумя дисульфидными облигаций ( Рисунок 1 , сплошной линии розовый).
      Примечание: Для завершения CS-αβ мотив, третий дисульфидными облигаций формируется из дополнительных которым помещен перед каждой половины CSH мотив ( рис. 1, пунктирные линии розовый).
  2. Ввести эти определения функции в электронную таблицу. Смотрите Рисунок 2.
    1. Использование столбцов для сохраненных функций и для представления пробелов между этими функциями. Держите достаточно широким, чтобы соответствовать чисел и убедитесь, что они имеют постоянной ширины столбцов. Задайте ширину с помощью " формат | Ширина столбца " функции ( рис. 2, розовыми стрелками).
    2. Использовать строки для имен последовательности.
    3. Когда последовательность имеет свою особенность, заполните поле с помощью функции заполнения ( рис. 2, розовый площади). Для интервалов между функциями, введите количество аминокислот в поле между и оставить незаполненной. Например, использование насекомых дефенсина последовательности дает ссылку, которая включает в себя шесть которым, с определенного расстояния между C2 и C3 и C5 и C6.
  3. Добавить представителя последовательностей, которые были ранее созданы как членов группы на основе структурных баз данных и литературы.
    Примечание: например, предыдущие литературы и базу ГКНП определить несколько групп для включения: насекомых дефензинов, короткоцепные Скорпион токсинов, длинноцепочечных Скорпион токсинов, МГД-1, завод дефензинов, нематода ABFs, drosomycins от дрозофилы, и macins. Литературе также определяет последовательность бактериальной с которым лишь четыре, которые могут представлять предок этого надсемейства 18. Добавление этих последовательностей увеличивает количество которым в ссылке от шести до десяти, но поддерживает выравнивание важных структурных особенностей ( рис. 3).
    1. Для добавления функции, которая может определить подгруппа последовательности (например, дополнительные цистеин), используйте " Вставка " функции ( рис. 3, розовыми стрелками).
    2. Если есть функции, отсутствующие в определенной последовательности, оставьте поле незаполненными и объединить его с коробки, представляющих промежуточные аминокислоты. При необходимости, объединить ячейки, используя функцию слияния и центр ( рис. 3, розовый ящик).
  4. Продолжать Добавление последовательности к группам получить более полную картину вариации в каждой группе больших надсемейства. Суммировать характеристики группы для облегчения сравнения ( рис. 4).
    1. Когда меняется количество аминокислот между основными функциями, используйте дефис для обозначения диапазона, например, 6-12 (6-12 аминокислоты) и косую черту для обозначения либо / или, например, 7/10 (7 или 10 аминокислот).
    2. Выбрать способ добавления заметок к функции последовательностей, которые могут иметь отношение, но не повторялись достаточно часто включить в ссылку. К примеру, с которым важны в этом надсемейства, этикетка дополнительные которым ( рис. 4, розовый коробки).
  5. Добавить Боровеy определены последовательности в электронную таблицу, используя в качестве руководства в установленной последовательности. Например, Добавление последовательности от тихоходок (желтый) показывает, что tardigrade последовательности делятся на несколько различных групп надсемейства ( рис. 5 показывает резюме вместо строки в последовательность для целей космической).
  6. Показать изменчивости в пределах таксономические группы Перестановка строк ( рис. 6).

4. Используйте ссылку для уточнения аминокислоты рядов

Примечание: существует множество программ, которые могут быть использованы для множественных выравниваний последовательности, но эта демонстрация будет использовать молекулярный анализ эволюционной генетики (MEGA6) 19 потому что он доступен для бесплатного скачивания.

  1. Скачать и установить программное обеспечение.
  2. Начать новое выравнивание в MEGA, выбрав " выравнивание изменить/создать " под вкладку Выравнивание выберите " создать новое выравнивание " в поле, который появляется и нажмите " ОК. " выберите " белка. "
  3. Выберите " вставка последовательности из файла " в " редактирования " меню для импорта последовательностей.
    Примечание: Последовательности будет нужно быть FASTA формат для импорта в мега. Цвета фона, которые отражают различные аминокислоты типы используются по умолчанию, но эта опция может быть отключена при " дисплей " меню.
  4. После того, как введены все последовательности, нажмите значок сгибание рук и затем " выравнивания белка " для выравнивания последовательностей с использованием алгоритма мышц 20.
    Примечание: ClustalW также доступен.
    1. Если сообщение о том, что ничего не был отдельных СОЗ и просит, чтобы выделить все, нажмите " ОК. "
    2. Примечание: откроется окно, которое позволяет изменять некоторые параметры, но они должны быть изменены только есть причина для этого. Этот анализ использует подмножество последовательностей, анализируются в предыдущем документ 12.
  5. Проверить выравнивание на основе важных особенностей; Обратите внимание, что верхняя панель выше последовательности покажет какие-либо столбцы где аминокислота является полностью сохранены (*). Смотреть Рисунок 7. Увидеть, что первоначальный выравнивание показывает только три из четырех сохранившихся которым ( рис. 7, розовый коробки); Глядя вниз по столбцу, AlCRP последовательность, явно неправильно ( рис. 7, розовыми стрелками).
  6. Избавиться от большого разрыва между I и сохранены C, тире и нажмите клавишу " удалить " ключ. Не выделять все аминокислоты, или они будут также удалены.
  7. Аминокислоты справа, выделите и нажмите пространство бара
    1. Обратите внимание, что AlCRP теперь имеет структурные которым согласованы и что последний C CXXXC мотив сохраняется на протяжении всего выравнивание ( рис. 8). Настроить выравнивание при необходимости уделять приоритетное внимание наиболее важных особенностей последовательностей.

5. Сравнение групп определены с помощью ссылки на результаты филогенетических анализов

  1. от предварительных рядов, определить, какие последовательности должны быть включены в филогенетический анализ, за небольшое количество последовательностей, этот шаг может ненужным.
    1. Сохранить файл выравнивания, который включает в себя все последовательности, но филогенетический анализ, удалите избыточные последовательности ( рис. 9, розовый коробки шоу пары избыточных последовательностей).
    2. Если набор данных включает в себя большое количество последовательностей, запустите предварительный анализ и выбор представителей групп, всегда образуют клада.
  2. Определить лучшие модели замены аминокислот.
    1. Экспорт выравнивание в мега формате (на вкладке данные).
    2. Перейти к меню модели и выберите " найти лучший ДНК/белок модель. " выберите сохраненный файл и открыть его, откроется окно, которое имеет несколько параметров, которые могут быть изменены.
    3. Использовать параметры по умолчанию, если нет причин менять их. Нажмите кнопку " вычислить " чтобы начать анализ.
  3. Запуск анализа максимального правдоподобия (мл) в мега.
    1. Выберите " конструкции/испытания максимальная вероятность дерево " от меню филогении.
    2. Выбрать модель решимости быть лучше всего подходят для данных из шага 5.2 (результат даст моделью замещения, а также лучшие " среди сайтов " параметр).
    3. 1000 выбрать загрузочный реплицирует для получения меры поддержки для дерева,.
    4. Нажмите " вычислить " для запуска анализа; МЕГА имеет " Обозреватель дерева " для визуализации дерева.
  4. Запустить байесовский анализ в MrBayes с открытым исходным кодом 21.
    Примечание: MrBayes инструкция доступна также с этого сайта. Это призвано обеспечить основные шаги и не полное руководство по Байесу филогенетический анализ.
    1. Экспорт мега выравнивание в формате PAUP (Nexus) в ту же папку, как в программе MrBayes.
    2. Открыт MrBayes и тип " exe файла " (например, " exe Alignment.nex ").
    3. Укажите параметры модели и анализа. Выберите модель, указанной на шаге 5.2 или выбрать " смешанного " параметр, который будет попробовать различные модели и сообщить частоты модели на деревьях с лучших апостериорные вероятности (надпись aamodelpr = смешанные). Тип " showmodel " сообщить текущие параметры модели и " помочь mcmc " чтобы показать текущие настройки параметров, с кратким объяснением каждого из.
    4. Установить количество поколений с помощью " mcmcp ngen = " команда (1 миллион типичной).
    5. Тип " mcmc " чтобы начать анализ.
    6. После завершения количество поколений, программа спросит для добавления нескольких поколений. Если средняя стандартное отклонение частоты Сплит является менее чем 0.1, введите без. Если это выше 0,1, анализа должно быть позволено продолжать, или некоторые параметры должны быть изменены (см. инструкцию).
    7. Использования " sumt " команда для создания дерева файлов.
    8. После того, как анализ завершен и формируется консенсус дерево, дерево может рассматриваться в FigTree (доступные сети).
  5. Сравнения на деревья, чтобы увидеть, если методы создают последовательные результаты.
    Примечание: Некоторые последовательности не предоставляют много информации: деревья не могут быть наилучшим образом решены и филиалы могут иметь минимальную поддержку ( Рисунок 10).
  6. Сравнить деревья для групп, выявленных с помощью ссылки, чтобы увидеть, если эти группы поддержки филогенетический анализ.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

На рисунке 4показаны группы последовательностей в CS-αβ надсемейства, сообщили в литературе. Цистеин комбинаций, основанные на нумерации для каждой последовательности предложить пять основных групп (Таблица 1, средний столбец). Группа 1 имеет шесть которым, которые с тремя дисульфидными облигаций и включает в себя последовательности от насекомых, паукообразных, моллюсков, нематод и грибов. Группы 2, 3 и 4 имеют 8 которым, которые образуют четыре дисульфидными облигаций. Группа 2 включает в себя насекомых, животные и завод последовательности; Группа 3 включает паукообразный, моллюсков и нематоды последовательности; и Группа 4 включает в себя последовательности от книдарий, аннелид, моллюсков и грибов. Группа 5 включает в себя 10 macins цистеина. Некоторые последовательности совсем не подходят эти шаблоны, но были обычно ближе к одной группе, чем другие.

Группы 1 и 2, как представляется, разделяют два облигации: C2 C5 и C3-C6; Однако начало нумерации каждой последовательности с его первого цистеина не признают структурного контекста облигаций. С2-С5 в группе 1 последовательности формы, которую один из двух облигаций в CSH мотив, а С2-С5 в последовательности группы 2 формирует окончательный Бонд, необходимые для стабилизации CS-αβ раза. Гомологичных Бонд для группы 1 С2-С5 — Group2 C3-C6, который не является очевидным из нумерации. Это также не очевидно, что в группе 3, С2-С6 Бонда играет ту же роль структурных.

С помощью последовательности из литературы создается ссылка в общей сложности десять которым. Мотив CSH формируется из облигаций C3-C8 и C4-C9, с С2-С6 завершения CS-αβ раза. Перенумерация пар цистеина, основанный на справочные номера разъясняет облигаций в каждой последовательности (Таблица 1, правый столбец). Теперь очевидно, что все последовательности имеют С2-С6, C3-C8 и C4-C9, отражающие структурные фолд, определяющий надсемейства. Использование ссылки позволяет для легкого сравнения между последовательностями, которые имеют несовместимые номенклатуры и неоднозначных классификационных критериев. Она также может помочь определить характеристики, которые определяют подгруппы последовательностей. Например C1-C7 Бонд может отличить macins от других членов надсемейства, что делает целесообразным классифицировать последовательности с этой Бонд как «macins» вместо «дефензинов» (Таблица 1 и рис. 4).

Поиски общественности онлайновых баз данных выявили шестнадцать последовательности от тихоходок, которые явно имеют CS-αβ складывать, восемь из Hypsibius dujardini и Milnesium tardigradum. Четыре новых последовательностей имеют шесть которым, девять имеют восемь, один имеет девять и два имеют десять. Это дает очень мало информации, но выравнивая последовательности к ссылке, становится ясно, что tardigrade последовательности с тем же числом, по которым не всегда имеют структурно важные которым в том же месте в пределах последовательности ( Рисунок 5 и рис. 6). Выравнивание с ссылкой также позволяет для вывода связывающих шаблонов (Таблица 2, выведен склеивания модели указаны в скобках). Некоторые из tardigrade последовательностей четко установить шаблоны 1-4. Другие являются наиболее близок к предлагаемой бактериальных предок, Скорпион Cl токсин или семейство грибковых дефенсина подобных пептидов. Шаблон 2 могут иметь две подгруппы, одна Скорпион Na + токсинов, представленного drosomycin и завод дефензинов и другой скорпионом Cl токсины. Чтобы определить, если следует рассмотреть некоторые токсины, вместо того, чтобы дефензинов необходима дальнейшая работа, исследование функции tardigrade белков.

Филогенетический анализ часто используются для изучения, как группа белков может эволюционировали. В CS-αβ надсемейства последовательности обычно короткие и очень разные; результате деревья часто плохо разрешаются и предлагают меньшюю проницательность. МЛ и Байесу деревья для подмножества последовательностей, проанализированы здесь были плохо урегулированы, с низкой поддержка многих КЛАДЕС (рис. 10, Дополнительные файлы 1 - 4). Это обычная практика, чтобы показывать только загрузчик уровнях более 70 (или апостериорные вероятности над 0,7), но Рисунок 10 сохраняет все номера, чтобы продемонстрировать общий низкий уровень поддержки. Пять групп были поддержаны выше 70/0,7 в по крайней мере один из двух деревьев: (a) 6C и 8C Скорпион токсин; (b) macins; (c) клещей и Скорпион дефензинов; (d) завод дефензинов; и (e) 6C дефензинов от насекомых, паукообразных и моллюсков. В дереве мл e клады также включает токсин 8C и 8C tardigrade дефенсина, но поддержка была очень низкой (Рисунок 10А). В целом эти отражают категорий, определенных с помощью нумерации хвоща ссылку, но также показывают, что последовательности с различными хвоща номерами в пределах крупных таксономических группы может быть более тесно связанной с чем последовательности с тем же шаблоном от различные группы. Хотя в этом исследовании были использованы лишь небольшое число последовательностей, больше анализа 250 последовательностей не устраняет отсутствие резолюции (Дополнительные файлы 5 - 8)12. Выравнивание таблицы ссылок могут предложить легче визуализации сходства с структурных или функциональных актуальность, по сравнению с филогенетических деревьев.

Figure 1
Рисунок 1: Определение последовательности и структурных особенностей CS-αβ надсемейства. Аминокислоты и 3D структуры имеют цветовую кодировку: петля (синий), альфа спираль (зеленый), бета листов (золото) и дисульфидными облигаций (розовый). Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 2
Рисунок 2: Предварительный ссылку шесть цистеина, основанный на последовательности насекомых дефенсина. Столбцы показывают сохранены которым (С1-С6) и, для CSH мотив, количество сохраняется амино кислоты, между которым. Заполненные клеточки указывают что последовательность данного цистеина и цифры указывают аминокислоты, между которым. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

ER.Within страницы = «1» >Figure 3
Рисунок 3: Изысканный десять цистеин ссылка на основе представительной последовательности от групп CS-αβ надсемейства. Столбцы показывают, которым сохраняется и аминокислот между ними. Которым способствует CSH мотив (C3, C4, C8 и C9) и CS-αβ фолд (C2 и C6) помечены. Последовательности цветовым таксономические группы: Arachnida (светло-оранжевый), бактерий (черный), стрекающих (серый), шестиногие (оранжевый), моллюски (синий), нематод (фиолетовый) и Plantae (зеленый). Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 4
Рисунок 4 : Резюме CS-αβ надсемейства последовательностей в соответствие с ссылкой на характеристики группы. Столбцы показывают, которым сохраняется и аминокислот между ними. Которым способствует CSH мотив (C3, C4, C8 и C9) и CS-αβ фолд (C2 и C6) помечены. Последовательности цветовым таксономические группы: Annelida (темно-красный), паукообразных (светло-оранжевый), бактерий (черный), стрекающих (серый), грибы (светло-зелёный), шестиногие (оранжевый), моллюски (синий), нематод (фиолетовый) и Plantae (зеленый). Чисел, разделенных дефисом указывают на ряд промежуточных аминокислот; числа, разделенные косой представляют либо / или. «C» указывает дополнительные цистеина, которые не происходят достаточно часто для добавления ссылки. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 5
Рисунок 5 : Добавление последовательности Tardigrade CS-αβ надсемейства выравнивания с ссылкой на характеристики группы. Столбцы показывают, которым сохраняется и аминокислот между ними. Которым способствует CSH мотив (C3, C4, C8 и C9) и CS-αβ фолд (C2 и C6) помечены. Последовательности цветовым таксономические группы: Annelida (темно-красный), паукообразных (светло-оранжевый), бактерий (черный), стрекающих (серый), грибы (светло-зелёный), шестиногие (оранжевый), моллюски (синий), нематод (фиолетовый), Plantae (зеленый) и тихоходки (желтый). Чисел, разделенных дефисом указывают на ряд промежуточных аминокислот; числа, разделенные косой представляют либо / или. «C» указывает дополнительные цистеина, которые не происходят достаточно часто для добавления ссылки. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 6
Рисунок 6: Добавление последовательности Tardigrade CS-αβ надсемейства выравнивания с ссылкой таксономические группы. Столбцы показывают, которым сохраняется и аминокислот между ними. Которым способствует CSH мотив (C3, C4, C8 и C9) и CS-αβ фолд (C2 и C6) помечены. Последовательности цветовым таксономические группы: Annelida (темно-красный), паукообразных (светло-оранжевый), бактерий (черный), стрекающих (серый), грибы (светло-зелёный), шестиногие (оранжевый), моллюски (синий), нематод (фиолетовый), Plantae (зеленый) и тихоходки (желтый). Чисел, разделенных дефисом указывают на ряд промежуточных аминокислот; числа, разделенные косой представляют либо / или. «C» указывает дополнительные цистеина, которые не происходят достаточно часто для добавления ссылки. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 7
Рисунок 7: Разрегулированные последовательности с помощью автоматизированных выравнивание. Аминокислоты, сохраняется в все последовательности обозначаются * в строке над первой последовательности (изложенные в розовой коробки). AlCRP разрегулированные. Этот разрыв необходимо удалить правильно выровнять C (розовый стрелка). Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 8
Рисунок 8: Ручной доработки выравнивание сохраняет структурно важных особенностей последовательностей. AlCRP теперь выровнено (розовый стрелка), и CXXXC мотив полностью сохранены для последовательностей (розовый коробки). Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 9
Рисунок 9 : Избыточные последовательностей в выравнивание. Если есть пар почти идентичные последовательности (розовый коробки), один может быть удалено, так как они скорее всего будут всегда вместе кластера в и вклад в общую топологию дерева. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 10
Рисунок 10 : Сравнение деревьев, образующиеся филогенетический анализ. (A) максимальный анализ вероятности в MEGA, с 1000 загрузчик реплицируется с использованием WAG + G + я модель. (B) байесовский анализ с 1 000 000 поколений, с помощью параметра смешанная модель. Клады, поддерживаемые на 70/0,7 показаны сплошные розовые линии; пунктирные линии розовый показывают КЛАДЕС, поддерживается на 70/0,7 в дереве других. (6C и 8C Скорпион токсин; (b) macins; (c) клещей и Скорпион дефензинов; (d) завод дефензинов; и (e) 6C дефензинов от насекомых, паукообразных и моллюсков. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Table 1
Таблица 1: группы внутри CS-αβ надсемейства на основе шаблонов, хвоща сопряжения. Пять основных моделей формирования облигаций указаны с помощью ссылки или внутренние номера (средний столбец) (правая колонка). Скорпион Cl - токсины, ASABF 6Cys-альфа и группа грибковых пептиды размещаются с узором, мсоответствует ОСТ. Цистеин, не включены в Справочник обозначается надстрочный которым до и после (например, C3/4 , между С3 и С4).

Table 2
Таблица 2: Добавление Tardigrade CS-αβ последовательности хвоща сопряжения группы шаблона. Tardigrade дефензинов и macins (жирным шрифтом), помещаются в ранее созданных групп там, где это возможно. Некоторые tardigrade последовательности может показать шаблон конкретной группе. Цистеин, не включены в Справочник обозначается надстрочный которым до и после (например, C3/4 , между С3 и С4). Обозначения «/12C» означает, что есть два которым вверх по течению ведения C1.

Дополнительный файл 1 (S1): выравнивание этого набора данных в мега. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 2 (S2): дерево максимального правдоподобия мега файл для этого набора данных. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 3 (S3): выравнивание этого набора данных в формате Nexus для MrBayes. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 4 (S4): консенсус файл из этого набора данных анализа MrBayes. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 5 (S5): выравнивание 250 CS-αβ последовательностей в мега. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 6 (S6): максимального правдоподобия дерево 250 последовательностей CS-αβ. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 7 (S7): выравнивание 250 CS-αβ последовательностей в Nexus формат для MrBayes. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 8 (S8): консенсус файл из MrBayes анализа последовательностей 250 CS-αβ. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Критерии для именования белка в группе должно быть ясно, но это не всегда так. Последовательности, которые имеют CS-αβ складывать были изучены в многих лабораториях с использованием различных организмов, в результате в различных системах номенклатуры, а также различные уровни квалификации. Попытки навязать совершенно новой номенклатуры не является разумным и приведет к много путаницы, когда консалтинг предыдущих литературы. Система нумерации ссылку может использоваться в дополнение к имени белка уточнить свои характеристики по отношению к надсемейства.

Группы белков с четкими критериями для именования и классификации скорее не пользоваться генерации ссылки в электронной таблице, хотя он может быть полезен для обобщения большого количества последовательностей и визуализации важные характеристики. Выравниваний последовательности и логотипы являются полезными для изучения уровня сохранения на каждом сайте, но не активно приоритеты последовательности функций, важных для структуры или функции. CS-αβ пример ориентирован на структуре, но конкретные аминокислоты, которые формируют привязки сайта также могут быть включены в качестве определяющей чертой. Как определены последовательности функций, которые дают конкретные мероприятия антимикробные/токсичных CS-αβ пептидов, они могут быть добавлены ссылки для уточнения на основе деятельности группы. Хотя только предсказал Зрелые пептиды были использованы в этом примере, если наличие сигнала пептид или про пептид имеет важное значение, что информация может быть добавлена для каждой последовательности. Конкретные вставки или удаления события, а также Интрон мест, также могут быть включены если они думали, чтобы быть информативным. Преимущество использования MrBayes для филогенетический анализ, что это не ограничивается молекулярных данных это можно анализировать кодирования данных для других характеристик, которые могут иметь эволюционное значение. Они могут быть закодированы как подарок или отсутствует, предоставляя больше информации, чем только последовательность.

Сбор соответствующих последовательностей является важнейшим шагом протокола. В зависимости от сферы охвата исследования и распределения членов группы это может охватывать широкий таксономических групп. Если цель состоит в том, чтобы понять всю группу протеинов, считают, что некоторые последовательности может находиться за пределами видов, которые они обычно сообщается из. Если таксон уже хорошо представлены и дополнительные последовательности вряд ли или излишним, исключая их из поиска может быть подходящей. Основные правилом оф пальца для извлечения хитов в поиске взрыв является использование выключени -05 для e значение. E значение является количество показов, ожидается случайно. Хотя это подходит для некоторых ситуаций, если есть группы последовательностей, весьма расходятся, но конкретные характеристики акций, он может быть менее надежный он может получить последовательностей, которые похожи, но не делать имеют специфические особенности хотел, и он не может возвращение последовательности, которые имеют ключевые характеристики, но это очень разные. Есть несколько возможных способов решения этого вопроса. Первый заключается в том, чтобы взглянуть на последовательности, определенные в поиск, находящиеся ниже отсечения-05, чтобы увидеть, если они удовлетворяют критериям включения. Во-вторых если есть достаточно информации, используйте положение конкретных повторного взрыва (PSI-взрыв)22 или шаблон-хит инициировал взрыва (фи-BLAST)23. PSI-ДОМЕННАЯ использует результаты начального поиска для создания новой модели для следующего раунда и иногда можно найти различные последовательности, которые первоначального поиска не выявлено. Фи-ДОМЕННАЯ требует шаблон должен быть представлен вместе с последовательности запроса. Это ограничивает те, которые содержат шаблон проверено последовательности. Этот инструмент особенно полезен, если мотив, уникальный в группу могут быть четко определены.

Точное выравнивание имеет решающее значение для филогенетический анализ; интерпретации деревьев действительны только в том случае, если они создаются с помощью хорошей выравнивание. Используя ссылку сообщить выравнивание может помочь избежать ошибок, которые очевидны только при рассмотрении структуры или деятельности. Последовательности избыточности должны быть определены для проекта. Две последовательности, которые излишним не может быть для филогенетических целей, если они от широко расходящихся таксонов или почти идентичны в последовательности, но имеют различные структурные или функциональные свойства. Если существует неопределенность относительно того, какие последовательности должны быть включены, можно несколько рядов и проанализированы отдельно, чтобы увидеть, как выравнивание изменения воздействия филогенетических выводы. Метод, представленные здесь не устраняет необходимости для ручной регулировки ряды, но он может помочь выяснить, как последовательности следует выровнять и может быть использован в сочетании с более сложную методику штриховое кодирование, чем было описано ранее13.

Для справки быть полезным важно выявить определяющие характеристики, которые в настоящее время очевидны не только последовательности. Например рассмотрим невозможность сравнить цистеина, склеивание шаблонов между последовательностями с разными номерами, по которым при каждой последовательности пронумерованы в отношении себя. Цель заключается в том, чтобы облегчить сравнение и дискуссии, чтобы не добавить еще один слой путаницы. Это может включать несколько итераций ссылки и решение вызывает в определении компонентов, которые требуется включить. Остается надеяться, что принятие общий метод обсуждения различных последовательностей в группе увеличит понимание группы в целом.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Автор не имеет ничего, чтобы раскрыть.

Acknowledgments

Текущие tardigrade антимикробного пептида исследований поддерживается интрамуральных финансирование от среднего запада университета Управление по исследованиям и поддержке программ (ORSP). ORSP имел никакой роли в дизайн исследования, сбор данных, анализ, интерпретация или подготовка рукописи.

Materials

Name Company Catalog Number Comments
BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

DOWNLOAD MATERIALS LIST

References

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, (Database issue) 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, (Database issue) 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).

Tags

Поведение выпуск 126 белки суперсемейства номенклатура белка белка классификации выравнивание последовательностей филогения беспозвоночных дефензинов CS-αβ надсемейства
Создание и применение ссылку для облегчения обсуждения и классификации белков в различные группы
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Tarr, D. E. K. Creating and Applying More

Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter