Использование филогенетический анализ расследовать эукариотический геном происхождения

* These authors contributed equally
Immunology and Infection

Your institution must subscribe to JoVE's Immunology and Infection section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

Описан метод построения филогенетическое дерево, основанный на последовательности гомологии сладостей от эукариот и SemiSWEETs от прокариот. Филогенетический анализ является полезным инструментом для объяснения эволюционное родство между гомологичных белки или гены из организма различных групп.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L. Q., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Филогенетический анализ использует нуклеотидных и аминокислотных последовательностей или другие параметры, такие как домен последовательности и трехмерную структуру, чтобы построить дерево Показать постепеновское отношение среди различных таксонам (классификационные единицы) на молекулярной уровне. Филогенетический анализ может также использоваться для расследования доменных связей в рамках отдельных Таксон, особенно для организмов, которые претерпели существенные изменения в морфологии и физиологии, но для которых исследователи не имеют ископаемые свидетельства из-за организмов долго эволюционной истории или нехватка окаменения.

В этом тексте подробный протокол описан с помощью метода филогенетических, включая аминокислоты выравнивание последовательностей с использованием Clustal Омега и последующего филогенетическое дерево строительство с использованием как максимальная вероятность (мл) молекулярной эволюционной генетики Анализ (мега) и выводы Байеза через MrBayes. Чтобы исследовать происхождение генов эукариот Сахара будет в конечном итоге быть экспортированы транспортеры (SWEET), были проанализированы 228 сладости, включая 35 сладкий белки от одноклеточных эукариот и 57 полусладкое белков прокариот. Интересно, что SemiSWEETs были найдены в прокариотах, но сладости были найдены у эукариот. Два филогенетических деревьев, построенный с помощью теоретически различных методов последовательно предложено, что первый эукариотических сладкий ген может вытекать из синтез бактериальный ген полусладкое и архей полусладкое гена. Стоит отметить, что надо быть осторожным, чтобы сделать вывод только на основе филогенетического анализа, хотя это полезно объяснить базовые отношения между различными таксонов, которые трудно или даже невозможно различить экспериментальным путем .

Introduction

Последовательности ДНК или РНК нести генетическую информацию для базового фенотипов, которые могут быть проанализированы через физиологические и биохимические методы или наблюдается через морфологических и ископаемые свидетельства. В некотором смысле генетическая информация является более надежным, чем оценки внешних фенотипов, потому что первый является основой для последнего. В исследовании, эволюционной ископаемые свидетельства очень прямой и убедительными. Однако многих организмов, таких как микроорганизмы, имеют мало шансов сформировать ископаемых во время долго геологического возраста. Таким образом молекулярной информации такие последовательности нуклеотидных и аминокислотных последовательностей от смежных сохранившиеся организмов представляют ценность для изучения эволюции отношения1. В настоящем исследовании простое введение базовых знаний филогенетический и легко научиться протокола была предоставлена для новичков, которые нужно построить филогенетическое дерево на своих собственных.

ДНК (нуклеотидов) и белки (аминокислоты) последовательности может использоваться для выведения Филогенетические отношения между гомологичных генов, органеллы или даже организмов2. Последовательностей ДНК, скорее всего, будут затронуты изменения в ходе эволюции. В отличие от аминокислотных последовательностей гораздо более стабильной, учитывая, что синонимом мутации в нуклеотидных последовательностей не вызывают мутации в аминокислотных последовательностях. В результате последовательности ДНК полезны для сравнения гомологичных генов от близкородственных организмов, тогда как аминокислотных последовательностей являются подходящими для гомологичных генов от отдаленно похожие организмов3.

Филогенетический анализ начинается с выравниванием амино кислоты или нуклеотидных последовательностей4 извлекается из аннотированной генома, секвенирование базы данных5 , перечисленных в формат FASTA, т.е., предполагаемые или выраженной белка последовательности, РНК последовательности , или последовательностей ДНК. Стоит отметить, что очень важно для сбора высококачественных последовательностей для анализа, и только гомологичных последовательности может использоваться для анализа Филогенетические отношения. Много различных платформ Clustal W, Clustal X, мышцы, T-кофе, MAFFT, может использоваться для выравнивания последовательности. Наиболее широко используется Clustal Омега6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/), который может быть использован онлайн или может быть загружен бесплатно бесплатно. Инструмент выравнивания имеет множество параметров, которые пользователь может настроить перед началом выравнивания, но параметры по умолчанию хорошо работать в большинстве случаев. После завершения процесса, соответствие последовательности должны сохраняться в правильный формат для следующего шага. Они должны затем редактироваться или обрезается, используя программное обеспечение для редактирования, такие как BioEdit, потому что филогенетическое дерево строительство мега требует последовательности, чтобы быть одинаковой длины, (включая аминокислоты аббревиатуры и дефисы. В соответствие последовательности, любой позиции без аминокислот или нуклеотидов представлена дефис «-»). Как правило следует удалить все выступающие аминокислоты или нуклеотидов на любом конце выравнивание. Кроме того столбцы, содержащие плохо выровненных последовательностей в выравнивание могут быть удалены, потому что они передают мало ценную информацию и может иногда дать заблуждение или ложной информации3. Столбцы, содержащие один или несколько переносов могут быть удалены в настоящее время или в более поздней стадии строительства дерево. Кроме того они могут использоваться для филогенетических вычислений. По завершении последовательности выравнивание и обрезки, соответствие последовательности должны сохраняться в формате FASTA, или требуемый формат, для последующего использования.

Многие программные платформы обеспечивают дерево строительство функции с использованием различных методов и алгоритмов. В целом методы могут быть классифицированы как расстояние матричные методы или методы дискретных данных. Расстояние матричные методы являются простой и быстрый для вычисления, в то время как дискретные данные методы являются сложным и трудоемким. Для очень тесно связанных таксонов с высокой степенью распределения аминокислоты нуклеотидной последовательности индивидуальности, метод матрицы расстояние (сосед присоединения: NJ; Невзвешенные метод группы пара с арифметическое: UPGMA) является целесообразным; для отдаленно связанные таксоны, метод дискретных данных (максимального правдоподобия: мл; Максимальная экономичность: MP; Выводы Байеза) является оптимальным3,8. В этом исследовании для построения филогенетических деревьев9применялись методы мл Мега (6.0.6) и выводы Байеза (MrBayes 3.2). В идеале при использовании правильной модели и параметры, результаты, полученные от различных методов может быть последовательным, и они, таким образом, более надежные и убедительные.

Для мл филогенетическое дерево, построенный с помощью мега10соответствие последовательности файлов в формате FASTA должен быть загружен в программу. Первым шагом является затем выбрать оптимальную замену модель для загруженных данных. Все доступные замены модели сравниваются на основе загруженных последовательностей, и их окончательные результаты будут показаны в таблице результатов. Выберите модель с наименьшим Оценка информации критерий Байеса (BIC) (сначала перечислены в таблице), задать параметры ML согласно Рекомендуемые модели и начать вычисления. Время вычисления варьируется от нескольких минут до нескольких дней, в зависимости от сложности загруженных данных (длина последовательности и количество таксонов) и производительности компьютера, на котором выполняются программы. По завершении вычисления филогенетическое дерево будет показан в новом окне. Сохраните файл как «FileName.mat». После установки параметров, чтобы задать внешний вид дерева, сохраните еще раз. С помощью этого метода, мега можно создавать публикации класс филогенетическое дерево фигур.

Для строительства дерево с MrBayes11первым шагом является соответствие последовательности, которая обычно отображается в формате FASTA, превратить nexus формат (.nex как тип файла). Преобразования nexus формат FASTA файлы могут быть обработаны в мега. Далее соответствие последовательности в формате nexus могут быть загружены в MrBayes. Когда файл успешно загружен, укажите подробные параметры для вычисления дерева. Эти параметры включают такие сведения, как аминокислоты замены модель, колебания ставок, цепь номер марковской цепи Монте-Карло (MCMC) муфты, номер ngen, среднее, стандартное отклонение частоты Сплит и так далее. После того, как эти параметры были заданы, начните вычисления. В конце концов два дерева фигур в код ASC II, один показ клады авторитет и другие длины филиал показываю, будет отображаться на экране.

В результате дерево будут сохранены автоматически как «FileName.nex.con». Этот файл дерево может быть открыт и под редакцией FigTree, и может быть изменен рисунок, отображается в FigTree далее, чтобы сделать его более подходящим для публикации.

В этом исследовании 228 сладкий белков, включая 35 сладости от одноклеточных эукариот и 57 SemiSWEETs от прокариот, были проанализированы в качестве примера. Сладости и SemiSWEETs были охарактеризованы как глюкоза, фруктоза или сахароза перевозчиков через мембраны12,13. Филогенетический анализ свидетельствует о том, что два MtN3/слюны доменов, содержащих конфеты может быть производным от эволюционного синтеза бактериального SemiSWEET и archaeon14.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. последовательность выравнивание

  1. Собирать аминокислотных последовательностей эукариотических сладкий и прокариот SemiSWEET в отдельных документах и перечислить их в формате FASTA. Скачайте последовательности от национального центра для биотехнологии информации (NCBI), Европейской лаборатории молекулярной биологии (ЕЛМБ) и Японии (DDBJ) баз данных банка данных ДНК, Поиск подобия с помощью инструмента основной инструмент поиска местных выравнивание (взрыв).
    1. В примере файлы Соберите 228 предполагаемого сладкий белковых последовательностей, обладающие двумя доменами MtN3/слюны (7 трансмембранных спиралей) 57 полусладкое белковых последовательностей, обладающие один домен MtN3/слюны (3 трансмембранных спиралей) прокариот и эукариот 13.
    2. Чтобы упростить этот процесс, выберите 35 кандидат сладкий белки от одноклеточных эукариот организмов среди 228 предполагаемого сладости для строительства филогенетическое дерево. Эти последовательности прикреплены так что читатель может практиковать на множестве реальных данных.
  2. Совместите 35 сладкий последовательности путем ввода их в Clustal Омега (http://www.ebi.ac.uk/Tools/msa/clustalo/).
    1. Скопируйте и вставьте белковых последовательностей в формате FASTA в поле ввода или загрузить файл последовательности в формате FASTA. Укажите, что они являются аминокислотной последовательности, нажав на иконку под раскрывающемся меню в разделе «Шаг 1».
    2. Укажите формат вывода и другие параметры в разделе «Шаг 2», если необходимо. Для этого исследования установить формат вывода как «clustal номер» и оставить другие параметры настроек по умолчанию. В большинстве случаев параметры по умолчанию работает хорошо без каких-либо спецификации.
  3. Представить и запустить выравнивание в разделе «Шаг 3». Это может занять от нескольких секунд до минут до завершения выравнивания. В панели «Результат резюме» щелкните правой кнопкой мыши ссылку в разделе «Выравнивание в формате CLUSTAL» и сохранять соответствие последовательности как «35.clustal» (рис. 1).
  4. Откройте файл результат выравнивание в BioEdit.
    1. На главной панели BioEdit нажмите кнопку «Последовательность» и в первом раскрывающемся меню выберите «Редактировать настроение», а затем нажмите кнопку «Редактировать остатков» в подменю (рис. 2).
    2. Выберите выступающих последовательности на левой стороне выравнивания с помощью курсора (выбранной последовательности будет показан в черном) и щелкните значок «Удалить» в меню «Правка», чтобы удалить выбранный последовательности (рис. 3).
    3. Выберите и удалите выступающую последовательности на правой стороне первого домена MtN3/слюны и сохранить обрезанные первый MtN3/слюны домена последовательности как 35-I.fas (рис. 4). Аналогичным образом удалить левой и правой стороне выступающие последовательностей второго домена MtN3/слюны и сохранить его как 35-II.fas. Первый и второй последовательности домена MtN3/слюны может быть предсказано с ритма (http://proteinformatics.charite.de/rhythm/inndex.php?site=helix) или TMHMM (http://www.cbs.dtu.dk/services/TMHMM/) заранее.
  5. Откройте файл 35-I.fas с мега и нажмите кнопку «Выровнять» при появлении соответствующего запроса. В меню «Правка» нажмите кнопку «Выбрать все», а затем нажмите кнопку «Выбрать Sequence(s)»; имена и последовательности таксонов будет выбран в черном (рис. 5).
    1. Выберите «Копировать» из меню «Редактировать», чтобы скопировать последовательности в буфер обмена и затем вставить скопированные последовательности в doc-файл.
    2. В doc-файл, замените все «#» «>», а затем удалите символы несвязанных с конвертировать их в формат FASTA. Добавить «-I» в конце каждого имени Таксон, чтобы пометить их как первый домен последовательности MtN3/слюны. Процесс второй MtN3/слюны домена последовательности после тот же метод и добавить «-II» после имени каждого таксон.
  6. Объединить первый и второй MtN3/слюны домена последовательности в формате FASTA в doc-файл.
    1. Снова загрузить комбинированных последовательностей в Clustal Омега и выравнивание последовательности, как описано выше. Сохраните результат, как «35 realigned.clustal».
    2. Откройте файл «35 realigned.clustal» в BioEdit, удалить неравномерным аминокислотных остатков (выступающие) на любом конце выравнивания последовательностей и затем сохраните последовательности как «35 realigned.fas». Нажмите «Да», когда предупредил, что некоторые нестандартные знаки могут быть сохранены.

2. Вычисление филогенетическое дерево

  1. Откройте «35 realigned.fas» в мега.
    1. Нажмите в меню «Данные» выберите «Экспорт выравнивание» и сохранить выравнивание в формате PAUP (nexus) как «35.nex» для последующего использования в MrBayes (рис. 6).
    2. Тем временем щелкните значок «Моделей» на главной панели мега, выберите «найти лучший ДНК/белок модели (мл)» и нажмите «OK» во всплывающем окне. Нажмите кнопку «Вычислить» чтобы начать модель Поиск процесса (рис. 7). Откроется новая панель прогресса; Этот процесс длится несколько минут до нескольких дней, в зависимости от сложности последовательности загрузки и производительности компьютера.
      Примечание: Таблица результатов будет открыта после завершения процесса поиска модели ( рис. 8). Маленький BIC оценка будут перечислены во-первых, последовал целый ряд различных моделей с постепенно увеличивая BIC баллы. Первая модель «LG + G + F» с наименьшим счетом BIC является рекомендуемой для мл дерева, основанный на файле «35 realigned.fas».
  2. Щелкните значок «Филогенетика» на главной панели мега, нажмите кнопку «Построить/тест максимальная вероятность дерево» и затем нажмите «Да» на всплывающей панели. Откроется новое окно, показаны различные параметры, которые должны быть указаны (рис. 9).
    1. Во-первых значение начальной загрузки в тесте филогении коробки; 500 или 1000 достаточна в большинстве случаев. Под замену модели выберите «аминокислоты» как тип замены. Цель выбора модели замены является оценить истинную разницу между последовательностями на основе их нынешних государств3.
    2. Выберите «LG с Freqs. (+F) модель» (LG + F) в поле метод модели. В поле шаблон и ставки, выберите «Гамма распределены» (G) для описания изменения курсов по сайтам, т.е., давая больше веса на изменения в медленно меняющихся сайтов3. В поле набор данных выберите «Завершить удаление» для удаления всех столбцов, содержащих дефисы.
    3. Держите все остальные параметры в их государствах по умолчанию (Рисунок 9). После уточнения этих параметров нажмите значок «Вычисления», чтобы запустить расчет.

3. Презентация филогенетическое дерево

Примечание: Филогенетическое дерево мл будет представлен по завершении вычисления с помощью мега (Рисунок 10).

  1. В раскрывающемся меню «Файл» значок на панели дерева, выберите «Сохранить текущие сессии», чтобы сохранить результат (.mas — тип файла по умолчанию). В настоящем исследовании результат был сохранен как «35.mas». На панели дерева многие параметры, включая длину клады, стиль дерево, дерево топологии, шрифт таксон имя, размер и цвет, отображаются и можно задать различные параметры.
  2. Сохраните файл окончательный дерево, щелкнув значок изображения и сохранить рисунок в разных форматах или скопировать изображение как источник для редактирования фотографий.

4. анализ взаимосвязи сладости и SemiSWEETs с помощью выравнивание последовательностей

Примечание: Этот шаг может не потребоваться в обычной последовательности анализа.

  1. Совместите 228 эукариотических сладости и 57 прокариот SemiSWEETs в Clustal Омега, как описано выше. Результаты выравнивания может быть показан в Jalview, который интегрирован в Clustal Омега и копируется в сохранить в графическом редакторе (Рисунок 11).
    Примечание: В примере выравнивание, некоторые SemiSWEETs с α-бактерии по алфавиту выравниваются с первым доменом MtN3/слюны сладкий последовательностей, в то время как SemiSWEETs из Methanobacteria (археи) выравниваются с второй домен MtN3/слюны сладкий последовательностей.

5. филогенетическое дерево строительство с MrBayes

  1. Для Байесу умозаключения с MrBayes откройте исполняемый файл MrBayes и DOS интерфейс come up в новом окне. Первым шагом является чтение файла данных связь. Ввод «выполнение 35.nex» после командную строку (не забудьте сохранить файл nex 35. в том же каталоге исполняемого файла MrBayes, или указать путь файла перед загрузкой). «Успешный читать матрица» сообщение будет показано после последнего из перечисленных таксонов (Рисунок 12). Файл nex 35. уже подготовлены и сохранены в мега (см. 2.1 выше).
  2. Установите Эволюционная модель.
    1. После командную строку, введите «надпись aamodelpr = fixed(lg); LSet ставки = g». «Lg» и «g» соответствуют «LG» и «G» модель, которая устанавливается в мега. После успешного установки модели, типа «mcmc nchains = 4 ngen = 5000000» после строки. Использование «nchains = 4» запись обозначает общее количество одной холодильной цепи и три горячие цепи для Метрополис муфты. «ngen = 5000000» означает для запуска 5000000 поколений Метрополис сцепления для конвергенции сетей холодного и горячего. В настоящем исследовании средняя стандартное отклонение частоты Сплит ниже 0,01 считался сближения горячей и холодной цепи.
    2. Обратите внимание, что номер ngen нельзя точно предсказать в начале процесса и обычно необходимо скорректировать на основе изменений в среднем стандартное отклонение частоты Сплит. Кроме того номер ngen конвергенции может отличаться каждый раз при запуске программы на основе тех же данных.
  3. Запустить анализ: Этот этап длится от нескольких минут до нескольких дней, в зависимости от сложности входных данных и производительности компьютера. После завершения заданных вычислений, будет предложено «Продолжать с анализа (да/нет)?» Если «нет» вводится после строки, вычислений будет остановить (рис. 13), в противном случае она будет продолжать вычисления после ввода количество далее поколений. После завершения вычисления (с средний стандартное отклонение частот Сплит < 0,01 и 0,05), остановить вычисление, введя «нет» после строки запроса.
    Примечание: 0.01 является строгим критерием, 0,05 является умеренным и обычно адекватные.
  4. Обобщить примеры: Тип «колодца» после строки, чтобы обобщить примеры параметров модели (рис. 14). Затем введите «sumt relburnin = да burninfrac = 0,25» после строки, чтобы обобщить образцы дерева. Подробная информация о строительстве филогенетическое дерево будет отображаться как показано на рисунке 15, следуют две цифры дерева, которые будут появляться в ASC II код на экране, один показ клады авторитет и другие длины филиал показаны. В то же время дерево файл с именем «35.nex.con» будут сохранены автоматически.
  5. Для лучшего представления филогенетическое дерево откройте файл «35.nex.con» дерево с FigTree инструмент (http://tree.bio.ed.ac.uk/software/figtree/), выберите стиль или размер для отображения результата (рис. 16) или даже редактировать его в графическом редакторе, чтобы сделать его более удобным для чтения.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Филогенетические деревья показывают, что все домены первого MtN3/слюны 35 сладкий последовательностей кластеры как один клады и доменов второго MtN3/слюны сладкий последовательностей, сгруппированы как другой клады. Кроме того результаты выравнивания сладости и SemiSWEETs показывают, что некоторые SemiSWEETs с α-бактерии по алфавиту в соответствие с первым доменом MtN3/слюны сладкий последовательностей, в то время как SemiSWEETs из Methanobacteria (археи) в соответствие с второй MtN3/слюны домен сладкий последовательностей. Вместе, эти результаты показывают, что два MtN3/слюны доменов, содержащих конфеты может быть производным от эволюционного синтеза бактериального SemiSWEET и archaeon14.

Figure 1
Рисунок 1 : Сохранить соответствие последовательности 35 предполагаемого эукариотических сладости как «35.clustal» через Clustal Омега. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 2
Рисунок 2 : Выберите путь в BioEdit обрезаемый соответствие последовательности «35.clustal», который был подготовлен в Омега Clustal. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 3
Рисунок 3 : Выберите и удалите неравномерным последовательности на левой стороне первого домена последовательностей MtN3/слюны 35 предполагаемого эукариотических сладостей в BioEdit. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 4
Рисунок 4 : Подстриженные последовательности первого домена MtN3/слюны 35 предполагаемого эукариотических сладостей в BioEdit. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 5
Рисунок 5 : Выберите и скопируйте первый домен последовательности MtN3/слюны 35 предполагаемого эукариотических сладостей в мега. Скопированные последовательности будет вставлен в doc файл для редактирования. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 6
Рисунок 6 : Преобразовать «35 realigned.fas» в «35.nex» (PAUP формат) для Байесовский вывод на более поздней стадии. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 7
Рисунок 7 : Поиск наиболее подходящей замены модели, мега для максимальной вероятности (мл) филогенетическое дерево строительство на основе «35 realigned.fas» файла. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 8
Рисунок 8 : Таблицы модели наиболее подходящей замены, рассчитанное для дерева мл, основанный на файле «35 realigned.fas». Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 9
Рисунок 9 : Укажите параметры для мл дерево вычислений на основе наилучшего замены модели для «35 realigned.fas» в мега. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 10
Рисунок 10 : Исходное дерево мл, сооруженные мега, основанный на «35 realigned.fas». На этом этапе, много вариантов для рисунок стиль, размер, цвет и т.д., доступны. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 11
Рисунок 11 : Выравнивание 228 эукариотических сладости и 57 прокариот SemiSWEETs компанией Clustal Omega. Результаты были показаны в Jalview, интегрированы в Clustal Омега. В выравнивание некоторые SemiSWEETs с α-бактерии по алфавиту были выровняны с первым доменом MtN3/слюны сладкий последовательностей, в то время как SemiSWEETs из Methanobacteria (археи) были согласованы с второй домен MtN3/слюны сладкий последовательностей. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 12
Рисунок 12 : Загрузить файл «35.nex» в MrBayes в окне DOS. Для того чтобы показать общие результаты, сократить показатель был удален контент, который был похож. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 13
Рисунок 13 : Информация, отображаемая на экране после вычисления файла «35.nex», с помощью MrBayes. Показать общие результаты, чтобы уменьшить длину фигуры был удален контент, который был похож. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 14
Рисунок 14 : Обобщить примеры параметров модели для «35.nex» файла. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 15
Рисунок 15 : Кратко образцы дерева «35.nex» файла. Показать общие результаты, чтобы уменьшить длину фигуры был удален контент, который был похож. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 16
Рисунок 16 : Филогенетическое дерево «35.nex.con» отображается FigTree. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Она становится все более популярным в биологических исследованиях сделать филогенетическое дерево, основанное на нуклеотидных и аминокислотных последовательностей8. Как правило есть три критических этапах практики, включая выравнивание последовательностей, оценки выравнивания последовательностей с надлежащий метод или алгоритм и Визуализация вычислительных результата как филогенетическое дерево. В представленных исследовании, были проведены три раунда выравнивание последовательностей: во-первых, сладкий белковых последовательностей, включая первый и второй домен MtN3/слюны, были согласованы; Во-вторых каждая из отдельных последовательностей домена MtN3/слюны сладости как независимый таксон собирали и согласовать вместе; и наконец, были совместно согласованы полусладкое последовательности и сладкий последовательности. Обычно только один раунд выравнивание последовательностей необходим для строительства phylogenic дерево.

На предварительном этапе гомологичных последовательности можно загрузить из других баз данных или NCBI. Эти загруженные последовательности может должны быть проверены, если они не являются хорошо аннотированных. В первой и второй ступени выравнивание и вычисление нельзя запустить если неверный формат последовательности. К примеру Омега Clustal отвергнет любой отход от FASTA формат в файле последовательности. В стадии вычислений Обратите внимание, что последовательность длины, включая аминокислоты или нуклеотидов и дефисы необходимо равны перед оценкой, мега.

Несмотря на богатство методов и моделей для построения дерева, которые доступны никто из них не является надежной. Надежные и убедительные результаты являются те, которые согласуются друг с другом при использовании различных алгоритмов или модели для оценки же данных15. В методе мл надежность топологии дерева во многом зависит от начальной загрузки значение каждого клады; значение начальной загрузки 70 или более обычно рассматривается как надежный. В настоящем исследовании, все из первой последовательности домена MtN3/слюны сгруппированы как большой клад с начальной стоимостью 83. Значение других клады, содержащий все второй домен последовательности MtN3/слюны, однако, было только 6 (рис. 10). Для проверки дерева архитектуры, MrBayes, который использует совершенно другой метод16 мл, был использован для анализа взаимоотношений таксонов. Апостериорные вероятности16 первого и второго домена КЛАДЕС, полученные от MrBayes были соответственно 100 и 68, (рис. 16).

Другое ограничение мл и вычисление MrBayes является то, что так много времени для запуска. С помощью компьютера с многоядерных процессоров и графических процессоров (GPU) является полезным для повышения вычислительной мощности и скорости17,18. Для работы MrBayes компьютер с дискретной видеокарты и соответствующих драйверов CUDA может значительно ускорить вычисления вероятности11.

Выбор правильной модели для вычисления филогенетическое дерево очень трудно для тех, кто с небольшим опытом. В этой связи Мега обеспечивает простой способ найти лучшие модели, сравнивая BIC десятки моделей кандидата. Кроме того недавно модернизированная 6.0 мега объединяет несколько инструментов Выравнивание последовательности как мышцы и Clustal W10, которые очень удобны в использовании. Она также обеспечивает последовательность редактирования и функции строительство филогенетическое дерево. Эти функции частично объяснить, почему это программное обеспечение настолько популярен в области вычислительной молекулярной эволюции. Что касается MrBayes, значительное преимущество этого инструмента является, что он может обрабатывать смешанные типы данных вместе (например., морфологических и молекулярных данных)11и таким образом результаты носят более всеобъемлющий характер.

В заключение настоящее исследование предоставляет метод для анализа молекулярного происхождение белок кодирование генов, которые претерпели сложные вариации таких фьюжн после дублирования или горизонтальный перенос генов (HGT) в ходе эволюции. Надеюсь больше выводы будут выявлены с широким применением филогенетического анализа в области эволюционных исследований.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторы не имеют ничего сообщать.

Acknowledgments

Эта работа была поддержана Фонд национального естественных наук Китая (31371596), исследовательский центр био технологии, Китай три ущелья университет (2016KBC04) и фонд естественных наук провинции Цзянсу, Китай (BK20151424).

Materials

Name Company Catalog Number Comments
Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group - Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4 GB memory, Core 2 or above CPU. Windows 7, Windows 10

DOWNLOAD MATERIALS LIST

References

  1. Nei, M., Kumar, S. Molecular Evolution and Phylogenetics. Oxford University Press. Oxford. (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics