系統解析を使用して真核生物遺伝子の起源を調査するには

* These authors contributed equally
Immunology and Infection

Your institution must subscribe to JoVE's Immunology and Infection section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

原核生物から真核生物と SemiSWEETs からお菓子の配列相同性に基づいて系統樹を構築する方法を説明します。系統解析は、異なる生物のグループから相同タンパク質や遺伝子の進化的関連性を説明するための便利なツールです。

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L. Q., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

系統解析分子進化の関係別分類 (分類単位) を表示するツリーを構築するヌクレオチドまたはアミノ酸配列またはドメイン配列や立体構造など、その他のパラメーターを使用して、レベル。相当受けている生物形態および生理学でも研究員不足のために化石の証拠のための変更のために特にも、系統解析を使用個々 の分類群内でのドメインの関係を調査することができます、生物の長い進化の歴史や化石化の欠乏。

Clustal オメガと後続の系統樹を用いた両方最大尤度 (ML) の分子進化遺伝学を使用してアミノ酸配列アラインメントを含む系統のメソッドを使用してこのテキストの詳しいプロトコルを紹介します。分析 (メガ) とベイズ推定 MrBayes を介して。真核生物の糖が最終的にトランスポーターのエクスポートをする(甘口) 遺伝子の起源を調べるためには、単細胞真核生物から 35 甘い蛋白質と原核生物から 57 の少し甘味がある蛋白質を含む 228 お菓子を行った。興味深いことに、SemiSWEETs が原で発見されたが、お菓子は真核生物で発見されました。理論的に異なるメソッドを使用して 2 つの系統樹は一貫して最初の真核生物の遺伝子を甘い可能性があります細菌の少し甘味がある遺伝子と古細菌甘味遺伝子の融合に由来することを示唆しています。それは慎重な困難または実験的手段によって識別することは不可能である、異なる分類群の基になる関係を説明するために便利ですが系統解析のみに基づいて結論を出すべきということは注目に値する.

Introduction

DNA や RNA 配列は、生理学的・生化学的方法を分析または形態および化石の証拠を観察できる基になる表現型の遺伝情報を運ぶ。ある意味で、遺伝情報は前者後者の基礎となるので、外部の表現型を評価するよりもより信頼性の高いです。進化の研究では、化石の証拠は非常に直接、説得力のあります。ただし、微生物などの多くの生物は、長い地質時代の化石を形成する機会がほとんど します。したがって、現存する生物の関連からアミノ酸配列と塩基配列などの分子情報が進化の関係1を探索するための値。本研究では独自に系統樹を構築する必要がある新規参入者の系統の基本的な知識と学ぶ簡単なプロトコルの簡単な紹介を行いました。

相同遺伝子、細胞小器官、または2も生物間の系統関係を推論する DNA (ヌクレオチド) とタンパク質 (アミノ酸) の両方を使用できます。DNA シーケンスは、進化の過程での変更によって影響を受ける可能性が高い。対照的に、アミノ酸配列はかなり安定して同義変異塩基配列がアミノ酸配列の変異を発生しないことを考える。結果として、DNA 配列、アミノ酸配列、遠縁の生物3から相同遺伝子の適切な密接に関連有機体から相同遺伝子の比較に役立ちます。

系統解析から始まるアミノ酸の配置またはヌクレオチド シーケンス4注釈付きヒトゲノム データベース5から取得表示 FASTA 形式、すなわち推定または表現される蛋白質シーケンス、RNA シーケンス、または DNA 配列。それは分析のための高品質のシーケンスを収集することが重要だけ相同配列は系統関係を分析する使用ことができます注目に値するです。多くの異なるプラットフォーム Clustal W、Clustal X、筋肉など MAFFT、T コーヒーをアライメントに使用できます。Clustal オメガ6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/)、オンラインで使用することができますまたは無料でダウンロードすることができますは、最も広く使用される料金。配置ツールには、ユーザーは、配置を開始する前に調整できますが、既定のパラメーターは、ほとんどの場合でうまく動作するさまざまなパラメーターがあります。プロセスの完了後、整列のシーケンスは次のステップの正しい形式に保存ください。彼らを編集する必要があります。 またはメガで系統樹構築 (アミノ酸略語とハイフンを含む長さが等しいするシーケンスを必要とするため BioEdit などの編集ソフトウェアを使用してトリミングします。整列順序アミノ酸またはヌクレオチドなしの任意の位置はハイフンで表されます"-")。一般的に、突出のアミノ酸またはヌクレオチド配置のどちらかの端のすべて削除する必要があります。さらに、ほとんどの貴重な情報を伝えるため、時々 混乱したり、偽情報3を与えることができるので、線形の不揃いシーケンスを含んでいる列を削除できます。この時または後のツリー建設段階で、1 つ以上のハイフンが含まれる列を削除できます。また、系統樹の計算に使用できます。配列アラインメントとトリミングを完了すると、一直線に並べられたシーケンスは FASTA 形式、または後で使用するため、目的の形式で保存必要があります。

多くのソフトウェア プラットフォームは、さまざまな方法またはアルゴリズムを使用してツリー構造の機能を提供します。一般的に、メソッドは、距離行列法または離散データのメソッドのいずれかに分類できます。距離行列法は、シンプル、高速離散データのメソッドが複雑で時間がかかる、計算します。アミノ酸またはヌクレオチド シーケンス id、距離行列法の共有度の高い非常に密接に関連種のため (隣人への参加: ニュージャージー;算術平均と加重対グループ法: UPGMA) 適切な;遠縁のイチイ、離散データ メソッドの (最大尤度: ML;最大の節約: MP;ベイズの推論) は、最適な3,8です。本研究では ML メガ (6.0.6) とベイズ推論 (MrBayes 3.2) の9系統樹を構築に適用しました。理想的には、適切なモデルとパラメーターを使用すると、異なる方法から得られた結果は、一貫性のあるかもしれないし、彼らより信頼性の高い、説得力のあります。

手法はメガ10ML 系統樹のプログラムに FASTA 形式で一直線に並べられたシーケンス ファイルをアップロードする必要があります。まず、アップロードされたデータの最適な代替モデルを選択することです。アップロードされたシーケンスに基づいてすべての利用可能な代替モデルを比較し、最終スコアが結果テーブルに表示されます。(表の最初に表示) 最小ベイズ情報基準 (BIC) のスコアを持つモデルを選択、推奨モデルによると ML パラメーターを設定し、計算を開始します。計算時間は、数分から読み込まれたデータ (シーケンスとイチイの数の長さ) の複雑さと、プログラムを実行するコンピューターのパフォーマンスに応じて、いくつかの日によって異なります。計算が完了したら、系統樹は新しいウィンドウに表示されます。"FileName.mat"としてファイルを保存します。ツリーの外観を指定するためのパラメーターを設定した後もう一度保存します。メガは、このメソッドを使用して、パブリケーション グレード系統樹図を生成できます。

MrBayes11木構築の最初のステップは、nexus 形式 (ファイルの種類として .nex) に FASTA 形式に通常記載されている整列のシーケンスを変換するためです。メガで FASTA ファイルをネクサスの形式に変換を処理できます。次に、nexus 形式で整列のシーケンスは、MrBayes にアップロードできます。ファイルが正常にアップロードされると、ツリーの計算の詳細なパラメーターを指定します。これらのパラメーターは、カップリング、ngen 数アミノ酸置換モデル、変化率、マルコフ連鎖モンテカルロ法 (MCMC) のチェイン ・ ナンバーなどの詳細を含める、分割周波数の標準偏差の平均、などなど。これらのパラメーターを指定すると後、は、計算を開始します。最後に、ASC II コード、1 つ示すクレード信頼性および他の示す枝長の 2 つのツリー図は、画面に表示されます。

ツリーの結果は、「FileName.nex.con」として自動的に保存されます。このツリーのファイルを開くおよびフィグツリー、編集できます、フィグツリーに表示される図は、文書により適切にさらに変更できます。

この研究では、単細胞真核生物から 35 お菓子など、原核生物から 57 SemiSWEETs 228 の甘い蛋白質は例として分析されました。お菓子と SemiSWEETs の両方は、膜12,13でブドウ糖や果糖、ショ糖トランスポーターとして特徴づけられた.系統解析では、細菌 SemiSWEET ・始原14進化融合由来のお菓子を含む 2 つの MtN3/唾ドメイン可能性がありますを示唆しています。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. アライメント

  1. 真核生物と原核生物 SemiSWEET 別々 のドキュメントでのアミノ酸配列を収集し、FASTA 形式でそれらを一覧表示します。基本的なローカル配置検索ツール (ブラスト) ツールと類似検索で国立センターから DDBJ データベースの DNA データバンク、欧州分子生物学研究所 (EMBL) 生物工学情報 (NCBI) のためのシーケンスをダウンロードします。
    1. 例ファイルで真核生物と原核生物の単一の MtN3/唾ドメイン (3 膜貫通ヘリックス) を有する 57 の少し甘味がある蛋白質シーケンスの 2 つの MtN3/唾ドメイン (7 本の膜貫通ヘリックス) を有する 228 推定甘い蛋白質シーケンスを収集します。13
    2. プロセスを簡素化、系統樹構築の 228 の推定お菓子の中で単細胞真核生物から 35 候補甘い蛋白質を選択します。これらのシーケンスは読者のリアルなデータ セットの練習がありますそのように接続します。
  2. 35 甘いシーケンスを揃える Clustal オメガ (http://www.ebi.ac.uk/Tools/msa/clustalo/) にそれらを入力することにより。
    1. コピーしタンパク質配列を FASTA 形式で入力ボックスに貼り付けるまたは FASTA 形式で一連のファイルをアップロードします。アミノ酸配列を ' ステップ 1' セクションでプルダウン メニューの下のアイコンをクリックしていることを指定します。
    2. 必要に応じて「ステップ 2」では、出力形式と他パラメーターを指定します。この研究」数 w/o clustal」として出力形式を設定し、既定の設定の他のパラメーターのまま。ほとんどの場合、既定のパラメーターは、任意の仕様がなく動作します。
  3. 送信し、' ステップ 3' セクションに配置を実行します。それはどこでも分配置が完了するまでに数秒からかかります。「結果概要」パネルで CLUSTAL 形式で"整列"下リンクを右クリックし、整列順序を付けて"35.clustal"(図 1)。
  4. BioEdit でアライメント結果ファイルを開きます。
    1. BioEdit のメイン パネルで、「シーケンス」をクリックし、最初のプルダウン メニューで「編集気分」を選択、サブメニュー (図 2) で「残基の編集」をクリックして。
    2. カーソル (選択したシーケンスは黒で表示されます) と線形の左側に突き出たシーケンスを選択し、選択したシーケンス (図 3) を削除する「編集」メニューの下の「削除」アイコンをクリックして。
    3. 選択し最初の MtN3/唾ドメインの右側にある突出のシーケンスを削除し、35 I.fas (図 4) としてトリミングの最初の MtN3/唾ドメインのシーケンスを保存します。同様に、左側と右側の 2 番目の MtN3/唾ドメインのシーケンスを突出を削除し、35 II.fas として保存します。最初と 2 番目の MtN3/唾ドメイン シーケンスはリズム (http://proteinformatics.charite.de/rhythm/inndex.php?site=helix) または TMHMM (http://www.cbs.dtu.dk/services/TMHMM/) を事前に予測します。
  5. メガのファイル 35 I.fas を開き、「整列」が表示されたら] をクリックします。「編集」メニューの下で"Select All"、クリックをクリックして「選択シーケンス」;黒 (図 5) で名前とイチイのシーケンスが選択されます。
    1. クリップボードには、シーケンスをコピーするのには「編集」メニューから「コピー」を選択し、doc ファイルにコピーされたシーケンスを貼り付けます。
    2. Doc ファイルで置き換えるすべて「#」">"、FASTA 形式にそれらを変換する任意の関係のない文字を削除。追加"-私「最初 MtN3/唾ドメイン シーケンスとしてそれらをマークするには、各分類群名終わりに。同じメソッドに続く 2 番目の MtN3/唾ドメイン シーケンスを処理し、追加"-II」各分類群名の後。
  6. FASTA 形式の doc ファイルに最初と 2 番目の MtN3/唾ドメイン配列を結合します。
    1. 再び Clustal オメガに結合されたシーケンスを読み込むし、前述したようにシーケンスを配置します。「35 realigned.clustal"として結果をを保存します。
    2. BioEdit で"35 realigned.clustal"ファイルを開き、整列のシーケンスのどちらかの端 (突出) 凹凸のアミノ酸残基を削除、"35 realigned.fas"としてシーケンスを保存します。いくつかの非標準の文字を保存できないことを警告したときに「はい」をクリックします。

2 系統樹の計算

  1. メガで「35 realigned.fas」を開きます。
    1. 「データ」メニューをクリックしてし"エクスポートの整列"を選択し MrBayes (図 6) 後で使用するための"35.nex"として PAUP 形式 (ネクサス) で配置を保存します。
    2. 一方、メガのメインパネルの「モデル」アイコンをクリックして"を見つける最高 DNA/タンパク質モデル (ML)"を選択し、ポップアップ ウィンドウで「OK」をクリックします。「計算」プロセス (図 7) を検索モデルを開始するをクリックします。新しい進行状況パネルが開きます。このプロセスは続くロード シーケンスとコンピューターのパフォーマンスの複雑さに応じて、いくつかの日には数分です。
      注: を示す表モデルの検索処理が完了したら、結果が開きます (図 8)。最小のビックカメラ スコアは徐々 にビックカメラ スコアの異なるモデルのシリーズに続く最初に表示されます。最小のビックカメラのスコアを持つ最初のモデル"LG + G + F"は、"35 realigned.fas"ファイルに基づいて ML ツリーの推奨モデルです。
  2. メガのメインパネルの「系統」アイコンをクリックして、「構築/テストの最大尤度ツリー」、をクリックして、ポップアップ パネルのクリックして「はい」。新しいウィンドウが開き、異なるが表示する必要があるパラメーターを指定 (図 9)。
    1. まず、系統ボックスのテストのブートス トラップ値を設定します。500 または 1,000 は、ほとんどの場合で十分です。置換モデルの下で切り替えの種類として「アミノ酸」を選択します。置換モデルを選択する目的は、自分の現在の状態3に基づくシーケンス間の真の違いを推定します。
    2. 選択「LG Freqs で。(+F) モデル」(LG + F) モデル/メソッド ボックス。「ガンマ配布」サイト、すなわちレートの変動を記述する (G) を選択率とパターン] ボックスで、.、サイト3のゆっくりと発展する時変更により多くの重量を与えます。[データの種類] ボックスで「完全削除」を選択ハイフンが含まれている列をすべて削除します。
    3. 他のすべてのパラメーターをデフォルトの状態 (図 9) にしてください。これらのパラメーターの指定の後に、計算を開始する「計算」アイコンをクリックします。

3。 系統樹のプレゼンテーション

注: メガを使用して計算したら ML 系統樹が表示されます (図 10)。

  1. ツリー ・ パネルの「ファイル」アイコンのプルダウン メニューで [結果を保存する「現在セッションを保存」選択 (.mas は既定ファイルの種類)。本研究の結果は、"35.mas"として保存されました。ツリー ・ パネル クレードの長さなど多くのパラメーター ツリーのスタイル、ツリー トポロジの分類群名、サイズ、色、フォントが表示され、さまざまなオプションを設定することができます。
  2. 画像アイコンをクリックして最終的な木ファイルを保存別形式で図を保存または写真編集用ソースとしてイメージをコピーします。

4. お菓子と配列アラインメントを用いた SemiSWEETs の関係の解析

注: この手順は、シーケンス解析には必要ありません可能性があります。

  1. 228 真核生物お菓子と Clustal オメガ前述の 57 原核生物 SemiSWEETs を合わせます。Jalview で Clustal オメガに統合され、フォト エディター (図 11) で保存するコピーの配置結果を示すことができます。
    注: の例の配置の α プロテオ バクテリアからいくつかの SemiSWEETs に配置されます甘いシーケンスの最初の MtN3/唾ドメイン メタノバクテリウム綱 (古細菌) から SemiSWEETs 甘いシーケンスの 2 番目の MtN3/唾ドメインと一直線に並ぶに対し。

5 MrBayes 系統樹建設

  1. MrBayes をベイズ推論、MrBayes 実行可能ファイルを開くし、新しいウィンドウで DOS インターフェースが出てくる。最初のステップは、ネクサスのデータファイルを読むことです。入力プロンプトの後「35.nex の実行」(35. nex MrBayes 実行可能ファイルと同じディレクトリに保存するかそれをアップロードする前にファイルの経路を指摘してください).次のリストされた分類群 (図 12) の最後「成功した読み取りマトリックス」メッセージが表示されます。35. nex ファイルが既に準備されてし、メガの保存 (上記 2.1 を参照してください)。
  2. 進化のモデルを設定します。
    1. 指示されたら、入力"prset aamodelpr = fixed(lg);lset 率 = g」。「Lg 電子」と"g"は、メガに設定されている「lg 電子」と"G"のモデルに対応します。モデルを正常に設定するには後に、入力"mcmc nchains 4 ngen を = = 5,000,000"プロンプトの後。使用して、"nchains = 4"エントリ 1 つのコールド チェーンとメトロポリスの結合の 3 つのホット チェーンの総数を示します。"ngen 5,000,000 を ="コールドとホットのチェーンの収束のメトロポリス カップリングの 5,000,000 の世代を実行することを意味します。本研究では 0.01 以下の分割周波数の平均の標準偏差は、ホット、コールド チェーンの収束とみなされました。
    2. Ngen 数プロセスの初めに正確に予想できないし、通常調整が必要注分割周波数の平均の標準偏差の変化による。さらに、収束に ngen 数異なる場合がありますたびに同じデータに基づくプログラムを実行する場合。
  3. 解析を実行:この手順は、入力データの複雑さとコンピューターのパフォーマンスに応じて、いくつかの日に数分から続きます。プリセットの計算を完了すると、プロンプトを尋ねます」解析 (はい/いいえ) 続行しますか?」場合は"no"の後に入力、プロンプト、コンピューティングが停止 (図 13)、それ以外の場合それ続けますさらに世代数を入力すると、計算。計算が完了したとき (分割周波数の平均の標準偏差と < 0.05 または 0.01)、お問い合わせプロンプトの後「いいえ」を入力して、計算停止します。
    注: 0.01 は厳格な基準、0.05 が適度な通常十分です。
  4. サンプルを要約:モデル パラメーター (図 14) のサンプルを要約するプロンプトの後「排水」を入力します。入力"sumt relburnin はい burninfrac を = = 0.25"ツリー サンプルを要約するプロンプトの後。系統発生の木の構造の詳細については、図 15の画面、1 つ示すクレード信頼性および他の示す枝長 ASC II コードで表示される 2 つのツリー図に続いてのように表示されます。同時に、"35.nex.con"という名前のツリー ファイルは自動的に保存されます。
  5. 系統樹のより良いプレゼンテーション、フィグツリー ツール (http://tree.bio.ed.ac.uk/software/figtree/) で"35.nex.con"ツリー ファイルを開く、スタイルまたは結果 (図 16) を表示するサイズを選択またはそれを作るためにフォトエディターで編集も読みやすい。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

系統発生の木は、すべての 35 の甘いシーケンスの最初の MtN3/唾ドメインが 1 つのクレードと別のクレードとしてクラスター化甘いシーケンスの 2 番目の MtN3/唾ドメインとしてクラスター化することを表示します。さらに、お菓子や SemiSWEETs の配置結果表示 α プロテオ バクテリアからいくつかの SemiSWEETs が甘いシーケンスの最初の MtN3/唾ドメインと揃っている 2 番目の MtN3/唾揃えてメタノバクテリウム綱 (古細菌) から SemiSWEETs に対し甘いシーケンスのドメイン。これらの結果は、細菌 SemiSWEET ・始原14進化融合由来のお菓子を含む 2 つの MtN3/唾ドメイン可能性があります一緒にお勧めします。

Figure 1
図 1: 35 推定真核生物お菓子のアラインメントを付けて Clustal オメガを介して"35.clustal"この図の拡大版を表示するのにはここをクリックしてください

Figure 2
図 2: [パスを"35.clustal"Clustal オメガで作成したアラインメントをトリムする BioEdit でこの図の拡大版を表示するのにはここをクリックしてください

Figure 3
図 3: 選択して BioEdit で 35 推定真核生物お菓子の最初の MtN3/唾ドメインのシーケンスの左側で不均一なシーケンスを削除しますこの図の拡大版を表示するのにはここをクリックしてください

Figure 4
図 4: 35 推定の真核生物お菓子 BioEdit での最初の MtN3/唾ドメインのトリミングされたシーケンスこの図の拡大版を表示するのにはここをクリックしてください

Figure 5
図 5: 選択し、メガで 35 推定真核生物お菓子の最初の MtN3/唾ドメインのシーケンスをコピーします。コピーした配列は編集の doc ファイルに貼り付けられます。この図の拡大版を表示するのにはここをクリックしてください

Figure 6
図 6: 後の段階でのベイズ推定」35 realigned.fas""35.nex"(PAUP 形式) 変換しますこの図の拡大版を表示するのにはここをクリックしてください

Figure 7
図 7:"35 realigned.fas"ファイルに基づくメガで最大尤度 (ML) 系統樹構築のための最適置換モデルの探索しますこの図の拡大版を表示するのにはここをクリックしてください

Figure 8
図 8: 最適置換モデルのテーブルには"35 realigned.fas"ファイルに基づいて ML ツリーの計算この図の拡大版を表示するのにはここをクリックしてください

Figure 9
図 9:"35 realigned.fas"メガでの最適置換モデルに基づく ML ツリー計算のパラメーターを指定しますこの図の拡大版を表示するのにはここをクリックしてください

Figure 10
図 10:"35 realigned.fas"に基づくメガで構築された元の ML ツリー。この段階で図形のスタイル、サイズ、色などの多くのオプション、あります。この図の拡大版を表示するのにはここをクリックしてください

Figure 11
図 11: 228 真核生物のお菓子と Clustal オメガ 57 原 SemiSWEETs 配置します。結果は、Clustal オメガに統合 Jalview で示されていた。配置、メタノバクテリウム綱 (古細菌) から SemiSWEETs が甘いシーケンスの 2 番目の MtN3/唾ドメインに整列したに対し、α プロテオ バクテリアからいくつかの SemiSWEETs された甘いシーケンスの最初の MtN3/唾ドメインに配置されます。この図の拡大版を表示するのにはここをクリックしてください

Figure 12
図 12: MrBayes DOS ウィンドウで"35.nex"ファイルをロードします。全体的な結果を示すために類似していたコンテンツは、図の長さを減らすために削除されました。この図の拡大版を表示するのにはここをクリックしてください

Figure 13
図 13: MrBayes を使用して"35.nex"ファイルの計算後、画面に表示される情報。全体の結果を表示するには、類似していたコンテンツは、図の長さを減らすために削除されました。この図の拡大版を表示するのにはここをクリックしてください

Figure 14
図 14:"35.nex"ファイルをモデル パラメーターのサンプルを要約します。この図の拡大版を表示するのには、ここをクリックしてください。この図の拡大版を表示するのにはここをクリックしてください

Figure 15
図 15:"35.nex"ファイルのツリー サンプルを要約します。全体の結果を表示するには、類似していたコンテンツは、図の長さを減らすために削除されました。この図の拡大版を表示するのにはここをクリックしてください

Figure 16
図 16: フィグツリーによって表示される"35.nex.con"の系統樹.この図の拡大版を表示するのにはここをクリックしてください

Subscription Required. Please recommend JoVE to your librarian.

Discussion

ヌクレオチドまたはアミノ酸シーケンス8に基づいて系統樹を作ることは生物学的研究にますます人気になっています。一般的に、配列アラインメント、適切なメソッドやアルゴリズムとアラインメントの評価と系統樹として計算結果の可視化を含む練習の 3 つの重要な段階があります。提示の研究では、アライメントの 3 つのラウンドを行った: 最初に、最初と 2 番目の MtN3/唾ドメインを含むタンパク質甘い一直線に並んだ;第二に、それぞれ独立した分類群としてお菓子の個別 MtN3/唾ドメイン系列の収集され、一緒に整列そして最終的に、少し甘味のあるシーケンス、シーケンスを甘いが共同で整列します。アライメントの 1 つだけのラウンドは、系統発生ツリーの構築に通常必要です。

予備の段階で相同の配列を NCBI や他のデータベースからダウンロードできます。これらのダウンロード シーケンスも注釈がない場合に上映される必要があります。最初と 2 番目のステージに配置し、計算を開始できませんシーケンスの形式が正しくない場合。たとえば、Clustal オメガは FASTA 形式のシーケンス ファイルから任意の出発が拒否されます。計算の段階で両方のアミノ酸またはヌクレオチドとハイフンを含むシーケンスの長さはメガで評価される前に等しくなるように必要な注意してください。

メソッドおよび利用可能なツリーの構築のためのモデルの富にもかかわらずそれらのどれもが誰にでもできます。堅牢かつ説得力のある結果、異なるアルゴリズムやモデルを使用して同じデータ15を評価する際に相互に矛盾が。最尤法でツリー トポロジの信頼性は、主として各クレード; のブートス トラップ値に依存します。ブートス トラップ値 70 以上の一般に信頼できるものとしてみなされます。本研究で、最初の MtN3/唾ドメインのシーケンスのすべてはブートス トラップ値が 83 の大クレードとしてクラスター化します。すべて、2 番目 MtN3/唾ドメインのシーケンスを含む他のクレードの値はのみ 6 (図 10) しかし、だった。ツリー アーキテクチャを確認するには、MrBayes ML よりも完全に別の方法で16を採用しは、イチイの関係を分析する使用されました。MrBayes から得られる最初および 2 番目のドメインのクレードの事後確率16それぞれ 100 と、68 であった (図 16)。

ML と MrBayes 計算の別の制限は両方が実行に時間がかかります。計算のパフォーマンスが向上し、17,18を高速化するマルチコア プロセッサ、グラフィック プロセッシング ユニット (GPU) を持つコンピューターを使用してお勧めします。MrBayes の操作は、個別のグラフィックス カードと適切な CUDA ドライバー コンピューター大幅尤度計算11をスピードアップできます。

系統樹計算に適切なモデルを選択するは、経験の少ない人のため困難です。この点では、メガは、候補モデルのビックカメラのスコアを比較することで最適なモデルを見つける簡単な方法を提供します。さらに、最近アップグレードされたメガ 6.0 は筋肉、Clustal W10など使用すると非常に便利であるいくつかのシーケンス配置ツールを統合します。また、シーケンスの編集と系統樹構築関数の両方を提供します。これらの機能は、部分的に説明する、なぜこのソフトウェアは計算の分子進化の分野でとても人気。MrBayes、このツールの重要な利点はそれが一緒に混合データ型を処理できます (e.g。、形態学的および分子データ)11、とこのように、結果はより包括的な。

結論として、本研究は、進化の過程で複製や遺伝子の水平伝播後核融合など複雑な変化を受けている蛋白質符号化の遺伝子の分子的起源を解析するメソッドを提供します。うまくいけばより多くの結果は、系統進化の研究分野での広範なアプリケーションで明らかにされます。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

著者が明らかに何もありません。

Acknowledgments

この作品は、江蘇省、中国 (BK20151424) の自然科学基金、中国三峡大学 (2016KBC04)、バイオ テクノロジー研究センター中国の国家自然科学基金 (31371596) によって支えられました。

Materials

Name Company Catalog Number Comments
Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group - Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4 GB memory, Core 2 or above CPU. Windows 7, Windows 10

DOWNLOAD MATERIALS LIST

References

  1. Nei, M., Kumar, S. Molecular Evolution and Phylogenetics. Oxford University Press. Oxford. (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics