Summary
ITS2のデータベースを同時に配列と内部転写スペーサ2の二次構造を考慮した系統推定のためのワークベンチです。これは正確な注釈、構造予測、複数の配列構造体のアライメントと高速ツリーの計算とデータ収集が含まれています。一言で言えば、このワークベンチは、数回のクリックに最初の系統解析を簡素化します。
Abstract
内部転写スペーサー2(ITS2)は二十年以上のための系統マーカーとして使用されています。 ITS2の研究は主に非常に可変ITS2シーケンスに焦点を当てたとして、それだけで低レベルの系統学にこのマーカーを閉じ込めた。しかし、ITS2配列とその高度に保存された二次構造の組み合わせは、分解能1系統を向上させ、種の区切り2月8日を含む複数の分類学上のランクで系統推定することができます。
ITS2データベース9は、正確にreannotated NCBI GenBankの11 10から内部転写スペーサー2配列の網羅的なデータセットを示します。プロファイル隠れマルコフモデル(HMM)による注釈に続いて、各配列の二次構造が予測されています。最初に、それは正しい、4つのらせんコンフォメーション倍に12に基づいて最小エネルギー(直接倍)が結果かどうかをテストされています。このようなケースでない場合は、構造がホモロジーモデリング13で予測した。ホモロジーモデリングでは、既に知られている二次構造は、別のITS2の配列に転送され、その二次構造は、ダイレクト倍で正しく折り畳むことができませんでした。
ITS2データベースは、ストレージ用にデータベースおよびITS2配列構造の検索だけではありません。また、注釈、構造予測、モチーフ検出と組み合わせた配列の構造情報のBLAST 14検索を含む、独自のITS2の配列を処理するためにいくつかのツールを提供しています。また、4SALE 15,16のトリミングされたバージョンを統合し、複数の配列構造体のアライメントの計算、18木の再建に参加する隣人のために17 ProfDistS。彼らは一緒に配列と二次構造に基づいて、系統への配列の最初のセットから一貫した解析パイプラインを形成します。
一言で言えば、このワークベンチは、最初の系統解析を簡素化数回のマウスクリック、さらに包括的な大規模解析のためのツールやデータを提供している。
Protocol
1。 ITS2配列の正しい注釈
- ここITS2データベース系統のワークベンチにアクセスhttp://its2.bioapps.biozentrum.uni-wuerzburg.deを
- セクションにある "注釈"アイコンをクリックして、分析を開始する "ツール"をその後、ウェブサイトの上部にあるシーケンスエディタにシーケンスを入力するか貼り付けます。シーケンスエディタは自動的にあなたのITS2配列が有効であるかどうか、チェックします。
- あなたのシーケンスに適したHMMモデル(植物例えば緑色植物亜界)を選択します。
- クリックしてプロセスを開始し、 "注釈"を
- "ハイブリダイズ"のアイコン上にマウスを移動することで、HMMアノテーションの精度の確認として、5.8Sおよび28S rRNAハイブリッドのイメージを表示することができます。
- 二次構造予測のあなたの方法を選択して、結果ITS2配列の緑色のプラス記号をクリックしてください。知られているtemplatなく、構造を予測するeは、をクリックして "構造を予測します。"あなたはホモロジーモデリングするための独自のテンプレートを使用する場合は、 "モデルの構造"をクリックします。
2。二次構造予測
- 予測する
- 注釈付きのITS2シーケンスは自動的にシーケンスエディタに貼り付けられます。
- デフォルトの設定で二次構造予測を開始するには、 "構造を予測する"ボタンをクリックしてください。
- 緑色のプラス記号をクリックして、データ·プールにモデル化された二次構造を含む結果ITS2シーケンスを保存してから、 "プールに追加します。"また、ドラッグアンドドロップ(図1)を介してデータプールに追加することができます。
- シーケンスを直接折り畳むことができなかった場合は、ホモロジーモデリングの最良の結果が表示されます。ドラッグ·アンド·データ·プールへのドロップで最も適した配列構造を保存します。また、をクリックし、右クリックでデータ·プールに配列構造を保存し、 "プールに追加します。"
- カスタムモデル
- タイプまたはペースト上位シーケンスエディタに1つまたは複数のテンプレート(既知の構造を持つ)。
- 型または低いシーケンスエディタにつまたは複数の標的配列(構造体なし)貼り付けます。
- デフォルトの設定でホモロジーモデリングを開始するには、 "最善のテンプレート(s)を予測する"をクリックしてください。
- 最高のテンプレートとターゲットの組み合わせは、結果リストに表示されます。
- ドラッグ·アンド·データ·プールへのドロップを介して、または右クリックし、をクリックすることにより、どちらかお好みのモデル化されたシーケンス構造(s)を保存する "プールに追加します。"
3。モチーフ検索
- ウェブサイトの上部にあるシーケンスエディタにあなたのクエリシーケンス(複数可)を入力するか貼り付けます。
- 正しいHMMモデル(植物例えば緑色植物亜界)を選択します。 3.3。プロセスを開始するには、 "モチーフ検索"をクリックします。
- 強調表示されたモチーフとITS2の配列はillustraです。ウェブサイトの下部にあるテッド。
- 二次構造で強調表示されたモチーフを表示するには、シーケンスヘッダの横にあるアイコンをクリックします。
4。検索とブラウズ
- 検索
- タイプ分類群名またはウェブサイトの上部にある検索フィールドにGenBankの識別子(GI)のいずれかです。
- 分類群名による検索が表示されるライブ検索ボックスでサポートされています。
- あなたのクエリをカンマで区切って複数の検索を実行することができます。
- 検索を実行するには、 "検索"ボタンをクリックします。
- あなたの結果は新しいタブに表示されて表示されます。
- 特定の列に従って結果をソートする列名をクリックします。また、列メニューでお好みの列を追加または削除することができます。列メニューが列名内で表示される矢印アイコンをクリックするだけで入力することができます。
- 配列構造の詳細を表示するには、 "詳細表示"をクリックします。 </ LI>
- ドラッグ·アンド·データ·プールへのドロップを介して、または右クリックし、をクリックすることにより、どちらかお好みの配列構造(s)を保存する "プールに追加します。"
- 外部ファイルに結果を保存するには、 "選択範囲を保存"またはをクリックして "すべてを保存します。"
- ブラウズ
- ウェブサイトの左側にツリー状の構造をナビゲートすることによりITS2データベースを閲覧しています。
- 1つ下のレベルに分類を表示するには、プラス記号をクリックします。
- 分類群のそれぞれの配列構造を含む新しいタブを開くには、分類群名をクリックしてください。
- シーケンス構造のペアの詳細を表示するには、 "詳細表示"をクリックします。
- ドラッグ·アンド·データ·プールへのドロップを介して、または右クリックし、をクリックすることにより、どちらかお好みの配列構造(s)を保存する "プールに追加します。"
- 外部ファイルに結果を保存するには、 "選択範囲を保存"またはをクリックして "すべてを保存します。"
5。 ITS2ブラスト
- 型またはシーケンスエディタにつまたは複数のクエリシーケンスを貼り付けます。あなたのシーケンスは、プレーンのヌクレオチド配列または配列構造体のペアがあります。また、一つの配列の下にいくつかの二次構造を入力することができます。チェックボックスをオンにして、これらの構造は、その後、個々のクエリとして使用される "XXFASTAシーケンスをシリアル化"。
- デフォルト設定を使用してBLASTを起動するには、をクリックし、 "ブラスト"。一般的なBLASTNまたはITS2の配列構造のBLASTのいずれか、クエリの性質に応じて、実行されます。
- サブタブが表示されるタブの "BLASTの結果、"同様に実行される検索の概要内の各クエリのシーケンス用に開かれます。
- 計算されたBLASTアラインメントを表示するには、 "表示アラインメント"をクリックします。
- ドラッグ·アンド·データ·プールへのドロップを介して、または右クリックし、をクリックすることにより、どちらかお好みのBLASTヒットを保存する "プールに追加します。"
- 外部ファイルに結果を保存するには、 "保存の選択をクリックしてください"または"すべてを保存します。 "
6。複数のシーケンス構造アライメント
- 右横にプール内のシーケンス番号に "データセットの管理"をクリックして、データプールを見て、その後虫眼鏡のシンボル。また、ウェブサイトの左下にあるデータプール記号をクリックすることができます。
- その詳細を表示するには、データプール内のシーケンス構造のペアをクリックします。
- あなたのプール内のすべての配列構造のペアを複数の配列構造体のアラインメントを作成し、次に "データ分析"をクリックして "シーケンス&構造"
- 今、あなたはあなたのアライメントのグラフィックモードを選択するよう求められます。あなたのアラインメントはわずかシーケンスが含まれている場合は、 "いいえ"をクリックして、スリムモードを断るそうでなければクリックして、スリムなグラフィックモードを選択して "はい。"
- しばらくすると、あなたのアラインメントは、新しいタブ(図2)に示されています。また、それは自動的にデータ·プールに保存されます。
- 自分を保存するには外部ファイルの配置は、 "配置を保存します"をクリックしてください
7。系統樹
- あなたのマルチプルアライメントのツリーを結合する配列構造ベースの隣人を計算するには、 "分析データセット"をクリックし、 "隣人への参加。"
- 結果ツリーは、新しいタブ(図3)に示されています。
- スクロールバーで自由にツリーを拡張する "ズーム木。"
- Rerootノードまたはツリーの葉の上にクリックしてからしてツリー "このノードでReroot。"
- あなたはデータプールからの分類群を削除する場合は、葉の上にクリックして "プールからこのノードを削除します。"今、あなたは、還元分類群のサンプリングと再計算して配置し、ツリーをすることができます。
- 外部NEWICKファイルへの分析の最終結果として系統樹を保存する "保存木"をクリックします。
8。その他のソフトウェア
- お知らせの追加を見つけるための "ツール" - "このウェブサイトについて"をクリックしてくださいスタンドアロンツール4SALEとProfDistS約ation。
- アライメントとITS2のデータベースのWebインタフェースで提供される近隣結合機能のほかに、あなたは今、いくつかの新しい機能が、代償ベースの変更(CBCs)に基づいて、例えば、種の区切りにアクセスできます。
9。代表的な結果
上記のようにワークフローが正常にいくつかのオープンアクセスの調査3,4に適用されている。例は以下のリンクを介して表示することができます。
- http://www.plosone.org/article/info%3Adoi%の2F10.1371%2Fjournal.pone.0016931
- http://www.biomedcentral.com/1756-0500/3/320
これらの大規模研究で、我々は緑藻の系統と同様にHypnales(コケ植物門)Wを解決することができましたi番目の高解像度。両方のケースでは、網羅的な分類群のサンプリングは、自動的に4SALE 15,16に沿ったITS2データベース9から収集され、最後に系統樹にProfDistS 17によって処理されます。これらすべての手順では、配列と構造情報が同時に使用されました。系統バックボーンのためのブートストラップのサポートはProfDistSのスタンドアロンバージョンで使用可能なプロファイルの近隣への参加(PNJ)19を使用して達成された。
分類群のサンプリングは、複数の配列構造体のアラインメント、最終的には系統樹の計算:配列構造のペアの小さいセットについては、図1から3は、直接新しいITS2データベース·ワークベンチでは、この自動化されたワークフロー5の主要な手順を説明します。
図1:ドラッグアンドドロップごとに分類群のサンプリング。任意の時間シーケンスまたはシーケンスstructurで eのペアは、ドラッグアンドドロップを介して、例えば、データプールに追加することができます。ここで、配列構造は、二次構造予測の後にドラッグアンドドロップを使用して追加されます。青い楕円は、配列構造は、データプールにドロップされたエリアをマークします。 この画像のフルサイズバージョンを表示するには、ここをクリックしてください。
図2:フルグラフィックモードでの複数の配列構造体のアラインメント。データプール内のいくつかのシーケンスの場合、フルグラフィックモードが選ばれました。塩基としては、着色されている。塩基対は、一塩基または塩基対のブラケットをクリックして、赤丸で強調表示することができます。 この画像のフルサイズバージョンを表示するには、ここをクリックしてください。
3.JPGの "alt ="図3 "/>
図3シーケンス構造の近隣には、ツリーに参加する。 7分類群に複数の配列構造体のアライメントの計算された自由に拡張可能なツリーがNEWICK形式で保存することができます。
Discussion
ITS2データベースは、内部転写スペーサ2配列構造に基づく系統学のための完全な、完全に機能ベンチです。ウェブサイトは非常に高速かつ直感的に操作することができます。 ARB 20またはMobyle 21のような他のウェブベースの系統のベンチだけ配列および/ またはコンセンサス構造情報上で動作することができますが、ITS2データベース9は、同時にそれぞれの分類群のための配列と個人の二次構造を考慮します。ただし、Webサーバの計算能力に制限があるため、それは非常に大規模なデータセットについて、それぞれ4SALE 15,16とProfDistS 17、18の計算に参加する複数のアラインメントと近隣のスタンドアロンツールを使用することをお勧めします。基本的なITS2の配列構造の系統ワークフロー5の横に、これらのツールは、ブートストラップ複製さを計算するように、(PNJ)19または正貨に参加プロファイル近隣のいくつかの追加機能を備えていますの区切りは代償ベースの変更(CBCs 8)に基づいています。ダウンロードおよび詳細については、 "ツール"セクション - 彼らは "このサイトについて"を介してアクセスすることができます。 4SALEとProfDistSを使用するには、常に正しい形式にファイルを持参する必要があります。 4SALEで処理されるようにサンプリング分類群は、結末を持っている必要があります。FASTAまたはTXT、ProfDistSの入力として配列構造体のアラインメント一方。xfastaで終了する必要があります。
我々は現在、ITS2データベースなどの関連ツールでの系統樹の再構築のための代替メソッドを実装している。したがって、配列構造をベースに最大節約22および/ または最大尤度23のようなメソッドは、将来的にアクセスできるようになります。
Disclosures
利害の衝突が宣言されません。
Acknowledgments
我々は、心から豊かな貴重なフィードバックをITS2グループ、バイオセンター、ヴュルツブルク大学、感謝します。資金調達のために、我々はまた、ドイツ学術振興(助成Mu-2831/1-1 DFG)に感謝。
Materials
Name | Company | Catalog Number | Comments |
Internet access | Preferably high-speed | ||
ITS2 Database9 | University of Warzburg | Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de | |
Software: 4SALE15,16 | University of Warzburg | Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/ | |
Software: ProfDistS17 | University of Warzburg | Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/ |
References
- Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
- Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
- Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
- Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
- Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
- Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
- Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
- Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
- Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
- Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
- Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
- Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
- Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
- Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
- Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
- Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE - A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
- Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
- Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
- Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
- Ludwig, W. olfgang ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
- Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
- Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
- Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).