March 12th, 2012
ITS2のデータベースを同時に配列と内部転写スペーサ2の二次構造を考慮した系統推定のためのワークベンチです。これは正確な注釈、構造予測、複数の配列構造体のアライメントと高速ツリーの計算とデータ収集が含まれています。一言で言えば、このワークベンチは、数回のクリックに最初の系統解析を簡素化します。
内部転写スペーサー2リボソーム遺伝子またはI TS 2は、分子系統学における最も重要なマーカーの1つです。過去20年間の研究は、主に系統発生の再構築のためのI Tsの2つの配列を利用することに焦点を当ててきました。しかし、I TS 2の二次構造は、いくつかの理由により、系統発生推論の分野でますます使用されています。
二次構造解析は、このマーカーの分類学的適用性を拡張しますが、急速に進化し、したがって非常に変動しやすいI TS 2配列は、主に種レベル以下の系統解析に適しています。構造情報を追加すると、その4つの特性essからなる2つの二次構造が強く保存されたItsにより、より高い分類学的ランクで同時に分析が可能になります。したがって、二次構造解析の結果は、一次配列から得られる系統分解を向上させることができます。
ようこそ、親愛なる同僚の皆さん、私の名前はマティアス・ヴォルフです。私は約8年間、I ts two proofで働いています。私はここ、ドイツのヴュルツブルク大学のバイオセンターにあるバイオインフォマティクス学科で働いています。
今日は、I ts twoデータベースの使用方法に関する小さな動画をご紹介したいと思います。こんにちは、yチューです。この映画の理由は、I Ts twoデータベースが実際にはストレージ用のデータベースであるだけでなく、系統解析を改善するための多くのツールを提供しているからです。
このムービーでは、これらのツールの使用方法と、これらすべてのツールを接続する方法を紹介したいと思います。そうです。I Ts 2つの配列の描写は、構造予測にとって非常に重要です。そのため、非表示のマークオフ モデルベース注釈の Web ベースのインターフェイスが実装されました。
I Ts 2つのシーケンスの正しい注釈を得るために、Webサイトの上部にあるシーケンスエディタに貼り付けることができます。これは、プランのシーケンスの例を読み込むことで示しています。シーケンスエディタ自体が、I TS 2つのシーケンスが有効かどうかをチェックし、エラーメッセージを出力します。
たとえば、PAC以外の文字を使用する場合 正しいHMMを選択した後、プログラムによって識別できる各5.8 sと28 SRNAの注釈をクリックしてプロセスを開始できます。これは削除され、間に位置していた正しく注釈が付けられたI ts 2つのシーケンスが残ります。その結果、区切られたI TSの2つの配列と、5.8 sと28 s-r-r-n-aの予測されたハイブリッドが示されました。新たに保持されたIts2配列のアノテーション後のHMMアノテーション精度の確認として、二次構造は2つの手段で決定することができる。
最初の予測は、データベースのシーケンスと構造の完全なセットをテンプレートとしてホモロジーモデリングによって達成できます。あなたの注釈の構造を予測するには、その2つのシーケンスは、構造の予測をクリックします。右の2つのシーケンスが典型的なその2つの二次構造に直接折りたたむことができれば、結果はすぐに描かれます。
これで、シーケンス構造をさらに処理するためのいくつかのオプション(データプールへの追加など)から選択できます。ここで、2つのシーケンスを直接折りたたむことができない場合は、データベースに対して一斉検索が実行されます。結果のページには、テンプレートとしての各プラスチックの相同性モデリングを含む、最高のブラストヒットが表示されます。
プラス記号の詳細をクリックすると、選択したシーケンス構造のペアを選択し、トラックアンドドロップまたは右クリックのコンテキストメニューを使用してデータプールに追加できます。2 つ目のアプローチは、1 つまたは複数のシーケンスを手動で入力し、その二次構造をテンプレートとして使用して、最適な二次構造をクエリシーケンスに転送する方法です。これは、複数のテンプレートのサンプルファイルを読み込むことで示されています。
「Predict best templates」をクリックすると、デフォルト設定でホモロジー・モデリングが実行されます。ホモロジーモデリングプログラムは、すべての構造に対してすべてを計算し、最適なクエリテンプレートの組み合わせを表示します。結果の表では、どのテンプレートがセカンダリ構造を正常に使用して 1 つまたは複数のクエリ シーケンスをモデル化できたかを確認できます。
ここでも、完全なホモロジーモデリングアプローチはI TS 2から独立しているため、プラス記号をクリックすることで結果の詳細を開くことができます。これは、既知の構造を持つ相同分子が与えられた任意のRNAの二次構造を予測するために使用できます。また、結果のシーケンス構造のペアは、ドラッグとtrごとに、または右クリックで開くコンテキストメニューからデータプールに追加できます。
全体的な構造に加えて、第3らせんの頂点に先行するA-U-G-G-U配列や、第2らせんの不一致のペリンピラミッドなどの保存された動機が、I TSの2つについて説明されています。このUUのミスマッチは、ヘリックス2の左側とヘリックス2とヘリックス3の間の右側に1つ、さらにトリプルAヌクレオチドを持つ2つの動機に囲まれています。これらの一連の動機をhmsに変換したので、私たちは今、これらの動機の識別を興味深い順序で提供します。
これらの動機を検索するには、検索フィールドにクエリシーケンスを入力し、正しいモデルを選択します。これも、プランの例ファイルを読み込むことで示されます。計算を開始するには、motive searchをクリックします。
2つの動機が注釈が付けられ、クエリシーケンスで強調表示されていることがわかりました。I tss two データベースから I ts 2 つのシーケンス構造のペアを取り出す方法の 1 つが、検索機能です。これにより、ユーザーは分類群名またはgenバンク識別子のいずれかで配列構造を検索できます。
GenBank識別子で配列構造を検索するには、検索フィールドにGIを入力し、[検索]をクリックします。ヒットのリストが新しいタブに表示されます。シーケンス構造の詳細を表示するには、[詳細を表示]をクリックします。
また、ドラッグ&ドロップごとに「シーケンス構造を表示」をクリックすることで、タブ内のすべてのヒットのシーケンスS方向を表示するか、右クリックしてコンテキストメニューから選択したシーケンス構造をデータプールに追加することができます。giによる配列構造ペアの検索に加えて、検索フィールドに分類群名を入力することができ、これは表示されるライブ検索ボックスでサポートされています。新しいタブが表示され、すべてのヒットがリストされたら、以前と同じ機能にアクセスできます。
たとえば、ドラッグ アンド ドロップごとにデータ プールに選択を追加します。データベースからシーケンス構造のペアを取得する 2 つ目の方法は、ブラウズ機能です。ここでは、テキストが並べ替えられています。
NCBIの分類データベースによると、データはツリー状の構造を通じてアクセスできます。ウェブサイトの左側にあります。プラス記号をクリックすると、1つ下のテキストを表示できます。
分類群名をクリックすると、各シーケンス構造、分類群のペアを含む新しいタブが開きます。CEMバンク識別子または種情報を持つ配列および構造の検索に加えて、I Ts twoデータベースはブラストベースの検索も提供します。しかし、傑出したブラスト手順では、遠縁のものを特定できないことがよくあります。
I ts 2つの配列は、配列の発散が高いためです。この障害を克服するために、相同性探索のために、高度に保存された構造に関する情報を含む配列および構造ベースのブラスト探索を実装しました。これは、配列構造を12文字の疑似タンパク質配列に翻訳することによって行われます。
したがって、種のサンプリングは、関心のある任意のシーケンスから始まり、カバーします。幅広い分類範囲は、一斉検索と同じくらい簡単になりました。一斉検索を実行するには、クエリシーケンスをシーケンスエディタに入力します。
クエリ配列が構造のない単純なヌクレオチド配列である場合、共通のblast nアルゴリズムが、その二次構造を含む配列に使用されます。Web インターフェイスは、I Ts 2 ブラスト アルゴリズムを使用します。「ブラスト」をクリックしてプロセスを開始します。
しばらくすると、ブラストヒットが新しいタップにリストされます。ここでは、クエリ シーケンスごとに 1 回のタップが表示されます。「アラインメントを表示」をクリックすると、以前と同様に石膏のアラインメントをスクロールして、選択した配列構造のペアを選択してデータプールに入れることができます。
ITS 2 データベースでの作業中に、データ プールが複数のシーケンス構造でいっぱいになっている可能性があります。いつでもデータプールにアクセスして、そのコンテンツを表示できます。解析の次のステップは、複数のシーケンス構造のアラインメントです。
「データセットの分析」をクリックし、「シーケンスと構造」をクリックして、シーケンス構造のアラインメントを実行します。次に、配置のグラフィックモードを選択するように求められます。シーケンスのセットが多い場合は、スリムバージョンを選択することをお勧めします。
データプールにはいくつかのシーケンス構造しか含まれていないため、フルグラフィックモードを選択します。計算が完了すると、アラインメントがデータプールに追加されます。ベースペアの一方の側をハイライトすると、対応するペアも自動的にハイライトされます。
最後に、安全な位置合わせをクリックすることで、位置合わせを安全にすることができます。配列構造のアラインメントの品質に満足したら、データセットの分析をクリックし、次に「隣接」をクリックして、系統連鎖結合ツリーを計算できます。結果のツリーを結合すると、新しいタブに表示されます。
スクロールバーを使用してツリーを自由にスケーリングし、ツリーの任意のノードまたはリーフをクリックしてツリーを再ルーティングし、このノードで再ルーティングできます。データプールから分類群を削除する場合は、リーフをクリックして選択します。このノードをプールから削除します。
これで、安全なツリーをクリックするだけで、分類群のサンプリングを減らして、アライメントとツリーを再計算できます。系統樹をNU形式で保存できます。このウェブサイトについてをクリックし、次にツールをクリックして、販売およびプロ向けのスタンドアロンツールに関する追加情報を見つけてください。
I Ts two データベース Web インターフェイスによって提供される隣接結合機能での整列に加えて、補償ベースの変更に基づく種 Del 制限など、いくつかの新しい機能にアクセスできるようになりました。最後の数分で、系統解析を改善する方法をいくつかご紹介したいと思います。I Ts two データベースからデータを収集し、それらを 4 つのセルに整列させ、最終的に Pro で木を計算する方法を示しました これらすべてのステップ S.In、シーケンスだけでなく、シーケンスと構造も考慮しました。もちろん。
私たちの小さな映画と重い木の建物を楽しんでいただけたでしょうか。おやすみなさい。
ITS2 データベースは、内部転写間隔2(ITS2)の配列データと二次構造情報を含む系統発生解析のための包括的なツールとして機能します。正確なアノテーション、構造予測、アラインメントを促進し、系統発生解析プロセスを効率化します。