Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

ゲノムワイドな探索とグレープバインで ATL E3 ユビキチンリ ガーゼ遺伝子家族の表現メタ分析のための包括的なワークフロー

Published: December 22, 2017 doi: 10.3791/56626
* These authors contributed equally

Summary

この記事は、同定とLevadura でシロイヌナズナ Tóxicos (ATL) E3 ユビキチンリ ガーゼの家族に適用されるグレイプバインの遺伝子ファミリーの解析手順を説明します。

Abstract

家族の遺伝子の分類と命名はできる符号化された蛋白質の多様性の説明と家族の家族機能シーケンス モチーフのまたは特定の存在など、いくつかの機能に基づく予測に大きく貢献します。翻訳後修飾と異なる条件での家族のメンバーの表現のプロフィールのためのサイト。この作品では、遺伝子家族特性評価のための詳しいプロトコルについて説明します。ここでは、プロシージャは、グレイプバインのLevadura でシロイヌナズナ Tóxicos (ATL) E3 ユビキチンリ ガーゼ家族の評価に適用されます。メソッドは、家族、遺伝子の局在化、構造、および重複の特性、保存されている蛋白質のモチーフの解析、タンパク質の局在化とリン酸化部位の予測の網羅的同定と同様遺伝子発現プロファイリング異なる dataset の家族間で。実験目的によってそれ以上の分析に拡張すること、そのようなプロシージャはゲノムのデータが利用可能なすべての植物種の遺伝子家族に適用できる、興味深い候補者を識別するために貴重な情報を提供します機能の研究、植物の環境適応の分子メカニズムに洞察力を与えます。

Introduction

最後の十年の間に、ブドウのゲノムの多くの研究きました。ブドウは、果実の発育と生物的・非生物的ストレスに対する樹木の反応研究のためのモデルとなっている認識された経済的に関連する作物です。このコンテキストでは、2007年1ヴィティス ・ ヴィニヘラ品種 PN40024 ゲノムと 2011年2内の更新されたバージョンのリリースは、"Omics"-スケール データの急速な蓄積と高スループット研究のバーストをもたらした。公開されたシーケンス データに基づいて、(一般に節約されたモチーフ、構造や機能の類似性と進化の関係を共有するタンパク質から成る) のある特定の遺伝子家族の包括的な分析を実行できるを明らかにする、分子機能と進化、遺伝子発現プロファイル。これらの分析は、遺伝子ファミリーがゲノム全体のレベルでの生理学的プロセスを制御する方法を理解することに貢献できます。

プラントのライフ サイクルの多くの側面は、規則的な細胞プロセスを確保するため売り上げ高は微調整を必要とする主要タンパク質のユビキチンを介した分解によって規制されています。重要なユビキチンを介した分解プロセスのコンポーネント、E3 ユビキチンリ ガーゼ、特定のターゲット3の採用により、システムの柔軟性のために責任があります。したがって、これらの酵素は、シロイヌナズナのゲノム4、特定の標的タンパク質のユビキチン化の演技各 E3 ユビキチンリ ガーゼで予測した約 1,400 E3 リガーゼ エンコーディング遺伝子を持つ巨大な遺伝子家族を表しています。植物の細胞の調節において基質特異的ユビキチン化の重要性にもかかわらずユビキチン経路の規制方法について知られている少しといくつかのケースでのみ標的タンパク質が同定されています。このような特異性と調節のメカニズムを解読するのに依存している最初同定と解析、特に、システムのさまざまなコンポーネントの E3 リガーゼ。ユビキチンリ ガーゼの間で ATL 亜科はシロイヌナズナリング H2 指ドメイン5,6、防衛およびホルモンの応答7で役割を果たしてそれらのいくつかの表示で識別された 91 のメンバーによって特徴付けられます。

新しい遺伝子家族のメンバーを定義する最初の重要なステップは、コンセンサス モチーフ、キー ドメイン蛋白質シーケンスの特性など、家族の機能の正確な定義です。確かに、高炉解析に基づくすべての遺伝子家族のメンバーの信頼性の高い検索には、いくつかの必須の順序特性は、特定のタンパク質ドメインのタンパク質機能/活性タンパク質の署名としての責任が必要です。これは、他の植物種の同じ遺伝子ファミリーの前の評価によって促進されるまたは推定一般的なシーケンスを分離する別の植物種で同じファミリーに属する別の遺伝子を分析することによって達成できます。家族付けることも、個別に指定された植物種の国際コンソーシアムによって解決一般的なルールに従います。グレープバインには、例えば、このような手順にさらされてV. viniferaa を含む系統樹の構築を確立するブドウ遺伝子アノテーション (sNCGGa) の超命名委員会の勧告遺伝子の注釈を許可する遺伝子家族のメンバーはヌクレオチド シーケンス8に基づきます。

家族と遺伝子重複調査の染色体の局在は、全ゲノムまたはタンデム重複遺伝子の存在を強調表示できます。このような情報はそれ機能的冗長性を表示したり、さまざまな状況、すなわち、非機能化、新機能、またはサブ機能化9を明らかにするので推定の遺伝子の機能を解明するために有用であります。両方ネオ- とサブ-functionalization は、遺伝的の目新しさは、新しい細胞成分を植物環境10の変化に適応を作成する重要なイベント。特に、遺伝子の重複と新しい遺伝子の生産されたブドウのゲノムの進化の過程で非常に頻繁に、グレイプバインの近位とタンデム重複から新しく形成された遺伝子が新しいを生成する可能性が高い関数11

遺伝子家族機能の解読においてもう一つ重要な要因は、トランスクリプトームのプロファイルです。トランスクリプトーム データの膨大な量にアクセス権を与えるパブリック データベースの可用性は、大規模なインシリコ発現解析を用いた遺伝子家族のメンバーに推定する機能を割り当てる従って悪用できます。確かに、いくつかの遺伝子が特定の植物器官または一定応力に対する応答の特異な表現を定義済みの条件に対応するタンパク質の推定の役割に関するいくつかのヒントを与えるでき、可能性についての仮説を応援しますさまざまな課題に対応するため重複遺伝子のサブ機能化。その目的のための複数のデータセットを考慮することが重要です: これらはすでに利用可能な遺伝子式マトリックス、グレープバイン器官の発達段階12ゲノム ・ トランスクリプトームのアトラスなどをすることができますまたはアドホックで構築することができます定義応力を受ける特定の植物種のためのトランスクリプトームのデータセットを取得しています。また、単純なアプローチは、2 つの行列を使用して、1 つはペアの類似性データ、他の 1 つのペアの共発現係数適用できます遺伝子ファミリー内のシーケンス類似性と遺伝子発現パターン間の関係を評価します。

この作業の目的も達成するために、タンパク質局在化とリン酸化部位の予測として遺伝子構造、節約された蛋白質のモチーフ、染色体、遺伝子重複と発現パターンを定義するグローバルなアプローチを提供することです、植物の遺伝子ファミリーの網羅的な評価。このような包括的なアプローチは、グレイプバインの ATL E3 ユビキチンリ ガーゼ家族の特性にここで適用されます。7主要な細胞プロセスの調節に ATL 亜科のメンバーの出現の役割によるとこの作品がよく機能研究のための強い候補者の識別を支援でき最終的に支配する分子メカニズムを解明、この重要な作物の環境への適応。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1 と推定される ATL の遺伝子家族のメンバーの同定

  1. PSI-BLAST web 版
    1. ブラスト web ページ13を開き、タンパク質ブラスト] セクションをクリックします。
    2. 「入力クエリ シーケンス」フィールドに、他の家族のメンバーを識別するプローブとして使用されます (ここで VIT_05s0077g01970) タンパク質のアミノ酸配列を入力します。
      注: 良い代表的な蛋白質である必要があります (家族を特徴付けるすべての重要なフィーチャを表示する蛋白質) を使用します。
    3. フィールドに「選択検索セット」、「タンパク質のリファレンス」データベース (refseq_protein) と (V. vinifera - taxid:29760) 興味の生物を選択します。
    4. フィールド「プログラムの選択」、PSI BLAST アルゴリズムを選択し、分析を実行するブラストのボタンをクリックします。
      注:「アルゴリズム パラメーター」をクリックしてしてだ (Max ターゲット シーケンス、スコアリング マトリックス、PSI-BLAST しきい値など) いくつかの高度なパラメーターを調整することが可能。
    5. ラウンドの最初の爆発がクエリと一致するを表示するすべてのシーケンスを取得します (既定では-選択したしきい値を超える e 値 0.005; この実験で 0.001)。明らかにいない「PSI-BLAST の選択」列でチェック マークをクリックして検討中の家族に属しているし、ステップ 1.1.4 のようにブラストのボタンをクリックして 2 番目の PSI-BLAST イテレーションを実行すべてのエントリを選択解除します。
    6. 新たに同定されたシーケンスは、黄色で強調表示されます。明らかに間違っている取得したヒット曲の選択を解除し、さらにイテレーション 1.1.5 の手順で説明するようを発見します。
    7. アルゴリズムに関連するエントリが見つからないか、収束 (新しいエントリは見つかりませんでした) に達するまで反復処理を続行します。さらなる分析の推定の遺伝子家族のメンバーのリストをダウンロードします。偽陽性の存在を避けるために各イテレーションで取得したヒットを目視で確認します。
  2. PSI-BLAST スタンドアロン版
    1. ブラスト ホーム ページ13の「ブラストをダウンロード」ボタンをクリックしてしてブラストのスタンドアロン バージョンをダウンロードする.
      注: スタンドアロン ブラスト ソフトウェアは、前に説明されている web インターフェイスのコマンド ライン バージョンです。カスタムのローカルまたはリモート データベースに対して PSI BLAST 検索を実行することができます。さらに、それと、事前に定義された位置特定のスコア行列 (PSSM) を検索できます。

2. PSI ブラスト識別される家族の検査

  1. 複数の配置
    1. 以前に FASTA 形式のファイルで特定したアミノ酸酸性配列を収集し、複数配置を続行するメガ ソフトウェア14にアップロードします。
    2. オープン メガ ソフトウェア、「整列」ボタンをクリックして、"編集/ビルド配置"をクリックして、「新しい線形を作成」をクリック、「タンパク質」をクリック。
    3. 配置メニューおよび「ファイルから挿入のシーケンス」から「編集」をクリックします。前に作成した FASTA ファイルを参照し、調査対象のすべてのシーケンスのアップロードを確認します。
    4. 配置メニューと「筋肉によって整列」から「配置」をクリックします。既定のパラメーターを使用して、「計算」ボタンをクリックして、複数配置の完了を待ちます。
    5. 誤って予測された家族のメンバーを除外するマルチプルアライメントを目視で確認します。正規 CxxC (13 x) PxCxHxxHxxCxxxW (7 倍) CxxCW モチーフ、(特に前に 3 番目のシステイン プロリン残基の存在) は ATL の家族のメンバーを定義するために必要な重要な機能です。
  2. 特定のロゴの解析
    1. 家族に節約されたモチーフを定義するモチーフ抽出 (ミーム)15複数の Em に (96 グレープバイン シーケンスは、ATL を考慮すべき要件を満たす) 家族の決定的なリストを提出します。
    2. ミームのホームページから「ミーム」ボタンをクリックし、「データ提出フォームを完成"特定の情報と家族に関する関心の。
    3. ミームの分析を使用して、グレープバイン ATL 家族、すなわち、リング H2、GLD のモチーフで 2 つの予想されるモチーフの存在を確認します。
  3. また、手順 2.1 および 2.2 バイオインフォマティクス ソフトウェア スイートを使用して同時に行う (材料の表を参照してください)。
    1. FASTA ファイルをアップロード (手順 2.1.1 参照) スイートに。メニューの [し、「インポート」、"ファイルから"をクリックしてから「ファイル」を選択します。FASTA ファイルを参照し、「開く」をクリックします。
    2. 一覧ですべてのインポートされたシーケンスを選択し、ツールバーで、「整列/組み立て」ボタンをクリックして「ペアワイズ複数配置」をクリックします。「筋肉の整列」を選択し、既定のパラメーターを使用して配置を起動する"OK"をクリックします。
    3. 配置のロゴを視覚化するには、「グラフ」→「オプション」をクリックし、「シーケンス ロゴ」を選択します。

3. 蛋白質の物理パラメーターとドメインの解析

  1. 家族の調査のメンバーのさまざまな物理パラメーターの定義は家族を包括的に説明することが重要と家族が特定の web ツールのリストを送信します。
    1. 等電ポイント (pI) と分子量 (kDa) は、既定のパラメーターを持つ Expasy ウェブサイト上 ProtParam ツール16を使用します。
    2. 蛋白質の細胞レベル下のローカリゼーションのタンパク質細胞内局在 v1.2 のプラウラー19 と既定の設定、既定の設定、targetP v1.1 の18 ngLOC v1.017より信頼性の高い予測を取得するさまざまなツールを使用して、0.5 の確率で。リン酸化サイトでは、既定のパラメーターを持つ MUsite v1.0 web ツール20を使用します。
  2. 家族内の付加的な蛋白質のドメインを調査します。
    1. Pfam データベース web ページ21を開く、「シーケンス検索」ツールを選択して、クエリ ボックスのタンパク質配列を送信、解析を実行するために"Go"をクリックします。
      注: 各蛋白質シーケンスが個別に分析されます。E 値は既定の設定で 1.0 は、重要でない重要なヒットを区別できます。
    2. 推定の膜貫通領域の有無を調査して生物の配列解析のためセンターから TMHMM サーバー22を開きます。
[クエリ] ボックスすべてのタンパク質を同時に貼り付ける (または FASTA 形式ですべてのタンパク質を含むテキスト ファイルをまたアップロード) 解析を実行する「送信」をクリック。
  • 推定の疎水性領域を識別する ProtScale ツール (3.2.2 ステップ)、TMHMM によると予測の膜貫通ドメインを欠けている蛋白質を分析します。23ProtScale web ページを開きます。各蛋白質シーケンスをクエリ ボックスにペーストし、"Hphob。/Kyte & ドゥリトル"アミノ酸スケールとして。解析を実行する「送信」をクリックします。
  • 4. 染色体分布、重複、およびエクソン ・ イントロン組織

    1. ブドウのゲノム CRIBI バイオ テクノロジー センター ウェブサイト24から取得した情報に基づく染色体に ATL の家族のメンバーにマップします。
      1. PhenoGram ウェブサイト ホームページ25を参照してください。"Phenogram"「入力ファイル」タブ区切りのテキスト ファイルとして遺伝子の特定の機能を持つ包括的なガイドラインと次のパス指定されたファイルのコンパイルに関する例によると、染色体にマップするを書く →」ドキュメント"→「オプション」→「入力ファイル」。
      2. 作品の「タイトル」を書きます。描画するゲノムを選択します。ゲノム グレープバイン ゲノムなど、ソフトウェアで実装されていないドロップ ダウン メニューで「その他」を選択します。"Phenogram"のガイドラインと例を提供、次のパスに従ってゲノム ファイルに書き込む →「ドキュメント」→「オプション」→「ゲノム」、とそれをアップロードします。
      3. 「表現型間隔」、「表現型色」、「画像フォーマット」、または選択の選択肢の既定のパラメーターを使用して、それぞれのメニューで、「プロット」染色体遺伝子の可視化を取得するをクリックします。
    2. MCScanX ソフトウェア26を使用しての家族のメンバーの重複状態を定義します。
      1. ダウンロードし、コマンド ・ ライン 1 (補足ファイル 1) を実行しているローカル コンピューター上の MCscanX のコピーを解凍します。MCscanX フォルダーを入力し、コマンド行 2 (補足ファイル 1) を実行する必要な実行可能ファイルを作成します。
        注: MCscanX のインストールは、いくつかの Linux の 64 ビット マシン関数 chdir に関する問題のために失敗する知られています。エラー メッセージが、時に、この関数に関連返されますコマンド実行、コマンド行 3 (補助ファイル 1) を実行して、コマンドの"make"はその後試みられるべき。
      2. V. vinifera蛋白質と 4 (補足ファイル 1) のコマンド ・ ラインを実行しているアノテーション ファイルをダウンロードします。
        注: 解凍するブドウのアノテーション ファイルのニーズと 5 (補足ファイル 1) のコマンド ・ ラインを実行して一意のファイルで単一の染色体情報猫。
      3. 「すべてのすべての対」blastp 検索クエリと件名V. ヴィニヘラタンパク質ファイルを使用して実行します。
      4. 6 (補足ファイル 1) のコマンド ・ ラインを実行しているVタンパク質のファイルを使用して検索可能なブラスト データベースを作成します。V. viniferaタンパク質ファイルをクエリとして使用して、blastp 検索実行コマンド ・ ライン 7 (補足ファイル 1) を実行して、以前作成されたデータベースに対して。
      5. MCScanX の適切な形式のアノテーション ファイルを変換します。8 (補足ファイル 1) カスタム perl スクリプト parseMSCanXgff.pl をダウンロードするコマンド ・ ラインを実行します。9 (補足ファイル 1) のコマンド ・ ラインを実行する解析を実行します。
        注: 次の形式で遺伝子座標を保持しているファイル vitis.gff が生成されます。
        sp # 遺伝子の開始位置が終了位置
        "sp"ここ「#」は足場の名前 (グレープバインの Vv) の種のための 2 文字のコードでは。指定されたカスタム perl スクリプトはほとんど変換に適した使用可能な注釈ファイルで提供される情報の多様性のためのいくつかの特定のケースでいくつかのコードの変更を必要がありますに注意してください。
      6. 10 (補足ファイル 1) のコマンド ・ ラインを実行して MCScanX を起動します。
        注:「ブドウ」注釈、ブラスト出力ファイルのプレフィックスであります。これは、ソフトウェアが実行するための必須事項を表します。
      7. MCScanX 結果を分析します。MCScanX は、1 つのテキスト ファイル"vitis.collinearity"は、同一直線上のブロックが含まれますを生成します。このようなファイルは任意のテキスト エディターで閲覧できます (例 1補足ファイル 1の出力を参照してください)。
        注: 各参照の染色体に対して同一線上にあるブロックの多重配列アライメントを備えた html ファイルを含む"mcscaxOutput.html"ディレクトリが生成されます。これらのファイルは、web ブラウザーを通じて閲覧できます。
      8. 染色体 11 (補足ファイル 1) のコマンド ・ ラインを実行している内の相対位置に基づいて paralogous 遺伝子を分類します。
        注: Paralogous 遺伝子分類、説明補足テーブル II。生成された出力ファイル"vitis.gene_type"には、シンプルなタブ区切り形式ですべての元の情報が含まれています。
      9. 遺伝子ファミリーは海抜 12 (補足ファイル 1) のコマンド ・ ラインを実行している特定のメカニズムによって発行されているかどうかを評価する濃縮分析を実行します。
        注: ファイル"vitis.gene_type"は 4.2.8 のステップで生成されたファイル"gene_family_file"ファミリーに属するすべての遺伝子の遺伝子座名によって (例えばATL_genes) の家族の名前の後にテキスト ファイルの 1 行を表すに対しタブで区切られます。濃縮応用検定、フィッシャーの正確確率検定とp-異なる起源の値は"outputFile.txt"ファイルに格納されます。
    3. 表示、アノテーション、および系統発生の木の管理の生命の対話型の木 (iTOL)27日オンライン ツールを用いた遺伝子のエクソン ・ イントロン組織を視覚化します。
      1. ITOL ウェブサイトの「アップロード」セクションで系統樹をアップロードします。以下のセクション 5 によると、ツリーを構築すると。それぞれの家族の一員の遺伝子のブドウのゲノム (上記の引用 CRIBI のウェブサイト) の V1 注釈から遺伝子構造予測を取得します。推定エクソン ・ イントロン、非翻訳領域 (UTRs) (bp) の長さを計算します。
      2. エクソン ・ イントロン パターンのグラフィカルな可視化の「タンパク質ドメイン」データセットを使用します。
    次のパス「ヘルプ」→「ヘルプ」→「データセットの種類」→「タンパク質ドメイン"iTOL ウェブサイト27指定に従って計算された長さを含むプレーン テキスト ファイルに書き込みます。「タンパク質のドメイン」データセットを使用して、「四角形 (RE)」と"四角形ギャップ (GP)「図形、エキソンと UTRs、それぞれ表します。

    5. 系統解析と命名

    1. 高品質の分子系統樹の構築と家族の命名法の定義を ATL 家族メンバー間の関係を分析します。
      1. グレープバイン遺伝子ファミリー8グレープバイン スーパー命名委員会によって確立された規則に従います。
      2. UniProt データベース28からグレープバイン遺伝子命名法8、参考資料として必要なシロイヌナズナATL のシーケンスを取得します。
      3. グレイプバインと系統解析に含まれるシロイヌナズナ遺伝子家族のメンバーのすべての塩基配列を含む FASTA ファイルを記述します。塩基配列 (タンパク質と比較して) 家族のメンバーの間で変動の最大値を許可します。
    2. 系統発生の木
      注: Phylogeny.fr 29パイプラインの使用は高品質の系統樹を得るようお勧めしますが、必須ではありません。
      1. Phylogeny.fr ホームページ29を参照し、「系統分析」のパイプラインを選択します。
        注:「ワンクリック」はほとんどの場合に適していますが、それを必要な場合は、特定の高度な設定 (「詳細」) またはも完全にカスタマイズされた分析を選択すること可能です ("アラカルト"; 5.2.5 の手順を参照してください).
      2. 書き込み」分析の名前「アップロード作成した FASTA ファイル (手順 5.2.1, し解析を実行する"送信"をクリックします。
      3. また、手順 (手順 5.2.1、5.2.2) 上記する場合エラー メッセージの結果は、個別に、次のように系統スイート パイプラインの各ステップを完了します。
        1. 筋肉ソフトウェア ホームページ30からは、「ステップ 1」で FASTA ファイル アップロードは、「ピアソン/FASTA」「ステップ 2」で"出力フォーマット"と"送信"をクリックして「ステップ 3」クエリの順序を配置するのを選択します。
        2. 「配置のファイルをダウンロード」をクリックし、手順についてはさらに FASTA ファイルとして保存します。
        3. プロセス不十分を排除する配置 FASTA ファイルは、Gblocks サーバー ツール31を使用して位置を揃えます。配置 FASTA ファイルをアップロード、「シーケンスの型」として「DNA」を選択し、(例えば、グレープバイン ATL 遺伝子家族選択"以下の厳格な選択"のすべての 3 つオプションを提案するため分析に最適な金詰りオプションを選んだ高いシーケンス発散)。クリックして"ブロック"に解析を実行します。
        4. [出力] ページの下部に「結果の整列」をクリックし、新しい FASTA ファイルとして結果を保存します。
        5. Phylogeny.fr のホームページは29日から「系統分析」パイプラインとして「A la Carte」を選択します。その後、「複数配置」の選択を解除と「配置キュレーション」.「ワークフローを作成する」をクリックして、(ステップ 5.2.5.4) Gblocks キュレーション FASTA ファイルをアップロード、「設定」のデフォルトのパラメーターで「Bootstrapping プロシージャ」を選択解析を実行する"送信"をクリック。
      4. 崩壊が不十分なサポート枝 (すなわち、ブートス トラップ値 < 70%) をクリックして「選択とアクション」セクションで「崩壊枝」とさら解析される系図の形式で最終結果をダウンロードします。
    3. 系統に基づく遺伝子名を割り当てます。
      1. ITOL スイート (セクション 4.3) 上記の引用にそれをアップロードすることによってツリー構造の信頼性を評価する系統樹を確認します。
      2. 家族の各メンバーに遺伝子名を手動で割り当てます。一対一第オーソロガスシロイヌナズナを割り当てる-名前のような (例えばAtATL3 → VviATL3)。グレープバイン遺伝子 (2 つ以上) は、同じ系統の距離を使用して単一シロイヌナズナ相同物から派生する数字、または文字をシロイヌナズナ遺伝子数が終了した場合を区別する (例えばAtATL23 → VviATL23a、VviATL23b)。
      3. 一対多または多対多の第オーソロガスシロイヌナズナから成る新しい遺伝子名を割り当てる-名前のような (ここで、"ATL") Vシロイヌナズナの両方に既に使用最高の番号よりも大きい番号の組み合わせ(e.g。、VviATL83)。
      4. 系統樹の下に、上から降順新しく定義された家族の命名を完了します。

    6. ブドウ オルガンとステージ発現プロファイリング

    1. 家族のメンバーの作業データ マトリックス含む式データを生成します。
      1. ResearchGate プラットフォーム32分散リンクから、 V. vinifera品種コービーナ遺伝子発現アトラス データ マトリックスをダウンロードします。このファイルには、次の手順で使用する正規化 RMA の式の値が含まれています。
      2. アトラス データ マトリックスから各ファミリー遺伝子の式の値を抽出し、アトラス データ マトリックスと同じヘッダー行を含む「作業データ マトリックス」を書きます。「作業データ マトリックス」をタブ区切りのテキスト ファイルとして保存します。
    2. マルチ実験ビューアー (MeV) ソフトウェアを使用して階層的な bi クラスター分析を実行します。
      1. ダウンロードして33MeV ソフトウェアをインストールします。
      2. 「作業データ マトリックス」をアップロード (ステップ 6.1.2)「ファイル」→「データ読み込み」→「ブラウズ」次のパスおよびテキスト ファイルを選択します。「単一のカラー配列」を選択し、自動アノテーションが指定されていない場合、「負荷注釈」から目盛りを削除します。式テーブル プレビューの上部左の式の値を選択し、「読み込み」ボタンをクリックします。
      3. Log2 変換 (「データの調整」→「ログ変換」→「Log2 変換」) と遺伝子/行の正規化 (「データの調整」→「遺伝子/行調整」"中央センター遺伝子/行") を適用するデータを調整します。適切な規模の限界 (「表示」→「設定カラー スケールの制限」) を設定します。
      4. 次のパス「分析」階層的クラスタ リングを計算 →「クラスター」→「HCL」.
    「リンケージ方式選択」フィールドで「遺伝子葉順序の最適化」と"フィールド順序の最適化","ピアソン相関」「距離行列選択」フィールドと「平均リンケージ クラスタ リング」の「サンプル葉順序の最適化」を選択します。解析を実行する"OK"をクリックします。
  • ウィンドウの左側のパネルの「分析結果」→「HCL」メニューで結果を表示します。ヒート マップをエクスポートするには、「ファイル」メニューの「画像を保存」をクリックします。
  • 7. 生物的・非生物的ストレスに対する応答の発現

    1. 手順 6.1 各パブリケーションとブドウの生物的・非生物的ストレスを調査し、研究から得られた GSE 加盟 ID を繰り返します。たとえば、病原菌 NimbleGen ブドウ全ゲノム マイクロ アレイを用いた灰色かび病菌感染ブドウ果実のトランスクリプトームのプロファイルを提供する実験は、GSE52586 の GSE ID で閲覧できます。6.1.1 と 6.1.2 手順を繰り返します。
    2. NCBI シーケンスを読み取るアーカイブ34 SRA/バイオ プロジェクト ID (例えば、SRP055458 または「ブドウ花シェーディング」実験用 PRJNA275778) を検索し、関連付けられているすべての塩基配列読み取りをダウンロードします。多くの異なった調査からのデータセットの RNA シーケンスは、一貫性を保つのため単一のパイプラインを使用して処理されます。
      1. 簡単に言えば、raw シーケンス FASTQ 読み取り (シングルおよびペア エンド) をトリムし、Trimmomatic35品質をフィルターします。AVGQUAL と MINLEN それぞれ 20 と 40 のフィルター使用してパラメーターはすべて、既定。
      2. × グレイプバイン参照ゲノム1 Bowtie236を使用して 12 をインデックスします。Bowtie2コマンドを実行する前に (例えばbowtie2 ビルド) 12 X 口コミ参照ゲノムをダウンロードします。
      3. グレープバイン V1 遺伝子モデルのアノテーション (GFF/GTF) ファイルを使用して htseq 数37カウント マトリックス テーブルを取得します。
    3. R38 RMA 正規化行列の limma39ライブラリとそれぞれ手順 7.1.1 と 7.2.1 から得られたカウント マトリックス テーブルの DESeq240ライブラリの差動遺伝子発現 (再-) 解析を実行します。
      1. 標準的な「2 つのグループ」比較を実行 (つまり、「治療」/「コントロール」)。デザイン行列/グループ「コントロール」と「治療」の条件が正しく指定されていることを確認します。
        注: の典型的な設計マイクロ アレイ発現解析 (GSE52586) コントロール (健康) 果実に対してlimmaコマンドを実行すると同じ開発段階で灰色かび病菌感染エル 33 果実を比較するには13 は、補助ファイル 1に表示されます。RNA シーケンス発現解析DESeq2コマンド行 14 を実行するとコントロールに対して陰処理下 (キャップ落下後 7 日間) で花を比較する (SRP055458 または PRJNA275778) の典型的な設計は補足のファイル 1 に示すように.
      2. それぞれの対照的に、 limmaの特異的発現遺伝子 (DEG) の一覧を取得、使用、関数lmFit()eBayes()、続いて、 topTable() 関数でDESeq2のために、を使用DESeqDataSetFromMatrix()DESeq()、およびresults()関数。以下、続くことに典型的なワークフローです。
        1. マイクロ アレイ発現解析コマンド ・ ライン 15 (補足ファイル 1) を参照してください。RNA シーケンス発現解析コマンド行 16 (補足ファイル 1) を参照してください。他のすべて異なる適切なデザイン スキーマ (7.3.1 の手順の例を参照) とは対照的に上記の手順を繰り返します
    4. DEGs 生成のリストから ATL V1 加盟に対応しない、log2 折る変更 (治療/コントロール) を含む列を保持するすべての行を抽出 > | 0.5 |pを調整 -値 (FDR) < 0.05、およびマージそれらに応じてマトリックス表にかどうか研究に該当」非生物的」または「生物/病原体相互作用」の解説。
    5. ライブラリgplotsを使用して R の階層的クラスター化されたヒートマップなど (非生物と生物の解説) を構築します。
      注: heatmap.2関数を呼び出すとともにそれぞれのマトリックス表から行樹状図ヒートマップを作成します。Cellnoteを使用して追加の引数の機能発現を区別するのに役立ちます (log2FC > 0.5、FDR < 0.05) による実験的条件の広い範囲にわたってそれぞれの比較で ATL 遺伝子、* 記号。17 (補足ファイル 1) のコマンド ・ ラインを実行している R の一般的なワークフローを適用またはまた、手順 6.2.2 に 6.2.5 MeV ソフトウェアを使用してヒートマップなどを構築します。

    8. Paralogous 遺伝子と遺伝子の共発現との関係の解析

    1. 一対の類似度を含むマトリックスを構築します。類似度行列の要素は、配列類似性対蛋白質線形から計算の値です。
      1. ペアワイズ配列アライメント、テキスト ファイルとして保存して、デフォルトの設定でエンボス針 web サーバー41を使用します。出力テキスト ファイルを開き、列と行の名前"similarityTable.txt"と呼ばれるファイルを生成すると、すべてのコメント行を削除します。
        注: そのようなテーブルは、ペアワイズ線形のそれぞれで計算された類似値をレポート各 ATL 遺伝子のラインを備えています。対称行列は対角値の点で生成されるように、行と列に座の順序は同じです。
    2. ピアソンの相関係数を計算することによって共発現データの行列を作成します。次の手順には、R と PDL の perl モジュールが必要です。
      1. 端末内のコマンド行 18 (補足ファイル 1) を実行している 96 の ATL 遺伝子の式の値をダウンロードします。19 (補足ファイル 1) のコマンド ・ ラインを実行することによってダウンロードすることができますカスタムの perl スクリプトを使用して共発現解析を実行します。このようなスクリプトは、以前に報告される ATL 遺伝子座のペアの間のピアソンの相関係数を計算します。
      2. 20 (補足ファイル 1) のコマンド ・ ラインを実行しているスクリプトを起動し、出力指示に従ってください。
    スクリプトは、ステップ 8.1 (この順序はマントルピース テストを実行、以下を参照してくださいに不可欠) で得られる行列の軌跡名順を備えた共発現行列を含む出力ファイル (すなわち"coexpressionTable.txt") になります。
  • 8.1、8.2 の手順で取得したデータ行列間のマントルピースのテストを実行します。次のコマンドを使用して ade4 ライブラリの読み込み (端末内からコマンド"R"を実行) R 環境に入ると後、: library(ade4)
    1. 「Nrep」順列の数を表すと 21 (補足ファイル 1) のコマンド ・ ラインを実行して統計情報を実行して、2 つのデータ行列の読み込みのマントルピース テストを実行します。テストは、これらの行列の成分間の相関を計算する、行列に置き換えています、再び同じ検定統計量を計算するで構成されています。
      メモ: pを計算に使用する統計テストの参照分布を構築する統計テストのすべての得られた値を使用-意義をテストする値。順列の数を定義する精度p-値を取得することができます。
  • Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    BLASTp 検索を通じてシロイヌナズナ ATL2 (At3g16720) に最も近いブドウのゲノムの ATL の家族のメンバーを調査するためのプローブとして使用されたように遺伝子 VIT_05s0077g01970 (V. vinifera cv ピノ ・ ノワール PN40024)。PSI-BLAST 解析は、(図 1 a) ブドウ ATL 遺伝子ファミリーに属すると推定される遺伝子のリストを明らかにいくつかのサイクル後に収束。各候補者のための正規のリング H2 ドメインの存在は、分析 (図 1 b) で識別されたすべてのエントリの筋肉の配置を視覚により評価しました。前に 3 番目のシステイン プロリン残基と同様、間隔を正しく保存されたアミノ酸、2 つのヒスチジン残基を含む遺伝子だけは、シロイヌナズナ5の元の ATL の定義によると投槍兵として考慮されました。96 グレープバインの遺伝子の合計は、要件を満たして、さらに特性の考慮されました。遺伝子および対応するエンコードされた蛋白質、すなわち、リング H2 に加えてその他既知のドメインは貫通または疎水性豊富な地域、細胞内の存在の特定の特性を定義する各 ATL 家族を行ったローカリゼーション、および推定されるリン酸化サイト (表 1および表 2)。

    Figure 1
    図 1: PSI-BLAST 調査と推定されるブドウ投槍兵配置します。(A) 餌として蛋白質シーケンス VIT_05s0077g01970 を使用して最初の PSI-BLAST 反復検索のトップ 10 ヒットのスクリーン ショット。そのリング H2 ドメインと対応するロゴを示す推定投槍兵を用いて分子生物学のスイート 96 選択したブドウの配置の (B) 部分 (材料の表を参照してください)。Ariani42クリエイティブコモンズ帰属 4.0 国際ライセンスの下でライセンスされてから再現。この図の拡大版を表示するのには、ここをクリックしてください。

    遺伝子の ID 遺伝子の長さ (bp) イントロンの数 UniProt ID 蛋白質の長さ (aa) リング H2 モチーフ TM/H ドメイン数 その他のドメイン
    VviATL3 VIT_09s0002g00220 1245 0 F6HXK6 304 PxC 1
    VviATL4 [VviRHX1A] VIT_15s0021g00890 1827 3 D7SM36 203 PxC 0
    VviATL18 VIT_11s0118g00780 1113 2 F6HCI8 193 PC 0
    VviATL23a VIT_18s0001g01060 935 0 F6H0E4 114 PxC 0.5
    VviATL23b VIT_18s0001g01050 399 0 E0CQX3 132 PxC 1
    VviATL24 VIT_17s0000g06460 4466 4 D7SI89 217 PxC 1
    VviATL27 VIT_00s0264g00020 2554 4 D7T1R5 235 PxC 1
    VviATL43 VIT_11s0052g00530 1576 2 D7SQD9 457 PxC 3
    VviATL54a VIT_18s0001g06640 3221 1 F6H0Y5 405 PxC 1
    VviATL54b VIT_03s0017g00670 2774 1 F6HTI0 427 PxC 1
    VviATL55 [VviRING1] VIT_07s0191g00230 1844 0 F6HRP9 372 PxC 1
    VviATL63 VIT_06s0004g06930 804 0 D7SJU6 267 PxC 1
    VviATL65 VIT_03s0063g01890 2068 0 F6HQI8 396 PxC 1
    VviATL82 VIT_01s0026g02540 820 0 F6HPQ9 233 PC 0.5
    VviATL83 VIT_17s0000g08400 1887 0 F6GSQ4 143 PC 0
    VviATL84 VIT_06s0004g00120 1853 0 F6GUP5 368 PC 0.5 zf RING_3
    VviATL85 VIT_12s0034g01400 786 0 F6H965 261 PC 0.5
    VviATL86 VIT_12s0034g01390 1434 1 D7T016 451 PC 0.5
    VviATL87 VIT_18s0001g03270 1002 0 F6H0T2 333 PC 0.5 zf RING_3
    VviATL88 VIT_08s0040g00590 1320 0 F6HQR2 314 PC 0 zf RING_3

    表 1: 最初 20 VviATL 遺伝子および対応するタンパク質のシーケンスの特性。TM: 貫通。H: 疎水性;0.5 は、1 つまたは複数の疎水性領域の存在を示します。Ariani42クリエイティブコモンズ帰属 4.0 国際ライセンスの下でライセンスされてから再現。

    Table 2
    表 2: 最初の 20 の詳細についてはVviATL遺伝子の位置V. vinifera ゲノム、重複状態と ATL タンパク質の物理化学的特性および位置。Musite; によって () のリン酸化サイトの数の予測少なくとも 2 つのソフトウェアを用いて (b) 同じような予測が強調表示されます太字で。ngLOC は、TargetP v1.1 とタンパク質プラウラー内局は、0.5 の確率で使用されたに対し、既定の設定で使用されました。NUC、核;MIT、ミトコンドリア。クロロフィル、葉緑体;PLA 膜;S、分泌経路 (シグナルペプチドの存在)。M、ミトコンドリア。C, 葉緑体;O または、他の場所;nd、未定 (すなわちしきい値を下回る値)。Ariani42クリエイティブコモンズ帰属 4.0 国際ライセンスの下でライセンスされてから再現。このファイルをダウンロードするここをクリックしてください

    ガイドラインに従って参照シロイヌナズナATL 遺伝子ファミリーのシーケンスと識別されたブドウ ATL エンコーディング遺伝子の塩基を含む系統解析を用いてグレープバイン ATL 命名のsNCGGa8V. ヴィニヘラからa90-6 および 83 の塩基配列は, 信頼性の高い系統樹を取得する Phylogeny.fr パイプラインに服従しました。後者のシーケンス後に注釈を付けるし、強固な関係 (図 2) に基づくグレープバイン遺伝子の名前使用されました。このアプローチは、次の 13 のうち 96 グレープバイン投槍兵を受け取った、シロイヌナズナATL. との一対一の orthology を考慮した特定の識別子他の 83 の遺伝子の名前は、ATL の遺伝子数が最高の番号で使用されるaより高いから始まって上から下に番号付けプログレッシブと系統樹に基づいて割り当てられました。

    Figure 2
    図 2: V. viniferaシロイヌナズナATL E3 ユビキチン リガーゼ エンコーディング遺伝子の系統樹.巡回のツリーが生成されました Phylogeny.fr スイート (V. ヴィニヘラ(グリーン) で、シロイヌナズナ(黄色) で UniProt データベースで報告の 83 の ATL 遺伝子。ブランチのサポートの値は、100 ブートス トラップ反復実験から得られました。赤い星は、対応する蛋白質の BCA2 亜鉛指 (BZF) ドメインの存在を示します。Ariani42クリエイティブコモンズ帰属 4.0 国際ライセンスの下でライセンスされてから再現。この図の拡大版を表示するのにはここをクリックしてください

    グレープバイン染色体に遺伝子の ATL のエンコーディングをマッピング グレイプバインの ATL 遺伝子ファミリーの拡大の主要な進化の力として全ゲノム重複を示唆、ゲノム全体の広範な分布を示した。確かに、31 投槍兵は潜在的分節または全体のゲノム重複イベントから発生した相同染色体領域で発見されました。さらに、同じ分析には、51 分散重複 (図 3)、1 つの近位重複 13 縦列重複遺伝子が強調表示されます。ATL ファミリー遺伝子複製数が非常に多いを考慮したゲノム分別中に重複した遺伝子の優遇の保持を確認する濃縮テスト (フィッシャーの正確確率検定) を行った。P-値 < 0.001、このテスト確認 ATL 遺伝子重複仮説よりもランダムに予想、グレイプバインの適応と進化の中に ATL 遺伝子ファミリーの役割を示唆して保持されていました。

    Figure 3
    V. vinifera染色体の重複状態図 3: ブドウ ATL エンコーディング遺伝子分布。96 グレープバイン ATL 遺伝子染色体の正確な情報をデータベースで使用可能なは 19 V染色体にマップされました。色は、元の重複イベントを表します。縦の黒い線と赤い線に由来するタンデム重複やゲノム重複、それぞれのペアを識別します。Ariani42クリエイティブコモンズ帰属 4.0 国際ライセンスの下でライセンスされてから再現。この図の拡大版を表示するのにはここをクリックしてください

    グレイプバインの投槍兵の推定の生物学的機能をさらに調査するは、 V. vinifera品種コービーナ的遺伝子発現アトラス12上をメタ解析を行った。データセットは、54 の異なるブドウ臓器や発達段階の全ゲノムの式の値が含まれています、階層的な bi クラスター分析を実行する使用されました。結果だけでなくすべての 96 投槍兵が 54 の組織/段階の少なくとも 1 つで表されるが、また発現プロファイル (図 4 a) の 5 つの主なクラスターの存在を指摘しました。簡潔に、クラスター A と E では逆に行動、特に最初によって特徴付けられるベリーの初期段階、若い葉、蔓、花房、芽の段階のほとんどなど少年のサンプルの ATL 遺伝子の一般的な低下。その一方で、同じクラスター A、登熟期と収穫後の果実のような成熟したサンプルは段階、木質組織、および優勢なアップレギュレーションを示した種子開発 ATL 遺伝子の後期段階を惹かれて。桂キャンパス C クラスターの遺伝子であったサンプルのほとんどの主にダウンレギュ レート ATL 遺伝子クラスター D しばしば誘導ベリー開発の後半の段階で。最後に、クラスター B は発現プロファイルに関連する変化を示さなかった。

    同様のアプローチは、グレープバイン ATL 家族の生物的・非生物的ストレスに対する応答でこの目的のために建てられた特定のデータセットを使用して式を研究に応用されました。遺伝子発現オムニバス (GEO) など ArrayExpress パブリック アクセス データベースにはマイクロ アレイおよび RNA シーケンス実験から派生する表現データの膨大な量があります。収集し、便利な正規化、ストレスに対する植物の応答に投槍兵の潜在的な機能のさらなる洞察の情報が悪用されました。62 のうち 96 の成績が重要な変調を示したことを明らかにしたブドウ投槍兵生物ストレスに対する応答の発現プロファイルを解析 (log2 倍変更 (FC) > | 0.5 |) 偽の発見率 (FDR) との少なくとも 2 つの条件で < 0.05 (図 4 b)。1 つの条件で FDR しきい値のみを考慮した 81 が増えます。グレイプバインにも病原体に対する ATL 遺伝子家族の直接の関与が強く示唆。特に、12 遺伝子 (VviATL3-27-54b-55-90-97-123-144-148-149-156) のグループ強く赤と necrotrophic 菌と草食動物などを含むほとんどの病原体への応答で亢進され、注目に値するそれ以上の機能解析。

    Figure 4
    図 4: 階層 clusteringof ATL 遺伝子発現グレープバイン アトラスとグレープバイン生物ストレス関連データセット。(A) ピアソンの距離に基づく階層的クラスター解析に使用されたアトラス12ブドウのブドウ ATL 遺伝子の値変換ログ式。カラー スケールを表す高い (赤) または下 (グリーン) 式のすべてのサンプルに関しては各遺伝子の平均成績豊富にレベルします。右側にある E に A の文字が識別される別のクラスターを示します。AB: 後バースト。B: バースト。芽 w: 冬芽;F: 開花;FB: 開花始まるFS: 結実;G: 緑;MR: 半ば-登;PFS: ポスト フルーツ セットPHWI-II-III: 収穫後の 1、2、3 ヵ月を枯れR: 登;S: 老化;幹 w: 木質茎。V: ベレーゾンWD: 発達;Y: 若い。(B) 色スケールはグレープバイン ATL 遺伝子発現条件ごとにコントロールと比較して感染ファイルのサンプル (青) のフォールドの変更を減少または増加 (赤) を表します。印は重要な差分式 (FDR < 0.05) 対応する条件の下で各 ATL の。Ariani42クリエイティブコモンズ帰属 4.0 国際ライセンスの下でライセンスされてから再現。この図の拡大版を表示するのにはここをクリックしてください

    補足表 1: ATL 遺伝子候補選択的スプライシングします。() ATL 遺伝子 ID V1 ブドウ遺伝子予測と注釈、V2 ブドウ遺伝子予測と注釈43、(c) の数と推定される ATL 代替スプライシングの亜種、(d) によると ATL (b) 遺伝子の ID によるとコーディング各推定 ATL バリアントの配列について説明します。このファイルをダウンロードするここをクリックしてください

    補足テーブル 2:このファイルをダウンロードするここをクリックしてください

    1 の補足ファイル:このファイルをダウンロードするここをクリックしてください

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    ゲノム時代の多くの遺伝子家族は深くいくつかの植物の種で特徴づけられています。この情報は、機能の研究は、家族の別のメンバーの役割をさらに調査するためのフレームを提供します。このコンテキストで、冗長性と名前は異なる遺伝子に独立して割り当てられて別の研究グループがときに発生する混乱を避けること、家族の各メンバーを一意に識別できるように命名システムの必要性もあります。

    配慮後、グレープバインの科学界はシロイヌナズナ遺伝子との類似性に基づくファミリ名グレープバイン遺伝子に合意し、一連のグレープバインには、新しい遺伝子家族の記述に適用する必要がありますルールを確立基本的にはブドウとシロイヌナズナの家族8間の塩基配列の系統発生の比較から始まってください。したがって、唯一の遺伝子が既に注釈、シロイヌナズナの名前が正しくは、グレイプバインの命名法で使用できます。ここで説明したシロイヌナズナにおけるブドウ ATL 第オーソロガス識別のため適用手順は、正しいグレープバイン遺伝子家族の命名法の割り当ての要求を満たすためにのみしたがって実施されました。それにもかかわらず、他の植物種の代替アプローチはオプションかもしれない。第オーソロガスがより類似している 2 種の遺伝子のペアとして定義されている双方向爆発ヒット (BBH) を使用して orthology を推論可能性があります例えば、(すなわち、最高のアライメント スコアと)、他の他の遺伝子よりも互いに種44。ただし、このメソッドは、植物や動物の45など多く第オーソロガス遺伝子の重複率が高い場合を見逃すこと。さらに、ATL エンコーディング遺伝子の場合 BBH を遺伝子 (プロリン残基を含む)、正確な ATL 型リング H2 構造に欠けている可能性があります取得や注釈およびシロイヌナズナの投槍兵として指名されていない遺伝子。進化の観点からは、この検索は関連するかもしれませんが、注釈がない第オーソロガス検索ないが成就するブドウ ATL 遺伝子家族アノテーションと命名と投槍兵として注釈ないの範囲名前グレープバインの家族のメンバーには使用できません。別の可能性は、このようなワークフローは、科学界によって明示的推奨されませんにもかかわらずアミノ酸塩基 InParanoid46, または最も最近の Hieranoid 247を使用してではなくに基づいて orthology を推測します。

    式メタ分析、研究し、発現データの異なるデータセットの公開リポジトリを結合する体系的なアプローチとして定義することができますは、さまざまな条件で共有と異なる分子メカニズムを強調表示できます。したがって、複数の大規模なトランスクリプトーム実験から遺伝子発現情報の統合できる遺伝子ファミリーの解析を最小限に抑える実験で家族の発現プロファイルを定義することによって、実験固有の要因、特定のプロセスで推定される遺伝子機能のより堅牢な仮定をサポートの影響。ただし、マイクロ アレイ データの使用には、自分の限界を考慮した、異なるプラットフォームで得られた発現データの統合が必要です。例えば、グレープバイン Nimblegen マイクロ アレイ プラットフォームは、対応する遺伝子の配列で表される probesets のかなりの割合の (~ 13,000 遺伝子) 潜在的クロス交配の問題48を持っています。グレープバイン ATL 家族の場合 15 の遺伝子は、このような現象で受けます。それにもかかわらず、クラメールで議論48、同じプローブによる類似性の高い遺伝子家族のクロスを識別、単一の遺伝子ののみならずより遺伝子の高いシーケンスを共有する 2 つの特定の条件で、式に関する興味深い情報を提供すること類似点とこうして潜在的共有ターゲットおよび機能。マイクロ アレイ データセットに関連するもう一つの潜在的な問題は非常に敏感ではないマイクロ アレイ プラットフォーム式検出限界です。両方を解決するために懸念、すなわち。、十字交配と信号感度、可能な解決策は、RNAseq 式のデータセットだけを考慮するかもしれない。しかし、多くのさまざまな研究から非常に大規模なデータセットの RNAseq データのメタ分析は非常に時間がかかるになることが、多くの計算資源と高い専門性を必要とする場合があります。

    アプローチは、すべてを網羅することを目的に紹介、それことができます確かにさらに他の分析を補完します。まず、さらに分子進化と植物の遺伝子家族のメンバー間の系統関係に洞察力を達成するために系統解析拡張すること家族の多重配列アライメントをによる分子系統樹の構築いくつかの植物の種から。また、Ks の値を決定することにより、進化の過程で彼らの代名詞とされ、非同義置換率の推定ファミリー遺伝子の進化の時間を計算することが可能だ (同義置換で同義サイトごとの数、特定時間の期間) と Ka (非同義サイトごと同じ期間での置換率の数)。Ka/Ks 比率を使用して、彼らの祖先から分岐した遺伝子重複イベントのメカニズムを推測します。Ka/Ks の値 = 1 は、中立的な選択の Ka/Ks の値を示唆している < 1 提案の選択、および Ka/Ks 値を浄化 > 1 が正の選択49を示唆しています。また、遺伝子構造解析には、イントロンの存在が明らかになった場合、代替のスプライシング ・ バリアントの検出、遺伝子家族の特性をさらに拡張できます。確かに、投槍兵は代替の接続イベントは、アイソ フォームこれらの投槍兵 (を参照してくださいの 2 から 16 に至るまでの潜在的な数のための強力な候補者をさまざまな組織、ストレス条件、遺伝子型43, (96) の 21 からの RNA シーケンス データの深い調査に基づく補足表 1)。別の成績証明書はよくアミノ酸配列が異なるタンパク質アイソ フォームを生産し、これらの変更は蛋白質の細胞の特性を変更することが、遺伝子産物の機能の損失に微妙な変調からの変化を引き起こす可能性があります。そのため、代替接続イベントは、重要な植物など、ストレス反応、耐病性、光合成および開花50,51に関与しています。推定cisを含む ATL 遺伝子プロモーター情報の統合-規制要素52または分子 (例えば、マイクロ Rna、長い非コード RNA) 潜在的ターゲット投槍兵53を見つけることができますもに補われるシステム洞察力複雑な分子の調整、グレープバイン投槍兵との相互作用を明らかにします。

    結論としては、遺伝子家族 id の範囲と、科学界によって、植物種の新しい遺伝子家族の特性に適用される手順と同様に、実行する解析の選択は駆動主に。それは一連の情報は、悪用、可能な限りその後の調査の手順、留意すべき重要な機能で植物、ゲノム構造の説明、または選択のための信頼性の高い候補者の間での遺伝子の進化を含む中研究。

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    著者が明らかに何もありません。

    Acknowledgments

    仕事は、共同のプロジェクト 2014 (特性グレイプバインの ATL の遺伝子ファミリーとPlasmopara 大期に抵抗に関与) の枠内でヴェローナ大学によって支えられました。

    Materials

    Name Company Catalog Number Comments
    Personal computer
    Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
    Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
    Motif-based sequence analysis tools (MEME) http://meme-suite.org/
    Geneious Biomatters Limited http://www.geneious.com/
    ProtParam Tool http://web.expasy.org/protparam/
    ngLOC http://genome.unmc.edu/ngLOC/index.html
    TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
    Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
    MUsite http://musite.sourceforge.net/
    Pfam http://pfam.xfam.org/
    TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
    ProtScale http://web.expasy.org/protscale/
    Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
    PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
    MCScanX http://chibba.pgml.uga.edu/mcscan2/
    Interactive Tree Of Life (iTOL) http://itol.embl.de/
    UniProt http://www.uniprot.org/
    Phylogeny.fr http://www.phylogeny.fr/index.cgi
    MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
    Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
    Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_
    datamatrix_geneIDs_Fasoli2012
    Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
    Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
    R https://www.r-project.org/
    EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

    DOWNLOAD MATERIALS LIST

    References

    1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
    2. Adam-Blondon, A. -F., et al. Genetics, Genomics, and Breeding of Grapes. , Science Publishers. 211-234 (2011).
    3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
    4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
    5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
    6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
    7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
    8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
    9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
    10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
    11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
    12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
    13. BLAST. BLAST2.6.0. , Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016).
    14. MEGA. MEGA7.0.25 build 7170412. , Available from: http://www.megasoftware.net/ (2017).
    15. MEME. MEME Suite Version 4.11.4. , Available from: http://meme-suite.org/ (2017).
    16. ProtParam. ExPASy Server. , Available from: http://web.expasy.org/protparam/ (2005).
    17. ngLOC v1.0. , Available from: http://genome.unmc.edu/ngLOC/index.html (2007).
    18. TargetP v1.1 Server. , Available from: http://www.cbs.dtu.dk/services/TargetP/ (2000).
    19. Prowler v1.2. , Available from: http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ (2005).
    20. MuSite v1.0. , Available from: http://musite.sourceforge.net/ (2010).
    21. Pfam. Pfam version 31.0. , Available from: http://pfam.xfam.org/ (2016).
    22. TMHMM v2.0c. , Available from: http://www.cbs.dtu.dk/services/TMHMM/ (2007).
    23. ExPASy. ProtScale. , Available from: http://web.expasy.org/protscale/ (2005).
    24. CRIBI. Grape genome database. , Available from: http://genomes.cribi.unipd.it/grape/ (2012).
    25. PhenoGram. , Available from: http://visualization.ritchielab.psu.edu/phenograms/plot (2012).
    26. ScanX v0.8. , Available from: http://chibba.pgml.uga.edu/mcscan2/ (2013).
    27. Interactive Tree Of Life (iTOL). Version3.5.3. , Available from: http://itol.embl.de/ (2016).
    28. UniProt. , Available from: http://www.uniprot.org/ (2016).
    29. Phylogeny.fr. , Available from: http://www.phylogeny.fr/index.cgi (2008).
    30. MUSCLE. , Available from: http://www.ebi.ac.uk/Tools/msa/muscle/ (2017).
    31. Gblocks Server. Version 0.91b. , Available from: http://molevol.cmima.csic.es/castresana/Gblocks_server.html (2002).
    32. Vitis vinifera cv. Corvina gene expression Atlas. , Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015).
    33. Multiple Experiment Viewer (MeV). Version 4.8.1. , Available from: http://mev.tm4.org/ (2017).
    34. Sequence Read Archive (SRA). , Available from: https://www.ncbi.nlm.nih.gov/sra (2017).
    35. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
    36. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
    37. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
    38. R. Version 3.4.1. , Available from: https://www.r-project.org/ (2017).
    39. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
    40. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
    41. EMBL-EBI. EMBOSS Needle. , Available from: http://www.ebi.ac.uk/Tools/psa/emboss_needle/ (2017).
    42. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
    43. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
    44. Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
    45. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
    46. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
    47. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
    48. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
    49. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
    50. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
    51. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
    52. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
    53. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

    Tags

    遺伝学、問題 130、ATL E3 ユビキチンリ ガーゼ、遺伝子ファミリー、ゲノム、名称、系統、式メタ分析、遺伝子重複、グレープバイン
    ゲノムワイドな探索とグレープバインで ATL E3 ユビキチンリ ガーゼ遺伝子家族の表現メタ分析のための包括的なワークフロー
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Ariani, P., Vandelle, E., Wong, D.,More

    Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter