Here, we present phenomic approaches for the functional characterization of putative phage genes. Techniques include a developed assay capable of monitoring host anabolic metabolism, the Multi-phenotype Assay Plates (MAPs), in addition to the established method of metabolomics, capable of measuring effects to catabolic metabolism.
ファージ – 宿主相互作用への電流の研究は、(メタ)ゲノムから知識を外挿することに依存しています。興味深いことに、60 – すべてのファージ配列の95%が現在の注釈付きタンパク質に相同性を共有しません。その結果、ファージ遺伝子の大部分は、仮定としてアノテートされています。この現実は頻繁に両方の構造および補助代謝遺伝子の注釈に影響を与えます。ここでは、これらの未知のファージ遺伝子のいずれの発現時に選択された宿主の生理学的応答(複数可)を捕捉するように設計phenomic方法を提示します。メタボロミクスは、代謝物質の存在量および多様性を監視することにより、副生成物の分析を提供しながら、複数の表現型アッセイプレート(マップ)が、ホスト基質利用およびその後のバイオマス形成の多様性を監視するために使用されます。両方のツールは、単一の推定上のファージのオープンリーディングフレーム(ORF)の発現に関連する表現型のプロファイルを提供するために同時に使用されます。両方の方法のための代表的な結果を、highl比較します推定上の構造的または代謝ファージ遺伝子のいずれかを有する宿主の表現型プロファイルの違いをighting。また、実験的な分析を容易に可視化技術と高スループットの計算パイプラインが提示されています。
(バクテリオファージまたはファージ別名)細菌に感染するウイルスは、世界的に粒子(VLP)のように10以上31ウイルスに存在すると推定し、環境1,2内の他のすべての生物を上回っています。海洋環境に関連したウイルスのコミュニティを調査する最初のメタゲノム研究では、ウイルス画分3内に見られる多様性を定量化することに焦点を当てました。さらに、Breitbartらは、ウイルスコミュニティ配列の65%以上が公共のデータベースで利用可能な任意の配列と相同性を共有していないことがわかりました。その後のメタゲノム研究では、同様の証拠を発見した:サンディエゴの海洋堆積物からmetagenomes、カリフォルニア州は、4、75%の未知のウイルス配列が含まれています。ソルトン湖の過塩性の湖からmetagenomesは98%で、未知のウイルス配列5が含まれています。 98%の未知のウイルス配列6 -やサンゴ関連metagenomesは、95が含まれています。注釈のないこのような情報の蓄積がもたらしました7「生物学的宇宙の暗黒物質」であるファージの遺伝物質。
ファージのゲノムの特徴付けは、既存の核酸とタンパク質データベースとの比較を通して配列類似性を特定することに依存しています。ファージにコードされた遺伝情報は、主に不明であるため、相同性に基づく方法は効果がありません。転写及び複製遺伝子、代謝遺伝子、構造遺伝子:そのゲノム内に、ファージは、典型的には3つの主要な遺伝子型をコードします。転写および複製遺伝子(クラスI / II遺伝子8)ポリメラーゼ、プライマーゼ、エンド/エキソヌクレアーゼ、およびキナーゼを含みます。これらの遺伝子は、高度に転写し、ファージの遺伝物質を複製、ファージ感染におけるその重要性のために保存されています。ファージポリメラーゼは、容易に、それらの地球環境保全9に、従来の配列相同性の方法を用いて同定され、系統学的マーカーとして有効で10を提供するために示されています。これとは対照的に、ファージ代謝および構造遺伝子(クラスII / III遺伝子8)は 、ますます発散、しばしば架空の遺伝子として注釈されています。
ファージ代謝遺伝子は、宿主の代謝能力に影響を与え、必ずしもウイルスの複製に必要とされていません。これらの遺伝子は、多くの場合、補助代謝遺伝子11(AMGs)と呼ばれる、ホストの代謝を調節し、成熟ビリオンの感染及び成功の最適な進行を可能にするように思われます。 AMGsは栄養素を制限する利用及び取り込みまたはエネルギー産生経路に関連しています。いくつかの例は、種々の12-16シアノファージのゲノム中に見出さ光化学遺伝子、遺伝子に連結され、リン酸代謝17,18、およびファージのdNTP生合成18,19用のペントースリン酸経路の利用により調節が挙げられます。比較では、構造遺伝子は、感染中に生成後期遺伝子中旬の間であり、異なるファージ浩にわたって変化しますSTシステム。構造タンパク質の生産は、それらの転写、翻訳、およびアセンブリ8のためのウイルスのdNTP、およびエネルギー·プールの可用性に依存しています。カプシドと尾部繊維構造タンパク質は、すべてのウイルスタンパク質をコードする遺伝子の最も発散とみなされ、成功したビリオン産生のために必要とされます。その発散は、通常、彼らは、ウイルス-宿主共進化20の形成に果たして積極的な役割に起因します。伝統的な相同性および配列アラインメント技術を使用した場合発散タンパク質は関係なく、遺伝子クラスの、容易に見過ごされています。厳密な配列比較で見られる制限を補正するための努力は、人工ニューラルネット21との関連付けを決定するために、配列の特徴を使用することが可能なバイオインフォマティクスツールをもたらしました。人工ニューラルネット(のANN)の構造および代謝遺伝子の予測を可能にする、しかし、直接特徴づけるために、下流の実験的検証が必要遺伝子機能。
本稿の目的は、新規なファージ遺伝子の発現の間に宿主細菌の両方の異化と同化代謝を監視することができるphenomicプロトコルを提供することで、機能のANNを通じて予測しました。フェノミクスの分野では、細胞表現型に関連する生物学は、十分に不明または多面的な機能を有するタンパク質の研究を支援するためにシステム生物学で確立されています。 Phenomicツールは、遺伝子型情報に表現型情報をリンクするために使用されています。我々は、その機能(複数可)は、ファージ遺伝子発現時に宿主の生理学的効果を観察することによって決定することができる推定上のファージ遺伝子を仮定しました。この仮説を調べるために、2つの定量的な方法を選択しました。メタボロミクスは、特定の環境で成長中のホスト代謝産物の多様性と相対的な存在量を測定しながら、複数の表現型アッセイプレート(マップ)がホスト基質利用およびその後のバイオマス形成をモニターするために使用しました。精神状態。推定上の構造および代謝タンパク質が大腸菌内で過剰発現し、両実験からの代表的な結果が比較されます。多数の視覚技術および高スループット処理パイプラインは、実験の複製を容易にするために提示されています。最後に、提示される方法の再現性と精度は、注釈付きのキャプシドタンパク質およびファージ代謝タンパク質、チオレドキシン、プラス2つの推定AMGsの予想生理学的効果との関連で議論されています。
ここでは、推定上のファージ遺伝子の機能解析のためのphenomicアプローチを提示します。技術は、監視ホスト同化代謝可能な開発されたアッセイを含む、マルチ表現型アッセイプレート(マップ)、異化代謝に効果を測定することができるメタボロミクスの確立された方法に加えて。我々は、高スループット処理および分析24を可能にする、これらの技術に起因する大規模なデータセットを管理するための追加のツールを提供しました。最後に、注釈付きファージキャプシドタンパク質、ファージチオレドキシン、2つの推定代謝ファージ遺伝子、平均実験的応答を比較して、我々は、表現型の傾向や異常値の識別の識別に重点を置いて、データセットと遺伝子クラスの両方を解釈する様々な戦略を提案します。
述べたように、両方のアプローチを定量宿主代謝の半分のみを測定します。のいずれかの相対的な機能を解釈するために、調査中の新規タンパク質は、両方の方法からのデータは、機能の証拠を提供する必要があります。これが私たちの現在の原稿の焦点ではありませんが、各phenomicメソッドからのデータ出力は、ランダム森林や主成分分析などのクラスタリング手法に焦点を当てコンビナトリアル分析を通して置かれます。また、複合解析から得られた仮説は、その後、伝統的な遺伝的方法によって検証されなければなりません。
最後に、提示される方法は、頻繁に細菌生理学の影響を受けているため、同じ基準に従います。どちらの方法を実施する場合、考慮事項がで実験している独立した、クローングループを確保するためになされる必要があります。汚染が防止されます。単一の変数をテストしています。および適切な制御を同時に実行されています。これらの点を考慮しないと、任意の生理学的アッセイと同様の不明瞭な結果をもたらすであろう。
マルチ表現型アッセイプレート(MAP)の
MAPの開発は、( 図5Aおよび表1,2)は、現在利用可能な技術と比較して高いスループットと適応性アッセイを提供します。アッセイは、消耗品、機器、およびすべての微生物学研究室で利用可能な基本的な技術を使用しています。その後のデータ処理および分析のための計算パイプライン、PMAnalyzer 24の組み込みは、迅速なデータ解釈を確保します。また、アプローチの実験と解析の両方の側面が容易に調整することができるか、またはカスタマイズされた目的のために調整。データの大部分は、セクション4で概説フィルタリングを通過しなかった場合、例えば、一方が手動で問題を識別するために成長曲線を取捨選択することができます。問題は厳しいフィルタパラメータに起因して生じる場合は、スクリプトの調整を行うことができます。あるいは、問題が実験的プロセスに関連付けられている場合( すなわち、長期の縮合;不適切な細菌性セルの転送LSは、等)、追加の複製を容易に繰り返すことができます。
クエバスら 24に記載されているように、PMAnalyzerは凝集性、自動化されたパイプラインとして構文解析し、解析スクリプトを実行するラッパー·スクリプトとして記述された単一のbashのプログラムです。すべてのスクリプトは、3回のデータ全体の各時点で中央値をとることにより、25℃でのGitリポジトリから自由にアクセス可能であり、その後、遅れ時間を得るためにロジスティック曲線、最大増殖速度、漸近線、および新規の用語、成長レベルをパラメータ化。中央値を大きく外れ値の影響を低減するために我々の研究において、平均の上に選択された、しかし、スクリプトが容易に複製データの平均値を計算するように適合させることができます。原因レプリケート·データ全体に見られる減少変化(SE)( 図2A)に、私たちはロジスティック曲線をフィッティングするためのPMAnalyzerにおける中央値の使用を維持しました。さらに、本研究では成長のためのカットオフ(GL≥0.4)はDETEましたデータは、成長レベルと最大増殖速度( 図1A、B)を横切って分離する方法と比較することによってrmined。楽器とモデル·システムに応じて、この再定義がカットオフ値を必要とする、この用語は変更になる場合があります使用しました。
私たちの分析の主な利点は、我々は成長レベル(GL)として定義し、全体的な微生物の増殖を特徴付ける単一のパラメータを使用して表現型を比較する機能です。 GLは調和平均であるため、データの大きな外れ値の影響を軽減します。成長の概要を提供するために、シフトロジスティック当てはめ値との調和平均を使用することは試行錯誤に到着しました。他の方法は、成長が含ま区別しようとした:それがかかった時間は、特定の曲線パラメータ(半μmaxを、μMAX、及び運搬能力)、決意(R 2)の係数、および特定の曲線パラメータを乗じたR 2の組み合わせに到達します。シフトと調和平均を使用してGLのためのロジスティックフィット値は、このように、それが選択の方法となり、成長を評価する際に最大の範囲を提供しました。注意すべき検討事項は、動的な成長曲線パターンは、単一のパラメータまたはフィットモデルを使用する場合に失われる可能性を有することです。例えば、ロジスティック曲線とGLの個々の曲線のパラメータは、二相の成長を表現することができません。単一の炭素の環境では、成長のこの効果は、基質利用中の基板やシフトのいずれかの変換にウイルスタンパク質の仲介を意味します。複数の成長パラメータを考慮していないときに、潜在的に失われた追加の効果は、次のとおりです。長期の遅れ時間を、ウイルスの機械や製品の負担増を提案。急速に、対数期の加速エネルギー産生経路をホストするように結合されたウイルスタンパク質を示唆しています。バイオマス形成のまたはより高いレベル、ホスト栄養摂取及び同化(データは示していない)におけるウイルスのサポートを意味します。したがって、(新生増殖曲線をプロット<stGLはクローンの全体的な成功を表すために、単一の定量的な数値を提供し、アカウントにロジスティックモデルの主要な変数をとるのに対し、栄>図2A、B)は、時間の傾向に関する情報を提供します。
マップの構造および代謝遺伝子に寄与異なる応答を考慮するとき、それは、問題の異なる基板クラスがタンパク質機能の最大の証拠を提供することが観察されます。例えば、代謝性タンパク質は、多くの場合、中央代謝16,32をホストするために非特異的であり限定的な栄養素の買収に関連しています。 MAP予備実験は、中央代謝炭素源( 図2A)上に成長した時、推定代謝ファージ遺伝子を保有するクローンが増加誘導期を有することを明らかにする。逆に、ホストのエネルギーとのdNTPプールの大きな割合を必要と推定される構造遺伝子を担持するクローンは、セントの成長に偽陽性応答をもたらしますRALおよびアミノ酸代謝の炭素基質。顕微鏡で観察されたように、これは( 図2Aおよびデータは示さず)によるホストフィラメンテーションおよび/ または封入体を生じる不溶性タンパク質の蓄積に起因する可能性が高いです。さらなる分析は、これらの予備的な結果を確認するために必要とされているが、MAPは、特異的ファージ遺伝子クラスの機能を仮定する相関表現型の応答を取得することが可能です。
未知のウイルスタンパク質の解明に加えて、MAPは、個々の細菌または細菌のコミュニティの機能および代謝の多様性を調査するための新規な資源です。 MAP成分が細菌の範囲の成長をサポートするために容易に改変するために設計されています。海洋、栄養要求性、及び嫌気性微生物を含みます。異なる細菌属は、マップでサポートすることができる前に、これらの取り組みを促進するために定義された基礎および前増殖培地は、追加または調整された化学種を必要とします。MAPのこの使用中のノートには、トリプトン、酵母エキス、ペプトンなどの成分の使用を禁止する、定義されたメディアを維持することです。
メタボロミクス
メタボロミクスの分野は、質量分析により同定し単離した代謝産物を含む代謝物データベースに依存します。ここで選択した中核施設では最大のメタボロミクスのいずれかのデータベースを持っています。他の人が前に私たちのホストに記録されていなかったしながら興味深いことに、我々の実験法から得られた代謝物の半分以上は、(〜65%)識別不能であった、 大腸菌は、(例としては、インドール3酢酸33、サリチル酸34、及びジヒドロ酸を35)。この事実は、植物代謝物、または調査中の特定のタンパク質に向けたデータベースの強いバイアスのいずれかに起因する可能性があります。それにもかかわらず、結果は、データ表現および分析のために利用可能な既知の代謝物の、限られた数です。府でトゥーレ、各種データベースを使用して複数のメタボロミクス法が大きく代謝産物のカバレッジを可能にするであろう。
本発明の新規なウイルスタンパク質を比較し、対比するとき現在、既知および未知の両方の代謝産物が使用されます。このアプローチを使用して、我々は機能的に類似のタンパク質を保有するクローンは、完全なメタボロームプロファイルで増加した類似性を共有すると仮定しました。予備メタボロミクス分析は、構造と代謝遺伝子は明らかに互いから分離しないしながら( 図6)を関連付けるか過剰発現された場合、それらの遺伝子は、ホスト上の同様の効果を発揮することが明らかになりました。例えば、本研究では、EDT2440とEDT2441で強調表示、推定代謝遺伝子と密接にキャプシド遺伝子クラスターを注釈付き。公的に利用可能な膜貫通トポロジーおよびシグナルペプチド予測プログラムを用いて調査の両方の推定上の代謝遺伝子は、単一の膜貫通ドメインを保有証拠を示しました。興味深いことに5番目のうち最初のクラスター·グループ(系統樹の最も左側の部分)で電子9クローンは、同じトポロジのプログラムを使用して、膜貫通ドメインを予測しています。さらなる調査が必要である、しかし、それは、これらのクローンの過剰発現の間に存在する代謝物が膜または構造負荷に起因する細胞ストレス応答と関連している可能性があります。この証拠は、メタボロミクスのデータは、ノイズの増加量を有しているが、この方法は、遺伝子のクラス内および間の両方、遺伝子の一般的な効果を区別する信号を強調することが可能であることを支持しています。この方法は、遺伝子機能の具体的な情報を抽出することができるかどうかを判断するには、代謝産物は、特定の代謝経路に分類しました。クローンは、単一の経路に特異的な代謝物に影響を与える場合である仮説は、その後、過剰発現した遺伝子は、その経路において活性です。私たちのメタボロミクスの品質保証·パイプラインの確立に先立って、予備データは、上にいることを明らかにしました過小評価D代謝産物は、それらが関連付けられている経路にほとんど情報を提供し、典型的には、「不明」であった(データは示さず)。前処理されたメタボロミクスデータは、しかし、代謝産物プロファイルの大部分が類似しており、唯一の未知および既知の代謝産物の存在量の選択された数は、インスタンスプトレシンおよびウラシル( 図6)のために、クローン間で異なることが明らかになりました。タンパク質機能の努力のより高い解像度を提供するために、実験的に機能的な特徴付けをベース代謝産物の「穴」を埋めるために使用することができる公知のファージ遺伝子、ファージに対する新規遺伝子を比較するために行われています。この技術を使用して、既知のウイルス遺伝子の割り当てられた機能は、未知の遺伝子の機能のためのリファレンスを提供します。それにもかかわらず、メタボローム解析の制限要因は、データベースのサイズと関連性があります。これらの制限を補正するために、本研究に関係づけメタボロミクスのデータベースを開発する必要があります。そのようなEのASKAコレクションに特定の代謝物のデータベースとその存在量として大腸菌クローンは、1つのORFは、36を過剰発現されます。 Lawerenceバークレー国立研究所の研究者がモデル細菌37の全体の変異体のライブラリーに特有の代謝物の最初の包括的なデータベースをコンパイルした場合、データベースの必要性の証拠は、2013年に提供されました。本研究では、表現型と遺伝子型との間に明確な接続を明らかに、特定の代謝産物の利用のために必要な遺伝子に新たな洞察を提供しました。
ツールとしてメタボロミクスを考えると、それは、処理体制は中核施設で追跡定義することが重要です。ほとんどの実験手順のアーティファクトは、使用の機器に関連する日々の分散です。現在までに、すべてのGC-MS分析は、各分析の実行に含まれる内部標準の使用を実装しています。しかし、プロジェクト固有の内部のサンプルの追加</ em>の実験のそれぞれの日には、追加の分散を削除しました。これらの考慮事項は、正規化の問題とバイアスを回避するために、早期に対処する必要があります。別の解決策は、同じマシン上の中核施設で、かつ単一のバッチ、任意の中核施設で利用可能なオプションとして、すべてのサンプルを処理することです。
この原稿に導入され、再調査し、両方のさまざまなツールは、新規の提供、機能未知のファージ遺伝子をスクリーニングし、特徴づけることを意味します。計算パイプラインの流線用いた実験手法の単純さと適応性は、これらの方法は、研究努力と幅広い分野に適用可能である保証します。私たちの目標は、ここに提示phenomicアプローチも同様に機能的に定義されていませんシステムに加えて、新規のファージタンパク質のさらなる研究を支援することです。
The authors have nothing to disclose.
We thank Benjamin Knowles, Yan Wei Lim, Andreas Haas, and members of the Viral Dark Matter consortium for their help and constructive input on this manuscript. This research is funded by the National Science Foundation (DEB-1046413) and is part of the Dimensions: Shedding Light on Viral Dark Matter project.
0.22µm Sterivex Filter | Fisher Scientific | SVGP01050 | Millipore |
0.22µm Millex Filters | Fisher Scientific | SLGV033RS | Millipore |
0.22µm SteriCap Filter | Fisher Scientific | SCGPS02RE | Millipore |
0.22 µm Omnipore membrane filters | Millipore | JHWP02500 | Millipore |
96 well micro-titer plates | VWR | 82050-764 | Standard F-Bottom 96 well Microplates |
2 mL 96 well plate | Fisher Scientific | ||
Adhesive Seal Plate Film | Sigma-Aldrich | Z369667 | |
2 L Nalgene square bottles | Cole Parmer | T-06040-70 | |
125 mL Nalgene square bottles | Cole Parmer | T-06040-50 | |
1/4inch Panel Mount Lock Nut, black nylon | Cole Parmer | EW-45509-04 | |
Female Luer Thread Style Panel Mount to 200 Series Barb 1/16inch | Cole Parmer | EW-45500-30 | |
Female Luer Thread Style Panel Mount to 200 Series Barb, 1/8inch | Cole Parmer | EW-45500-34 | |
Male Luer Integral Lock Ring to 500 Series Barb, 1/16inch ID tubing | Cole Parmer | EW-45505-31 | |
Male Luer with Lock Ring x Female Luer Coupler | Cole Parmer | T-45508-80 | |
Barbed Bulkhead Fittings 1/4inch OD | Fisher Scientific | 6149-0002 | |
Sanipure Tubing 1/16inch ID x 1/8inch OD | SaniPure | AR400002 | |
Sanipure Tubing 1/4inch OD x 1/8inch ID | SaniPure | AR400007 | |
Variable Flow Mini Pump (Peristaltic pump) | Fisher Scientific | 13-876-1 | |
Magnetic Stirrer | Velp Scientifica | F203A0160 | |
Forceps | Fisher Scientific | 14-512-141 | Millipore* Filter Forceps |
Multi-plate spectrophotometer plate reader | Molecular Devices Analyst GT | ||
Filter manifold | Fisher Scientific | XX10 025 02 | |
Software: | |||
Python version 2.7.5 | http://www.python.org/ | ||
PyLab module | http://wiki.scipy.org/PyLab | ||
R version 3.0.1 | http://www.r-project.org/ | ||
reshape2 library | http://had.co.nz/reshape | ||
ggplot2 library | http://ggplot2.org/ | ||
Gene Composer | PSI Tech Portal | http://www.genecomposer.net | |
Services: | |||
West Coast Metabolomics Center | UC Davis | http://metabolomics.ucdavis.edu | |
DNA 2.0 | https://www.dna20.com |