ここでは、推定ファージ遺伝子の機能的特徴付けのための現象的アプローチを提示します。技術には、宿主の同化代謝を監視できる開発されたアッセイ、マルチ表現型アッセイプレート(MAP)、確立されたメタボロミクスの方法に加えて、異化代謝への影響を測定することができます。
Method Article
ここでは、推定ファージ遺伝子の機能的特徴付けのための現象的アプローチを提示します。技術には、宿主の同化代謝を監視できる開発されたアッセイ、マルチ表現型アッセイプレート(MAP)、確立されたメタボロミクスの方法に加えて、異化代謝への影響を測定することができます。
ファージ - 宿主相互作用への電流の研究は、(メタ)ゲノムから知識を外挿することに依存しています。興味深いことに、60 - すべてのファージ配列の95%が現在の注釈付きタンパク質に相同性を共有しません。その結果、ファージ遺伝子の大部分は、仮定としてアノテートされています。この現実は頻繁に両方の構造および補助代謝遺伝子の注釈に影響を与えます。ここでは、これらの未知のファージ遺伝子のいずれの発現時に選択された宿主の生理学的応答(複数可)を捕捉するように設計phenomic方法を提示します。メタボロミクスは、代謝物質の存在量および多様性を監視することにより、副生成物の分析を提供しながら、複数の表現型アッセイプレート(マップ)が、ホスト基質利用およびその後のバイオマス形成の多様性を監視するために使用されます。両方のツールは、単一の推定上のファージのオープンリーディングフレーム(ORF)の発現に関連する表現型のプロファイルを提供するために同時に使用されます。両方の方法のための代表的な結果を、highl比較します推定上の構造的または代謝ファージ遺伝子のいずれかを有する宿主の表現型プロファイルの違いをighting。また、実験的な分析を容易に可視化技術と高スループットの計算パイプラインが提示されています。
(バクテリオファージまたはファージ別名)細菌に感染するウイルスは、世界的に粒子(VLP)のように10以上31ウイルスに存在すると推定し、環境1,2内の他のすべての生物を上回っています。海洋環境に関連したウイルスのコミュニティを調査する最初のメタゲノム研究では、ウイルス画分3内に見られる多様性を定量化することに焦点を当てました。さらに、Breitbartらは、ウイルスコミュニティ配列の65%以上が公共のデータベースで利用可能な任意の配列と相同性を共有していないことがわかりました。その後のメタゲノム研究では、同様の証拠を発見した:サンディエゴの海洋堆積物からmetagenomes、カリフォルニア州は、4、75%の未知のウイルス配列が含まれています。ソルトン湖の過塩性の湖からmetagenomesは98%で、未知のウイルス配列5が含まれています。 98%の未知のウイルス配列6 -やサンゴ関連metagenomesは、95が含まれています。注釈のないこのような情報の蓄積がもたらしました7「生物学的宇宙の暗黒物質」であるファージの遺伝物質。
ファージのゲノムの特徴付けは、既存の核酸とタンパク質データベースとの比較を通して配列類似性を特定することに依存しています。ファージにコードされた遺伝情報は、主に不明であるため、相同性に基づく方法は効果がありません。転写及び複製遺伝子、代謝遺伝子、構造遺伝子:そのゲノム内に、ファージは、典型的には3つの主要な遺伝子型をコードします。転写および複製遺伝子(クラスI / II遺伝子8)ポリメラーゼ、プライマーゼ、エンド/エキソヌクレアーゼ、およびキナーゼを含みます。これらの遺伝子は、高度に転写し、ファージの遺伝物質を複製、ファージ感染におけるその重要性のために保存されています。ファージポリメラーゼは、容易に、それらの地球環境保全9に、従来の配列相同性の方法を用いて同定され、系統学的マーカーとして有効で10を提供するために示されています。これとは対照的に、ファージ代謝および構造遺伝子(クラスII / III遺伝子8)は 、ますます発散、しばしば架空の遺伝子として注釈されています。
ファージ代謝遺伝子は、宿主の代謝能力に影響を与え、必ずしもウイルスの複製に必要とされていません。これらの遺伝子は、多くの場合、補助代謝遺伝子11(AMGs)と呼ばれる、ホストの代謝を調節し、成熟ビリオンの感染及び成功の最適な進行を可能にするように思われます。 AMGsは栄養素を制限する利用及び取り込みまたはエネルギー産生経路に関連しています。いくつかの例は、種々の12-16シアノファージのゲノム中に見出さ光化学遺伝子、遺伝子に連結され、リン酸代謝17,18、およびファージのdNTP生合成18,19用のペントースリン酸経路の利用により調節が挙げられます。比較では、構造遺伝子は、感染中に生成後期遺伝子中旬の間であり、異なるファージ浩にわたって変化しますSTシステム。構造タンパク質の生産は、それらの転写、翻訳、およびアセンブリ8のためのウイルスのdNTP、およびエネルギー·プールの可用性に依存しています。カプシドと尾部繊維構造タンパク質は、すべてのウイルスタンパク質をコードする遺伝子の最も発散とみなされ、成功したビリオン産生のために必要とされます。その発散は、通常、彼らは、ウイルス-宿主共進化20の形成に果たして積極的な役割に起因します。伝統的な相同性および配列アラインメント技術を使用した場合発散タンパク質は関係なく、遺伝子クラスの、容易に見過ごされています。厳密な配列比較で見られる制限を補正するための努力は、人工ニューラルネット21との関連付けを決定するために、配列の特徴を使用することが可能なバイオインフォマティクスツールをもたらしました。人工ニューラルネット(のANN)の構造および代謝遺伝子の予測を可能にする、しかし、直接特徴づけるために、下流の実験的検証が必要遺伝子機能。
本稿の目的は、新規なファージ遺伝子の発現の間に宿主細菌の両方の異化と同化代謝を監視することができるphenomicプロトコルを提供することで、機能のANNを通じて予測しました。フェノミクスの分野では、細胞表現型に関連する生物学は、十分に不明または多面的な機能を有するタンパク質の研究を支援するためにシステム生物学で確立されています。 Phenomicツールは、遺伝子型情報に表現型情報をリンクするために使用されています。我々は、その機能(複数可)は、ファージ遺伝子発現時に宿主の生理学的効果を観察することによって決定することができる推定上のファージ遺伝子を仮定しました。この仮説を調べるために、2つの定量的な方法を選択しました。メタボロミクスは、特定の環境で成長中のホスト代謝産物の多様性と相対的な存在量を測定しながら、複数の表現型アッセイプレート(マップ)がホスト基質利用およびその後のバイオマス形成をモニターするために使用しました。精神状態。推定上の構造および代謝タンパク質が大腸菌内で過剰発現し、両実験からの代表的な結果が比較されます。多数の視覚技術および高スループット処理パイプラインは、実験の複製を容易にするために提示されています。最後に、提示される方法の再現性と精度は、注釈付きのキャプシドタンパク質およびファージ代謝タンパク質、チオレドキシン、プラス2つの推定AMGsの予想生理学的効果との関連で議論されています。
マルチ表現型アッセイプレートの調製(MAP)基板、基本培地、プレ成長メディア、およびバッファ
細菌の細胞懸濁液の調製
マルチ表現型アッセイプレートの調製(MAP)の
4.マルチ表現型アッセイプレート(MAP)の処理とパラメータ化
[1]
[2]
[3]
[4] MAPの5表現型解析
[6] 6.連続培養装置の構築
7.メタボロミクスのための連続培養を実行します
8.メタボロミクスのための連続継代のバッチ培養を実行します
9.代謝物の分析·加工
この研究において選択されたオープンリーディングフレーム(ORF)を決定するために使用されるすべてのサンプルはスターバック島、サイト7(STAR7)とキャロライン環礁、南ライン諸島のサイト9(CAR9)から収集しました。以前5記載のように、これらのサイトからの海水の推定100 Lは、ビルジポンプを使用して、サンゴ境界層の下に回収しました。ポンプの内容は、小さな真核生物を除去するために、大きな孔のフィルターを通して分別の対象とし、その後粒子(VLP)のような唯一の微生物やウイルスを残し100kDaのタンジェンシャルフローフィルターを用いて濃縮しました。のVLPを分離するために、残りの海水はviromeその結果、0.45μmのフィルターを通過させました。クロロホルムは、残りの細胞の増殖を阻止するために、このウイルス画分に導入し、4℃で保存しました。
VLPは、密度勾配遠心分離を介して分離し、VIRの回復を可能にする塩化セシウム法を用いて精製しました。〜1.35グラム/ミリリットルグラム/ mlの3〜1.5でイオン。ウイルスDNAは、CTAB /フェノールを用いて抽出した。クロロホルムプロトコルとファージphi29試薬を用いて、複数の変位増幅を介して増幅しました。 viromeの配列決定は、市販のパイロシーケンシング技術を用いて達成されました。
以下のように、この研究のために処理し、ウイルスのORFの選択に使用されるバイオインフォマティクスです。三前処理ステップはCAR9とSTAR7ウイルスmetagenomesで使用されました。まず、公共のソフトウェアを配列27の前に、ウイルスDNAの増幅から生じたタグ配列を除去しました。第二に、このような配列の重複と低コピー数などの一般的なシーケンシングアーチファクトが追加のバイオインフォマティクスプログラム28を介して、データセットのうち、濾過しました。最後に、外来配列の汚染29を除去する≥90%の範囲と以下のデータベースにおける配列と≥94%の同一性を有していたこれらの配列のために実施した:のRefSeq Virusゲノム;ヒト - リファレンスGRCh37。ヒト - セレラ·ジェノミクス。ヒト - クレイグ·ベンター(HuRef)。ヒト - ソン·ジン·キム(韓国)。ヒト - 染色体7バージョン2(TCAG);と人間-ジェームズ·ワトソン、YanHuang(YH、アジア)、ヨルバ語(NA18507、アフリカ)参照配列21。これらのプロセスに続いて、CAR9サンプルからの配列は、591600を合計しSTAR7配列は939311円となりました。これらの配列はMGRASTにアップロードして、デフォルト設定を使用して、アセンブラソフトウェアを介して組み立てました。コンティグは6リーディングフレームと推定されるオープンリーディングフレーム(pORFs)に翻訳されました以前に21を説明するように、スクリプトを使用して同定しました。
未知のORFを同定するために、類似ベースの検索数は、既知の機能ののORFを除去するために行われました。簡単に説明すると、次の検索は、それに対応する検索条件21を用いて行きました。
得られたpORFsは大腸菌における発現のために設計されました公に利用可能な遺伝子設計ソフトウェアを使用して大腸菌 。アミノ酸配列の逆翻訳E.における発現に適応するように設計されたユニバーサル·コドン使用表を用います2%の最低使用率のしきい値を持つ大腸菌 。制限酵素認識配列をBamHIおよびHindIIIのための、クローニングを容易にするために、配列から除外しました。社外30工学遺伝子配列を合成し、その後のORFは、標準的な制限酵素クローニングを介して、中程度のコピー数のpBADプロモーターベクター、pEMB11にクローニングしました。すべてのクローンは、 大腸菌に形質転換しました大腸菌 K-12株BW 27784 23。
マルチ表現型アッセイプレート(MAP)の
高いスループットと堅牢なソフトウェアパイプラインは地図、PMAnalyzer 24の分析のために活用されました。パイプラインは、Linuxサーバ環境で開発を含む様々なステップを実行した:光学密度ファイルの解析品質保証(QA)が読み取り可能なテキストファイル、成長曲線の前処理へのデータをフォーマットし、成長曲線を分析するために、数学的モデリング技術を実行します。主要モデリングスクリプトはPyLabモジュールを利用するPythonのバージョン2.7.5に開発されました。
図2A)のための標準誤差(SE)を用いて評価しました。生の成長曲線は、実験中にプログラムPMAnalyzer正確にパラメータ化し、モデル化され、クローン増殖(データは示していない)かどうかを決定するためにロジスティック増殖曲線と比較しました。 MAPの正確性および有効性の詳細については、とPMAnalyzerクエバスらを参照してください。24
方法の検証に続いて、地図データは、処理パイプラインによって提供されるような最大増殖速度(μmax)が、成長レベル(GL)などの複数のパラメータを用いて分析しました。増殖曲線の比較視覚化は、多くの場合、成長データの解釈のために使用されます。しかしながら、比較のために一度に視覚化することができる曲線の数には限界があります。同時に多数の成長曲線を分析するために、ヒートマップ派生プロットは、単一substrat上に成長させたクローンの数十を比較するために懇願しました。その条件「平均応答( 図2B)に対してE。新規ファージタンパク質の過剰発現によって配置影響は、特に、曲線パラメータの変化によって観察される:誘導期、対数期最大バイオマス収量(漸近線)。一例として、カプシドタンパク質( 図2A)の成長曲線でモデル化された指数期に遅滞期から急な登りが、 図2Bの動的なプロットに同じクローンについて黒から白への色強度の迅速な変化によって再現されます。
基板全体のクローン分布の全体像を得るためには、GLから誘導される表現型の分類は( 図3)を用いました。ここでは、4つの表現型は、各バーの高さは、特定の基材のためにその表現型を示すクローンの数を表す4のグラフに分離されています。データ内の異常値は、府の「ゲインに落ちるクローンとして認識されていますnction」または「機能」カテゴリの損失。異常値は、その後、個別に求めることが実験的に、より密接に調査することができます。また、世界的な分析は、アッセイに基板バイアスを認識します。フェニルアラニン、リンゴ酸、およびグリシンなどの基質は、「非増殖」分類をもたらしました。一貫して成長なし分類に分類された基板は、全てのクローンを横切って、重く下流機能的特徴に加重されていません。
メタボロミクス
未知のファージ遺伝子を発現するクローンからの異化産物は、メタボロミクスを用いて同定しました。簡単に説明すると、クローンは前メタボロミクスコア施設でGC-TOFMS分析のために送信されるまで、バッチ培養環境中で連続培養または連続継代のいずれかの下で成長させました。選択された中核施設によって実装GC-TOFMS用のサンプル処理、分析、および正規化の詳細についてはFiehn ら 31ブリを参照してくださいefly、冷抽出溶媒1mlのサンプルはボルテックスし、5分間冷浴中で超音波処理された後、各サンプルに添加されます。試料は、最終的に遠心分離し、試料の半分をデカントし、分析のためにダウン乾燥します。抽出物を精製し、ガスクロマトグラフ上にロードし、その後質量分析計に転送される前に、内部保持指標マーカーでスパイクされています。各サンプルからのデータは、クロマトグラムのすべての検出された信号の信号強度を報告するように分析されます。正規化のために、各サンプルのピークの存在量が合計され、総ピーク存在量は、セット内のすべてのサンプル間で平均化されます。サンプルあたりの代謝産物の存在量は、サンプルのピーク豊富で割って、サンプルセットの平均ピーク豊富で乗算されています。得られたデータを考察研究のメタボロミクスの分析のために使用されます。
メタボロミクス再現性の検証をする必要がありました各培養方法のための適切なサンプルサイズを決定します。サンプル内に見られる精度とサンプル全体に見られる変化を検出するには、両方のn = 3およびn = 6のデータセットを検討した( 図5B)の平均(S M)の標準誤差のサイズ。かかわらず、連続培養(CC)サンプルサイズの、データの1%未満、1.5≤S Mを有していました。中央値S M sが221と300であり、そして値は、0〜5×10 7.55へと3.74×10 5用のn = 3およびn = 6、それぞれの範囲でした。 S、M sは、サンプルの各セットについて計算した、シリアル文化(SC)メソッドで複製します。ここでも、データの1%未満ではS、M≤1.5、137の中央値S M、0〜3.51×10 5の範囲であった。各サンプルセット(CC n = 3の対の間のS、Mの分布を比較しますSC 対。CC、N = 6、n = 3のCC 対の SC n = 3であり、CCはn = 6は、n = 3)並べ替え検定を行いました。 DISTRIBいずれかの連続培養S、Mは 、データセットの値のutionはシリアル文化S M値 (p値= 0.0)の分布と有意差はなかったです。しかし、連続培養のためのS M値の分布はn = 3のデータは著しく連続培養のためのM S 値とは異なった、N = 6のデータ(p値= 1.908804×10 -49)でした。最後に、代謝産物あたり変動係数は、品質保証(QA)ステップ( 図5C)の実施の前と後を比較しました。合計では、210の代謝産物は、QAパイプライン(データの40%)の実施後に削除されました。削除されたデータの1%未満では、ゼロの代謝物の豊かさを持っていた〜2%、内部標準データだった、〜5%が代謝物からのデータは、前のEに観察されませんでした大腸菌 、残りの代謝物(> 30%)が1より大きく変動係数を有していました。
MAPの分析と同様に、グローバルobservatioNSは、情報メタボロミクスの提供の深さの初期の理解を提供しました。全体像を得るために、クローンは、階層的にクローン代謝産物プロファイル、関連する機能の潜在的なクローン、およびクローンの代謝産物の異常値( 図6)についての情報を提供し、それらの相対的な代謝産物の存在量に基づいてクラスター化しました。タンパク質の機能を強調するために、代謝産物を分離し、共通の代謝経路に基づいてグループ化されています。予備的な結果で、この分析を使用して、メタボロミクスは、異なるクラスからの遺伝子を分離することができることは明らかであった( 図6、クローンを強調しました)。さらに、メタボロミクスのデータと外れ値の識別は、各クローンの代謝産物対のための標準的なスコア(Zスコア)を計算することによって決定しました。統計的有意性を確保するために、外れ値は、データのわずか5%を占める、2のZスコア値を有するクローン代謝産物ペアとして定義された(データは示さず)。
ether.withinページ= "常に"> 
図の表現型分類の1.定義。成長レベル(GL)と最大成長率との間に(A)の関係。赤い丸で囲んだデータ点はない基質利用に少しを示す成長曲線を表します。 (B)箱ひげ図表現最小の伸び率(<0.15 OD /時間)での成長曲線の分布に基づいて、成長閾値を定義します。 (C)分散及びGLの標準偏差は、基質D-ガラクトースについて計算されます。短い破線は、2つの標準偏差平均から離れ表す。 この図の拡大版を表示するには、こちらをクリックしてください。
highres.jpg "/>
精度と差別化を介して、図2のMAP検証。(A)、注釈付き構造(カプシド)および代謝のクローンの成長曲線(チオレドキシン)、2つの新規な代謝のクローン(EDT2440、EDT2441)、およびクローンの平均応答は、スクロース、D-上に成長させましたマップのガラクトースとD-マンノース。青い線は、レプリケート·データとの間に見られる標準誤差を示す(n = 3)でした。 (B)47の異なるクローンの成長曲線は、白糖、D-ガラクトースとD-マンノースのヒートマップとして表されます。注釈付き構造(緑色の丸)および代謝のクローン(オレンジ色の円)、2つの新規な代謝クローン(濃い水色の円)、平均応答(赤い円)がハイライトされている。 この図の拡大版を表示するには、こちらをクリックしてください。
PLOAD / 52854 / 52854fig3highres.jpg "幅=" 700 "/>
複数の基板を挟んで表現型については、図3のクローン分布。72カーボン特有の成長条件を横切る47個のクローンのための表現型クローン数。表は、各表現型についての直接のカウントを提供しています。 この図の拡大版を表示するには、こちらをクリックしてください。

連続培養装置の構成を詳述する図4図(A)α-γ連続培養リアクターのポートを構築するために使用される手順は、(B)ステップは、(Cアウトフロー連続培養リアクターのポートと、を構築するために使用します)δと連続培養哺乳瓶のεポートを構築するための手順を。 = "https://www.jove.com/files/ftp_upload/52854/52854fig4highres.jpg「ターゲット=" _空白 ">この図の拡大版を表示するには、こちらをクリックしてください。

提示phenomic方法の図5の比較。マルチ表現型アッセイプレートを調製するための(A)ワークフロー(MAP)の、連続的な文化やシリアル文化。 (B)は、平均の標準誤差(S M)の割合はカウントのための両方のn = 3およびn =メタボロミクスのための連続培養(CC)とシリアル文化(SC)の調製方法のための6サンプルサイズ。 y軸は対数スケールです。連続培養(CC)メソッドのQAパイプラインの実装前後の代謝産物あたり(C)変動係数の分布(CV)、。g5highres.jpg「ターゲット= "_空白">この図の拡大版を表示するには、こちらをクリックしてください。

連続培養で増殖させたクローンの図6.メタボロームプロファイル。代謝物のセットの中央代謝産物の存在量を連続培養で増殖さ84クローンについてプロットされています。注釈付き(カプシド)の構造および代謝のクローン(チオレドキシン)、2つの新規な代謝のクローン(EDT2440、EDT2441)、平均代謝反応のための代謝産物プロファイルは赤色で強調表示されている。 この図の拡大版を表示するには、こちらをクリックしてください。
| 化合物 | カーボン | 窒素 | 硫黄 | リン |
| グリセロール | - | 0.40パーセント | 0.40パーセント | 0.40パーセント |
| 塩化アンモニウム | 9.5 mMの | - | 9.5 mMの | 9.5 mMの |
| 硫酸ナトリウム | 0.250 mMの | 0.250 mMの | - | 0.250 mMの |
| 硫酸マグネシウム | 1.0 mMの | 1.0 mMの | - | 1.0 mMの |
| リン酸カリウム | 1.32 mMの | 1.32 mMの | 1.32 mMの | - |
| 塩化マグネシウム | - | - | * | - |
| 塩化カリウム | 10 mMの | 10 mMの | 10 mMの | 10 mMの |
| 塩化カルシウム | 0.5μM | 0.5μM | 0.5μM | |
| 塩化ナトリウム | 5 mMの | 5 mMの | 5 mMの | 5 mMの |
| 塩化第二鉄 | 6μM | 6μM | 6μM | 6μM |
| L-アラビノース | 0.10% | 0.10% | 0.10% | 0.10% |
| MOPSのpHは7.4 | 1X | 1X | 1X | 1X |
表1の化合物とのMAPで使用される異なる基礎培地の濃度。 *塩化マグネシウム、1.0 mMのは、置換されています。 1×MOPS = 40mMのMOPS、4 mMのトリシン。
| 炭素基質 | 窒素基質 | 硫黄基質 | Phosphorus基質 |
| 2デオキシ-D-リボース | 2-デオキシ-D-リボース | 1-ブタンスルホン酸 | アデノシン-5- monophoshate |
| 4ヒドロキシフェニル酢酸 | アセトアミド | アセチルシステイン | ベータ - グリセロリン |
| 酢酸 | アデニン | D-システイン | creatinephosphate |
| アデノシン-5-一リン酸 | アデノシン | D-メチオニン | D-グルコース-6-リン酸 |
| アドニトール | アラントイン | ジエチルジチオホスフェート | ジエチルジチオホスフェート |
| α-D-グルコース | ベータ - フェニルエチルアミン | DL-エチオニン | DL-α-グリセロリン |
| α-D-ラクトース | ビウレット | グルタチオン | リン酸カリウム |
| α-D-melebiose | シチジン | イセチオン酸 | ピロリン酸ナトリウム |
| クエン酸 | シトシン | L-システイン酸 | ナトリウムチオリン |
| D-アラニン | D-アラニン | L-システイン | |
| D-アラビノース | D-アスパラギン | L-ジエンコル酸 | |
| D-アラビトール | -D-アスパラギン酸 | L-メチオニン | |
| D-アスパラギン | D-システイン | 硫酸マグネシウム | |
| -D-アスパラギン酸 | D-グルコサミン | メタンスルホン酸 | |
| D-セルビオース | D-グルタミン酸 | N-アセチル-DL-メチオニン | |
| D-システイン | DL-α-アミノ-N-酪酸 | N-アセチル-L-システイン | |
| D-フルクトース | D-メチオニン | カリウムテトラチオン | |
| D-ガラクトース | D-セリン | チオ硫酸ナトリウム | |
| D-グルコサミン | D-バリン | sulfanic酸 | |
| D-グルコース | ガンマアミノ-N-酪酸 | タウリン | |
| D-グルコース-6-リン酸 | グリシン | タウロコール酸 | |
| D-グルタミン酸 | グアニジン | チオ尿素 | |
| D-マンノース | ヒスタミン | ||
| D-ラフィノース | イノシン | ||
| Dリボース | L-アラニン | ||
| D-サリシン | Lアルギニン | ||
| D-セリン | L-アスパラギン | ||
| D-トレハロース | L-シトルリン | ||
| D-キシロース | L-システイン | ||
| ズルシトール | L-グルタミン酸 | ||
| グリセロール | L-グルタミン酸 | ||
| グリシン | Lグルタチオン | ||
| I-エリスリトール | L-ヒスチジン | ||
| イノシン | L-イソロイシン | ||
| L-アラニン | L-ロイシン | ||
| L-アラビノース | L-リジン | ||
| L-アラビトール | L-メチオニン | ||
| L-アスパラギン | L-オルニチン | ||
| L-アスパラギン酸 | L - フェニル - アラニン | ||
| L-システイン酸 | L-プロリン | ||
| L-システイン | L-ピログルタミン酸 | ||
| L-フコース | L-セリン; L-スレオニン | ||
| L-グルタミン酸 | L-トリプトファン | ||
| L-グルタミン酸 | L-バリン | ||
| L-イソロイシン | N-アセチル-D-グルコサミン | ||
| L-ロイシン | プトレッシン | ||
| チオ尿素 | |||
| L-メチオニン | チミジン | ||
| L-フェニルアラニン | チミン | ||
| L-ピログルタミン酸 | チラミン | ||
| L-ラムノース | チロシン | ||
| L-セリン | ウリジン | ||
| L-ソルボース | |||
| L-スレオニン | |||
| L-トリプトファン | |||
| L-バリン | |||
| Lキシロース | |||
| 乳酸塩 | |||
| ラクツロース | |||
| リンゴ酸塩 | |||
| ミオイノシトール | |||
| シュウ酸 | |||
| ソルビン酸カリウム | |||
| プロピオン酸 | |||
| プトレッシン | |||
| キナ酸 | |||
| ピルビン酸ナトリウム | |||
| コハク酸ナトリウム | |||
| スクロース | |||
| チミジン | |||
| キシリトール |
MAP実験に使用される基板の表2にリスト。
ここでは、推定上のファージ遺伝子の機能解析のためのphenomicアプローチを提示します。技術は、監視ホスト同化代謝可能な開発されたアッセイを含む、マルチ表現型アッセイプレート(マップ)、異化代謝に効果を測定することができるメタボロミクスの確立された方法に加えて。我々は、高スループット処理および分析24を可能にする、これらの技術に起因する大規模なデータセットを管理するための追加のツールを提供しました。最後に、注釈付きファージキャプシドタンパク質、ファージチオレドキシン、2つの推定代謝ファージ遺伝子、平均実験的応答を比較して、我々は、表現型の傾向や異常値の識別の識別に重点を置いて、データセットと遺伝子クラスの両方を解釈する様々な戦略を提案します。
述べたように、両方のアプローチを定量宿主代謝の半分のみを測定します。のいずれかの相対的な機能を解釈するために、調査中の新規タンパク質は、両方の方法からのデータは、機能の証拠を提供する必要があります。これが私たちの現在の原稿の焦点ではありませんが、各phenomicメソッドからのデータ出力は、ランダム森林や主成分分析などのクラスタリング手法に焦点を当てコンビナトリアル分析を通して置かれます。また、複合解析から得られた仮説は、その後、伝統的な遺伝的方法によって検証されなければなりません。
最後に、提示される方法は、頻繁に細菌生理学の影響を受けているため、同じ基準に従います。どちらの方法を実施する場合、考慮事項がで実験している独立した、クローングループを確保するためになされる必要があります。汚染が防止されます。単一の変数をテストしています。および適切な制御を同時に実行されています。これらの点を考慮しないと、任意の生理学的アッセイと同様の不明瞭な結果をもたらすであろう。
マルチ表現型アッセイプレート(MAP)の
MAPの開発は、( 図5Aおよび表1,2)は、現在利用可能な技術と比較して高いスループットと適応性アッセイを提供します。アッセイは、消耗品、機器、およびすべての微生物学研究室で利用可能な基本的な技術を使用しています。その後のデータ処理および分析のための計算パイプライン、PMAnalyzer 24の組み込みは、迅速なデータ解釈を確保します。また、アプローチの実験と解析の両方の側面が容易に調整することができるか、またはカスタマイズされた目的のために調整。データの大部分は、セクション4で概説フィルタリングを通過しなかった場合、例えば、一方が手動で問題を識別するために成長曲線を取捨選択することができます。問題は厳しいフィルタパラメータに起因して生じる場合は、スクリプトの調整を行うことができます。あるいは、問題が実験的プロセスに関連付けられている場合( すなわち、長期の縮合;不適切な細菌性セルの転送LSは、等)、追加の複製を容易に繰り返すことができます。
クエバスら 24に記載されているように、PMAnalyzerは凝集性、自動化されたパイプラインとして構文解析し、解析スクリプトを実行するラッパー·スクリプトとして記述された単一のbashのプログラムです。すべてのスクリプトは、3回のデータ全体の各時点で中央値をとることにより、25℃でのGitリポジトリから自由にアクセス可能であり、その後、遅れ時間を得るためにロジスティック曲線、最大増殖速度、漸近線、および新規の用語、成長レベルをパラメータ化。中央値を大きく外れ値の影響を低減するために我々の研究において、平均の上に選択された、しかし、スクリプトが容易に複製データの平均値を計算するように適合させることができます。原因レプリケート·データ全体に見られる減少変化(SE)( 図2A)に、私たちはロジスティック曲線をフィッティングするためのPMAnalyzerにおける中央値の使用を維持しました。さらに、本研究では成長のためのカットオフ(GL≥0.4)はDETEましたデータは、成長レベルと最大増殖速度( 図1A、B)を横切って分離する方法と比較することによってrmined。楽器とモデル·システムに応じて、この再定義がカットオフ値を必要とする、この用語は変更になる場合があります使用しました。
私たちの分析の主な利点は、我々は成長レベル(GL)として定義し、全体的な微生物の増殖を特徴付ける単一のパラメータを使用して表現型を比較する機能です。 GLは調和平均であるため、データの大きな外れ値の影響を軽減します。成長の概要を提供するために、シフトロジスティック当てはめ値との調和平均を使用することは試行錯誤に到着しました。他の方法は、成長が含ま区別しようとした:それがかかった時間は、特定の曲線パラメータ(半μmaxを、μMAX、及び運搬能力)、決意(R 2)の係数、および特定の曲線パラメータを乗じたR 2の組み合わせに到達します。シフトと調和平均を使用してGLのためのロジスティックフィット値は、このように、それが選択の方法となり、成長を評価する際に最大の範囲を提供しました。注意すべき検討事項は、動的な成長曲線パターンは、単一のパラメータまたはフィットモデルを使用する場合に失われる可能性を有することです。例えば、ロジスティック曲線とGLの個々の曲線のパラメータは、二相の成長を表現することができません。単一の炭素の環境では、成長のこの効果は、基質利用中の基板やシフトのいずれかの変換にウイルスタンパク質の仲介を意味します。複数の成長パラメータを考慮していないときに、潜在的に失われた追加の効果は、次のとおりです。長期の遅れ時間を、ウイルスの機械や製品の負担増を提案。急速に、対数期の加速エネルギー産生経路をホストするように結合されたウイルスタンパク質を示唆しています。バイオマス形成のまたはより高いレベル、ホスト栄養摂取及び同化(データは示していない)におけるウイルスのサポートを意味します。したがって、(新生増殖曲線をプロット図2A、B)は、時間の傾向に関する情報を提供します。
マップの構造および代謝遺伝子に寄与異なる応答を考慮するとき、それは、問題の異なる基板クラスがタンパク質機能の最大の証拠を提供することが観察されます。例えば、代謝性タンパク質は、多くの場合、中央代謝16,32をホストするために非特異的であり限定的な栄養素の買収に関連しています。 MAP予備実験は、中央代謝炭素源( 図2A)上に成長した時、推定代謝ファージ遺伝子を保有するクローンが増加誘導期を有することを明らかにする。逆に、ホストのエネルギーとのdNTPプールの大きな割合を必要と推定される構造遺伝子を担持するクローンは、セントの成長に偽陽性応答をもたらしますRALおよびアミノ酸代謝の炭素基質。顕微鏡で観察されたように、これは( 図2Aおよびデータは示さず)によるホストフィラメンテーションおよび/ または封入体を生じる不溶性タンパク質の蓄積に起因する可能性が高いです。さらなる分析は、これらの予備的な結果を確認するために必要とされているが、MAPは、特異的ファージ遺伝子クラスの機能を仮定する相関表現型の応答を取得することが可能です。
未知のウイルスタンパク質の解明に加えて、MAPは、個々の細菌または細菌のコミュニティの機能および代謝の多様性を調査するための新規な資源です。 MAP成分が細菌の範囲の成長をサポートするために容易に改変するために設計されています。海洋、栄養要求性、及び嫌気性微生物を含みます。異なる細菌属は、マップでサポートすることができる前に、これらの取り組みを促進するために定義された基礎および前増殖培地は、追加または調整された化学種を必要とします。MAPのこの使用中のノートには、トリプトン、酵母エキス、ペプトンなどの成分の使用を禁止する、定義されたメディアを維持することです。
メタボロミクス
メタボロミクスの分野は、質量分析により同定し単離した代謝産物を含む代謝物データベースに依存します。ここで選択した中核施設では最大のメタボロミクスのいずれかのデータベースを持っています。他の人が前に私たちのホストに記録されていなかったしながら興味深いことに、我々の実験法から得られた代謝物の半分以上は、(〜65%)識別不能であった、 大腸菌は、(例としては、インドール3酢酸33、サリチル酸34、及びジヒドロ酸を35)。この事実は、植物代謝物、または調査中の特定のタンパク質に向けたデータベースの強いバイアスのいずれかに起因する可能性があります。それにもかかわらず、結果は、データ表現および分析のために利用可能な既知の代謝物の、限られた数です。府でトゥーレ、各種データベースを使用して複数のメタボロミクス法が大きく代謝産物のカバレッジを可能にするであろう。
本発明の新規なウイルスタンパク質を比較し、対比するとき現在、既知および未知の両方の代謝産物が使用されます。このアプローチを使用して、我々は機能的に類似のタンパク質を保有するクローンは、完全なメタボロームプロファイルで増加した類似性を共有すると仮定しました。予備メタボロミクス分析は、構造と代謝遺伝子は明らかに互いから分離しないしながら( 図6)を関連付けるか過剰発現された場合、それらの遺伝子は、ホスト上の同様の効果を発揮することが明らかになりました。例えば、本研究では、EDT2440とEDT2441で強調表示、推定代謝遺伝子と密接にキャプシド遺伝子クラスターを注釈付き。公的に利用可能な膜貫通トポロジーおよびシグナルペプチド予測プログラムを用いて調査の両方の推定上の代謝遺伝子は、単一の膜貫通ドメインを保有証拠を示しました。興味深いことに5番目のうち最初のクラスター·グループ(系統樹の最も左側の部分)で電子9クローンは、同じトポロジのプログラムを使用して、膜貫通ドメインを予測しています。さらなる調査が必要である、しかし、それは、これらのクローンの過剰発現の間に存在する代謝物が膜または構造負荷に起因する細胞ストレス応答と関連している可能性があります。この証拠は、メタボロミクスのデータは、ノイズの増加量を有しているが、この方法は、遺伝子のクラス内および間の両方、遺伝子の一般的な効果を区別する信号を強調することが可能であることを支持しています。この方法は、遺伝子機能の具体的な情報を抽出することができるかどうかを判断するには、代謝産物は、特定の代謝経路に分類しました。クローンは、単一の経路に特異的な代謝物に影響を与える場合である仮説は、その後、過剰発現した遺伝子は、その経路において活性です。私たちのメタボロミクスの品質保証·パイプラインの確立に先立って、予備データは、上にいることを明らかにしました過小評価D代謝産物は、それらが関連付けられている経路にほとんど情報を提供し、典型的には、「不明」であった(データは示さず)。前処理されたメタボロミクスデータは、しかし、代謝産物プロファイルの大部分が類似しており、唯一の未知および既知の代謝産物の存在量の選択された数は、インスタンスプトレシンおよびウラシル( 図6)のために、クローン間で異なることが明らかになりました。タンパク質機能の努力のより高い解像度を提供するために、実験的に機能的な特徴付けをベース代謝産物の「穴」を埋めるために使用することができる公知のファージ遺伝子、ファージに対する新規遺伝子を比較するために行われています。この技術を使用して、既知のウイルス遺伝子の割り当てられた機能は、未知の遺伝子の機能のためのリファレンスを提供します。それにもかかわらず、メタボローム解析の制限要因は、データベースのサイズと関連性があります。これらの制限を補正するために、本研究に関係づけメタボロミクスのデータベースを開発する必要があります。そのようなEのASKAコレクションに特定の代謝物のデータベースとその存在量として大腸菌クローンは、1つのORFは、36を過剰発現されます。 Lawerenceバークレー国立研究所の研究者がモデル細菌37の全体の変異体のライブラリーに特有の代謝物の最初の包括的なデータベースをコンパイルした場合、データベースの必要性の証拠は、2013年に提供されました。本研究では、表現型と遺伝子型との間に明確な接続を明らかに、特定の代謝産物の利用のために必要な遺伝子に新たな洞察を提供しました。
ツールとしてメタボロミクスを考えると、それは、処理体制は中核施設で追跡定義することが重要です。ほとんどの実験手順のアーティファクトは、使用の機器に関連する日々の分散です。現在までに、すべてのGC-MS分析は、各分析の実行に含まれる内部標準の使用を実装しています。しかし、プロジェクト固有の内部のサンプルの追加</ em>の実験のそれぞれの日には、追加の分散を削除しました。これらの考慮事項は、正規化の問題とバイアスを回避するために、早期に対処する必要があります。別の解決策は、同じマシン上の中核施設で、かつ単一のバッチ、任意の中核施設で利用可能なオプションとして、すべてのサンプルを処理することです。
この原稿に導入され、再調査し、両方のさまざまなツールは、新規の提供、機能未知のファージ遺伝子をスクリーニングし、特徴づけることを意味します。計算パイプラインの流線用いた実験手法の単純さと適応性は、これらの方法は、研究努力と幅広い分野に適用可能である保証します。私たちの目標は、ここに提示phenomicアプローチも同様に機能的に定義されていませんシステムに加えて、新規のファージタンパク質のさらなる研究を支援することです。
著者らは開示するものは何もない。
この原稿に対する彼らの助けと建設的な意見に対して、Benjamin Knowles、Yan Wei Lim、Andreas Haas、そしてViral Dark Matterコンソーシアムのメンバーに感謝します。この研究は、全米科学財団(DEB-1046413)の資金提供を受けており、Dimensions: Shedding Light on Viral Dark Matterプロジェクトの一部です。
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| 0.22 以上m Sterivex Filter | Fisher Scientific | SVGP01050 | Millipore |
| 0.22 & マイクロ;m Millex Filters | Fisher Scientific | SLGV033RS | Millipore |
| 0.22 & micro;m SteriCap | フィッシャーサイエンティフィック | SCGPS02RE | ミリポア |
| 0.22µm オムニポア メンブレン フィルター | ミリポア | JHWP02500 | ミリポア |
| 96 ウェル マイクロタイター プレート | VWR | 82050-764 | 標準 F-ボトム 96 ウェル マイクロプレート |
| 2 ml 96 ウェル プレート | フィッシャー サイエンティフィ | ||
| 接着シール プレート フィルム | シグマ-アルドリッチ | Z369667 | |
| 2 L ナルゲン スクエア ボトル | コール パーマー | T-06040-70 | |
| 125 ml Nalgene スクエア ボトル | コール パーマー | T-06040-50 | |
| 1/4 インチパネルマウントロックナット、ブラックナイロン | コールパー | マーEW-45509-04 | |
| メスルアースレッドスタイルのパネルマウント、200シリーズバーブ、1/16インチ | コールパー | マーEW-45500-30 | |
| メスルアースレッドスタイルパネルマウント、200シリーズバーブ、1/8インチ | コールパー | マーEW-45500-34 | |
| オスルアー一体型ロックリング-500シリーズバーブ、1/16インチIDチューブ | コール・パーマー | EW-45505-31 | |
| ロックリング付きオス・ルアー x メス・ルアー・カプラー | コール・パーマー | T-45508-80 | |
| 有刺鉄線バルクヘッド継手、1/4インチOD | フィッシャーサイエンティフィック | 6149-0002 | |
| サニピュアチューブ、1/16 インチID x 1/8 インチ外径 | SaniPure | AR400002 | |
| Sanipureチューブ、1/4インチ外径 x 1/8 インチID | SaniPure | AR400007 | |
| 可変流量ミニポンプ(蠕動ポンプ) | フィッシャーサイエンティフィック | 13-876-1 | |
| マグネチックスターラー | ベルプサイエンティフィカ | F203A0160 | |
| フォーセプス | フィッシャーサイエンティフィック | 14-512-141 | ミリポア*フィルター |
| マルチプレート分光光度計 プレートリーダー | モレキュラーデバイスアナリスト GT | ||
| フィルターマニホールド | Fisher Scientific | XX10 025 02 | |
| Software: | |||
| Python version 2.7.5 | http://www.python.org/ | ||
| >PyLab module | http://wiki.scipy.org/PyLab | ||
| R バージョン 3.0.1 | http://www.r-project.org/ | ||
| reshape2 library | http://had.co.nz/reshape | ||
| ggplot2 library | http://ggplot2.org/ | ||
| >Gene Composer | PSI Tech Portal | http://www.genecomposer.net | |
| Services: | |||
| 西海岸メタボロミクスセンター | UCデービス | 校http://metabolomics.ucdavis.edu | |
| DNA 2.0 | https://www.dna20.com | ||
Request permission to reuse the text or figures of this JoVE article
Request Permission