Introduction
メタゲノミクスは、環境試料1内で見つかった生物群集から精製されたDNAの直接分析であり、もともと堆積物2で見つかったunculturable細菌を検出するために使用されました。メタゲノミクスは広く海4内、さらにはコーヒーマシン5上で開発細菌群集の解析のための微生物群を分類する、そのような人間microbiome 3を特定するようなアプリケーションの数のために使用されています。次世代シークエンシング技術の導入は、より大きな配列決定のスループットと出力が得られました。その結果、DNA配列決定は、6より経済的になってきているし、実行することができシーケンシングの深さが大幅に強力な、分析ツールになるためにメタゲノミクスを可能にする、増加しています。
メタゲノム配列決定の実用的な、分子の局面では、「フロントエンド」の機能強化は、 中の成長を牽引してきました分類学的分類7-9、機能アノテーション10,11とDNA配列データを視覚的に表現12,13のために利用可能なシリコバイオインフォマティクスツール。使用可能な数の増加は、常に配列決定されたゲノム15の「バックエンド」参照データベースに対して実行されている微生物群集の分類でさらに精度を可能にする原核生物と真核生物の14のゲノム配列を決定しました。二つの主要なアプローチは、メタゲノム解析のために採用することができます。
多くの従来の方法は、細菌ゲノムの16S rRNA遺伝子のコード領域の分析です。種の同定16のために利用することができる- 16S rRNAのは非常に(V9 V1)原核生物種が、展示物9の超可変領域の間で保存されています。 (300bpのペアエンド≤)より長い配列決定の導入は、特に二超可変領域にわたるDNA配列の分析のために許可されましたV3 - V4領域17。このようなオックスフォードナノ細孔18とPacBIO 19などの他の配列決定技術、の進歩は、全体の16S rRNA遺伝子が連続して配列決定することが可能です。
16S rDNAのベースのライブラリは、種の同定への標的アプローチを提供し、天然の精製されたサンプル内で発生する低コピー数のDNAの検出を可能にするが、ショットガン配列決定ライブラリは16Sのいずれかによって増幅されないDNA領域を含んでいてもよい種の検出を可能にrRNAのマーカーのプライマー配列を使用し、または鋳型配列と増幅プライマー配列の違いは20,21大きすぎるからです。 DNAポリメラーゼは、DNA複製の高い忠実度を有するが、さらに、ベース・エラーにもかかわらず、PCR増幅中に発生することができ、これらの組み込まれたエラーは、種22を発信の誤った分類をもたらすことができます。テンプレートseqのPCR増幅におけるバイアスuencesにも発生することがあります。高GC含有量のDNAの配列を下に、最終的なアンプリコンプール23で表現することができ、例えば、チミングリコールなどと同様の非天然塩基修飾は、DNA配列24の増幅の障害の原因となるDNAポリメラーゼを停止させることができます。対照的に、ショットガン配列決定DNAライブラリーは、サンプルから抽出し、続いて前の配列決定のための準備に短いDNA鎖の長さに断片化された精製されたDNAの全てを用いて調製されたDNAライブラリーです。 16S rRNAのアンプリコンシーケンス25と比較した場合、信頼性の高い配列決定の深さに到達するのに必要な財政的コストは、アンプリコンの配列決定26よりも大きいが、ショットガン配列決定によって生成されたDNA配列の分類学的分類は、より正確です。ショットガンシーケンシングメタゲノムの主な利点は、彼らがされた後、試料中の様々なゲノムの配列決定された領域は、遺伝子の探査のために利用可能であるということです分類学的に27に分類されています。
メタゲノム配列データは、バイオインフォマティクスツールの増え続ける範囲で分析します。これらのツールは、例えば、多種多様なアプリケーションを実行することができ、対の端部の重なりの生配列データ28の品質管理分析は、配列のデノボアセンブリはコンティグと足場30,31、分類学的分類および可視化に読み出し、29読み出しシーケンスの読み込み、シーケンス7,12,32,33および組み立てシーケンス34,35の機能注釈を組み立てました。
例えばトウモロコシなどの発酵穀物( トウモロコシはメイズ )から世界各地の農家によって生産サイレージは、主に牛の飼料として使用されています。サイレージは、細菌のラクトバチルス属で処理されます。発酵36を補助するが、現在までに、サイレージで見つかった他の微生物集団の限られた知識があります。 fermentation個のプロセスがサイレージ37内に普及してきて、望ましくない、潜在的に有害な微生物につながることができます。酵母及びカビに加えて、細菌は、サイレージ発酵における嫌気性環境に特に適応可能であり、より頻繁に家畜における疾患ではなく、サイレージ38の分解に関連しています。サイレージサイロを充填し、したがってサイレージ39のpHを増加させ、酪酸に、乳酸、嫌気性消化の製品を変換することができますときに不注意土壌から追加することができます酪酸菌が残っています。このpHの増加は、通常、最適なサイレージの発酵条件38の下で成長を持続することはできないであろう腐敗細菌で盛り上がりにつながることができます。 クロストリジウム属 。 、 リステリア属。及びバチルス属 。 gastrを生き残った細菌胞子のように、特に乳牛用飼料サイレージでは、特に懸念されますointestinal管40は 、食物連鎖に入る食品の腐敗につながると、まれに、動物およびヒトの死亡者37,39,41-44にすることができます。それはサイレージの損傷によって引き起こされる獣医学的治療および家畜損失の正確な経済的影響を推定することは困難であるがまた、流行が発生した場合、ファームに有害である可能性が高いです。
メタゲノムアプローチを使用することによって、私たちがする是正措置を可能にする、サイレージ試料中に存在する微生物群を分類し、さらに、今度は、潜在的に家畜に有害な影響を持っているでしょうサイレージの腐敗に関連した微生物群集を識別することができると仮定されますサイレージは、食料源として使用される前に採取。
Protocol
1.サイトの場所
- このようなファームとして適切なサイトからサイレージのサンプルを収集します。ここでは、ファームはBallydulea、株式会社コーク、アイルランド(51°51'58.4 "N 8°16'48.7" W)に位置していました。
2. DNA抽出
注:DNA抽出は、製造業者の説明書に従って市販のキットを用いて行きました。何のサンプルが含まれていないネガティブコントロールは、ライブラリー調製方法全体で使用されました。
- 供給された溶解チューブに978μLのリン酸ナトリウム緩衝液122μL土壌溶解緩衝液に試料400mgの - 100を追加します。
- 6.0メートル/秒の速度で40秒間均質化に溶解チューブを配置することによって、サンプルを均質化します。
- 15分間14,000×gで遠心分離溶解物およびタンパク質沈殿溶液(PPS)の250μLを含むクリーンなマイクロ遠心チューブに上清を移します。 10回と遠心機を反転させることにより溶液を混合5分間、14,000×gで。
- きれいな15 mL遠心チューブに1 mLのDNA結合マトリックスに上清を追加します。 3分間絶えずチューブを反転させた溶液を混ぜます。次いで、混合物を、3分間沈降上清の500μLを破棄することができます。残りの上清を混ぜます。
- 1分間14,000×gでスピンフィルターや遠心分離機にサスペンションの600μLを転送します。ろ液を捨て、残りの懸濁液で処理を繰り返します。
- その後、1分間14,000×gで遠心し、ピペッティングにより混合し、スピンフィルター内のDNA結合マトリックスへの洗浄緩衝液500μLを加えます。
- ろ液を捨て、すべての洗浄緩衝液が除去されていることを確認するために2分間、14,000×gで再びスピンフィルターを遠心してください。 5分間23℃でのスピンフィルターを乾燥させます。
- (70℃)DNアーゼを含まない水(DES)プリ暖かく、スピンフィルター内のDESの100μLで再懸濁DNA結合マトリックス。きれいな1.5 mLのマイクロ遠心機TUにスピンフィルターを転送DNAを溶出するために1分間14,000×gであること、および遠心分離機。さらなる分析が行われるまで-20℃で精製したDNAを保管してください。
DNA精製ビーズを用い3. DNA精製
注:以前抽出したDNA試料が得られた純粋なDNAを確実にするために、精製ビーズを用いて精製したメタゲノムライブラリーの調製に関する。
- 使用前に30分間23℃でビーズをインキュベートします。 DNAサンプルにビーズの2ボリュームを追加し、5分間23℃で溶液をインキュベートします。
- 5分間分離磁石の上にサンプルを置き、その後、上清を捨てます。 200μLの新鮮な80%エタノール(エタノール)で2回ビーズを洗浄してください。空気を10分間ビーズを乾燥させます。
- 分離磁石からサンプルを削除し、溶出緩衝液(EB)の50μLを追加し、ピペッティングにより混合します。
- これは後に戻って3分間分離磁石の上にサンプルを置き、5分間23℃でサスペンションをインキュベートします。
- Trのきれいなチューブに、DNAを含む上清を、ansfer。ビーズを捨てます。
- セクション4に従って精製されたDNAを定量化します。
精製されたDNAの4定量
注:精製DNAを、製造業者の説明書に従って蛍光および二本鎖(二本鎖DNA)高感度(HS)アッセイキットを用いて定量しました。
- 試薬にバッファの1比:199を使用して、ワーキング溶液を調製します。
- ワーキング溶液190μLに各DNA標準の10μLを追加します。
- ワーキング溶液190μLに精製されたDNAの10μLを追加します。最終容量は200μLでなければなりません。 2分間23℃での標準およびDNAサンプルをインキュベートします。
- 画面上の指示を使用して、蛍光光度計でのDNAサンプルの前に基準を分析します。
5.ショットガンシーケンシングライブラリの準備
注:ショットガンシーケンシングライブラリーAを用いて調製しました。製造元の指示を使用して、市販のライブラリー調製キット。
- EBを使用して、0.2 ngの/μLにDNA試料を希釈します。すでにこの濃度未満である任意のサンプルは、ネガティブコントロール、すなわち 、現在の濃度で残されています。
- 10μLのバッファーと5μL酵素ミックスで精製されたDNAの5μLを混ぜます。 5分間55℃でサンプルをインキュベートします。
- バッファを中和する5μLを加え、5分間23℃で溶液をインキュベートします。
- サンプルの特定の塩基配列決定の指標のそれぞれの5μL、15μLのPCRマスターミックスを追加します。
- サーモサイクラーで、10秒、30秒55℃、30秒間72℃、95℃の12サイクルの前に、3分、30秒95℃、72℃でサンプルをインキュベートします。 5分間72℃で、最終的にサンプルをインキュベートします。
- 前としてではなくEBの30μLの最終溶出とビーズ精製を用いて調製されたDNAを精製します。
6. Library数量と品質チェック
注:準備ライブラリの量と質は、市販のキットおよび器具を用いて評価しました。
- 使用前に30分間23℃のキット成分をインキュベートします。
- 2000 rpmで1分間のバッファと渦の2μLにDNAの2μLを追加します。
- それはチューブの底にあることを確認するために、サンプルをスピンダウン。
- 機器にサンプル管、分析テープやヒントを挿入し、ソフトウェアによって指示されるように分析を行います。
7. DNAシーケンシング
- 300bpのペアエンドシーケンシング45を使用して、シークエンシングサービスやシーケンスに準備し、定量化されたDNAシーケンシングライブラリのサンプルを転送します。
生配列データの8解析
注記:Linuxオペレーティングシステムを使用して、各プログラムのコマンドは、プロトコルのステップの下に示されています。 sのために使用されるパイプラインequenceデータ分析は、図1に示されています。プログラムは、分析前にユーザーによってインストールされるべきです。このプロセスは、各試料について個別に行われるべきです。
- raw_read1.fastq raw_read2.fastqを読み込んで分析し、視覚化FastQC 46を使用して、DNA配列データをコマンドライン/パスからファイルへ/ fastqcに入力することで、前方に続いて、生を逆転。
- -o output_fastqcと-f FASTQによって生の読み取りファイルのファイル形式を入力して、出力フォルダを指定します。
- 出力ファイル( 図2)を表示します。
パスからファイルへ/ fastqc raw_read1.fastq raw_read2.fastq -o OUTPUT_DIRECTORY -f FASTQ。
9.品質管理のトリミングとフィルタリングシーケンスデータ
- コマンドラインのjava -jar /パスからファイルへ/ trimmomatic-0.35.jarに入力することで、トリミングプログラム、Trimmomatic 28を実行します 。
- 指定したファイルは「PE」を入力して、エンドファイルを対になっています。国家その16中央広報ocessing装置(CPU)は、-threads 16を入力して、プログラムによって使用されるべきです。
- 生の前方の名前を入力して、QCチェックに2つのファイルを一覧表示し、読み込み逆。出力ファイルの接頭辞が-baseoutサイレージを入力することによって決定されます。
- ILLUMINACLIPを入力して、プログラムのオプションを定義します。NexteraPE-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:20 CROP:200 HEADCROP:15 MINLEN:36。
- 完了したら、以前のようにFastQCを使用してトリミングされた配列を分析し、成功したトリミングを保証するために、生の配列データに出力を比較します。
注:ソフトウェアツール、Trimmomaticは、(品質3以下)低品質またはN基盤の末尾に、各4塩基ワイドスライディングウィンドウで読み取るスキャンの除去、(品質3以下)をリードする低品質またはN塩基を除去することにより、さらに読み込みトリミング。パラメータは、塩基当たり平均品質はいずれも36塩基長の下読み込みドロップし、次に20を下回ったとき切断するため設定しました。最後に、15塩基がfrのクロップましたオムそれぞれの頭を読み取り、読み取りの開始から200塩基を維持するためにトリミングされた読み取り。長い(> 200塩基対)を読み込むを配列決定すると、この最後のステップは、いくつかの品質の問題を克服するために行きました。これらは、特定のサンプル28のために調整することができます。
ます。java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseoutサイレージILLUMINACLIP:NexteraPE-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4 :20 CROP:200 HEADCROP:15 MINLEN:36
10.メタゲノムアセンブリ
- 不対をマージ、トリミング読み取り不対に続いて猫を入力して読み込みます。 silage_read2_unpaired.fastq silage_read1_unpaired.fastq。 > silage_merged_unpaired.fastqを入力して新しいファイルにファイルを書き込みます
猫silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq - デノボに、配列決定されたDNAを組み立てる入力/パスにすることによりスペード(サンクトペテルブルクゲノムアセンブラ)30を使用-file / spades.py。 16のCPUが16を-t入力して、およびメタゲノムパラメータが--meta入力して適用されるべきであることに使用されることを指定します。
- 前方にトリミングされた識別することは使用して-1 silage_read1_paired.fastqを読み取り、逆は-2 silage_read2_paired.fastqによって読み取ります。マージされた不対は、-s silage_merged_unpaired.fastqによって指定されている読み込みます。
- -o silage_spadesを入力して、出力フォルダを定義します。
パスからファイルへ/ spades.py -t 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades
11.ペアエンドリードオーバーラップ
- DNA配列のペアをマージするには、コマンドライン/パスからファイルへの/フラッシュメモリに入力することにより、FLASH(ショートの高速長さ調節が読み込み)29を使用して読み込みます。 16のCPUが-oサイレージを入力して、16と出力接頭辞を-t使用することによって使用されるべきであることを指定します。
- silage_trimmed_R1.fastq silage_trimmed_R2.fastqを入力することで読み込みトリミング識別
1 -tパスからファイルへの/フラッシュ6 -oはsilage_read1_paired.fastq silage_read2_paired.fastqを点滅しました
12.分類学的分類
- タイプ/パス・ツー・ファイル/クラーケンと--db /パスからファイルへ/標準を入力して、データベースを指定します。
- 16のCPUが--threads 16を入力して使用されるべきであることを定義し、FLASHed_silage_extendedFrags_kraken.txt --output使用して出力フォルダを識別します。入力ファイル名を入力します。 FLASHed_silage.extendedFrags.fastq
パスからファイルへ/クラーケン--db標準--thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
注:クラーケン7を使用して組み立てられたDNA配列足場の分類は、利用可能なすべての原核生物ゲノム配列を含ま最近、標準クラーケンデータベースに対して完了しました。 - カットを入力して、出力ファイルから、新しいファイルに列2および3を転送-f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int カット-f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
- ktImportTaxonomyを入力して、クローナ12に新しいファイルをインポートします。 FLASHed_silage_extendedFrags_kraken.intを入力して、入力ファイルを指定します。 FLASHed_silage_extendedFrags_kraken.out.htmlを-o入力して、出力ファイルを確認します。
パスからファイルへ/ ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html
13.機能アノテーション
- MG-RAST 47ウェブサイト、http://metagenomics.anl.gov/に移動します。必要に応じて新規ユーザーとして登録します。ログイン後、「アップロード」ボタンをクリックします。ステップ10から組み立てた足場をアップロードします。
- ファイルをアップロードしたら、「送信」し、指示に従ってくださいにクリックして、分析の完了を待っています。
- 分析が完了した後、EM を介して送信されるリンクを表示MG-RASTからAIL、または代替的には、「進歩」をクリックしてください。完了したジョブのリストがあります。当該ジョブIDにしてから「ダウンロードページ」へのリンクをクリックしてください。
- ダウンロードページで、見出しの下に「プロテインクラスタリング90%」、予測されたタンパク質のファイル、550.cluster.aa90.faaをダウンロードするには、タンパク質ボタンをクリックしてください。
- 推定される特定のCAZY酵素クラスに属するタンパク質を分類するために、CAZYデータベース48にダウンロードしたタンパク質を比較します。ファイルから炭水化物活性酵素データベース(CAZY)をダウンロードし、次のとおりです。AA.zip、CE.zip、GH.zip、GT.zipとPL.zip。炭水化物エステラーゼ(CE)、補助活動(AA)、グリコシダーゼ(GH)、グリコシルトランスフェラーゼ(GT)と多糖リアーゼ(PL):これらのファイルは、それぞれ以下の酵素のクラスを表します。
- データベース・ファイルを解凍し、USEARCH UBLAST ALGORを使用してCAZYデータベースタンパク質へのタンパク質の類似性を決定することにより、タンパク質に注釈を付けますITHM 49。 5データベース.txtファイルの種類を反復処理する(*の.txtで私のために)bashのループを使用するには、「* .txtとで私のために、やります」。
- ublastアルゴリズムを使用するためには、パラメータ-ublastと入力する/パス・ツー・ファイルを/ usearch8によってUSEARCHを実行します。そして、MG-RAST、「mgmXXXXXX.3.550.cluster.aa90.faa」からダウンロードしたタンパク質配列ファイルの名前を入力。
- データベースファイルを示すために"$ iは-db」と1E -5でE-値のしきい値を指定するタイプ、タイプ「-evalue 1E-5」を使用します。
- 標的配列の発見後、検索を終了し、したがって、標的酵素クラス、 例えば GH、タイプ「-masaccepts 1」に属するものとして、そのタンパク質配列を分類します。
- 16のCPUがタイプ "-threads 16」を使用する必要があるとATAB区切りのテキストタイプ」-blast6out」として出力ファイルの形式を指定することを定義します。出力ファイル・タイプの "$ i.ublast」を識別するために。トン、bashのループを終了するにはYPE ";行わ"
* .txtとでiについて。
やる/パス・ツー・ファイルを/私は-evalue usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ 1E-5 -maxaccepts 1 -threads 16 $ i.ublast -blast6out。
終わりました
14.可視化CAZYアノテーション
- ベン図としてCAZY注釈からの出力を視覚化するために、bashのループを使用して、各酵素のクラスのタンパク質IDリストを生成します。 "*の.ublastで私のために、やる」タイプ。
- 出力ファイルから、新しいファイルに列1を転送するには、タイプ「猫は$ iが| -f 1> $のi.listを切ります」。
- ループと種類を終了 ";済」。
- テキストエディタでの.listファイルを開きます。 Webサイトにアクセスし、5のようにセット数を選択して、個別のボックス内の各リストファイルの内容を貼り付けます。 .SVGファイルとして結果の図をダウンロードしてください。
I IN * .ublastため。
|猫の$ iが行います-f 1> $ i.listカット。
終わりました
Representative Results
バイオインフォマティクスの処理に先立って、生のシーケンスは、トリミングした読み取りおよびアダプタはTrimmomaticソフトウェア28を使用して除去しました。トリミングおよび濾過工程の後、配列の50%に減少した読み取りの数( 表1)を読み出します。平均ベースPHREDスコアは、品質管理( 図2)の後に> 30でした。
重複領域を持っていたDNA配列のペアが長く、単一生成するために、FLASHソフトウェア29を使用してマージされた非重複が別々のファイルに保存された読み取り、読み取ります。 45.47パーセントが正常に組み合わせ(105343)を読み出します。重複読み取りのFLASHを使用して、読み込み後、得られた拡張フラグメントはクラーケンソフトウェア7を用いて細菌の分類学的分類を受け、その後クローナソフトウェア( 図3)を用いて可視化しました。
、図4に見ることができます。メタゲノム中で最も豊富な種は、 ラクトバチルス属でした。 (24%;ファーミキューテス)、 コリネバクテリウム属 。 (8%;アクチノ)、 プロピオン酸菌属 。 (3%;アクチノ)及びプレボテラ属 。 (3%;バクテロイデス門)。疾患に関与する動物の健康に重要と種も観察されました。 クロストリジウム属 。 (1%)、バチルス属 。 (0.6%)、 リステリア属。 (0.2%)サイレージの試料中に存在すると予測されました。
機能アノテーション読み取り組み立てを行いました。メタゲノムをトリミングし、濾過を使用して、スペードアセンブラ30を使用して組み立てましたペアエンドと不対92284足場を生成する読み込みます。セルラーゼを同定するために、タンパク質は、MG-RASTを用いて予測し、炭水化物活性酵素データベース(CAZY)を使用して注釈を付けました。 97562予測タンパク質のうち、6357はCAZYデータベース( 図5)を構成する5酵素のクラスのいずれかで推定される炭水化物活性酵素として注釈されました。結果は、複数のCAZY酵素クラス注釈を含むものを含むタンパク質注釈の分布を示すInteractiVennソフトウェア50を使用して、ベン図として視覚化しました。これらのうち、3861は、グリコシド加水分解酵素活性を有すると予測され、更なる機能を確認するために実験室で特徴付けられます。
図1: サイレージの分析のためのバイオインフォマティクスメタゲノミクスパイプライン。二つの主要なアプローチがありましたサイレージ、分類学的分類と機能アノテーションのmicrobiomeを調査するために使用。 この図の拡大版をご覧になるにはこちらをクリックしてください。
図2: 前とトリミング後ごとのベースシーケンスの品質とアダプタの取り外し。 FASTQCからあたりの塩基配列品質のプロットは、配列の長さにわたって平均PHREDスコアは前後の品質管理を読み取り、表示されます。 この図の拡大版をご覧になるにはこちらをクリックしてください。
図3: 分類学的Classificaソリッドサイレージの細菌Microbiomeの化。 FLASHはクラーケン7を使用して実行し、その後クローナで可視化したからトリミングし、重複配列の分類は、読み取ります。 この図の拡大版をご覧になるにはこちらをクリックしてください。
図4: ソリッドサイレージの細菌Microbiomeで4最も豊富な門の分類学的クラス分布。 4つの最も豊富な門内細菌の各クラスの割合。ファーミキューテス: クロストリジウム (赤)および桿菌 (ダークブルー)。プロテオバクテリア: デルタ/イプシロン (ピンク)、 アルファ (淡いブルー)、 ガンマ (橙)、 ベータ (ターコイズ)。バクテロイデス門:Flavobacteriia(ダークブルー)とBacteroidia(薄緑色);放線菌:Coriobacteriia(濃い紫色)および他の放線菌 (ダークグリーン)。 この図の拡大版をご覧になるにはこちらをクリックしてください。
図5: ソリッドサイレージMicrobiomeにおける予測プロテオームのCAZY注釈。固体サイレージmicrobiomeの予測プロテオームにおけるCAZYアノテーションの5酵素クラスの分布を示すベン図。 この図の拡大版をご覧になるにはこちらをクリックしてください。
#生の読み取り | #フィルタ済み読み込み(ペアリング) | #フィルタ済み読み取り#読み取り点滅しました | |
(ペアリング) | (不対) | ||
2374949×2 | 231679×2 | 1892534 | 105343 |
表1:シーケンシングの概要表に読み込みます。
Discussion
インシリコ解析における環境試料中に存在する微生物群集に優れた洞察力を与えることができるが、分類学上の分類は、関連するコントロールに関連しておよび配列決定の適切な深さが全体をキャプチャするために達成されたことを実行することを実証することが重要です51現在の人口。
任意のコンピュータ解析により、同様の目的を達成するために多くのルートがあります。我々は本研究で使用した方法は、サイレージのmicrobiomeについての分析の範囲を達成するために一緒にされてきた、適切かつ簡単な方法の一例です。多様性とバイオインフォマティクスのツールと技術の増え続けるには、インスタンスPhylosift 8とMetaPhlAn2 52のため、メタゲノムデータを分析するために利用可能であり、これらは、サンプルとの関連性のための調査・分析REQの前に評価されなければなりません53 uired。メタゲノム解析手法は、分類、シーケンシングの深さおよび配列決定の品質のために利用できるため、データベースによって制限されています。
ここで実証したバイオインフォマティクスの処理はローカル、ハイパワーマシン上で実行されました。しかし、クラウド・ベースのシステムも利用可能です。これらのクラウドベースのサービスは、適切な強力なローカル・ワークステーションの高コストの投資をせずに必要な計算能力のレンタルを可能にします。この方法の潜在的な適用は、従って、食物連鎖に入るそれらを妨げる潜在的に有害な細菌が存在しないことを保証するために、農業での使用前に、サイレージを評価することです。
Materials
Name | Company | Catalog Number | Comments |
FastDNA SPIN Kit for Soil | MP Bio | 116560200 | DNA Extraction |
DNA FastPrep | MP Bio | 116004500 | DNA Extraction |
Agencourt AMPure XP beads | Beckman Coulter | A63880 | DNA Purification |
Elution Buffer | Qiagen | 19806 | DNA Purification |
Qubit Fluorometer | Thermo Fisher | Q33216 | DNA Quantification |
Qubit dsDNA HS Assay Kit | Thermo Fisher | Q32854 | DNA Quantification |
Nextera XT DNA Library Prep Kit | Illumina | FC-131-1024 | Library Preparation |
Nextera XT Index Kit | Illumina | FC-131-1001 | Library Preparation |
TapeStation 2200 | Agilent | G2964AA | DNA Quantification |
HS D100 ScreenTape | Agilent | 5067-5584 | DNA Quantification |
HS D100 ScreenTape Reagents | Agilent | 5067-5585 | DNA Quantification |
TapeStation Tips | Agilent | 5067-5153 | DNA Quantification |
TapeStation Tubes | Agilent | 401428 and 401425 | DNA Quantification |
HiSeq 2500 | Illumina | DNA Sequencing - provided by a sequencing service | |
High Power Analysis Workstation | Various | Local or cloud based, user preferred system |
References
- Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38 (1), 525-552 (2004).
- Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59 (1), 143-169 (1995).
- Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486 (7402), 207-214 (2012).
- Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304 (5667), 66-74 (2004).
- Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
- Hayden, E. C.
Technology: The $1,000 genome. Nature. 507 (7492), 294-295 (2014). - Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15 (3), 46 (2014).
- Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2 (12), 243 (2014).
- Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12 (1), 59-60 (2015).
- Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7 (1), 651 (2014).
- Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32 (9), 1323-1330 (2016).
- Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
- Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
- Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43 (1), 1099-1106 (2015).
- Camacho, C., et al.
BLAST+: architecture and applications. BMC Bioinf. 10 (1), 421 (2009). - Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69 (2), 330-339 (2007).
- Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2 (1), 6 (2014).
- Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14 (6), 1097-1102 (2014).
- Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20 (4), 853-853 (2011).
- Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343 (6169), 1236573 (2014).
- Der Sarkissian, C., et al.
Ancient genomics. Phil. Trans. R. Soc. B. 370 (1660), (2015). - Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65 (3), 709-719 (2013).
- McInroy, G. R., Raiber, E. -A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50 (81), 12047-12049 (2014).
- Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104 (3), 814-818 (2007).
- Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469 (4), 967-977 (2016).
- Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15 (2), 121-132 (2014).
- Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32 (9), 2685-2694 (2004).
- Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30 (15), 2114-2120 (2014).
- Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27 (21), 2957-2963 (2011).
- Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19 (5), 455-477 (2012).
- Nurk, S., Meleshko, D., Korobeynikov, A. metaSPAdes: a new versatile de novo metagenomics assembler. , (2016).
- Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215 (3), 403-410 (1990).
- Tanaseichuk, O., Borneman, J., Jiang, T.
Phylogeny-based classification of microbial communities. Bioinf. 30 (4), 449-456 (2014). - Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10 (11), 0142102 (2015).
- Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106 (1), 1-6 (2015).
- Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167 (3), 334-343 (2013).
- Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22 (4), 212-216 (2000).
- Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182 (1-4), 1-15 (2013).
- Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90 (7), 3278-3285 (2007).
- Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. , (2002).
- Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86 (6), 1865-1875 (2003).
- Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153 (1), 9-29 (1997).
- Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. , (2011).
- Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50 (4), 281-304 (2010).
- Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456 (7218), 53-59 (2008).
- Andrews, S. Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. , (2015).
- Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, Chapter 13 207-233 (2016).
- Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, Database issue 233-238 (2009).
- Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26 (19), 2460-2461 (2010).
- Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16 (1), 213 (2015).
- Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
- Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12 (10), 902-903 (2015).
- Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9 (9), 75-88 (2015).