L'analisi metagenomica di insilato

1Biosciences, University of Exeter
Published 1/13/2017
0 Comments
  CITE THIS  SHARE 
Genetics
 

Summary

Cite this Article

Copy Citation

Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Introduction

Metagenomica è l'analisi diretta del DNA purificato da comunità biologiche trovate all'interno di campioni ambientali 1 ed è stato originariamente utilizzato per rilevare i batteri non coltivabili si trovano nei sedimenti 2. Metagenomics è stato ampiamente utilizzato per numerose applicazioni, come identificare microbiome umano 3, classificando popolazioni microbiche nell'oceano 4 ed anche per l'analisi delle comunità batteriche che si sviluppano su macchine da caffè 5. L'introduzione di tecnologie di sequenziamento di nuova generazione ha portato una maggiore produttività e di uscita sequenziamento. Di conseguenza, sequenziamento del DNA è diventato più economico 6 e la profondità di sequenziamento che può essere eseguita è notevolmente aumentata, consentendo metagenomics diventare un potente strumento analitico.

Miglioramenti "front-end" nella pratica, aspetto molecolare di sequenziamento metagenomica hanno guidato la crescita della astrumenti di bioinformatica silico disponibili per la classificazione tassonomica 7-9, annotazione funzionale 10,11 e 12,13 rappresentazione visiva dei dati di sequenza del DNA. Il crescente numero di disponibili, sequenziato procariote ed eucariote 14 genomi permette ulteriormente la precisione nella classificazione delle comunità microbiche, che sono sempre eseguite con un database di riferimento "back-end" dei genomi sequenziati 15. Due approcci principali possono essere adottati per l'analisi metagenomica.

Il metodo più convenzionale è l'analisi del gene 16S rRNA regione codificante del genoma batterico. La 16S rRNA è altamente conservata tra le specie procarioti, ma presenta nove regioni iper-variabile (V1 - V9), che può essere sfruttata per l'identificazione di specie 16. L'introduzione di sequenziamento più (≤ 300 bp fine accoppiato) consentito per l'analisi di sequenze di DNA che abbracciano due regioni iper-variabili, in particolareV3 - regione V4 17. I progressi nelle altre tecnologie di sequenziamento, come Oxford Nanopore 18 e PacBIO 19, permettono l'intero gene 16S rRNA da sequenziare contiguo.

Mentre librerie basate 16S rDNA forniscono un approccio mirato per l'identificazione delle specie e consentono il rilevamento di basso numero di copie di DNA che si trova naturalmente all'interno di campioni purificati, librerie shotgun sequencing consentono l'individuazione di specie che possono contenere regioni del DNA che non sono né amplifiable dai 16S rRNA sequenze marcatore primers utilizzati, o perché le differenze tra la sequenza template e la sequenza di amplificazione Primer sono troppo grandi 20,21. Inoltre, anche se le DNA polimerasi hanno una elevata fedeltà della replicazione del DNA, errori base possono verificarsi comunque durante l'amplificazione PCR e questi errori incorporati possono causare errata classificazione di specie 22 originario. Distorsioni nel amplificazione del modello ssPossono verificarsi anche influenze; sequenze di DNA con un alto contenuto di GC possono essere sotto rappresentato nella piscina amplicone finale 23 e allo stesso modo le modifiche di base innaturali, come la timina glicole, in grado di fermare la DNA polimerasi provocando fallimenti l'amplificazione di sequenze di DNA 24. Al contrario, una libreria di DNA sequenziamento shotgun è una libreria di DNA che è stato preparato utilizzando tutto il DNA purificato che è stato estratto da un campione e successivamente frammentata in lunghezze di catena di DNA più brevi prima della preparazione per il sequenziamento. Classificazione tassonomica di sequenze di DNA generati dal sequenziamento shotgun è più accurato se confrontato 16S rRNA amplicone sequenziamento 25, anche se il costo finanziario necessario per raggiungere una profondità di sequenziamento affidabile è maggiore di quella di amplicone sequenziamento 26. Il vantaggio principale di shotgun sequencing metagenomica è che le regioni in sequenza dei vari genomi del campione sono disponibili per il gene prospezione una volta che sono statiè stato tassonomicamente classificato 27.

i dati di sequenza metagenomic viene analizzato da una gamma sempre crescente di strumenti bioinformatici. Questi strumenti sono in grado di eseguire una grande varietà di applicazioni, per esempio, analisi di controllo della qualità dei dati di sequenza grezzi 28, sovrapposti di estremità accoppiati legge 29, de novo assemblaggio della sequenza legge al contig e ponteggi 30,31, classificazione tassonomica e visualizzazione di sequenza di letture e assemblato sequenze 7,12,32,33 e l'annotazione funzionale delle sequenze assemblate 34,35.

Insilato, prodotto dagli agricoltori di tutto il mondo a partire da cereali fermentati come il mais (Zea mays), viene prevalentemente utilizzato come mangime per il bestiame. Insilato è trattata con la sp batterio Lactobacillus. per aiutare la fermentazione 36, ma fino ad oggi, non vi è una conoscenza limitata delle altre popolazioni microbiche trovate in insilato. il enzimaticiprocesso n può portare a microrganismi indesiderati e potenzialmente nocivi diventando prevalente all'interno del insilato 37. Oltre a lieviti e muffe, batteri sono particolarmente adattabile all'ambiente anaerobica fermentazione insilati e sono più frequentemente associati a malattie del bestiame piuttosto che la degradazione della insilati 38. I batteri dell'acido butirrico possono essere inavvertitamente aggiunti dal suolo rimane durante il riempimento dei silos insilato e sono in grado di convertire l'acido lattico, un prodotto di digestione anaerobica, acido butirrico, aumentando così il pH della insilati 39. Questo aumento del pH può portare ad un aumento nei batteri alterativi che normalmente sarebbe in grado di sostenere la crescita in ottimali condizioni di fermentazione di insilato 38. Clostridium spp. , Listeria spp. e Bacillus spp. sono di particolare interesse, soprattutto in insilato per l'alimentazione del bestiame da latte, come le spore batteriche che sono sopravvissuti distuointestinal tratto 40 può entrare nella catena alimentare, portare a deterioramento degli alimenti e, in rari casi, di animali e di decessi umani 37,39,41-44. Inoltre, mentre è difficile stimare l'esatto impatto economico trattamento veterinario e zootecnico perdita causata da insilato deterioramento, è probabile che sia dannoso per una fattoria se un focolaio era a verificarsi.

Si ipotizza che, utilizzando un approccio di metagenomica possiamo classificare le popolazioni microbiche che sono presenti nei campioni insilati e, inoltre, di identificare le comunità microbiche associate con insilato deterioramento che, a sua volta, potenzialmente avere un effetto negativo sul bestiame, consentendo azioni correttive per essere presa prima insilato deve essere utilizzato come fonte di cibo.

Protocol

1. Site Location

  1. Raccogliere il campione insilato da un sito appropriato, come una fattoria. Qui, l'azienda si trovava in Ballydulea, Co. Cork, Irlanda (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA Extraction

NOTA: estrazione del DNA è stata effettuata utilizzando un kit commerciale seguendo le istruzioni del produttore. Un controllo negativo, che conteneva nessun campione, è stata utilizzata in tutto il metodo di preparazione della libreria.

  1. Aggiungere 100 - 400 mg di campione di 978 microlitri tampone fosfato di sodio e 122 microlitri di tampone di lisi suolo nei tubi di lisi forniti.
  2. Omogeneizzare campioni ponendo le provette di lisi in omogeneizzatore per 40 s ad una velocità di 6,0 m / s.
  3. lisati centrifugare a 14000 g per 15 minuti e trasferire il surnatante in una provetta pulita micro-centrifuga contenente 250 ml di proteine ​​precipitato Solution (PPS). Mescolare la soluzione capovolgendo 10 volte e centrifugarea 14000 xg per 5 min.
  4. Aggiungere il surnatante a 1 ml DNA matrice vincolante in 15 mL provetta pulita. Miscelare la soluzione invertendo la provetta costantemente per 3 min. Lasciare il composto di stabilirsi per 3 minuti, poi scarta 500 ml di surnatante. Mescolare il surnatante rimanente.
  5. Trasferire 600 microlitri della sospensione ad un filtro rotativo e centrifugare a 14000 xg per 1 min. Eliminare il filtrato e ripetere il processo con la sospensione rimanente.
  6. Aggiungere 500 ml di tampone di lavaggio alla matrice legame al DNA all'interno del filtro di spin, mescolare pipettando, quindi si centrifuga a 14000 g per 1 min.
  7. Eliminare il filtrato e centrifugare di nuovo il filtro rotativo a 14000 g per 2 minuti al fine di garantire tutti i tampone di lavaggio viene rimosso. Asciugare il filtro rotativo a 23 C per 5 min.
  8. Pre-caldo (70 ° C) l'acqua priva di DNasi (DES) e ri-sospendere la matrice di legame al DNA in 100 ml di DES all'interno del filtro rotativo. Trasferire il filtro di selezione per un ambiente pulito 1,5 ml di micro-centrifuga tuessere e centrifugare a 14000 g per 1 minuto per eluire il DNA. Conservare il DNA purificato a -20 C fino al momento ulteriori analisi.

3. Perline di depurazione usando il DNA Purificazione del DNA

NOTA: Prima di preparazione biblioteca metagenomica il DNA estratto è stato purificato con perline di depurazione al fine di garantire un campione di DNA puro è stato ottenuto.

  1. Incubare le perline a 23 C per 30 minuti prima dell'uso. Aggiungere 2 volumi di perline per il campione di DNA e incubare la soluzione a 23 C per 5 min.
  2. Porre i campioni su un magnete di separazione per 5 minuti e poi scartare il surnatante. Lavare le perle due volte con 200 microlitri fresca 80% di etanolo (EtOH). Far asciugare le perle per 10 min.
  3. Rimuovere i campioni dal magnete separazione e aggiungere 50 ml di tampone di eluizione (EB), mescolare pipettando.
  4. Incubare la sospensione a 23 C per 5 minuti, dopo di che posizionare i campioni indietro sul magnete di separazione per 3 min.
  5. Transfer il surnatante, che contiene il DNA, in una provetta pulita. Eliminare le perline.
  6. Quantificare il DNA purificato di cui al punto quattro.

4. La quantificazione del DNA purificato

NOTA: DNA purificato è stato quantificato utilizzando un fluorimetro e kit di analisi a doppia elica (dsDNA) Alta sensibilità (HS) seguendo le istruzioni del produttore.

  1. Preparare una soluzione di lavoro con 199: 1 rapporto di tampone di reagente.
  2. Aggiungere 10 ml di ogni standard DNA per 190 ml di soluzione di lavoro.
  3. Aggiungere 10 ml di DNA purificato a 190 ml di soluzione di lavoro. Il volume finale deve essere di 200 microlitri. Incubare campioni standard e di DNA a 23 C per 2 min.
  4. Analizzare gli standard prima che i campioni di DNA sul fluorimetro utilizzando le istruzioni sullo schermo.

5. Shotgun Sequencing Biblioteca Preparazione

NOTA: La biblioteca shotgun sequencing è stato preparato utilizzando unkit commerciale di preparazione libreria utilizzando le istruzioni del produttore.

  1. Diluire i campioni di DNA a 0,2 ng / mL con EB. Ogni campione che è già sotto questa concentrazione, cioè il controllo negativo, è lasciato alla sua concentrazione di corrente.
  2. Mescolare 5 ml di DNA purificato con 10 microlitri di buffer e 5 ml mix enzima. Incubare i campioni a 55 C per 5 min.
  3. Aggiungere 5 ml di neutralizzare buffer e incubare la soluzione a 23 C per 5 min.
  4. Aggiungere 5 ml di ciascuno degli indici di sequenziamento specifico campione e 15 ml di PCR master mix
  5. In un termociclatore, incubare i campioni a 72 C per 3 minuti, 95 C per 30 s, prima di 12 cicli di 95 C per 10 s, 55 C per 30 s e 72 C per 30 s. Incubare i campioni infine a 72 C per 5 min.
  6. Purificare il DNA preparato utilizzando la purificazione tallone come prima, ma con un eluizione finale di 30 ml di EB.

6. Library quantità e di verifica della qualità

NOTA: La quantità e qualità delle librerie preparati sono stati valutati utilizzando un kit commerciale e strumentazione.

  1. Incubare i componenti del kit a 23 C per 30 minuti prima dell'uso.
  2. Aggiungere 2 ml di DNA di 2 ml di tampone e vortex per 1 min a 2000 rpm.
  3. Centrifugare il campione per assicurarsi che sia sul fondo della provetta.
  4. Inserire le provette dei campioni, nastro analisi e suggerimenti nello strumento, ed eseguire analisi come indicato dal software.

Il sequenziamento del DNA 7.

  1. Trasferire i preparati e quantificabili biblioteche sequenziamento del DNA di campioni ad un servizio di sequenziamento e la sequenza con 300 pb fine accoppiato sequenziamento 45.

8. L'analisi di sequenza di dati grezzi

NOTA: I comandi per ciascun programma usando un sistema operativo Linux sono mostrate sotto dello scalino protocollo. La conduttura utilizzata per sanalisi dei dati equence è mostrato in Figura 1. I programmi devono essere installati dall'utente prima dell'analisi. Questo processo deve essere eseguito singolarmente per ogni campione.

  1. Analizzare e visualizzare i dati di sequenza del DNA utilizzando FastQC 46 digitando alla riga di comando / path-to-file / fastqc, seguito dal avanti e indietro cruda legge raw_read2.fastq raw_read1.fastq.
  2. Specificare una cartella di output digitando output_fastqc -o e il formato di file dei file di lettura prime da parte FASTQ -f.
  3. Visualizzare il file di output (Figura 2).
    path-to-file / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f FASTQ.

9. Qualità controllo di guarnizione e filtraggio sequenza di dati

  1. Eseguire il programma di rifilatura, Trimmomatic 28 digitando nella riga di comando java -jar / path-to-file / trimmomatic-0.35.jar.
  2. Specificare i file sono accoppiati i file finali digitando 'PE'. Stato che il 16 pr centraleunità ocessing (CPU) devono essere utilizzati dal programma digitando -threads 16.
  3. Elencare i due file per verificare QC digitando i nomi dei avanti prima e retromarcia legge. Il prefisso dei file di output viene determinata digitando insilato -baseout.
  4. Definire le opzioni per il programma digitando ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEADER: 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 LUNMIN: 36.
  5. Una volta completato, analizzare le sequenze tagliate utilizzando FastQC come prima e confrontare l'output per i dati della sequenza prime per garantire il taglio è stato eseguito con successo.
    NOTA: Il software, Trimmomatic, rifilato legge ulteriormente rimuovendo leader di bassa qualità o basi N (al di sotto di qualità 3), la rimozione di uscita bassa qualità o basi N (al di sotto di qualità 3) e la scansione di ogni letto con un 4-base ampia finestra scorrevole. I parametri sono stati fissati per il taglio quando la qualità media per di base scende al di sotto di 20 e poi a rilasciare qualsiasi legge di sotto di 36 basi. Infine, 15 basi sono state tagliate from la testa di ogni legge e legge sono stati tagliati per mantenere 200 basi fin dall'inizio della lettura. Questa fase finale è stata eseguita per superare alcuni problemi di qualità durante la sequenziazione lungo (> 200 bp) legge. Questi possono essere regolati per i campioni specifici 28.
    java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout insilato ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEADER: 3 TRAILING: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 LUNMIN: 36

10. Assemblea metagenoma

  1. Unire il spaiato, tagliati legge digitando cat seguito dal spaiato legge; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Scrivere i file in un nuovo file digitando> silage_merged_unpaired.fastq
    cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
  2. Per de novo assemblare il DNA sequenziato, usare picche (St. Petersburg genoma assembler) 30 digitando / path-to-file / spades.py. Specifica che 16 CPU devono essere utilizzati digitando -t 16 e che il parametro metagenomic dovrebbe applicata digitando --meta.
  3. Identificare il rifilato in avanti si legge utilizzando -1 silage_read1_paired.fastq e il contrario si legge da -2 silage_read2_paired.fastq. Il spaiato fusione legge sono specificati dal silage_merged_unpaired.fastq -s.
  4. Definire la cartella di output digitando -o silage_spades.
    path-to-file / spades.py -t 16 --meta -1 -2 silage_read1_paired.fastq silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. associati-end Leggi Overlap

  1. Unisci coppie di sequenze di DNA letture di Uso del flash (rapido Lunghezza Regolazione del corto letture) 29 digitando nella riga di comando / path-to-file / flash. Specificare che 16 CPU dovrebbero essere usati usando -t 16 e il prefisso di uscita digitando -o insilati.
  2. Identificare guarnite legge digitando silage_trimmed_R1.fastq silage_trimmed_R2.fastq
    path-to-file / flash -t 16 -o lampeggiavano silage_read2_paired.fastq silage_read1_paired.fastq

12. Classificazione tassonomica

  1. Tipo / path-to-file / kraken e specificare il database digitando --db / path-to-file / standard.
  2. Definire che 16 CPU dovrebbero essere utilizzati digitando --threads 16 e individuare una cartella di output utilizzando --output FLASHed_silage_extendedFrags_kraken.txt. Digitare il nome del file di input; FLASHed_silage.extendedFrags.fastq
    path-to-file / standard di --db kraken --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
    NOTA: Classificazione degli scaffold sequenza del DNA assemblati utilizzando Kraken 7 è stata completata contro il più recente, database standard Kraken che conteneva tutte le sequenze del genoma procariote disponibili.
  3. colonne di trasferimento 2 e 3 del file di output e in un nuovo file digitando taglio -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  4. tagliare -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  5. Importare il nuovo file in Krona 12 digitando ktImportTaxonomy. Specificare il file di input digitando FLASHed_silage_extendedFrags_kraken.int. Identificare il file di output digitando -o FLASHed_silage_extendedFrags_kraken.out.html.
    path-to-file / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. annotazione funzionale

  1. Vai alla MG-RAST 47 siti, http://metagenomics.anl.gov/. Registrati come nuovo utente, se richiesto. Dopo il login, fare clic sul pulsante "Upload". Carica i ponteggi montati dal punto 10.
  2. Una volta che i file sono caricati, cliccare su "Invia" e seguire le istruzioni e attendere il completamento dell'analisi.
  3. Dopo l'analisi è completa, visualizzare il link inviato via email da MG-RAST, o, in alternativa, cliccare su "Progress". C'è un elenco dei lavori completati. Fare clic sul relativo ID del processo e poi sul link alla pagina "download".
  4. Nella pagina di download, sotto il titolo "Protein Clustering 90%", fai clic sul pulsante di proteine ​​per scaricare il file prevedeva proteina, 550.cluster.aa90.faa.
  5. Per classificare le proteine come putativamente appartenenti a una particolare classe di enzimi cazy, confrontare le proteine scaricato al database Cazy 48. Scarica il database enzimi di carboidrati-attivi (cazy) dai file sono: AA.zip, CE.zip, GH.zip, GT.zip e PL.zip. Questi file rappresentano le seguenti classi di enzimi, rispettivamente: Attività ausiliari (AA), carboidrati esterasi (CE), glicoside idrolasi (GH), glicosil transferasi (GT) e polisaccaride liasi (PL).
  6. Decomprimere i file di database e annotare le proteine ​​determinando la somiglianza proteina alle proteine ​​del database cazy utilizzando il Algor USEARCH UBLASTithm 49. Per utilizzare un ciclo bash (for i in * .txt) per scorrere la 5 database di tipo file .txt "for i in * .txt; fare".
  7. Eseguire USEARCH digitando / path-to-file / usearch8 con il parametro -ublast al fine di utilizzare l'algoritmo ublast. Quindi digitare il nome del file di sequenza della proteina scaricato da MG-RAST, "mgmXXXXXX.3.550.cluster.aa90.faa".
  8. Per indicare il file del database da usare tipo "-db $ i" e per specificare la soglia di E-valore a 1e -5, digitare "-evalue 1e-5".
  9. Per terminare la ricerca dopo la scoperta di una sequenza bersaglio e quindi classificare tale sequenza proteica come appartenente alla classe enzima bersaglio, ad esempio GH, tipo "-masaccepts 1".
  10. Per definire che 16 CPU dovrebbero essere usati tipo "-threads 16" e per specificare il formato del file di output come tipo di testo "-blast6out" ATAB separati. Per identificare il tipo di file di output "$ i.ublast". Per terminare il ciclo bash, tipo "; fatto"
    for i in * .txt;
    fare / path-to-file / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out $ i.ublast;
    fatto

14. Visualizing Cazy annotazione

  1. Per visualizzare l'output l'annotazione cazy come un diagramma di Venn, generare elenchi di ID di proteine ​​per ogni classe di enzimi utilizzando un ciclo bash. Tipo "for i in * .ublast; fare".
  2. Per trasferire la colonna 1 dal file di output e in un nuovo file, digitare "cat $ i | cut -f 1> $ i.list".
  3. Terminare il loop e tipo ", fatto".
  4. Aprire i file .list in un editor di testo. Vai al sito, selezionare il numero di set come 5 e incollare il contenuto di ogni file di elenco in una scatola separata. Scarica lo schema risultante come file .SVG.
    for i in * .ublast;
    fare cat $ i | tagliare -f 1> $ i.list;
    fatto

Representative Results

Prima di elaborazione bioinformatica, sequenza prime letture sono stati tagliati e gli adattatori sono stati rimossi utilizzando il software Trimmomatic 28. Dopo la fase di taglio e filtrazione, il numero di letture è stato ridotto al 50% della sequenza legge (Tabella 1). Il punteggio medio di base Phred era> 30 dopo il controllo di qualità (Figura 2).

Coppie di sequenze di DNA che avevano regioni sovrapposte sono state fuse con il software Flash 29 per generare singolo più si legge, non si sovrappongono letture di stati tenuti in un file separato. 45.47% legge (105.343) combinato con successo. A seguito della sovrapposizione di legge utilizzando Flash di legge, i frammenti estesi risultanti sono stati sottoposti batterica classificazione tassonomica utilizzando il software Kraken 7 e sono stati successivamente visualizzati con il software di Corona (Figura 3).

Figura 4. La specie più abbondante nel metagenoma erano Lactobacillus spp. (24%; Firmicutes), Corynebacterium spp. (8%; Actinobacteria), Propionibacterium spp. (3%; Actinobacteria) e Prevotella spp. (3%; Bacteroidetes). sono state osservate anche specie importanti per la salute degli animali e implicati nella malattia; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) sono stati previsto per essere presenti nel campione insilato.

annotazione funzionale è stata eseguita su assemblato legge. Il metagenoma è stato assemblato utilizzando l'assemblatore picche 30 utilizzando il rifilato e filtrataabbinato-end e spaiato letture di generare 92,284 ponteggi. Al fine di individuare cellulasi, le proteine ​​sono stati previsti con MG-RAST e annotati utilizzando il database di enzimi di carboidrati-attivi (Cazy). Dei 97,562 proteine previste, 6357 sono stati annotati come un enzima carboidrato-attiva putative in una delle cinque classi di enzimi che compongono il database cazy (Figura 5). I risultati sono stati visualizzati come un diagramma di Venn utilizzando il software InteractiVenn 50 che mostra la distribuzione delle annotazioni di proteine, tra cui quelli contenenti più di una classe di enzimi cazy annotazione. Di questi, 3861 sono stati previsti per avere attività idrolasi glicoside e sarà ulteriormente caratterizzato in laboratorio per confermare la funzione.

Figura 1
Figura 1: bioinformatica Metagenomica Pipeline per l'Analisi di insilati. Due approcci principali eranoutilizzato per indagare il microbioma di insilati, classificazione tassonomica e annotazione funzionale. Clicca qui per vedere una versione più grande di questa figura.

figura 2
Figura 2: Qualità Sequenza Per-base Prima e dopo il taglio e rimozione adattatore. La trama di qualità sequenza per-base dalla FASTQC mostra il punteggio medio Phred per tutta la lunghezza della sequenza di legge di controllo pre e post-qualità. Clicca qui per vedere una versione più grande di questa figura.

Figura 3
Figura 3: tassonomica Classificazione del batterica Microbiome di insilati Solid. Classificazione della sequenza tagliati e sovrapposti legge dal FLASH è stata effettuata utilizzando Kraken 7 e successivamente visualizzati con corona. Clicca qui per vedere una versione più grande di questa figura.

Figura 4
Figura 4: tassonomica Classe Distribuzione del 4 Phyla più abbondante nel batterica Microbiome di insilati Solid. La percentuale di ciascuna classe di batteri all'interno delle quattro più abbondante phyla. Firmicutes: clostridi (rosso) e bacilli (blu scuro); Proteobacteria: Delta / Epsilon (rosa), alfa (azzurro), gamma (arancione) e beta (turchese); Bacteroidetes: Flavobacteriia (blu scuro) e Bacteroidia(verde pallido); Actinobacteria: Coriobacteriia (viola scuro) e altri Actinobacteria (verde scuro). Clicca qui per vedere una versione più grande di questa figura.

Figura 5
Figura 5: cazy Annotazione del proteoma prevista nel solido insilato Microbiome. diagramma di Venn che mostra la distribuzione delle cinque classi di enzimi di annotazioni cazy nel proteoma previsto di microbiome insilato solido. Clicca qui per vedere una versione più grande di questa figura.

# Raw legge # Filtrata legge (in coppia) # Filtrato legge # Lampeggiavano legge
(Accoppiato) (Spaiato)
2.374.949 x2 231.679 x2 1.892.534 105.343

Tabella 1: Tabella riassuntiva dei Sequencing Legge.

Discussion

Mentre un analisi in silico può dare una visione eccellente alle comunità microbiche che sono presenti all'interno di campioni ambientali, è fondamentale che le classificazioni tassonomiche dimostrato essere eseguita in associazione con relativi controlli e che una adeguata profondità di sequenziamento è stato raggiunto per catturare tutta popolazione presente 51.

Con qualsiasi analisi computazionale, ci sono molti percorsi per raggiungere un obiettivo simile. I metodi che abbiamo usato in questo studio sono esempi di adatti e semplici metodi, che sono stati portati insieme per realizzare una serie di analisi sul microbiome insilato. Una varietà e un numero sempre crescente di strumenti di bioinformatica e le tecniche sono disponibili per analizzare i dati metagenomic, per esempio Phylosift 8 e MetaPhlAn2 52, e che devono essere valutati prima l'indagine per la loro rilevanza per il campione e l'analisi required 53. metodi di analisi metagenomiche sono limitati dai database per disponibili per la classificazione, la profondità sequenziamento e la qualità di sequenziamento.

L'elaborazione bioinformatica dimostrato qui è stata effettuata su un alto Macchina motorizzata locale; tuttavia i sistemi cloud-based sono inoltre disponibili. Questi servizi basati su cloud consentono per il noleggio della necessaria potenza di calcolo senza avere l'investimento ad alto costo di un adeguato potente workstation locale. Un potenziale applicazione di questo metodo potrebbe essere quello di valutare insilato prima del suo utilizzo in agricoltura per garantire che nessun batteri potenzialmente nocivi sono presenti quindi impedendo loro di entrare nella catena alimentare.

Materials

Name Company Catalog Number Comments
FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

DOWNLOAD MATERIALS LIST

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38, (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59, (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486, (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304, (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507, (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15, (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2, (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12, (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7, (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32, (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43, (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10, (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69, (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2, (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14, (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20, (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343, (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370, (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65, (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50, (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104, (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469, (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15, (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32, (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30, (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27, (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19, (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. metaSPAdes: a new versatile de novo metagenomics assembler. (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30, (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10, (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106, (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167, (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22, (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182, (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90, (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86, (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153, (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50, (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456, (7218), 53-59 (2008).
  46. Andrews, S. Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, Chapter 13 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, Database issue 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26, (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16, (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12, (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9, (9), 75-88 (2015).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Video Stats