Genetics

L'analisi metagenomica di insilato

Published: January 13, 2017 doi: 10.3791/54936

Richard K. Tennant¹, Christine M. Sambles¹, Georgina E. Diffey¹, Karen A. Moore¹, John Love¹

Introduction

Metagenomica è l'analisi diretta del DNA purificato da comunità biologiche trovate all'interno di campioni ambientali ¹ ed è stato originariamente utilizzato per rilevare i batteri non coltivabili si trovano nei sedimenti ^2. Metagenomics è stato ampiamente utilizzato per numerose applicazioni, come identificare microbiome umano ^3, classificando popolazioni microbiche nell'oceano ⁴ ed anche per l'analisi delle comunità batteriche che si sviluppano su macchine da caffè ^5. L'introduzione di tecnologie di sequenziamento di nuova generazione ha portato una maggiore produttività e di uscita sequenziamento. Di conseguenza, sequenziamento del DNA è diventato più economico ⁶ e la profondità di sequenziamento che può essere eseguita è notevolmente aumentata, consentendo metagenomics diventare un potente strumento analitico.

Miglioramenti "front-end" nella pratica, aspetto molecolare di sequenziamento metagenomica hanno guidato la crescita della astrumenti di bioinformatica silico disponibili per la classificazione tassonomica ^7-9, annotazione funzionale ^10,11 e ^12,13 rappresentazione visiva dei dati di sequenza del DNA. Il crescente numero di disponibili, sequenziato procariote ed eucariote ¹⁴ genomi permette ulteriormente la precisione nella classificazione delle comunità microbiche, che sono sempre eseguite con un database di riferimento "back-end" dei genomi sequenziati ^15. Due approcci principali possono essere adottati per l'analisi metagenomica.

Il metodo più convenzionale è l'analisi del gene 16S rRNA regione codificante del genoma batterico. La 16S rRNA è altamente conservata tra le specie procarioti, ma presenta nove regioni iper-variabile (V1 - V9), che può essere sfruttata per l'identificazione di specie ^16. L'introduzione di sequenziamento più (≤ 300 bp fine accoppiato) consentito per l'analisi di sequenze di DNA che abbracciano due regioni iper-variabili, in particolareV3 - regione V4 ^17. I progressi nelle altre tecnologie di sequenziamento, come Oxford Nanopore ¹⁸ e PacBIO ^19, permettono l'intero gene 16S rRNA da sequenziare contiguo.

Mentre librerie basate 16S rDNA forniscono un approccio mirato per l'identificazione delle specie e consentono il rilevamento di basso numero di copie di DNA che si trova naturalmente all'interno di campioni purificati, librerie shotgun sequencing consentono l'individuazione di specie che possono contenere regioni del DNA che non sono né amplifiable dai 16S rRNA sequenze marcatore primers utilizzati, o perché le differenze tra la sequenza template e la sequenza di amplificazione Primer sono troppo grandi ^20,21. Inoltre, anche se le DNA polimerasi hanno una elevata fedeltà della replicazione del DNA, errori base possono verificarsi comunque durante l'amplificazione PCR e questi errori incorporati possono causare errata classificazione di specie ²² originario. Distorsioni nel amplificazione del modello ssPossono verificarsi anche influenze; sequenze di DNA con un alto contenuto di GC possono essere sotto rappresentato nella piscina amplicone finale ²³ e allo stesso modo le modifiche di base innaturali, come la timina glicole, in grado di fermare la DNA polimerasi provocando fallimenti l'amplificazione di sequenze di DNA ^24. Al contrario, una libreria di DNA sequenziamento shotgun è una libreria di DNA che è stato preparato utilizzando tutto il DNA purificato che è stato estratto da un campione e successivamente frammentata in lunghezze di catena di DNA più brevi prima della preparazione per il sequenziamento. Classificazione tassonomica di sequenze di DNA generati dal sequenziamento shotgun è più accurato se confrontato 16S rRNA amplicone sequenziamento ^25, anche se il costo finanziario necessario per raggiungere una profondità di sequenziamento affidabile è maggiore di quella di amplicone sequenziamento ^26. Il vantaggio principale di shotgun sequencing metagenomica è che le regioni in sequenza dei vari genomi del campione sono disponibili per il gene prospezione una volta che sono statiè stato tassonomicamente classificato ^27.

i dati di sequenza metagenomic viene analizzato da una gamma sempre crescente di strumenti bioinformatici. Questi strumenti sono in grado di eseguire una grande varietà di applicazioni, per esempio, analisi di controllo della qualità dei dati di sequenza grezzi ^28, sovrapposti di estremità accoppiati legge ^29, de novo assemblaggio della sequenza legge al contig e ponteggi ^30,31, classificazione tassonomica e visualizzazione di sequenza di letture e assemblato sequenze ^7,12,32,33 e l'annotazione funzionale delle sequenze assemblate ^34,35.

Insilato, prodotto dagli agricoltori di tutto il mondo a partire da cereali fermentati come il mais (Zea mays), viene prevalentemente utilizzato come mangime per il bestiame. Insilato è trattata con la sp batterio Lactobacillus. per aiutare la fermentazione ^36, ma fino ad oggi, non vi è una conoscenza limitata delle altre popolazioni microbiche trovate in insilato. il enzimaticiprocesso n può portare a microrganismi indesiderati e potenzialmente nocivi diventando prevalente all'interno del insilato ^37. Oltre a lieviti e muffe, batteri sono particolarmente adattabile all'ambiente anaerobica fermentazione insilati e sono più frequentemente associati a malattie del bestiame piuttosto che la degradazione della insilati ^38. I batteri dell'acido butirrico possono essere inavvertitamente aggiunti dal suolo rimane durante il riempimento dei silos insilato e sono in grado di convertire l'acido lattico, un prodotto di digestione anaerobica, acido butirrico, aumentando così il pH della insilati ^39. Questo aumento del pH può portare ad un aumento nei batteri alterativi che normalmente sarebbe in grado di sostenere la crescita in ottimali condizioni di fermentazione di insilato ^38. Clostridium spp. , Listeria spp. e Bacillus spp. sono di particolare interesse, soprattutto in insilato per l'alimentazione del bestiame da latte, come le spore batteriche che sono sopravvissuti distuointestinal tratto ⁴⁰ può entrare nella catena alimentare, portare a deterioramento degli alimenti e, in rari casi, di animali e di decessi umani ^37,39,41-44. Inoltre, mentre è difficile stimare l'esatto impatto economico trattamento veterinario e zootecnico perdita causata da insilato deterioramento, è probabile che sia dannoso per una fattoria se un focolaio era a verificarsi.

Si ipotizza che, utilizzando un approccio di metagenomica possiamo classificare le popolazioni microbiche che sono presenti nei campioni insilati e, inoltre, di identificare le comunità microbiche associate con insilato deterioramento che, a sua volta, potenzialmente avere un effetto negativo sul bestiame, consentendo azioni correttive per essere presa prima insilato deve essere utilizzato come fonte di cibo.

Protocol

1. Site Location

Raccogliere il campione insilato da un sito appropriato, come una fattoria. Qui, l'azienda si trovava in Ballydulea, Co. Cork, Irlanda (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA Extraction

NOTA: estrazione del DNA è stata effettuata utilizzando un kit commerciale seguendo le istruzioni del produttore. Un controllo negativo, che conteneva nessun campione, è stata utilizzata in tutto il metodo di preparazione della libreria.

Aggiungere 100 - 400 mg di campione di 978 microlitri tampone fosfato di sodio e 122 microlitri di tampone di lisi suolo nei tubi di lisi forniti.
Omogeneizzare campioni ponendo le provette di lisi in omogeneizzatore per 40 s ad una velocità di 6,0 m / s.
lisati centrifugare a 14000 g per 15 minuti e trasferire il surnatante in una provetta pulita micro-centrifuga contenente 250 ml di proteine precipitato Solution (PPS). Mescolare la soluzione capovolgendo 10 volte e centrifugarea 14000 xg per 5 min.
Aggiungere il surnatante a 1 ml DNA matrice vincolante in 15 mL provetta pulita. Miscelare la soluzione invertendo la provetta costantemente per 3 min. Lasciare il composto di stabilirsi per 3 minuti, poi scarta 500 ml di surnatante. Mescolare il surnatante rimanente.
Trasferire 600 microlitri della sospensione ad un filtro rotativo e centrifugare a 14000 xg per 1 min. Eliminare il filtrato e ripetere il processo con la sospensione rimanente.
Aggiungere 500 ml di tampone di lavaggio alla matrice legame al DNA all'interno del filtro di spin, mescolare pipettando, quindi si centrifuga a 14000 g per 1 min.
Eliminare il filtrato e centrifugare di nuovo il filtro rotativo a 14000 g per 2 minuti al fine di garantire tutti i tampone di lavaggio viene rimosso. Asciugare il filtro rotativo a 23 C per 5 min.
Pre-caldo (70 ° C) l'acqua priva di DNasi (DES) e ri-sospendere la matrice di legame al DNA in 100 ml di DES all'interno del filtro rotativo. Trasferire il filtro di selezione per un ambiente pulito 1,5 ml di micro-centrifuga tuessere e centrifugare a 14000 g per 1 minuto per eluire il DNA. Conservare il DNA purificato a -20 C fino al momento ulteriori analisi.

3. Perline di depurazione usando il DNA Purificazione del DNA

NOTA: Prima di preparazione biblioteca metagenomica il DNA estratto è stato purificato con perline di depurazione al fine di garantire un campione di DNA puro è stato ottenuto.

Incubare le perline a 23 C per 30 minuti prima dell'uso. Aggiungere 2 volumi di perline per il campione di DNA e incubare la soluzione a 23 C per 5 min.
Porre i campioni su un magnete di separazione per 5 minuti e poi scartare il surnatante. Lavare le perle due volte con 200 microlitri fresca 80% di etanolo (EtOH). Far asciugare le perle per 10 min.
Rimuovere i campioni dal magnete separazione e aggiungere 50 ml di tampone di eluizione (EB), mescolare pipettando.
Incubare la sospensione a 23 C per 5 minuti, dopo di che posizionare i campioni indietro sul magnete di separazione per 3 min.
Transfer il surnatante, che contiene il DNA, in una provetta pulita. Eliminare le perline.
Quantificare il DNA purificato di cui al punto quattro.

4. La quantificazione del DNA purificato

NOTA: DNA purificato è stato quantificato utilizzando un fluorimetro e kit di analisi a doppia elica (dsDNA) Alta sensibilità (HS) seguendo le istruzioni del produttore.

Preparare una soluzione di lavoro con 199: 1 rapporto di tampone di reagente.
Aggiungere 10 ml di ogni standard DNA per 190 ml di soluzione di lavoro.
Aggiungere 10 ml di DNA purificato a 190 ml di soluzione di lavoro. Il volume finale deve essere di 200 microlitri. Incubare campioni standard e di DNA a 23 C per 2 min.
Analizzare gli standard prima che i campioni di DNA sul fluorimetro utilizzando le istruzioni sullo schermo.

5. Shotgun Sequencing Biblioteca Preparazione

NOTA: La biblioteca shotgun sequencing è stato preparato utilizzando unkit commerciale di preparazione libreria utilizzando le istruzioni del produttore.

Diluire i campioni di DNA a 0,2 ng / mL con EB. Ogni campione che è già sotto questa concentrazione, cioè il controllo negativo, è lasciato alla sua concentrazione di corrente.
Mescolare 5 ml di DNA purificato con 10 microlitri di buffer e 5 ml mix enzima. Incubare i campioni a 55 C per 5 min.
Aggiungere 5 ml di neutralizzare buffer e incubare la soluzione a 23 C per 5 min.
Aggiungere 5 ml di ciascuno degli indici di sequenziamento specifico campione e 15 ml di PCR master mix.
In un termociclatore, incubare i campioni a 72 C per 3 minuti, 95 C per 30 s, prima di 12 cicli di 95 C per 10 s, 55 C per 30 s e 72 C per 30 s. Incubare i campioni infine a 72 C per 5 min.
Purificare il DNA preparato utilizzando la purificazione tallone come prima, ma con un eluizione finale di 30 ml di EB.

6. Library quantità e di verifica della qualità

NOTA: La quantità e qualità delle librerie preparati sono stati valutati utilizzando un kit commerciale e strumentazione.

Incubare i componenti del kit a 23 C per 30 minuti prima dell'uso.
Aggiungere 2 ml di DNA di 2 ml di tampone e vortex per 1 min a 2000 rpm.
Centrifugare il campione per assicurarsi che sia sul fondo della provetta.
Inserire le provette dei campioni, nastro analisi e suggerimenti nello strumento, ed eseguire analisi come indicato dal software.

Il sequenziamento del DNA 7.

Trasferire i preparati e quantificabili biblioteche sequenziamento del DNA di campioni ad un servizio di sequenziamento e la sequenza con 300 pb fine accoppiato sequenziamento ^45.

8. L'analisi di sequenza di dati grezzi

NOTA: I comandi per ciascun programma usando un sistema operativo Linux sono mostrate sotto dello scalino protocollo. La conduttura utilizzata per sanalisi dei dati equence è mostrato in Figura 1. I programmi devono essere installati dall'utente prima dell'analisi. Questo processo deve essere eseguito singolarmente per ogni campione.

Analizzare e visualizzare i dati di sequenza del DNA utilizzando FastQC ⁴⁶ digitando alla riga di comando / path-to-file / fastqc, seguito dal avanti e indietro cruda legge raw_read2.fastq raw_read1.fastq.
Specificare una cartella di output digitando output_fastqc -o e il formato di file dei file di lettura prime da parte FASTQ -f.
Visualizzare il file di output (Figura 2).
path-to-file / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f FASTQ.

9. Qualità controllo di guarnizione e filtraggio sequenza di dati

Eseguire il programma di rifilatura, Trimmomatic ²⁸ digitando nella riga di comando java -jar / path-to-file / trimmomatic-0.35.jar.
Specificare i file sono accoppiati i file finali digitando 'PE'. Stato che il 16 pr centraleunità ocessing (CPU) devono essere utilizzati dal programma digitando -threads 16.
Elencare i due file per verificare QC digitando i nomi dei avanti prima e retromarcia legge. Il prefisso dei file di output viene determinata digitando insilato -baseout.
Definire le opzioni per il programma digitando ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEADER: 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 LUNMIN: 36.
Una volta completato, analizzare le sequenze tagliate utilizzando FastQC come prima e confrontare l'output per i dati della sequenza prime per garantire il taglio è stato eseguito con successo.
NOTA: Il software, Trimmomatic, rifilato legge ulteriormente rimuovendo leader di bassa qualità o basi N (al di sotto di qualità 3), la rimozione di uscita bassa qualità o basi N (al di sotto di qualità 3) e la scansione di ogni letto con un 4-base ampia finestra scorrevole. I parametri sono stati fissati per il taglio quando la qualità media per di base scende al di sotto di 20 e poi a rilasciare qualsiasi legge di sotto di 36 basi. Infine, 15 basi sono state tagliate from la testa di ogni legge e legge sono stati tagliati per mantenere 200 basi fin dall'inizio della lettura. Questa fase finale è stata eseguita per superare alcuni problemi di qualità durante la sequenziazione lungo (> 200 bp) legge. Questi possono essere regolati per i campioni specifici ^28.
java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout insilato ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEADER: 3 TRAILING: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 LUNMIN: 36

10. Assemblea metagenoma

Unire il spaiato, tagliati legge digitando cat seguito dal spaiato legge; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Scrivere i file in un nuovo file digitando> silage_merged_unpaired.fastq
cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
Per de novo assemblare il DNA sequenziato, usare picche (St. Petersburg genoma assembler) ³⁰ digitando / path-to-file / spades.py. Specifica che 16 CPU devono essere utilizzati digitando -t 16 e che il parametro metagenomic dovrebbe applicata digitando --meta.
Identificare il rifilato in avanti si legge utilizzando -1 silage_read1_paired.fastq e il contrario si legge da -2 silage_read2_paired.fastq. Il spaiato fusione legge sono specificati dal silage_merged_unpaired.fastq -s.
Definire la cartella di output digitando -o silage_spades.
path-to-file / spades.py -t 16 --meta -1 -2 silage_read1_paired.fastq silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. associati-end Leggi Overlap

Unisci coppie di sequenze di DNA letture di Uso del flash (rapido Lunghezza Regolazione del corto letture) ²⁹ digitando nella riga di comando / path-to-file / flash. Specificare che 16 CPU dovrebbero essere usati usando -t 16 e il prefisso di uscita digitando -o insilati.
Identificare guarnite legge digitando silage_trimmed_R1.fastq silage_trimmed_R2.fastq
path-to-file / flash -t 16 -o lampeggiavano silage_read2_paired.fastq silage_read1_paired.fastq

12. Classificazione tassonomica

Tipo / path-to-file / kraken e specificare il database digitando --db / path-to-file / standard.
Definire che 16 CPU dovrebbero essere utilizzati digitando --threads 16 e individuare una cartella di output utilizzando --output FLASHed_silage_extendedFrags_kraken.txt. Digitare il nome del file di input; FLASHed_silage.extendedFrags.fastq
path-to-file / standard di --db kraken --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
NOTA: Classificazione degli scaffold sequenza del DNA assemblati utilizzando Kraken ⁷ è stata completata contro il più recente, database standard Kraken che conteneva tutte le sequenze del genoma procariote disponibili.
colonne di trasferimento 2 e 3 del file di output e in un nuovo file digitando taglio -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

tagliare -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

Importare il nuovo file in Krona ¹² digitando ktImportTaxonomy. Specificare il file di input digitando FLASHed_silage_extendedFrags_kraken.int. Identificare il file di output digitando -o FLASHed_silage_extendedFrags_kraken.out.html.
path-to-file / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. annotazione funzionale

Vai alla MG-RAST ⁴⁷ siti, http://metagenomics.anl.gov/. Registrati come nuovo utente, se richiesto. Dopo il login, fare clic sul pulsante "Upload". Carica i ponteggi montati dal punto 10.
Una volta che i file sono caricati, cliccare su "Invia" e seguire le istruzioni e attendere il completamento dell'analisi.
Dopo l'analisi è completa, visualizzare il link inviato via email da MG-RAST, o, in alternativa, cliccare su "Progress". C'è un elenco dei lavori completati. Fare clic sul relativo ID del processo e poi sul link alla pagina "download".
Nella pagina di download, sotto il titolo "Protein Clustering 90%", fai clic sul pulsante di proteine per scaricare il file prevedeva proteina, 550.cluster.aa90.faa.
Per classificare le proteine come putativamente appartenenti a una particolare classe di enzimi cazy, confrontare le proteine scaricato al database Cazy ^48. Scarica il database enzimi di carboidrati-attivi (cazy) dai file sono: AA.zip, CE.zip, GH.zip, GT.zip e PL.zip. Questi file rappresentano le seguenti classi di enzimi, rispettivamente: Attività ausiliari (AA), carboidrati esterasi (CE), glicoside idrolasi (GH), glicosil transferasi (GT) e polisaccaride liasi (PL).
Decomprimere i file di database e annotare le proteine determinando la somiglianza proteina alle proteine del database cazy utilizzando il Algor USEARCH UBLASTithm ^49. Per utilizzare un ciclo bash (for i in * .txt) per scorrere la 5 database di tipo file .txt "for i in * .txt; fare".
Eseguire USEARCH digitando / path-to-file / usearch8 con il parametro -ublast al fine di utilizzare l'algoritmo ublast. Quindi digitare il nome del file di sequenza della proteina scaricato da MG-RAST, "mgmXXXXXX.3.550.cluster.aa90.faa".
Per indicare il file del database da usare tipo "-db $ i" e per specificare la soglia di E-valore a 1e ^-5, digitare "-evalue 1e-5".
Per terminare la ricerca dopo la scoperta di una sequenza bersaglio e quindi classificare tale sequenza proteica come appartenente alla classe enzima bersaglio, ad esempio GH, tipo "-masaccepts 1".
Per definire che 16 CPU dovrebbero essere usati tipo "-threads 16" e per specificare il formato del file di output come tipo di testo "-blast6out" ATAB separati. Per identificare il tipo di file di output "$ i.ublast". Per terminare il ciclo bash, tipo "; fatto"
for i in * .txt;
fare / path-to-file / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out $ i.ublast;
fatto

14. Visualizing Cazy annotazione

Per visualizzare l'output l'annotazione cazy come un diagramma di Venn, generare elenchi di ID di proteine per ogni classe di enzimi utilizzando un ciclo bash. Tipo "for i in * .ublast; fare".
Per trasferire la colonna 1 dal file di output e in un nuovo file, digitare "cat $ i | cut -f 1> $ i.list".
Terminare il loop e tipo ", fatto".
Aprire i file .list in un editor di testo. Vai al sito, selezionare il numero di set come 5 e incollare il contenuto di ogni file di elenco in una scatola separata. Scarica lo schema risultante come file .SVG.
for i in * .ublast;
fare cat $ i | tagliare -f 1> $ i.list;
fatto

Representative Results

Prima di elaborazione bioinformatica, sequenza prime letture sono stati tagliati e gli adattatori sono stati rimossi utilizzando il software Trimmomatic ^28. Dopo la fase di taglio e filtrazione, il numero di letture è stato ridotto al 50% della sequenza legge (Tabella 1). Il punteggio medio di base Phred era> 30 dopo il controllo di qualità (Figura 2).

Coppie di sequenze di DNA che avevano regioni sovrapposte sono state fuse con il software Flash ²⁹ per generare singolo più si legge, non si sovrappongono letture di stati tenuti in un file separato. 45.47% legge (105.343) combinato con successo. A seguito della sovrapposizione di legge utilizzando Flash di legge, i frammenti estesi risultanti sono stati sottoposti batterica classificazione tassonomica utilizzando il software Kraken ⁷ e sono stati successivamente visualizzati con il software di Corona (Figura 3).

Figura 4. La specie più abbondante nel metagenoma erano Lactobacillus spp. (24%; Firmicutes), Corynebacterium spp. (8%; Actinobacteria), Propionibacterium spp. (3%; Actinobacteria) e Prevotella spp. (3%; Bacteroidetes). sono state osservate anche specie importanti per la salute degli animali e implicati nella malattia; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) sono stati previsto per essere presenti nel campione insilato.

annotazione funzionale è stata eseguita su assemblato legge. Il metagenoma è stato assemblato utilizzando l'assemblatore picche ³⁰ utilizzando il rifilato e filtrataabbinato-end e spaiato letture di generare 92,284 ponteggi. Al fine di individuare cellulasi, le proteine sono stati previsti con MG-RAST e annotati utilizzando il database di enzimi di carboidrati-attivi (Cazy). Dei 97,562 proteine previste, 6357 sono stati annotati come un enzima carboidrato-attiva putative in una delle cinque classi di enzimi che compongono il database cazy (Figura 5). I risultati sono stati visualizzati come un diagramma di Venn utilizzando il software InteractiVenn ⁵⁰ che mostra la distribuzione delle annotazioni di proteine, tra cui quelli contenenti più di una classe di enzimi cazy annotazione. Di questi, 3861 sono stati previsti per avere attività idrolasi glicoside e sarà ulteriormente caratterizzato in laboratorio per confermare la funzione.

Figura 1: bioinformatica Metagenomica Pipeline per l'Analisi di insilati. Due approcci principali eranoutilizzato per indagare il microbioma di insilati, classificazione tassonomica e annotazione funzionale. Clicca qui per vedere una versione più grande di questa figura.

Figura 2: Qualità Sequenza Per-base Prima e dopo il taglio e rimozione adattatore. La trama di qualità sequenza per-base dalla FASTQC mostra il punteggio medio Phred per tutta la lunghezza della sequenza di legge di controllo pre e post-qualità. Clicca qui per vedere una versione più grande di questa figura.

Figura 3: tassonomica Classificazione del batterica Microbiome di insilati Solid. Classificazione della sequenza tagliati e sovrapposti legge dal FLASH è stata effettuata utilizzando Kraken ⁷ e successivamente visualizzati con corona. Clicca qui per vedere una versione più grande di questa figura.

Figura 4: tassonomica Classe Distribuzione del 4 Phyla più abbondante nel batterica Microbiome di insilati Solid. La percentuale di ciascuna classe di batteri all'interno delle quattro più abbondante phyla. Firmicutes: clostridi (rosso) e bacilli (blu scuro); Proteobacteria: Delta / Epsilon (rosa), alfa (azzurro), gamma (arancione) e beta (turchese); Bacteroidetes: Flavobacteriia (blu scuro) e Bacteroidia(verde pallido); Actinobacteria: Coriobacteriia (viola scuro) e altri Actinobacteria (verde scuro). Clicca qui per vedere una versione più grande di questa figura.

Figura 5: cazy Annotazione del proteoma prevista nel solido insilato Microbiome. diagramma di Venn che mostra la distribuzione delle cinque classi di enzimi di annotazioni cazy nel proteoma previsto di microbiome insilato solido. Clicca qui per vedere una versione più grande di questa figura.

# Raw legge	# Filtrata legge (in coppia) # Filtrato legge	# Lampeggiavano legge
(Accoppiato)	# Filtrata legge (in coppia) # Filtrato legge	# Lampeggiavano legge	(Spaiato)
2.374.949 x2	231.679 x2	1.892.534	105.343

Tabella 1: Tabella riassuntiva dei Sequencing Legge.

Discussion

Mentre un analisi in silico può dare una visione eccellente alle comunità microbiche che sono presenti all'interno di campioni ambientali, è fondamentale che le classificazioni tassonomiche dimostrato essere eseguita in associazione con relativi controlli e che una adeguata profondità di sequenziamento è stato raggiunto per catturare tutta popolazione presente ^51.

Con qualsiasi analisi computazionale, ci sono molti percorsi per raggiungere un obiettivo simile. I metodi che abbiamo usato in questo studio sono esempi di adatti e semplici metodi, che sono stati portati insieme per realizzare una serie di analisi sul microbiome insilato. Una varietà e un numero sempre crescente di strumenti di bioinformatica e le tecniche sono disponibili per analizzare i dati metagenomic, per esempio Phylosift ⁸ e MetaPhlAn2 ^52, e che devono essere valutati prima l'indagine per la loro rilevanza per il campione e l'analisi required ^53. metodi di analisi metagenomiche sono limitati dai database per disponibili per la classificazione, la profondità sequenziamento e la qualità di sequenziamento.

L'elaborazione bioinformatica dimostrato qui è stata effettuata su un alto Macchina motorizzata locale; tuttavia i sistemi cloud-based sono inoltre disponibili. Questi servizi basati su cloud consentono per il noleggio della necessaria potenza di calcolo senza avere l'investimento ad alto costo di un adeguato potente workstation locale. Un potenziale applicazione di questo metodo potrebbe essere quello di valutare insilato prima del suo utilizzo in agricoltura per garantire che nessun batteri potenzialmente nocivi sono presenti quindi impedendo loro di entrare nella catena alimentare.

Materials

Name	Company	Catalog Number	Comments
FastDNA SPIN Kit for Soil	MP Bio	116560200	DNA Extraction
DNA FastPrep	MP Bio	116004500	DNA Extraction
Agencourt AMPure XP beads	Beckman Coulter	A63880	DNA Purification
Elution Buffer	Qiagen	19806	DNA Purification
Qubit Fluorometer	Thermo Fisher	Q33216	DNA Quantification
Qubit dsDNA HS Assay Kit	Thermo Fisher	Q32854	DNA Quantification
Nextera XT DNA Library Prep Kit	Illumina	FC-131-1024	Library Preparation
Nextera XT Index Kit	Illumina	FC-131-1001	Library Preparation
TapeStation 2200	Agilent	G2964AA	DNA Quantification
HS D100 ScreenTape	Agilent	5067-5584	DNA Quantification
HS D100 ScreenTape Reagents	Agilent	5067-5585	DNA Quantification
TapeStation Tips	Agilent	5067-5153	DNA Quantification
TapeStation Tubes	Agilent	401428 and 401425	DNA Quantification
HiSeq 2500	Illumina		DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation	Various		Local or cloud based, user preferred system