Genetics

Análise metagenômica de Silagem

Published: January 13, 2017 doi: 10.3791/54936

Richard K. Tennant¹, Christine M. Sambles¹, Georgina E. Diffey¹, Karen A. Moore¹, John Love¹

Introduction

Metagenomics é a análise directa de ADN purificado a partir de comunidades biológicos encontrados nas amostras ambientais ¹ e foi originalmente usado para detectar bactérias unculturable encontrados em sedimentos ^2. Metagenomics tem sido amplamente utilizada para um número de aplicações, tais como a identificação da microbiota humano ^3, classificando as populações microbianas dentro do oceano ⁴ e até mesmo para a análise das comunidades de bactérias que se desenvolvem em máquinas de café ^5. A introdução de tecnologias de sequenciamento de próxima geração resultou em maior rendimento de sequenciação e de saída. Consequentemente, sequenciamento de DNA tornou-se mais económica ⁶ e a profundidade de sequenciação que pode ser executada aumentou consideravelmente, permitindo metagenômica para se tornar uma poderosa ferramenta analítica.

Melhorias "Front-end" no aspecto prático, molecular de sequenciamento metagenomic têm impulsionado o crescimento do noferramentas de bioinformática silico disponíveis para a classificação taxonómica ^7-9, anotação funcional ^10,11 e representação visual ^12,13 de dados de sequência de DNA. O crescente número de disponíveis, sequenciado procariotas e eucariotas ¹⁴ genomas permite ainda mais a precisão na classificação de comunidades microbianas, que são invariavelmente realizadas contra um "back-end" de banco de dados de referência de genomas seqüenciados ^15. Duas abordagens principais podem ser adotados para análise metagenômica.

O método mais convencional é a análise do gene 16S rRNA região de codificação do genoma bacteriano. O ARNr 16S é altamente conservada entre espécies procariotas mas apresenta nove regiões hiper-variáveis (V1 - V9), o que pode ser explorado na identificação de espécies ^16. A introdução de mais sequenciação (≤ 300 pb final emparelhado) permitiu a análise de sequências de ADN que abrangem duas regiões hiper-variáveis, nomeadamenteo V3 - V4 região ^17. Avanços em outras tecnologias de seqüenciamento, tais como Oxford Nanopore ¹⁸ e PacBIO ^19, que permitem que todo o gene 16S rRNA a ser sequenciado de forma contígua.

Enquanto as bibliotecas baseadas 16S rDNA proporcionar uma abordagem orientada para a identificação de espécies e permitir a detecção de ADN de baixo número de cópias que ocorre naturalmente dentro de amostras purificadas, bibliotecas shotgun de sequenciação permitir a detecção de espécies que podem conter regiões de DNA que sejam ou não amplificável por 16S sequências de iniciadores de ARNr marcador utilizado, ou porque as diferenças entre a sequência do molde e a sequência de amplificação do iniciador são muito grandes ^20,21. Além disso, apesar de as polimerases de ADN tem uma alta fidelidade da replicação de ADN, no entanto, os erros de base pode ocorrer durante a amplificação por PCR e estes erros incorporados pode resultar na classificação errada das espécies originárias ^22. Desvios na amplificação por PCR do modelo SEQuencia também pode ocorrer; sequências de ADN com um elevado teor de GC pode ser representada sob a piscina em amplicão finais ²³ e similarmente modificações de bases não naturais, tais como a timina glicol, pode interromper as polimerases de ADN causando falhas na amplificação de sequências de ADN ^24. Em contraste, uma biblioteca de ADN shotgun de sequenciação é uma biblioteca de DNA que foi preparado usando todo o DNA purificado que foi extraída a partir de uma amostra e, subsequentemente, fragmentadas em comprimentos de cadeia de DNA mais curtos antes da preparação para a sequenciação. A classificação taxonómica das sequências de ADN gerados pela sequenciação espingarda é mais exacto quando comparado com o rRNA 16S amplicão sequenciação ^25, embora o custo financeiro necessário para atingir uma profundidade de sequenciação de confiança é maior do que a do fragmento amplificado de sequenciação ^26. O principal benefício de espingarda sequenciamento metagenômica é que as regiões sequenciadas dos vários genomas na amostra estão disponíveis para a prospecção de genes depois de terem sidofoi taxonomicamente classificada ^27.

dados de seqüência metagenômica é analisado por uma gama cada vez maior de ferramentas de bioinformática. Essas ferramentas são capazes de executar uma ampla variedade de aplicações, por exemplo, análises de controle de qualidade dos dados de sequência de ^{matérias-28,} a sobreposição de final emparelhado lê ^29, de novo montagem de sequência lê para contigs e scaffolds ^30,31, classificação taxonômica e visualização da sequência lê e montados sequências ^7,12,32,33 e a anotação funcional das sequências montados ^34,35.

Silagem, produzido por agricultores em todo o mundo a partir de cereais fermentados, como o milho (Zea mays), é predominantemente utilizado como alimento para o gado. A silagem é tratada com a bactéria Lactobacillus sp. para ajudar a fermentação ³⁶ mas até à data, não há conhecimento limitado das outras populações microbianas encontradas em silagem. o fermentadosprocesso n pode levar a microrganismos indesejáveis e potencialmente prejudiciais se tornando predominantes dentro da silagem ^37. Além de bolores e leveduras, bactérias são particularmente adaptáveis ao ambiente anaeróbio em fermentação de silagem e são mais frequentemente associados com doenças no gado, em vez do que a degradação da silagem ^38. Bactérias ácido butírico pode ser adicionado inadvertidamente a partir do solo permanece durante o enchimento do silo de silagem e é capaz de converter o ácido láctico, um produto de digestão anaeróbica, para o ácido butírico, aumentando, assim, o pH da silagem ^39. Este aumento no pH pode levar a um surto de bactérias de deterioração que, normalmente, seria incapaz de sustentar o crescimento em condições de fermentação óptima silagem ^38. Clostridium spp. , Listeria spp. e Bacillus spp. são particularmente preocupantes, especialmente em silagem para alimentação de gado leiteiro, como esporos de bactérias que sobreviveram desatrato ointestinal ⁴⁰ podem entrar na cadeia alimentar, levar à deterioração dos alimentos e, em casos raros, à sanidade animal e mortes humanas ^37,39,41-44. Além disso, embora seja difícil estimar o impacto econômico exata de tratamento veterinário e perda de gado causado pela deterioração de silagem, é provável que seja prejudicial para uma fazenda, se um surto estava a ocorrer.

Supõe-se que ao utilizar uma abordagem metagenômica podemos classificar as populações microbianas que estão presentes em amostras de silagem e, além disso, identificar as comunidades microbianas associadas com a deterioração da silagem que, por sua vez, potencialmente, ter um efeito negativo sobre os animais domésticos, permitindo medidas correctivas a ser tomadas antes da silagem é para ser usado como uma fonte de alimento.

Protocol

1. Site Location

Coletar a amostra de silagem de um local apropriado, como uma fazenda. Aqui, a fazenda foi localizado em Ballydulea, Co. Cork, Irlanda (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. Extração de DNA

NOTA: extracção de ADN foi realizada utilizando um kit comercial, seguindo as instruções do fabricante. Um controlo negativo, que não continha qualquer amostra, foi usado em todo o processo de preparação da biblioteca.

Adicionar 100-400 mg de amostra a 978 ul de tampão de fosfato de sódio e 122 uL de tampão de lise do solo no interior dos tubos de lise fornecidos.
Homogeneizar amostras colocando os tubos de lise para o homogeneizador durante 40 segundos a uma velocidade de 6,0 m / s.
Os lisados de centrifugar a 14000 xg durante 15 minutos e transferir o sobrenadante para um tubo de micro-centrífuga limpo contendo 250 uL de proteína Precipitado Solução (PPS). Misture a solução por inversão 10 vezes e centrifugara 14000 xg durante 5 min.
Adicionar ao sobrenadante para uma matriz de ligação ao ADN ml num tubo de 15 ml de centrífuga limpo. Misture a solução por inversão do tubo constantemente durante 3 min. Deixar a mistura assentar durante 3 min, depois descartá-se 500 pL de sobrenadante. Misturar-se o sobrenadante restante.
Transferir 600 ul da suspensão para um filtro de centrifugação e centrifugar a 14000 xg durante 1 min. Descartar o filtrado e repetir o processo com a suspensão remanescente.
Adicionar 500 ul de tampão de lavagem para a matriz de ligação ao ADN no interior do filtro de rotação, mistura por pipetagem, depois centrifugar a 14000 xg durante 1 min.
Descartar o filtrado e centrifugar novamente o filtro de centrifugação a 14000 xg durante 2 minutos para garantir que todo o tampão de lavagem é removida. Seca-se o filtro de rotação a 23 ° C durante 5 min.
Pré-quente (70 ° C) a água livre de DNase (DES) e re-suspender a matriz de ligação ao DNA em 100 mL de DES dentro do filtro de rotação. Transferir o filtro de rotação para um ambiente limpo 1,5 mL micro-centrífuga tuser e centrifugar a 14000 xg durante 1 min para eluir o DNA. Armazenar o ADN purificado a -20 ° C até análise posterior é executada.

3. Purificação de DNA Beads purificação usando DNA

NOTA: Antes da preparação da biblioteca metagenômico o DNA extraído foi purificado utilizando esferas de purificação para garantir uma amostra de ADN puro foi obtido.

Incubar os grânulos a 23 ° C durante 30 min antes da utilização. Adicionar 2 volumes de grânulos para a amostra de ADN e incubar a solução a 23 C durante 5 min.
Coloque as amostras em um íman separação durante 5 min e, em seguida, desprezar o sobrenadante. Lavam-se as esferas duas vezes com 200 mL de etanol fresco a 80% (EtOH). Ar secar os grânulos durante 10 min.
Retirar as amostras de separação do magneto e adicionar 50 ul de tampão de eluição (EB), misturar por pipetagem.
Incubar a suspensão a 23 ° C durante 5 min, após o que coloca as amostras de volta para o íman de separação durante 3 min.
Transfer o sobrenadante, que contém o DNA, para um tubo limpo. Descarte as contas.
Quantificar o DNA purificado conforme a secção quatro.

4. Quantificação do ADN purificado

NOTA: O ADN purificado foi quantificado usando um fluorómetro e kit de ensaio de cadeia dupla (dsDNA) de alta sensibilidade (HS) seguindo as instruções do fabricante.

Preparar uma solução de trabalho usando 199: 1 de tampão de reagente.
Adicionam-se 10 ul de cada padrão de ADN a 190 uL de solução de trabalho.
Adiciona-se 10 uL de ADN purificado a 190 uL de solução de trabalho. O volume final deverá ser de 200 uL. Incubar as amostras normais e de ADN a 23 C durante 2 min.
Analisar os padrões antes de as amostras de DNA no fluorímetro usando as instruções na tela.

5. Shotgun Sequencing Biblioteca Preparação

NOTA: A biblioteca shotgun de sequenciação foi preparado usando umkit de preparação biblioteca comercial utilizando as instruções do fabricante.

Diluir as amostras de DNA de 0,2 ng / mL usando EB. Qualquer amostra que já está abaixo desta concentração, isto é, o controlo negativo, é deixado na sua concentração actual.
Dissolvem-se 5 uL do ADN purificado com 10 ul de tampão e 5 ul mistura de enzima. Incubar as amostras a 55 C durante 5 min.
Adicionar 5 uL de tampão de neutralização e incubar a solução a 23 C durante 5 min.
Adicionar 5 uL de cada um dos índices de sequenciação específicos de amostra e 15 ul de PCR Master Mix.
Num termociclador, incubar as amostras a 72 ° C durante 3 min, 95 C durante 30 s, antes de 12 ciclos de 95 C durante 10 s, 55 C durante 30 s e 72 C durante 30 s. Incubar as amostras a 72 finalmente C durante 5 min.
Purifica-se o ADN preparado utilizando o talão de purificação como antes, mas com uma eluição final de 30 mL de EB.

6. Library Quantidade e Verificação da Qualidade

NOTA: A quantidade e qualidade das bibliotecas preparadas foram avaliadas utilizando um kit comercial e instrumentação.

Incubar os componentes do kit a 23 ° C durante 30 min antes da utilização.
Adicionar 2 mL de ADN de 2 mL de tampão e vortex durante 1 min a 2000 rpm.
Girar a amostra para assegurar que está na parte inferior do tubo.
Insira os tubos de amostra, fita de análise e dicas para o instrumento, e realizar análises conforme indicado pelo software.

Sequencing 7. DNA

Transferir as amostras bibliotecas de sequenciamento de DNA preparados e quantificáveis para um serviço de sequenciação e sequência usando 300 pb final emparelhado sequenciamento ^45.

8. Análise de Dados de Sequência bruto

NOTA: Os comandos para cada programa usando um sistema operacional Linux são mostrados abaixo do salto de protocolo. A tubagem utilizada para sanálise de dados equence é mostrado na Figura 1. Os programas devem ser instalados pelo usuário antes da análise. Este processo deve ser realizado separadamente para cada amostra.

Analisar e visualizar dados de sequência de DNA usando FastQC ^46, digitando na linha de comando / path-to-file / fastqc, seguido pela frente e verso, cru lê raw_read2.fastq raw_read1.fastq.
Especifique uma pasta de saída, digitando output_fastqc -o eo formato de arquivo dos arquivos de leitura em bruto por fastq -f.
Ver o arquivo de saída (Figura 2).
path-to-file / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. Controle de Qualidade aparamento e Dados Sequence Filtering

Execute o programa de corte, Trimmomatic ²⁸ digitando na linha de comando java -jar / path-to-file / trimmomatic-0.35.jar.
Especificar os arquivos estão emparelhados arquivos finais, digitando "PE". Estado que 16 pr Centralunidades ocessing (CPUs) deve ser utilizado pelo programa escrevendo -threads 16.
Liste os dois arquivos para verificar QC, digitando os nomes da frente cru e reverter lê. O prefixo dos arquivos de saída é determinado digitando silagem -baseout.
Definir as opções para o programa digitando ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 principais: 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 minLen: 36.
Uma vez completo, analisar as sequências aparadas usando FastQC como antes e comparar a saída para os dados de sequência de matérias para garantir o corte foi realizado com sucesso.
NOTA: A ferramenta de software, Trimmomatic, aparado lê mais, removendo líder baixa qualidade ou bases N (abaixo qualidade 3), a remoção de fuga de baixa qualidade ou bases N (abaixo qualidade 3) e analisando cada lido com um 4-base da janela ampla deslizante. Os parâmetros foram ajustados para o corte quando a qualidade média por base de cair abaixo de 20 e depois para soltar qualquer lê abaixo de 36 bases de comprimento. Finalmente, 15 bases foram cortadas from a cabeça de cada ler e lê foram cortadas para manter 200 bases a partir do início da leitura. Esta etapa final foi realizada para superar alguns problemas de qualidade quando sequenciar longo (> 200 pb) lê. Estes podem ser ajustadas para amostras específicas ^28.
java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout silagem ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 principais: 3 TRAILING: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 minLen: 36

Assembléia metagenoma 10.

Mesclar a não pareado, aparado lê digitando cat seguido pelo não emparelhado lê; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Escrever os arquivos para um novo arquivo digitando> silage_merged_unpaired.fastq
cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
Para de novo montar o DNA sequenciado, usar Espadas (St. Petersburg genoma assembler) ³⁰ digitando / path-to-file / spades.py. Especificar que CPUs 16 estão a ser utilizados, digitando -t 16 e que o parâmetro metagenômico deve aplicada escrevendo --meta.
Identificar os aparado frente lê usando -1 silage_read1_paired.fastq eo reverso lê por -2 silage_read2_paired.fastq. A não pareado mesclada lê são especificados por silage_merged_unpaired.fastq -s.
Definir a pasta de saída, digitando -o silage_spades.
path-to-file / spades.py -t 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11.-end Emparelhado Leia Sobreposição

Mesclar pares de sequência de DNA lê usando FLASH (Ajuste Rápido comprimento de curto Lê) ²⁹ digitando na linha de comando / path-to-file / flash. Especificar que CPUs 16 deve ser usado usando -t 16 e o prefixo saída digitando -o silagem.
Identificar aparado lê digitando silage_trimmed_R1.fastq silage_trimmed_R2.fastq
caminho para arquivo / flash -t 16 -o brilhou silage_read2_paired.fastq silage_read1_paired.fastq

12. taxonômica Classificação

Tipo / path-to-file / kraken e especifique o banco de dados digitando --db / caminho-para-arquivo / standard.
Definir que 16 CPUs deve ser usado digitando --threads 16 e identificar uma pasta de saída usando --output FLASHed_silage_extendedFrags_kraken.txt. Digite o nome do arquivo de entrada; FLASHed_silage.extendedFrags.fastq
path-to-file / padrão --db kraken --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
NOTA: A classificação dos andaimes de sequência de ADN montados usando Kraken ⁷ foi completado contra o mais recente banco de dados, padrão Kraken que continha todas as sequências do genoma Prokaryote disponíveis.
colunas de transferência de 2 e 3 do arquivo de saída e para um novo arquivo digitando corte -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

cortar -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

Importar o novo arquivo para Krona ¹² digitando ktImportTaxonomy. Especifique o arquivo de entrada, digitando FLASHed_silage_extendedFrags_kraken.int. Identificar o arquivo de saída, digitando -o FLASHed_silage_extendedFrags_kraken.out.html.
path-to-file / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. anotação funcional

Ir para ⁴⁷ site da MG-RAST, http://metagenomics.anl.gov/. Registre-se como um novo usuário, se necessário. Após o login, clique no botão "Upload". Faça o upload dos andaimes montados a partir do Passo 10.
Uma vez que os arquivos foram enviados, clique em "Enviar" e siga as instruções e aguardar a conclusão da análise.
Após a análise for concluída, consulte o link enviado via email da MG-RAST, ou, em alternativa, clique em "Progress". Há uma lista de trabalhos concluídos. Clique na ID de trabalho relevante e, em seguida, o link para a "página de download".
Na página de download, sob o título "Clustering Protein 90%", clique no botão de proteína para baixar o arquivo de proteína prevista, 550.cluster.aa90.faa.
Para classificar as proteínas como supostamente pertencentes a uma determinada classe de enzimas cazy, comparar as proteínas transferidas para o banco de dados cazy ^48. Baixar as enzimas Carboidratos-ativos banco de dados (cazy) de arquivos são: AA.zip, CE.zip, GH.zip, GT.zip e PL.zip. Esses arquivos representam as seguintes classes de enzimas, respectivamente: Actividades Auxiliares (AA), hidrato de carbono Esterases (CE), glicosídeo hidrolases (GH), glicosil transferases (GT) e polissacarídeo Liases (PL).
Descompacte os arquivos de bancos de dados e anotar as proteínas determinando a similaridade de proteína para as proteínas de banco de dados cazy usando o algor USEARCH UBLASTithm ^49. Para usar um loop bash (for i in * .txt) para percorrer a 5 de banco de dados tipo de arquivos .txt "for i in * .txt; fazer".
Execute USEARCH digitando / path para arquivo / usearch8 com o -ublast parâmetro, a fim de usar o algoritmo ublast. Em seguida, digite o nome do arquivo de sequência de proteína baixado MG-RAST ", mgmXXXXXX.3.550.cluster.aa90.faa".
Para indicar o arquivo de banco de dados para ser utilizado tipo "-db $ i" e especificar o limite de E-valor em 1e ^-5, digite "-evalue 1e-5".
Para terminar a pesquisa após a descoberta de uma sequência alvo e, por conseguinte, a classificação da referida sequência de proteína como pertencendo à classe das enzimas-alvo, por exemplo, GH, tipo "-masaccepts 1".
Para definir que 16 CPUs deve ser utilizado tipo "-threads 16" e especificar o formato do arquivo de saída como tipo de texto "-blast6out" separados por ATAB. Para identificar o tipo de arquivo "$ i.ublast". Para terminar o loop festança, tipo "; feito"
for i in * .txt;
fazer / caminho-para-arquivo / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out $ i.ublast;
feito

14. A visualização cazy Anotação

Para visualizar a saída a partir da anotação cazy como um diagrama de Venn, gerar listas ID proteína para cada classe de enzimas utilizando uma ansa festa. Tipo "for i in * .ublast; fazer".
Para transferir coluna 1 do arquivo de saída e para um novo arquivo, digite "cat $ i | cut -f 1> $ i.list".
Terminar o loop e tipo "; done".
Abra os arquivos .list em um editor de texto. Ir para o site, selecione o número de conjuntos como 5 e colar o conteúdo de cada arquivo de lista em uma caixa separada. Baixe o diagrama resultante como um arquivo .SVG.
for i in * .ublast;
fazer cat $ i | cortar -f 1> $ i.list;
feito

Representative Results

Antes do processamento de bioinformática, sequência cru lê foram aparadas e adaptadores foram removidos usando software Trimmomatic ^28. Depois do passo de limpeza e filtração, o número de leituras foi reduzida para 50% da sequência lê-se (Tabela 1). A pontuação média de base Phred era> 30 depois de controle de qualidade (Figura 2).

Pares de sequências de DNA que tinham regiões sobrepostas foram fundidas usando o software Flash ²⁹ para gerar única já não lê, não sobreposta lê foram mantidos em um arquivo separado. 45.47% lê (105.343), combinada com sucesso. Após a sobreposição de leituras usando FLASH de leituras, as resultantes fragmentos estendidos foram submetidos a classificação taxonômica bacteriana usando software Kraken ⁷ e foram posteriormente visualizados com software Krona (Figura 3).

Figura 4. As espécies mais abundantes no metagenome foram Lactobacillus spp. (24%; Firmicutes), Corynebacterium spp. (8%; Actinobactérias), Propionibacterium spp. (3%; Actinobactérias) e Prevotella spp. (3%; Bacteroides). Espécies importantes para a saúde animal e implicados na doença também foram observados; Clostridium spp. (1%) de Bacillus spp. (0,6%), Listeria spp. (0,2%) foram previstos para estar presente na amostra de ensilagem.

anotação funcional foi realizado em montado lê. O metagenome foi montado utilizando o montador pás ³⁰ usando o aparadas e filtradaemparelhado-end e não emparelhado lê gerando 92,284 andaimes. A fim de identificar as celulases, as proteínas foram preditos usando MG-RAST e anotado usando as enzimas de carboidratos-ativos banco de dados (cazy). Dos 97,562 proteínas preditas, 6357 foram anotados como uma enzima de hidrato de carbono-activo putativo em uma das cinco classes de enzimas que compõem a base de dados cazy (Figura 5). Os resultados foram visualizados como um diagrama de Venn usando software InteractiVenn ⁵⁰ que mostra a distribuição de notas de proteínas, incluindo aqueles que contêm mais do que uma classe de enzimas cazy anotação. Destes, 3861 foram previstos como tendo actividade beta-glicosidases e vai ainda ser caracterizado no laboratório para confirmar a função.

Figura 1: Bioinformatic Metagenomics Pipeline para Análise de Silagem. Duas abordagens principais foramusado para investigar o microbioma da silagem, classificação taxonômica e anotação funcional. Por favor clique aqui para ver uma versão maior desta figura.

Figura 2: Qualidade Sequence Per-base antes e após o corte e remoção do adaptador. A trama de qualidade per-base de sequência de FASTQC mostra a pontuação média Phred em todo o comprimento da sequência lê controle pré e pós-qualidade. Por favor clique aqui para ver uma versão maior desta figura.

Figura 3: taxonômica Classificação do bacteriana Microbiome de Silagem Sólido. Classificação da sequência aparado e sobreposição lê a partir FLASH foi realizada utilizando Kraken ⁷ e posteriormente visualizados com coroa. Por favor clique aqui para ver uma versão maior desta figura.

Figura 4: Classe taxonômica Distribuição do 4 Filos mais abundante no bacteriana Microbiome de Silagem Sólido. A percentagem de cada classe de bactérias dentro das quatro filos mais abundante. Firmicutes: Clostridia (vermelho) e bacilos (azul escuro); Proteobactérias: delta / epsilon (rosa), alfa (azul-claro), gama (laranja) e beta (turquesa); Bacteroidetes: Flavobacteriia (azul escuro) e Bacteroidia(verde pálido); Actinobacteria: Coriobacteriia (roxo escuro) e outros actinobactérias (verde escuro). Por favor clique aqui para ver uma versão maior desta figura.

Figura 5: cazy anotação do Proteome prevista no sólido Silagem Microbiome. diagrama de Venn mostra a distribuição das cinco classes de enzimas de anotações cazy no proteoma previsto de microbioma silagem sólido. Por favor clique aqui para ver uma versão maior desta figura.

# Raw lê	# Filtrada lê (emparelhado) # Filtrada lê	# Brilhou lê
(Emparelhado)	# Filtrada lê (emparelhado) # Filtrada lê	# Brilhou lê	(Não pareado)
2.374.949 x2	231.679 x2	1.892.534	105343

Tabela 1: Resumo da tabela de Sequenciamento Lê.

Discussion

Embora uma análise in silico pode dar uma excelente visão para as comunidades microbianas que estão presentes nas amostras ambientais, é crítico que as classificações taxonómicos demonstrou ser realizada em associação com os controlos relevantes e que uma profundidade adequada de sequenciação foi obtida para capturar a totalidade população presente ^51.

Com qualquer análise computacional, existem muitos caminhos para atingir um objetivo similar. Os métodos que usamos neste estudo são exemplos de métodos adequados e direta, que foram trazidos em conjunto para alcançar uma gama de análises sobre o microbioma silagem. A variedade e um número cada vez maior de ferramentas e técnicas de bioinformática estão disponíveis para analisar os dados metagenomic, por exemplo Phylosift ⁸ e MetaPhlAn2 ^52, e estes devem ser avaliados antes da investigação por sua relevância para a amostra ea análise required ^53. métodos de análise metagenomic são limitados pelos bancos de dados para disponíveis para a classificação, a profundidade de sequenciação e a qualidade do sequenciamento.

O processamento de bioinformática demonstrado aqui foi realizada num aparelho mecânico local, um elevado; no entanto sistemas baseados em nuvem também estão disponíveis. Estes serviços baseados em nuvem permitem o aluguer do poder computacional necessário sem ter o investimento de alto custo de uma estação de trabalho local poderosa adequado. Uma aplicação potencial deste método seria para avaliar a silagem antes da sua utilização na agricultura para garantir que não há bactérias potencialmente nocivas estão presentes, portanto, impedindo-os de entrar na cadeia alimentar.

Materials

Name	Company	Catalog Number	Comments
FastDNA SPIN Kit for Soil	MP Bio	116560200	DNA Extraction
DNA FastPrep	MP Bio	116004500	DNA Extraction
Agencourt AMPure XP beads	Beckman Coulter	A63880	DNA Purification
Elution Buffer	Qiagen	19806	DNA Purification
Qubit Fluorometer	Thermo Fisher	Q33216	DNA Quantification
Qubit dsDNA HS Assay Kit	Thermo Fisher	Q32854	DNA Quantification
Nextera XT DNA Library Prep Kit	Illumina	FC-131-1024	Library Preparation
Nextera XT Index Kit	Illumina	FC-131-1001	Library Preparation
TapeStation 2200	Agilent	G2964AA	DNA Quantification
HS D100 ScreenTape	Agilent	5067-5584	DNA Quantification
HS D100 ScreenTape Reagents	Agilent	5067-5585	DNA Quantification
TapeStation Tips	Agilent	5067-5153	DNA Quantification
TapeStation Tubes	Agilent	401428 and 401425	DNA Quantification
HiSeq 2500	Illumina		DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation	Various		Local or cloud based, user preferred system