Metagenomisk Analyse af ensilage

1Biosciences, University of Exeter
Published 1/13/2017
0 Comments
  CITE THIS  SHARE 
Genetics
 

Summary

Cite this Article

Copy Citation

Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Introduction

Metagenomics er den direkte analyse af DNA oprenset fra biologiske samfund findes inden miljøprøver 1 og blev oprindeligt anvendt til at detektere unculturable bakterier, der findes i sedimenter 2. Metagenomics har været meget anvendt i en række applikationer, såsom at identificere den menneskelige microbiome 3, klassificering mikrobielle populationer i havet 4 og selv for analysen af de bakterielle samfund, der udvikler på kaffemaskiner 5. Indførelsen af ​​næste generation sekventering teknologi resulteret i større sekventering gennemløb og output. Derfor har DNA-sekventering blevet mere økonomisk 6 og dybden af sekventering der kan udføres steget kraftigt, så metagenomics at blive en kraftfuld, analytisk værktøj.

"Front-end" forbedringer i det praktiske, molekylær aspekt af metagenomisk sekventering har drevet væksten i isilico bioinformatiske værktøjer til rådighed for den taksonomiske klassifikation 7-9, funktionel annotation 10,11 og visuel repræsentation 12,13 DNA sekvens data. Det stigende antal tilgængelige, sekventeret prokaryote og eukaryote 14 genomer tillader yderligere nøjagtighed i klassificeringen af mikrobielle samfund, som altid udføres mod en "back-end" reference database over sekventerede genomer 15. kan vedtages to vigtigste tilgange til metagenomisk analyse.

Den mere konventionelle metode er analyse af 16S rRNA-genet kodende region af bakterielle genom. 16S rRNA er stærkt konserveret mellem prokaryote arter, men udviser ni hyper-variable regioner (V1 - V9), som kan udnyttes til identifikation art 16. Indførelsen af ​​længere sekventering (≤ 300 bp parret ende) tilladt til analyse af DNA-sekvenser, der spænder over to hyper-variable regioner, isærV3 - V4 område 17. Fremskridt i andre sekventering teknologier, såsom Oxford nanopore 18 og PacBIO 19, tillader hele 16S rRNA-genet skal sekventeret sammenhængende.

Mens 16S rDNA baserede biblioteker tilvejebringe målrettet med identifikation af arter og muliggøre detektion af lavt kopital DNA, der forekommer naturligt inden oprensede prøver, shotgun sekventering biblioteker kan påvises over arter, der kan indeholde DNA-regioner, der enten ikke amplificerbare af 16S rRNA markør primersekvenser anvendes, eller fordi forskellene mellem templatesekvensen og forstærkningsorganet primersekvensen er for store 20,21. Selv DNA-polymeraser har en high fidelity af DNA-replikation, base-fejl kan alligevel forekomme under PCR-amplifikation og disse indarbejdet fejl kan resultere i fejlagtig klassificering af arter 22 oprindelse. Bias i PCR-amplifikation af template sequences kan også forekomme; sekvenser af DNA med et højt GC-indhold kan være underrepræsenteret i den endelige amplicon pool 23 og tilsvarende unaturlige basemodifikationer, såsom thymin glycol, kan standse DNA-polymeraser bevirker svigt i amplifikation af DNA-sekvenser 24. Derimod kan et haglgevær sekventering DNA-bibliotek er et DNA-bibliotek, der er blevet fremstillet ved hjælp af alle af de oprensede DNA, der er blevet ekstraheret fra en prøve og efterfølgende fragmenteret i kortere DNA kædelængder før forberedelse til sekventering. Klassifikation, af DNA-sekvenser genereret af shotgun-sekventering er mere præcis i forhold til 16S rRNA amplicon sekventering 25, selv om den finansielle omkostninger, der kræves for at nå en pålidelig sekventering dybde er større end den for amplikon sekventering 26. Den største fordel ved shotgun sekventering metagenomics er, at sekvenserede regioner af de forskellige genomer i prøven er tilgængelige for gen efterforskning, når de har væreter blevet taksonomisk klassificeret 27.

Metagenomisk sekvens data analyseres ved en stadig stigende udvalg af bioinformatiske værktøjer. Disse værktøjer er i stand til at udføre en bred vifte af applikationer, for eksempel, kvalitetskontrol analyse af de rå sekvensdata 28, overlappende af parret ende læser 29, de novo samling af sekvens læser til contig'er og stilladser 30,31, taksonomisk klassifikation og visualisering af sekvens læser og samles sekvenser 7,12,32,33 og den funktionelle annotation af samlede sekvenser 34,35.

Ensilage, produceret af landmænd i hele verden fra fermenterede korn såsom majs (Zea mays), der overvejende bruges som kvægfoder. Ensilage behandles med bakterien Lactobacillus sp. at hjælpe gæring 36, men til dato, der er begrænset viden om de andre mikrobielle populationer findes i ensilage. Den fermentation proces kan føre til uønskede og potentielt skadelige mikroorganismer bliver udbredt i ensilagen 37. Foruden gær og skimmelsvampe, bakterier er særligt tilpasses til det anaerobe miljø i gærende ensilage og er hyppigere forbundet med sygdomme hos husdyr snarere end nedbrydningen af ensilagen 38. Smørsyre bakterier kan uforvarende tilføjet fra jorden forbliver ved påfyldning af ensilage siloer og er i stand til at omdanne mælkesyre, et produkt fra anaerob udrådning, at smørsyre, hvilket øger pH i ensilagen 39. Denne stigning i pH kan føre til en stigning i fordærvende bakterier, der normalt ville være i stand til at opretholde væksten under optimal ensilage fermenteringsbetingelser 38. Clostridium spp. , Listeria spp. og Bacillus spp. er af særlig bekymring, især i ensilage til malkekvæg foder, som bakteriesporer, der har overlevet den Gastrointestinal tarmkanalen 40 kan komme ind i fødekæden, føre til mad fordærv og, i sjældne tilfælde, at dyr og mennesker dødsfald 37,39,41-44. Selv om det er vanskeligt at vurdere den nøjagtige økonomiske konsekvenser af dyrlægebehandling og husdyr tab som følge af ensilage fordærv, er det sandsynligt, at være til skade for en gård, hvis et udbrud var at forekomme.

Det antages, at vi ved hjælp af en metagenomisk tilgang kan klassificere mikrobielle populationer, der er til stede i ensilage prøver og desuden identificere mikrobielle samfund forbundet med ensilage fordærv, der ville til gengæld potentielt have en skadelig virkning på husdyr, så afhjælpende foranstaltninger for at være taget før ensilagen skal anvendes som fødekilde.

Protocol

1. Webstedet Beliggenhed

  1. Saml ensilagen prøve fra et passende sted, såsom en gård. Her gården lå i Ballydulea, Co. Cork, Irland (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA ekstraktion

BEMÆRK: DNA-ekstraktion blev udført ved anvendelse af et kommercielt kit ifølge producentens anvisninger. En negativ kontrol, der ikke indeholdt prøven, blev anvendt i hele biblioteket fremstillingsmetode.

  1. Tilføj 100-400 mg prøve til 978 uL natriumphosphatbuffer og 122 uL jord lysis buffer i de medfølgende lysis rør.
  2. Homogenisere prøver ved at anbringe lysis rør i homogenisator i 40 sekunder ved en hastighed på 6,0 m / s.
  3. Centrifuger lysater ved 14.000 xg i 15 minutter og Supernatanten overføres til en ren mikro-centrifugerør indeholdende 250 pi proteinudfældningsprodukt Solution (PPS). Bland løsningen ved at vende 10 gange og centrifugeved 14.000 xg i 5 min.
  4. Tilsæt supernatant til 1 ml DNA-bindende matrix i et rent 15 ml centrifugerør. Bland opløsningen ved at vende røret konstant i 3 min. Lad blandingen nøjes med 3 minutter, derefter kassere 500 pi supernatant. Bland resterende supernatant.
  5. Overfør 600 pi af suspensionen til et spin-filter og der centrifugeres ved 14.000 xg i 1 min. Kassér filtratet og gentage processen med den resterende suspension.
  6. Der tilsættes 500 pi vaskebuffer til det DNA-bindende matrix inden centrifugeringsfiltret, blandes ved pipettering, centrifugeres ved 14.000 x g i 1 min.
  7. Kassér filtrat og centrifugeres spinnefilteret igen ved 14.000 x g i 2 minutter for at sikre alle vaskebuffer er fjernet. Tør spinnefilteret ved 23 C i 5 min.
  8. Pre-varm (70 ° C) DNase-frit vand (DES) og re-suspendere DNA-bindende matrix i 100 pi DES inden centrifugeringsfiltret. Overfør spin filter på en ren 1,5 ml mikrocentrifuge tuvære og centrifugeres ved 14.000 xg i 1 min til eluering DNA. Opbevar oprenset DNA ved -20 C indtil udføres yderligere analyse.

3. DNA oprensning ved anvendelse DNA Purification Beads

BEMÆRK: Før metagenomisk bibliotek forberedelse det ekstraherede DNA blev oprenset under anvendelse rensning perler for at sikre en ren DNA-prøve blev opnået.

  1. Inkuber perlerne ved 23 C i 30 minutter før brug. Tilsæt 2 volumener perler til DNA-prøven og inkuber opløsningen ved 23 C i 5 min.
  2. Placer prøverne på en adskillelse magnet i 5 minutter og derefter kassere supernatanten. Vask perlerne to gange med 200 pi frisk 80% ethanol (EtOH). Lufttørre perlerne i 10 minutter.
  3. Fjern prøverne fra separationen magnet og tilsættes 50 pi elueringsbuffer (EB), blandes ved pipettering.
  4. Inkuber suspensionen ved 23 C i 5 minutter, hvorefter placere prøverne tilbage på adskillelse magnet for 3 min.
  5. transfer supernatanten, som indeholder DNA'et, til et rent rør. Kassér perlerne.
  6. Kvantificer det oprensede DNA som pr afsnit fire.

4. Kvantificering af oprenset DNA

BEMÆRK: Oprenset DNA blev kvantificeret ved anvendelse af et fluorometer og dobbeltstrenget (dsDNA) Høj følsomhed (HS) assaykit ifølge producentens anvisninger.

  1. Der fremstilles en arbejdsopløsning ved hjælp 199: 1-forhold mellem buffer med reagens.
  2. Der tilsættes 10 pi af hver DNA standard til 190 pi arbejdsopløsning.
  3. Tilsæt 10 pi oprenset DNA til 190 pi af arbejdsopløsning. Slutvolumenet bør være 200 pi. Inkuber standard og DNA-prøver ved 23 C i 2 minutter.
  4. Analyser standarder før de DNA-prøver på fluorometer ved hjælp af vejledningen på skærmen.

5. Shotgun sekventering Bibliotek Forberedelse

BEMÆRK: haglgevær sekventering bibliotek blev fremstillet under anvendelse af enkommercielt bibliotek forberedelse kit anvendelse af producentens anvisninger.

  1. Fortynd DNA-prøverne til 0,2 ng / uL hjælp EB. Enhver prøve, som allerede ligger under denne koncentration, dvs. den negative kontrol, der er tilbage på det nuværende koncentration.
  2. Bland 5 pi af det oprensede DNA med 10 pi buffer og 5 pi enzymblanding. Inkuber prøverne ved 55 C i 5 min.
  3. Tilsæt 5 pi af neutraliserende puffer og inkuberes opløsningen ved 23 C i 5 min.
  4. Tilsæt 5 pi af hver af prøven specifikke sekventering indekser og 15 pi PCR Master Mix.
  5. I en thermocycler, inkuberes prøverne ved 72 ° C i 3 min, 95 ° C i 30 s, før 12 cykler ved 95 C i 10 s, 55 ° C i 30 s og 72 ° C i 30 s. Inkuber prøver endelig ved 72 C i 5 min.
  6. Oprens tilberedte DNA under anvendelse perlen oprensning som før, men med en endelig eluering af 30 pi EB.

6. Library Mængde og Kvalitet Check

BEMÆRK: Mængden og kvaliteten af ​​de fremstillede biblioteker blev vurderet ved anvendelse af et kommercielt kit og instrumentering.

  1. Inkubér kittets komponenter ved 23 C i 30 min før anvendelse.
  2. Tilsæt 2 pi DNA til 2 pi buffer og vortex i 1 min ved 2000 rpm.
  3. Spin ned prøven for at sikre det er i bunden af ​​røret.
  4. Sæt prøverør, analyse bånd og tips i instrumentet, og udfører analyser som anvist af softwaren.

7. DNA-sekventering

  1. Overfør den forberedte og kvantificerbare DNA sekventering biblioteker prøver til en sekventering service og sekvens ved hjælp af 300 bp parret ende sekventering 45.

8. Analyse af Raw Sequence data

BEMÆRK: kommandoer for hvert program ved hjælp af et Linux-operativsystem er vist nedenfor protokollen trin. Rørledningen anvendes til sEquence dataanalyse er vist i figur 1. Programmerne skal installeres af før analyse brugeren. Denne proces bør udføres individuelt for hver prøve.

  1. Analyser og visualisere DNA-sekvens data ved hjælp FastQC 46 ved at skrive i til kommandolinjen / sti til fil / fastqc, efterfulgt af frem og bak rå læser raw_read1.fastq raw_read2.fastq.
  2. Angiv en output mappe ved at skrive -o output_fastqc og filformatet for de rå læse filer ved -f fastq.
  3. Se uddatafilen (figur 2).
    sti til fil / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. Kvalitetskontrol Skæring og filtrering Sequence data

  1. Kør trimning program, Trimmomatic 28 ved at skrive i kommandolinjen java -jar / sti til fil / trimmomatic-0.35.jar.
  2. Angiv filerne er parret ende filer ved at skrive "PE". Stat, at 16 centrale PRocessing enheder (CPU'er) bør anvendes af programmet ved at skrive -threads 16.
  3. Anfør de to filer til QC kontrol ved at skrive navnene på de rå frem og bak læser. Præfikset af output-filer bestemmes ved at skrive -baseout ensilage.
  4. Definer indstillinger for programmet ved at skrive ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 FØRENDE: 3 Trailing: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 MINLEN: 36.
  5. Når færdig, analysere de trimmede sekvenser under anvendelse FastQC som før og sammenligne outputtet til de rå sekvensdata at sikre trimning er blevet udført med succes.
    BEMÆRK: softwareværktøj, Trimmomatic, trimmet læser videre ved at fjerne førende lav kvalitet eller N baser (under kvalitet 3), fjerne efterstillede lav kvalitet eller N baser (under kvalitet 3) og scanning hver læses med en 4-base, bred glidende vindue. Parametrene blev sat til at skære, når den gennemsnitlige kvalitet pr basen falder til under 20, og derefter at droppe enhver læser under 36 baser lang. Endelig blev 15 baser beskåret from lederen af ​​hvert læse og læser blev beskåret til at holde 200 baser fra starten af ​​læse. Dette sidste trin blev udført for at overvinde nogle kvalitet spørgsmål, når sekventering lange (> 200 bp) læser. Disse kan justeres til specifikke prøver 28.
    java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout ensilage ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 FØRENDE: 3 Trailing: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 MINLEN: 36

10. metagenom Assembly

  1. Flet den uparret, trimmet læser ved at skrive kat efterfulgt af uparrede læser; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Skriv filerne til en ny fil ved at skrive> silage_merged_unpaired.fastq
    kat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
  2. Til de novo samle sekventeret DNA, bruge Spades (St. Petersburg genom assembler) 30 ved at skrive / sti-til-file / spades.py. Angiv, at 16 CPU'er skal anvendes ved at skrive -t 16 og at den metagenomisk parameter bør anvendes ved at skrive --meta.
  3. Identificer det trimmede fremad læser bruger -1 silage_read1_paired.fastq og omvendt læser ved -2 ​​silage_read2_paired.fastq. Den fusionerede uparret læser er specificeret af -s silage_merged_unpaired.fastq.
  4. Angiv output mappe ved at skrive -o silage_spades.
    sti til fil / spades.py-t 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. Parret ende Læs Overlap

  1. Flet par af DNA-sekvensen læser bruger FLASH (Fast længde Justering af Short Reads) 29 ved at skrive i kommandolinje / sti til fil / flash. Specificere, at 16 CPU'er skal bruges ved at bruge -t 16 og output præfiks ved at skrive -o ensilage.
  2. Identificer trimmes læser ved at skrive silage_trimmed_R1.fastq silage_trimmed_R2.fastq
    sti til fil / flash-t 16 -o blinkede silage_read1_paired.fastq silage_read2_paired.fastq

12. Taksonomisk klassifikation

  1. Type / sti til fil / Kraken og angiv databasen ved at skrive --db / sti til fil / standard.
  2. Definer at 16 CPU'er skal bruges ved at skrive --threads 16 og identificere en output mappe ved at bruge --output FLASHed_silage_extendedFrags_kraken.txt. Skriv navn input fil; FLASHed_silage.extendedFrags.fastq
    sti til fil / Kraken --db standard --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
    BEMÆRK: Klassificering af de forsamlede DNA sekvens stilladser ved hjælp af Kraken 7 blev afsluttet mod den seneste, standard Kraken database, der indeholder alle tilgængelige Prokaryote genom-sekvenser.
  3. Overfør kolonne 2 og 3 fra output-fil og til en ny fil ved at skrive snit -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  4. skære -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  5. Importer den nye fil ind Krona 12 ved at skrive ktImportTaxonomy. Angiv inddatafilen ved at skrive FLASHed_silage_extendedFrags_kraken.int. Identificer output filen ved at skrive -o FLASHed_silage_extendedFrags_kraken.out.html.
    sti til fil / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. Funktionel Annotation

  1. Gå til MG-RAST 47 hjemmeside, http://metagenomics.anl.gov/. Registrere som ny bruger, hvis det kræves. Når du er logget ind, klik på knappen "Upload". Upload de forsamlede stilladser fra trin 10.
  2. Når filerne er uploadet, skal du klikke på "Send" og følg instruktionerne og afvente færdiggørelsen af ​​analysen.
  3. Når analysen er færdig, se linket sendes via email fra MG-RAST, eller alternativt, klik på "Progress". Der er en liste over udførte opgaver. Klik på det pågældende job id og derefter på linket til "download-side".
  4. På download siden, under overskriften "Protein Clustering 90%", klik på knappen protein for at hente den forudsagte protein-filen, 550.cluster.aa90.faa.
  5. For at klassificere proteiner formodentlig tilhører en bestemt cazy enzym klasse, sammenligne de downloadede proteiner til cazy databasen 48. Download Kulhydrat-aktive enzymer Database (cazy) fra filer er: AA.zip, CE.zip, GH.zip, GT.zip og PL.zip. Disse filer repræsenterer følgende enzymklasser henholdsvis: hjælpetjenester (AA), kulhydrat Esteraser (CE), glycosidhydrolaser (GH), glycosyltransferaser (GT) og polysaccharid Lyaser (PL).
  6. Pak databasefilerne og anmærke proteinerne ved at bestemme protein lighed med cazy database proteiner ved hjælp af USEARCH UBLAST algorithm 49. For at bruge en bash loop (for jeg i * .txt) til gentage gennem fem databasen .txt-filer type "for jeg i * .txt; gøre".
  7. Kør USEARCH ved at skrive / sti til fil / usearch8 med parameteren -ublast for at bruge ublast algoritme. Indtast derefter navnet på protein sekvens fil downloadet fra MG-RAST, "mgmXXXXXX.3.550.cluster.aa90.faa".
  8. For at angive databasen fil, der skal bruges type "-db $ i", og til at angive e-værdi tærsklen på 1e -5, type "-evalue 1e-5".
  9. For at afslutte søgningen efter opdagelsen af en målsekvens, og derfor klassificere at protein sekvens som hørende til målenzymet klassen, f.eks GH, skriv "-masaccepts 1".
  10. For at definere, at 16 CPU'er skal bruges type "-threads 16", og til at angive formatet for output filen som ATAB-separeret tekst type "-blast6out". For at identificere output filtype "$ i.ublast". For at afslutte bash loop, type "gjort"
    for jeg i * .txt;
    gøre / sti til fil / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out $ i.ublast;
    Færdig

14. Visualisering cazy Annotation

  1. At visualisere output fra cazy annotation som Venn-diagram, generere protein-listen for hvert enzym klasse under anvendelse af en bash løkke. Type "for jeg i * .ublast, gøre".
  2. Sådan overfører kolonne 1 fra output-filen, og til en ny fil, skriv "cat $ i | skære -f 1> $ i.list".
  3. Afslut løkken og type "gjort".
  4. Åbn .list filer i en teksteditor. Gå til hjemmesiden, skal du vælge antallet af sæt som 5 og indsætte indholdet af hver liste fil i en separat boks. Downloade resulterende diagram som .svg fil.
    for jeg i * .ublast;
    gøre cat $ i | cut -f 1> $ i.list;
    Færdig

Representative Results

Forud for bioinformatisk behandling, lyder rå sekvens blev trimmet og adaptere blev fjernet ved hjælp Trimmomatic software 28. Efter trimning og filtreringstrin, antallet af aflæsninger blev reduceret til 50% af sekvensen læser (tabel 1). Den gennemsnitlige basen Phred score var> 30 efter kvalitetskontrol (figur 2).

Par af DNA-sekvenser, som havde overlappende områder blev fusioneret ved hjælp af Flash-software 29 til at generere enkelt længere læser, læser ikke-overlappende blev holdt i en separat fil. 45,47% læser (105.343) kombineret med succes. Efter overlapning af læser bruger FLASH af læser, de resulterende udvidede fragmenter gennemgik bakteriel taksonomisk klassifikation hjælp Kraken software 7 og blev efterfølgende visualiseret med kroner software (figur 3).

figur 4. De mest udbredte arter i metagenomet var Lactobacillus spp. (24%, Firmicutes), Corynebacterium spp. (8% aktinobakterier), Propionibacterium spp. (3% aktinobakterier) og Prevotella spp. (3%; Bacteroidetes). Arter vigtige for dyresundhed og impliceret i sygdom blev også observeret; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) blev forudsagt at være til stede i ensilagen prøven.

Funktionel anmærkning blev udført på samlet læser. Den metagenomet blev samlet under anvendelse af spader assembler 30 ved anvendelse af trimmet og filtreretparret-end og uparrede læser genererer 92,284 stilladser. For at identificere cellulaser blev proteiner forudsiges ved hjælp MG-RAST og kommenteret under anvendelse af Kulhydrat-aktive enzymer Database (cazy). Af de 97,562 forudsagte proteiner, 6357 blev kommenteret som en formodet kulhydrat-aktive enzym i en af de fem enzymer klasser, der udgør cazy databasen (figur 5). Resultaterne blev visualiseret som et Venn-diagram ved hjælp InteractiVenn software 50 viser fordelingen af protein anmærkninger, herunder dem, der indeholder mere end én cazy enzym klasse annotation. Af disse blev 3861 forudsiges at have glycosidhydrolase aktivitet og vil blive yderligere karakteriseret i laboratoriet for at bekræfte funktionen.

figur 1
Figur 1: Bioinformatik Metagenomics Pipeline for Analyse af ensilage. To vigtige tilgange varbruges til at undersøge microbiome af ensilage, taksonomisk klassifikation og funktionel annotation. Klik her for at se en større version af dette tal.

Figur 2
Figur 2: Sekvens Kvalitet Per-basen Før og efter trimning og adapter Removal. Den per-basesekvens kvalitet plot fra FASTQC viser de gennemsnitlige Phred score på tværs af længden af ​​sekvensen læser før og efter kvalitetskontrol. Klik her for at se en større version af dette tal.

Figur 3
Figur 3: Taksonomisk klassifikationtion af Bakteriel microbiome af Solid ensilage. Klassifikation af trimmet og overlappende sekvens læser fra FLASH blev udført ved hjælp af Kraken 7 og efterfølgende visualiseret med krone. Klik her for at se en større version af dette tal.

Figur 4
Figur 4: Taksonomisk klasse Fordeling af fire mest udbredte phyla i Bakteriel microbiome af Solid ensilage. Procentdelen af ​​hver klasse af bakterier inden for fire mest udbredte phyla. Firmicutes: Clostridia (rød) og baciller (mørkeblå); Proteobacteria: delta / epsilon (lyserød), alfa (lyseblå), gamma (orange) og beta (turkis); Bacteroidetes: Flavobacteriia (mørkeblå) og Bacteroidia(Bleg grøn); Aktinobakterier: Coriobacteriia (mørk lilla) og andre aktinobakterier (mørkegrøn). Klik her for at se en større version af dette tal.

Figur 5
Figur 5: cazy Annotation af forventet Proteome i Solid ensilage microbiome. Venn-diagram der viser fordelingen af ​​de fem enzymklasser af cazy anmærkninger i den forudsagte proteom af fast ensilage microbiome. Klik her for at se en større version af dette tal.

# Raw læser # Filtreret læser (parret) # Filtreret læser # Blinkede læser
(Parret) (Uparret)
2.374.949 x2 231.679 x2 1.892.534 105.343

Tabel 1: Oversigtstabel over Sequencing Læser.

Discussion

Mens en in silico analyse kan give en fremragende indsigt til den mikrobielle samfund, der er til stede i miljøprøver, er det afgørende, at de taksonomiske klassificeringer demonstrerede udføres sammen med relevante kontroller, og at en passende dybde af sekventering er blevet opnået til at fange hele befolkning nuværende 51.

Med enhver beregningsanalyse, der er mange veje til at opnå en lignende mål. De metoder, som vi har anvendt i denne undersøgelse, er eksempler på egnede og ligefremme metoder, der er blevet bragt sammen for at opnå en række analyser på ensilagen microbiome. En sort og en stadigt stigende antal bioinformatiske værktøjer og teknikker er til rådighed til at analysere metagenomisk data, for eksempel Phylosift 8 og MetaPhlAn2 52, og disse virkninger skal vurderes, inden undersøgelsen for deres relevans til prøven og analysen reqgendannes for 53. Metagenomisk analysemetoder er begrænset af databaserne for rådighed for klassificering, sekventering dybde og kvaliteten af ​​sekventering.

Den bioinformatiske behandling demonstreret her blev udført på en lokal, høj drevet maskine; dog cloud-baserede systemer er også tilgængelige. Disse cloud-baserede tjenester giver for leje af den nødvendige regnekraft uden at have den høje omkostninger investering af en egnet stærk lokal arbejdsstation. En potentiel anvendelse af denne metode ville være at vurdere ensilage før dens anvendelse i landbruget for at sikre, at ingen potentielt skadelige bakterier er til stede derfor forhindrer dem i at komme ind i fødekæden.

Materials

Name Company Catalog Number Comments
FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

DOWNLOAD MATERIALS LIST

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38, (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59, (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486, (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304, (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507, (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15, (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2, (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12, (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7, (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32, (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43, (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10, (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69, (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2, (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14, (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20, (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343, (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370, (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65, (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50, (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104, (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469, (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15, (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32, (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30, (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27, (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19, (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. metaSPAdes: a new versatile de novo metagenomics assembler. (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30, (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10, (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106, (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167, (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22, (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182, (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90, (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86, (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153, (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50, (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456, (7218), 53-59 (2008).
  46. Andrews, S. Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, Chapter 13 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, Database issue 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26, (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16, (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12, (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9, (9), 75-88 (2015).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Video Stats