Metagenomic Analyse av Silo

1Biosciences, University of Exeter
Published 1/13/2017
0 Comments
  CITE THIS  SHARE 
Genetics
 

Summary

Cite this Article

Copy Citation

Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Introduction

Metagenomikk er den direkte analyse av DNA renset fra biologiske samfunn innenfor miljøprøver 1 og ble opprinnelig brukt til å oppdage unculturable bakterier som finnes i sedimenter 2. Metagenomikk har vært mye brukt for en rekke programmer, for eksempel identifisering av den menneskelige mikrobiomer 3, klassifisering mikrobielle populasjoner i havet 4 og selv for analyse av bakteriesamfunn som utvikler på kaffemaskiner 5. Innføringen av neste generasjons sekvense teknologi ført til større sekvense gjennomstrømming og resultat. Følgelig har DNA-sekvensering blir mer økonomisk 6 og dybden av sekvensering som kan utføres har sterkt øket, slik at metagenomikk til å bli en kraftig, analytisk verktøy.

"Front-end" forbedringer i det praktiske, molekylære aspekter av metagenomic sekvense har drevet veksten av isilico bioinformatikk verktøy tilgjengelig for taksonomisk klassifisering 7-9, funksjonell annotering 10,11 og visuell representasjon 12,13 av DNA sekvensdata. Det økende antall tilgjengelige, sekvensert prokaryote og eukaryote 14 genomer gir ytterligere nøyaktighet i klassifiseringen av mikrobielle samfunn, som alltid utføres mot en "back-end" referansedatabase for sekvensert genomene 15. To hovedtilnærminger kan bli vedtatt for metagenomic analyse.

Den mer konvensjonelle metoden er analyse av 16S rRNA-genet kodende region av bakterielt genom. 16S rRNA er sterkt konservert mellom prokaryote arter, men viser ni hyper-variable regioner (V1 - V9) som kan utnyttes for artsbestemmelse 16. Innføringen av lengre sekvensering (≤ 300 bp sammenkoblet ende) er tillatt for analyse av DNA-sekvenser som strekker seg over to hypervariable regioner, i særdeleshetV3 - V4 region 17. Fremskritt i andre sekvense teknologier, for eksempel Oxford nanopore 18 og PacBIO 19, tillater hele 16S rRNA-genet for å bli sekvensert contiguously.

Mens 16S rDNA-baserte biblioteker tilveiebringe en målrettet tilnærming til artsidentifikasjon og muliggjøre påvisning av lave kopitall DNA som naturlig forekommer i løpet av rensede prøver, hagle sekvense biblioteker tillate påvisning av arter som kan inneholde DNA-områder som er enten ikke forøkbare av 16S rRNA markør primersekvensene anvendt, eller fordi forskjellene mellom malen-sekvensen og den forsterkende primer-sekvensen er for store 20,21. Videre, selv om DNA-polymeraser har en høy fidelity av DNA replikasjon, base feil kan likevel oppstå under PCR forsterkning og disse innlemmet feil kan føre til feilklassifisering av opprinnelsesarter 22. Skjevheter i PCR-amplifisering av malen sequences kan også oppstå; sekvenser av DNA med et høyt GC-innhold kan være under representert i den endelige amplikonet bassenget 23 og likeledes unaturlige Basemodifikasjoner, såsom tymin glykol, kan stoppe DNA-polymeraser som forårsaker svikt i amplifikasjonen av DNA-sekvenser 24. I motsetning til dette, er et DNA-bibliotek som har blitt fremstilt ved hjelp av alle de rensede DNA som er ekstrahert fra en prøve og deretter fragmentert i kortere DNA-kjedelengder før forberedelse for sekvense en hagle sekvensering DNA-bibliotek. Taksonomisk klassifisering av DNA-sekvenser som er generert av hagle sekvensering blir mer nøyaktig i forhold til 16S rRNA amplikonet sekvensering 25, selv om den økonomiske kostnader som kreves for å oppnå en pålitelig sekvense dybde er større enn den til amplikonet sekvense 26. Den store fordelen med hagle sekvense metagenomikk er at sekvensert regioner i de ulike genomer i utvalget er tilgjengelige for genet prospektering når de har værthar blitt taksonomisk klassifisert 27.

Metagenomic sekvens data er analysert av en stadig økende utvalg av bioinformatiske verktøy. Disse verktøyene er i stand til å utføre en rekke forskjellige anvendelser, for eksempel, kvalitetskontroll analyse av rå sekvensdata 28, overlapp av parede ende leser 29, de novo montering av sekvensavlesning for å contigs og stillaser 30,31, taksonomisk klassifisering og visualisering av sekvensen leser og sammensatte sekvenser 7,12,32,33 og funksjonell annotering av sammensatte sekvenser 34,35.

Silo, produsert av bønder over hele verden fra gjæret korn som mais (Zea mays), blir hovedsakelig brukt som dyrefôr. Silofor behandlet med bakterien Lactobacillus sp. å hjelpe gjæring 36, men til dags dato, er det begrenset kunnskap om de andre mikrobielle populasjoner funnet i silo. den fermentation prosessen kan føre til uønskede og potensielt skadelige mikroorganismer blir utbredt i ensilasje 37. I tillegg til gjær og mugg, bakterier er spesielt tilpasses for anaerobt miljø i fermen silofor, og er mer hyppig assosiert med sykdommer i husdyr i stedet for nedbrytning av ensilasje 38. Smørsyrebakterier kan utilsiktet tilsettes fra jord forblir ved fylling av silo siloer og er i stand til å omdanne melkesyre, et produkt av anaerob nedbrytning, til smørsyre, og dermed øke pH-verdien i ensilasje 39. Denne økningen i pH kan føre til et oppsving i kvalitetsforringende bakterier som normalt vil være ute av stand til å opprettholde vekst under optimale ensileringsmidler gjæringsforhold 38. Clostridium spp. , Listeria spp. og Bacillus spp. er av spesiell bekymring, særlig i surfôr for melkekyr fôr, som bakteriesporer som har overlevd Gastrointestinal kanalen 40 kan komme inn i næringskjeden, føre til mat forringende og, i sjeldne tilfeller, til dyr og mennesker dødsfall 37,39,41-44. Videre, mens det er vanskelig å anslå nøyaktig økonomiske konsekvensene av veterinærbehandling og husdyr tap forårsaket av surfôr forringende, er det sannsynlig å være skadelig for en gård om et utbrudd skulle oppstå.

Det er en hypotese at ved å bruke en metagenomic tilnærming kan vi klassifisere de mikrobielle populasjoner som er tilstede i siloprøver og videre identifisere mikrobielle samfunn forbundet med surfôr forringende som ville i sin tur potensielt ha en skadelig effekt på husdyr, slik at hjelpetiltak skal være tatt før ensilasje skal brukes som en matkilde.

Protocol

1. Side Location

  1. Samle ensilasje prøve fra en egnet område for eksempel en gård. Her gården lå i Ballydulea, Co Cork, Irland (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA Extraction

MERK: DNA ekstraksjon ble utført ved hjelp av et kommersielt kit følge produsentens instruksjoner. En negativ kontroll som ikke inneholdt prøven, ble brukt i hele biblioteket fremstillingsmetode.

  1. Legg 100-400 mg av prøve til 978 pl natriumfosfatbuffer, og 122 ul lyseringsbuffer jord i de medfølgende lysis rør.
  2. Prøvene homogeniseres ved å plassere lysis rørene inn i homogenisatoren i 40 s ved en hastighet på 6,0 m / s.
  3. Sentrifuger lysater ved 14 000 xg i 15 min, og supernatanten overføres til et rent mikro-sentrifugerør inneholdende 250 pl av protein Bunnfall løsning (PPS). Bland løsningen ved å vende 10 ganger og sentrifugerved 14 000 xg i 5 minutter.
  4. Legg supernatanten til 1 ml DNA-bindingsmatrise i en ren 15 ml sentrifugerør. Bland løsningen ved å snu røret kontinuerlig i 3 min. La blandingen til takke med 3 min, og deretter kaste 500 mL av supernatant Bland resten supernatant.
  5. Overfør 600 ul av suspensjonen til en spinne filter og sentrifuger ved 14 000 xg i 1 min. Kast filtratet og gjenta prosessen med den resterende suspensjonen.
  6. Legg 500 ul vaskebuffer til den DNA-bindende matrise innen sentrifuge filteret, blandes ved pipettering, og sentrifuger ved 14 000 x g i 1 min.
  7. Kast filtratet og sentrifuge sentrifuge filteret på nytt ved 14.000 xg i 2 minutter for å sikre at all vaskebuffer er fjernet. Tørk sentrifugefilter ved 23 ° C i 5 min.
  8. Pre-varm (70 ° C) DNase-fri vann (DES) og re-suspendere den DNA-bindende matrise i 100 ul DES innenfor spinnfilter. Overfør spin filter på en ren 1,5 ml mikrosentrifuge tuvære og sentrifuger ved 14 000 xg i 1 min for å eluere DNA. Oppbevar det rensede DNA ved -20 C inntil videre analyse blir utført.

3. DNA rensing med DNA-rensing perler

MERK: Før metagenomic biblioteket forberedelse den ekstraherte DNA ble renset ved hjelp av rensing perler for å sikre en ren DNA-prøve ble oppnådd.

  1. Inkubering av kulene ved 23 C i 30 minutter før bruk. Tilsett 2 volumer av perler til DNA-prøve og inkuber løsningen ved 23 ° C i 5 min.
  2. Plassere prøvene på et separasjons magnet i 5 minutter og deretter kaste supernatanten. Vask kulene to ganger med 200 pl frisk 80% etanol (EtOH). Air tørke perlene i 10 min.
  3. Fjerne prøvene fra separasjons magneten og tilsett 50 ul elueringsbuffer (EB), blandes ved pipettering.
  4. Inkuber suspensjonen ved 23 C i 5 minutter, hvoretter plasserer prøvene tilbake på separasjons magnet i 3 min.
  5. transfer supernatanten, som inneholder DNA, til et rent rør. Kast perlene.
  6. Kvantifisere renset DNA som angitt i del fire.

4. Kvantifisering av renset DNA

MERK: Renset DNA ble kvantifisert ved hjelp av en fluorometer og dobbel-strandet (dsDNA) Høy følsomhet (HS) assay kit følge produsentens instruksjoner.

  1. Fremstille en arbeidsoppløsning ved bruk av 199: 1 forhold av buffer til reagens.
  2. Tilsett 10 ul til hver DNA-standard til 190 mL av arbeidsløsning.
  3. Tilsett 10 pl av renset DNA i 190 ul av arbeidsløsning. Sluttvolumet bør være 200 ul. Inkuber standard og DNA-prøvene ved 23 ° C i 2 min.
  4. Analyser standarder før DNA-prøvene på fluorometer ved å følge instruksjonene på skjermen.

5. Shotgun Sekvense Bibliotek Forberedelse

MERK: hagle sekvense Biblioteket ble utarbeidet med enkommersiell bibliotek forberedelse kit med produsentens instruksjoner.

  1. Fortynn DNA-prøvene til 0,2 ng / mL bruker EB. Enhver prøve som allerede er under denne konsentrasjonen, dvs. den negative kontroll, er igjen ved sin strømkonsentrasjon.
  2. Bland 5 ul av det rensede DNA med 10 ul buffer og 5 pl enzymblanding. Inkuber prøver ved 55 ° C i 5 min.
  3. Tilsett 5 ul av nøytraliserende buffer og inkubere oppløsningen ved 23 ° C i 5 min.
  4. Tilsett 5 ul av hver av de eksempel spesifikke sekvenseringsindekser, og 15 ul av PCR masterblanding.
  5. I en termosykler, inkubere prøvene ved 72 C i 3 minutter, 95 ° C i 30 sekunder, før 12 sykluser på 95 ° C i 10 s, 55 ° C i 30 s og 72 ° C i 30 sek. Inkuber prøvene endelig ved 72 C i 5 min.
  6. Rense den fremstilte DNA ved hjelp av vulsten rensing som før, men med en endelig eluering av 30 ul av EB.

6. Library Kvantitet og kvalitet Check

MERK: Mengden og kvaliteten på de preparerte bibliotekene ble vurdert ved hjelp av et kommersielt kit og instrumentering.

  1. Inkuber kit komponenter ved 23 ° C i 30 minutter før bruk.
  2. Tilsett 2 mL av DNA til 2 mL av bufferen og virvle i 1 min ved 2000 rpm.
  3. Spinne ned prøven for å sikre at den er i bunnen av røret.
  4. Sett prøverør, analyse tape og tips inn i instrumentet, og utføre analyser som anvist av programvaren.

7. DNA Sekvense

  1. Overfør forberedt og tallfestede DNA-sekvense biblioteker prøvene til en sekvensering service og sekvens ved hjelp av 300 bp paret slutten sekvense 45.

8. Analyse av Raw sekvensdata

MERK: Kommandoene for hvert program du bruker et operativsystem Linux er vist nedenfor protokollen trinn. Rørledningen brukes til sequence dataanalyse er vist i figur 1. Programmene skal installeres av brukeren før analyse. Denne prosessen må utføres individuelt for hver prøve.

  1. Analysere og visualisere DNA sekvensdata ved hjelp FastQC 46 ved å skrive inn i kommandolinjen / sti-til-fil / fastqc, etterfulgt av forover og bakover rå leser raw_read1.fastq raw_read2.fastq.
  2. Angi en output mappe ved å skrive -o output_fastqc og filformatet av rå lese filer av f fastq.
  3. Vis utdatafilen (figur 2).
    sti-til-fil / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. Kvalitetskontroll Trimming og filtrering Sequence data

  1. Kjør trimming program, Trimmomatic 28 ved å skrive inn i kommandolinjen java-jar / sti-til-fil / trimmomatic-0.35.jar.
  2. Angir filene er paret end-filer ved å skrive 'PE ". Fastslår at 16 sentrale processing heter (CPU) skal brukes av programmet ved å skrive -threads 16.
  3. List opp to filer til QC sjekk ved å skrive inn navnene på de rå forover og bakover leser. Prefikset av utgangs filer bestemmes ved å skrive -baseout ensilasje.
  4. Definer alternativene for programmet ved å skrive ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEDENDE: 3 etterfølgende: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 MINLEN: 36.
  5. Når du er ferdig, analysere trimmet sekvenser bruker FastQC som før og sammenligne utgang til rå sekvensdata for å sikre trimming er vellykket.
    MERK: Programvaren verktøyet, Trimmomatic, trimmet leser videre ved å fjerne ledende lav kvalitet eller N baser (nedenfor kvalitet 3), fjerning følgende lav kvalitet eller N baser (nedenfor kvalitet 3) og skanning hver lese med en 4-basen brede skyvevinduet. Parametrene ble satt for å kutte når den gjennomsnittlige kvaliteten per basen kommer under 20 og deretter slippe noen leser under 36 baser lang. Til slutt ble 15 baser beskjæres from lederen for hver leser og leser ble beskåret for å holde 200 baser fra starten av lese. Dette siste trinnet ble utført for å overvinne noen kvalitetsproblemer når sekvense lang (> 200 bp) leser. Disse kan justeres etter spesifikke eksempler 28.
    java-jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout surfôr ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEDENDE: 3 etterfølgende: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 MINLEN: 36

10. Metagenome Assembly

  1. Flett uparet, trimmet leser ved å skrive cat fulgt av uparet leser; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Skriv filene til en ny fil ved å skrive> silage_merged_unpaired.fastq
    cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
  2. Til de novo montere sekvensert DNA, bruker spader (St. Petersburg genom assembler) 30 ved å skrive / sti-to-fil / spades.py. Spesifisere at 16 CPUer skal brukes ved å skrive -t 16 og at metagenomic parameteren bør brukes ved å skrive --meta.
  3. Identifiser trimmet frem leser bruker -1 silage_read1_paired.fastq og omvendt leser av -2 silage_read2_paired.fastq. Det fusjonerte uparet leser er spesifisert av -s silage_merged_unpaired.fastq.
  4. Definer output-mappen ved å skrive -o silage_spades.
    sti-til-fil / spades.py tl 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. parvise end Les Overlapping

  1. Flett par av DNA-sekvensen leser bruker FLASH (Fast Lengde justering av korte Leser) 29 ved å skrive inn kommandolinje / sti til fil / flash. Spesifisere at 16 CPUer bør brukes ved hjelp -t 16 og utgangs prefikset ved å skrive -o ensilasje.
  2. Identifiser trimmet leser ved å skrive silage_trimmed_R1.fastq silage_trimmed_R2.fastq
    sti-til-fil / flash tl en6 -o blinket silage_read1_paired.fastq silage_read2_paired.fastq

12. taksonomisk klassifisering

  1. Type / sti-til-fil / kraken og angi databasen ved å skrive --db / sti til fil / standard.
  2. Definer at 16 CPUer skal brukes ved å skrive --threads 16 og identifisere en output mappe ved hjelp Output FLASHed_silage_extendedFrags_kraken.txt. Skriv inn filnavnet; FLASHed_silage.extendedFrags.fastq
    sti-til-fil / kraken --db standard --thread 16 Output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
    MERK: Klassifisering av sammensatte DNA sekvens stillaser bruker Kraken 7 ble gjennomført mot den siste, standard Kraken database som inneholdt alle tilgjengelige prokaryote genomsekvenser.
  3. Overfør kolonne 2 og 3 fra utdatafilen og til en ny fil ved å skrive kutt -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  4. kutte -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  5. Importere den nye filen til Krona 12 ved å skrive ktImportTaxonomy. Angi input filen ved å skrive FLASHed_silage_extendedFrags_kraken.int. Identifiser utdatafilen ved å skrive -o FLASHed_silage_extendedFrags_kraken.out.html.
    sti-til-fil / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. Funksjonell Kommentar

  1. Gå til MG-RAST 47 nettside, http://metagenomics.anl.gov/. Registrer deg som ny bruker om nødvendig. Når du har logget inn, klikk på "Last opp" -knappen. Last den sammensatte stillasene fra trinn 10.
  2. Når filene er lastet opp, klikk på "Send", og følg instruksjonene og avvente ferdigstillelse av analysen.
  3. Etter at analysen er ferdig, se den tilsendt via email fra MG-RAST, eller alternativt, klikk på "Progress". Det er en liste over fullførte jobber. Klikk på den aktuelle jobben id og deretter på linken til "download side".
  4. På nedlastingssiden, under overskriften "Protein Clustering 90%", klikk på protein-knappen for å laste ned antatte proteinet fil, 550.cluster.aa90.faa.
  5. For å klassifisere de proteinene som putatively tilhører en bestemt cazy enzym klasse, sammenligne lastet ned proteiner til cazy database 48. Last ned karbohydrat-aktive enzymer Database (cazy) fra filer er: AA.zip, CE.zip, GH.zip, GT.zip og PL.zip. Disse filene representerer følgende enzymklasser henholdsvis: Hjelpe Aktiviteter (AA), Karbohydrat esteraser (CE), Glycoside Hydrolases (GH), glykosyltransferaser (GT) og polysakkarid lyaser (PL).
  6. Pakk databasefilene og kommentere proteiner ved å bestemme protein likhet med cazy database proteiner ved hjelp av USEARCH UBLAST Algorithm 49. For å bruke en bash sløyfe (for jeg i * .txt) for å iterere gjennom fem databasen .txt filer type "for jeg i * .txt; gjøre".
  7. Kjør USEARCH ved å skrive / sti-til-fil / usearch8 med parameteren -ublast for å bruke ublast algoritmen. Deretter skriver du inn navnet på proteinsekvensen fil lastet ned fra MG-RAST, "mgmXXXXXX.3.550.cluster.aa90.faa".
  8. For å indikere databasefilen som skal brukes type "-db $ i" og å spesifisere E-verdien terskel på 1e -5, type "-evalue 1e-5".
  9. For å avslutte søket etter oppdagelsen av et mål sekvens og derfor klassifisere som proteinsekvens som tilhørende målet enzymet klassen, f.eks GH, type "-masaccepts 1".
  10. Hvis du vil definere som 16 prosessorer bør brukes type "-threads 16" og til å angi formatet på utdatafilen som ATAB separert teksttype "-blast6out". For å identifisere hva slags type fil "$ i.ublast". For å avslutte bash loop, type "; gjort"
    for jeg i * .txt;
    gjøre / sti-til-fil / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts en -threads 16 -blast6out $ i.ublast;
    ferdig

14. Visualisering cazy Kommentar

  1. For å visualisere resultatet fra cazy merknaden som et Venn-diagram, generere protein ID lister for hvert enzym klasse ved hjelp av et bash loop. Type "for jeg i * .ublast, gjøre".
  2. Slik overfører kolonne 1 fra utdatafilen og til en ny fil, type "cat $ i | kutte -f en> $ i.list".
  3. Avslutt loopen og type "; ferdig".
  4. Åpne .list filene i en tekst editor. Gå til nettsiden, velg antall sett som 5 og lime inn innholdet i hver liste fil i en egen boks. Last ned den resulterende diagrammet som en SVG-fil.
    for jeg i * .ublast;
    gjøre cat $ i | kutte -f en> $ i.list;
    ferdig

Representative Results

Før bioinformatiske behandlingen, leser rå sekvensen ble trimmet og adaptere ble fjernet ved hjelp Trimmomatic programvare 28. Etter trimming og filtrering trinn, antallet lesninger ble redusert til 50% av sekvensen leser (tabell 1). Den gjennomsnittlige basis Phred poengsum var> 30 etter kvalitetskontroll (figur 2).

Par av DNA-sekvenser som hadde overlappende områder ble slått sammen ved hjelp av Flash-programvare 29 for å generere enkelt lenger leser, leser ikke-overlappende ble holdt i en egen fil. 45.47% leser (105343) kombinert med hell. Etter overlapping av lyder ved hjelp av FLASH av lyder, de resulterende utvidede fragmenter gikk bakteriell taksonomisk klassifisering ved hjelp av Kraken programvare 7 og ble deretter visualisert med Krona programvare (figur 3).

figur 4. De mest tallrike artene i metagenome var Lactobacillus spp. (24%; firmicutes), Corynebacterium spp. (8%, aktinobakterier), Propionibacterium spp. (3%; aktinobakterier) og Prevotella spp. (3%; bacteroidetes). Arter som er viktige for dyrehelse og innblandet i sykdom ble også observert; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) ble anslått til å være til stede i ensilasje prøven.

Funksjonell merknaden ble utført på montert leser. Den metagenome ble satt sammen ved hjelp av spader assembler 30 med trimmet og filtrertparvise end og uparede leser generere 92,284 stillaser. For å identifisere cellulaser, ble proteiner beregnet med MG-RAST og kommentert ved hjelp av karbohydrat-aktive enzymer Database (cazy). Av de antatte proteinene 97,562, 6357 ble kommentert som en antatt karbohydrat-aktivt enzym i en av de fem enzymklasser som utgjør cazy database (figur 5). Resultatene ble visualisert som et Venn-diagram ved hjelp InteractiVenn programvare 50 viser fordelingen av protein merknader inkludert de som inneholder mer enn én cazy enzym klasse merknader. Av disse 3 861 ble forutsagt å ha glykosid hydrolase-aktivitet og vil bli ytterligere karakterisert i laboratoriet for å bekrefte funksjonen.

Figur 1
Figur 1: bioinformatiske metagenomikk Pipeline for analyse av Silo. To hovedtilnærminger varbrukes til å undersøke mikrobiomer av silofôr, taksonomisk klassifisering og funksjonell annotering. Klikk her for å se en større versjon av dette tallet.

Figur 2
Figur 2: Sekvens Quality Per-basen før og etter trimming og Adapter fjerning. Det per-basesekvens kvalitet plottet fra FASTQC viser gjennomsnitts Phred poengsum på tvers av lengden på sekvensen leser pre- og post-kvalitetskontroll. Klikk her for å se en større versjon av dette tallet.

Figur 3
Figur 3: taksonomiske klassifiseringensjon av bakteriell mikrobiomer av Solid Silo. Klassifisering av trimmet og overlappende sekvens leser fra FLASH ble utført ved hjelp Kraken 7 og deretter visualisert med krona. Klikk her for å se en større versjon av dette tallet.

Figur 4
Figur 4: Vitenskapelige klasse Fordeling av fire mest tallrike Phyla i Bakteriell mikrobiomer av Solid Silo. Prosentandelen av hver klasse av bakterier i de fire mest tallrike phyla. Firmicutes: Clostridier (rød) og basiller (mørk blå); Proteobacteria: delta / epsilon (rosa), alpha (lyseblå), gamma (oransje) og beta (turkis); Bacteroidetes: Flavobacteriia (mørk blå) og Bacteroidia(blek grønn); Aktinobakterier: Coriobacteriia (mørk lilla) og andre aktinobakterier (mørk grønn). Klikk her for å se en større versjon av dette tallet.

Figur 5
Figur 5: cazy Kommentar av Forut Proteome i Solid Silo mikrobiomer. Venn-diagram som viser fordelingen av de fem enzymklasser cazy merknader i spådd proteomet av solid surfôr mikrobiomer. Klikk her for å se en større versjon av dette tallet.

# Raw leser # Filtrert leser (paret) # Filtrert leser # Blinket leser
(Paret) (Uparet)
2374949 x2 231679 x2 1892534 105343

Tabell 1: Oppsummering Fortegn Sequencing Leser.

Discussion

Mens en i silico analyse kan gi en god innsikt til de mikrobielle samfunn som er til stede i miljøprøver, er det viktig at de taksonomiske klassifisering demonstrert bli utført i forbindelse med relevante kontrollene, og at en passende dybde av sekvensering er oppnådd for å fange hele befolkning til stede 51.

Med noen matematisk analyse, er det mange ruter for å oppnå et lignende mål. Metodene som vi har brukt i denne studien er eksempler på egnede og enkle metoder, som har blitt brakt sammen for å oppnå en rekke analyser på surfôr mikrobiomer. En variasjon og et stadig økende antall bioinformatikk verktøy og teknikker er tilgjengelige for å analysere metagenomic data, for eksempel Phylosift 8 og MetaPhlAn2 52, og disse bør vurderes før etterforskningen for sin relevans til prøven og analysen required 53. Metagenomic analysemetoder er begrenset av databaser for tilgjengelige for klassifisering, sekvensering dybden og kvaliteten av sekvensering.

Den bioinformatiske behandlingen demonstrert her ble utført på en lokal, høy drevet maskin; Men cloud-baserte systemer er også tilgjengelig. Disse nettskybaserte tjenester gir mulighet for leie av nødvendig datakraft uten å ha høye kostnader investering på en passende kraftig lokal arbeidsstasjon. En potensiell anvendelse av denne metode ville være å vurdere silo før dets anvendelse i jordbruket for å sikre at ingen potensielt skadelige bakterier er til stede og således hindre dem fra å komme inn i næringskjeden.

Materials

Name Company Catalog Number Comments
FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

DOWNLOAD MATERIALS LIST

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38, (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59, (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486, (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304, (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507, (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15, (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2, (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12, (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7, (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32, (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43, (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10, (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69, (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2, (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14, (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20, (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343, (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370, (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65, (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50, (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104, (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469, (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15, (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32, (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30, (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27, (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19, (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. metaSPAdes: a new versatile de novo metagenomics assembler. (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30, (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10, (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106, (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167, (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22, (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182, (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90, (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86, (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153, (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50, (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456, (7218), 53-59 (2008).
  46. Andrews, S. Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, Chapter 13 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, Database issue 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26, (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16, (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12, (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9, (9), 75-88 (2015).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Video Stats