Genetics

Metagenomic Analyse av Silo

Published: January 13, 2017 doi: 10.3791/54936

Richard K. Tennant¹, Christine M. Sambles¹, Georgina E. Diffey¹, Karen A. Moore¹, John Love¹

Introduction

Metagenomikk er den direkte analyse av DNA renset fra biologiske samfunn innenfor miljøprøver ¹ og ble opprinnelig brukt til å oppdage unculturable bakterier som finnes i sedimenter ^2. Metagenomikk har vært mye brukt for en rekke programmer, for eksempel identifisering av den menneskelige mikrobiomer ^3, klassifisering mikrobielle populasjoner i havet ⁴ og selv for analyse av bakteriesamfunn som utvikler på kaffemaskiner ^5. Innføringen av neste generasjons sekvense teknologi ført til større sekvense gjennomstrømming og resultat. Følgelig har DNA-sekvensering blir mer økonomisk ⁶ og dybden av sekvensering som kan utføres har sterkt øket, slik at metagenomikk til å bli en kraftig, analytisk verktøy.

"Front-end" forbedringer i det praktiske, molekylære aspekter av metagenomic sekvense har drevet veksten av isilico bioinformatikk verktøy tilgjengelig for taksonomisk klassifisering ^7-9, funksjonell annotering ^10,11 og visuell representasjon ^12,13 av DNA sekvensdata. Det økende antall tilgjengelige, sekvensert prokaryote og eukaryote ¹⁴ genomer gir ytterligere nøyaktighet i klassifiseringen av mikrobielle samfunn, som alltid utføres mot en "back-end" referansedatabase for sekvensert genomene ^15. To hovedtilnærminger kan bli vedtatt for metagenomic analyse.

Den mer konvensjonelle metoden er analyse av 16S rRNA-genet kodende region av bakterielt genom. 16S rRNA er sterkt konservert mellom prokaryote arter, men viser ni hyper-variable regioner (V1 - V9) som kan utnyttes for artsbestemmelse ^16. Innføringen av lengre sekvensering (≤ 300 bp sammenkoblet ende) er tillatt for analyse av DNA-sekvenser som strekker seg over to hypervariable regioner, i særdeleshetV3 - V4 region ^17. Fremskritt i andre sekvense teknologier, for eksempel Oxford nanopore ¹⁸ og PacBIO ^19, tillater hele 16S rRNA-genet for å bli sekvensert contiguously.

Mens 16S rDNA-baserte biblioteker tilveiebringe en målrettet tilnærming til artsidentifikasjon og muliggjøre påvisning av lave kopitall DNA som naturlig forekommer i løpet av rensede prøver, hagle sekvense biblioteker tillate påvisning av arter som kan inneholde DNA-områder som er enten ikke forøkbare av 16S rRNA markør primersekvensene anvendt, eller fordi forskjellene mellom malen-sekvensen og den forsterkende primer-sekvensen er for store ^20,21. Videre, selv om DNA-polymeraser har en høy fidelity av DNA replikasjon, base feil kan likevel oppstå under PCR forsterkning og disse innlemmet feil kan føre til feilklassifisering av opprinnelsesarter ^22. Skjevheter i PCR-amplifisering av malen sequences kan også oppstå; sekvenser av DNA med et høyt GC-innhold kan være under representert i den endelige amplikonet bassenget ²³ og likeledes unaturlige Basemodifikasjoner, såsom tymin glykol, kan stoppe DNA-polymeraser som forårsaker svikt i amplifikasjonen av DNA-sekvenser ^24. I motsetning til dette, er et DNA-bibliotek som har blitt fremstilt ved hjelp av alle de rensede DNA som er ekstrahert fra en prøve og deretter fragmentert i kortere DNA-kjedelengder før forberedelse for sekvense en hagle sekvensering DNA-bibliotek. Taksonomisk klassifisering av DNA-sekvenser som er generert av hagle sekvensering blir mer nøyaktig i forhold til 16S rRNA amplikonet sekvensering ^25, selv om den økonomiske kostnader som kreves for å oppnå en pålitelig sekvense dybde er større enn den til amplikonet sekvense ^26. Den store fordelen med hagle sekvense metagenomikk er at sekvensert regioner i de ulike genomer i utvalget er tilgjengelige for genet prospektering når de har værthar blitt taksonomisk klassifisert ^27.

Metagenomic sekvens data er analysert av en stadig økende utvalg av bioinformatiske verktøy. Disse verktøyene er i stand til å utføre en rekke forskjellige anvendelser, for eksempel, kvalitetskontroll analyse av rå sekvensdata ^28, overlapp av parede ende leser ^29, de novo montering av sekvensavlesning for å contigs og stillaser ^30,31, taksonomisk klassifisering og visualisering av sekvensen leser og sammensatte sekvenser ^7,12,32,33 og funksjonell annotering av sammensatte sekvenser ^34,35.

Silo, produsert av bønder over hele verden fra gjæret korn som mais (Zea mays), blir hovedsakelig brukt som dyrefôr. Silofor behandlet med bakterien Lactobacillus sp. å hjelpe gjæring ^36, men til dags dato, er det begrenset kunnskap om de andre mikrobielle populasjoner funnet i silo. den fermentation prosessen kan føre til uønskede og potensielt skadelige mikroorganismer blir utbredt i ensilasje ^37. I tillegg til gjær og mugg, bakterier er spesielt tilpasses for anaerobt miljø i fermen silofor, og er mer hyppig assosiert med sykdommer i husdyr i stedet for nedbrytning av ensilasje ^38. Smørsyrebakterier kan utilsiktet tilsettes fra jord forblir ved fylling av silo siloer og er i stand til å omdanne melkesyre, et produkt av anaerob nedbrytning, til smørsyre, og dermed øke pH-verdien i ensilasje ^39. Denne økningen i pH kan føre til et oppsving i kvalitetsforringende bakterier som normalt vil være ute av stand til å opprettholde vekst under optimale ensileringsmidler gjæringsforhold ^38. Clostridium spp. , Listeria spp. og Bacillus spp. er av spesiell bekymring, særlig i surfôr for melkekyr fôr, som bakteriesporer som har overlevd Gastrointestinal kanalen ⁴⁰ kan komme inn i næringskjeden, føre til mat forringende og, i sjeldne tilfeller, til dyr og mennesker dødsfall ^37,39,41-44. Videre, mens det er vanskelig å anslå nøyaktig økonomiske konsekvensene av veterinærbehandling og husdyr tap forårsaket av surfôr forringende, er det sannsynlig å være skadelig for en gård om et utbrudd skulle oppstå.

Det er en hypotese at ved å bruke en metagenomic tilnærming kan vi klassifisere de mikrobielle populasjoner som er tilstede i siloprøver og videre identifisere mikrobielle samfunn forbundet med surfôr forringende som ville i sin tur potensielt ha en skadelig effekt på husdyr, slik at hjelpetiltak skal være tatt før ensilasje skal brukes som en matkilde.

Protocol

1. Side Location

Samle ensilasje prøve fra en egnet område for eksempel en gård. Her gården lå i Ballydulea, Co Cork, Irland (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA Extraction

MERK: DNA ekstraksjon ble utført ved hjelp av et kommersielt kit følge produsentens instruksjoner. En negativ kontroll som ikke inneholdt prøven, ble brukt i hele biblioteket fremstillingsmetode.

Legg 100-400 mg av prøve til 978 pl natriumfosfatbuffer, og 122 ul lyseringsbuffer jord i de medfølgende lysis rør.
Prøvene homogeniseres ved å plassere lysis rørene inn i homogenisatoren i 40 s ved en hastighet på 6,0 m / s.
Sentrifuger lysater ved 14 000 xg i 15 min, og supernatanten overføres til et rent mikro-sentrifugerør inneholdende 250 pl av protein Bunnfall løsning (PPS). Bland løsningen ved å vende 10 ganger og sentrifugerved 14 000 xg i 5 minutter.
Legg supernatanten til 1 ml DNA-bindingsmatrise i en ren 15 ml sentrifugerør. Bland løsningen ved å snu røret kontinuerlig i 3 min. La blandingen til takke med 3 min, og deretter kaste 500 mL av supernatant. Bland resten supernatant.
Overfør 600 ul av suspensjonen til en spinne filter og sentrifuger ved 14 000 xg i 1 min. Kast filtratet og gjenta prosessen med den resterende suspensjonen.
Legg 500 ul vaskebuffer til den DNA-bindende matrise innen sentrifuge filteret, blandes ved pipettering, og sentrifuger ved 14 000 x g i 1 min.
Kast filtratet og sentrifuge sentrifuge filteret på nytt ved 14.000 xg i 2 minutter for å sikre at all vaskebuffer er fjernet. Tørk sentrifugefilter ved 23 ° C i 5 min.
Pre-varm (70 ° C) DNase-fri vann (DES) og re-suspendere den DNA-bindende matrise i 100 ul DES innenfor spinnfilter. Overfør spin filter på en ren 1,5 ml mikrosentrifuge tuvære og sentrifuger ved 14 000 xg i 1 min for å eluere DNA. Oppbevar det rensede DNA ved -20 C inntil videre analyse blir utført.

3. DNA rensing med DNA-rensing perler

MERK: Før metagenomic biblioteket forberedelse den ekstraherte DNA ble renset ved hjelp av rensing perler for å sikre en ren DNA-prøve ble oppnådd.

Inkubering av kulene ved 23 C i 30 minutter før bruk. Tilsett 2 volumer av perler til DNA-prøve og inkuber løsningen ved 23 ° C i 5 min.
Plassere prøvene på et separasjons magnet i 5 minutter og deretter kaste supernatanten. Vask kulene to ganger med 200 pl frisk 80% etanol (EtOH). Air tørke perlene i 10 min.
Fjerne prøvene fra separasjons magneten og tilsett 50 ul elueringsbuffer (EB), blandes ved pipettering.
Inkuber suspensjonen ved 23 C i 5 minutter, hvoretter plasserer prøvene tilbake på separasjons magnet i 3 min.
transfer supernatanten, som inneholder DNA, til et rent rør. Kast perlene.
Kvantifisere renset DNA som angitt i del fire.

4. Kvantifisering av renset DNA

MERK: Renset DNA ble kvantifisert ved hjelp av en fluorometer og dobbel-strandet (dsDNA) Høy følsomhet (HS) assay kit følge produsentens instruksjoner.

Fremstille en arbeidsoppløsning ved bruk av 199: 1 forhold av buffer til reagens.
Tilsett 10 ul til hver DNA-standard til 190 mL av arbeidsløsning.
Tilsett 10 pl av renset DNA i 190 ul av arbeidsløsning. Sluttvolumet bør være 200 ul. Inkuber standard og DNA-prøvene ved 23 ° C i 2 min.
Analyser standarder før DNA-prøvene på fluorometer ved å følge instruksjonene på skjermen.

5. Shotgun Sekvense Bibliotek Forberedelse

MERK: hagle sekvense Biblioteket ble utarbeidet med enkommersiell bibliotek forberedelse kit med produsentens instruksjoner.

Fortynn DNA-prøvene til 0,2 ng / mL bruker EB. Enhver prøve som allerede er under denne konsentrasjonen, dvs. den negative kontroll, er igjen ved sin strømkonsentrasjon.
Bland 5 ul av det rensede DNA med 10 ul buffer og 5 pl enzymblanding. Inkuber prøver ved 55 ° C i 5 min.
Tilsett 5 ul av nøytraliserende buffer og inkubere oppløsningen ved 23 ° C i 5 min.
Tilsett 5 ul av hver av de eksempel spesifikke sekvenseringsindekser, og 15 ul av PCR masterblanding.
I en termosykler, inkubere prøvene ved 72 C i 3 minutter, 95 ° C i 30 sekunder, før 12 sykluser på 95 ° C i 10 s, 55 ° C i 30 s og 72 ° C i 30 sek. Inkuber prøvene endelig ved 72 C i 5 min.
Rense den fremstilte DNA ved hjelp av vulsten rensing som før, men med en endelig eluering av 30 ul av EB.

6. Library Kvantitet og kvalitet Check

MERK: Mengden og kvaliteten på de preparerte bibliotekene ble vurdert ved hjelp av et kommersielt kit og instrumentering.

Inkuber kit komponenter ved 23 ° C i 30 minutter før bruk.
Tilsett 2 mL av DNA til 2 mL av bufferen og virvle i 1 min ved 2000 rpm.
Spinne ned prøven for å sikre at den er i bunnen av røret.
Sett prøverør, analyse tape og tips inn i instrumentet, og utføre analyser som anvist av programvaren.

7. DNA Sekvense

Overfør forberedt og tallfestede DNA-sekvense biblioteker prøvene til en sekvensering service og sekvens ved hjelp av 300 bp paret slutten sekvense ^45.

8. Analyse av Raw sekvensdata

MERK: Kommandoene for hvert program du bruker et operativsystem Linux er vist nedenfor protokollen trinn. Rørledningen brukes til sequence dataanalyse er vist i figur 1. Programmene skal installeres av brukeren før analyse. Denne prosessen må utføres individuelt for hver prøve.

Analysere og visualisere DNA sekvensdata ved hjelp FastQC ⁴⁶ ved å skrive inn i kommandolinjen / sti-til-fil / fastqc, etterfulgt av forover og bakover rå leser raw_read1.fastq raw_read2.fastq.
Angi en output mappe ved å skrive -o output_fastqc og filformatet av rå lese filer av f fastq.
Vis utdatafilen (figur 2).
sti-til-fil / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. Kvalitetskontroll Trimming og filtrering Sequence data

Kjør trimming program, Trimmomatic ²⁸ ved å skrive inn i kommandolinjen java-jar / sti-til-fil / trimmomatic-0.35.jar.
Angir filene er paret end-filer ved å skrive 'PE ". Fastslår at 16 sentrale processing heter (CPU) skal brukes av programmet ved å skrive -threads 16.
List opp to filer til QC sjekk ved å skrive inn navnene på de rå forover og bakover leser. Prefikset av utgangs filer bestemmes ved å skrive -baseout ensilasje.
Definer alternativene for programmet ved å skrive ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEDENDE: 3 etterfølgende: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 MINLEN: 36.
Når du er ferdig, analysere trimmet sekvenser bruker FastQC som før og sammenligne utgang til rå sekvensdata for å sikre trimming er vellykket.
MERK: Programvaren verktøyet, Trimmomatic, trimmet leser videre ved å fjerne ledende lav kvalitet eller N baser (nedenfor kvalitet 3), fjerning følgende lav kvalitet eller N baser (nedenfor kvalitet 3) og skanning hver lese med en 4-basen brede skyvevinduet. Parametrene ble satt for å kutte når den gjennomsnittlige kvaliteten per basen kommer under 20 og deretter slippe noen leser under 36 baser lang. Til slutt ble 15 baser beskjæres from lederen for hver leser og leser ble beskåret for å holde 200 baser fra starten av lese. Dette siste trinnet ble utført for å overvinne noen kvalitetsproblemer når sekvense lang (> 200 bp) leser. Disse kan justeres etter spesifikke eksempler ^28.
java-jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout surfôr ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEDENDE: 3 etterfølgende: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 MINLEN: 36

10. Metagenome Assembly

Flett uparet, trimmet leser ved å skrive cat fulgt av uparet leser; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Skriv filene til en ny fil ved å skrive> silage_merged_unpaired.fastq
cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
Til de novo montere sekvensert DNA, bruker spader (St. Petersburg genom assembler) ³⁰ ved å skrive / sti-to-fil / spades.py. Spesifisere at 16 CPUer skal brukes ved å skrive -t 16 og at metagenomic parameteren bør brukes ved å skrive --meta.
Identifiser trimmet frem leser bruker -1 silage_read1_paired.fastq og omvendt leser av -2 silage_read2_paired.fastq. Det fusjonerte uparet leser er spesifisert av -s silage_merged_unpaired.fastq.
Definer output-mappen ved å skrive -o silage_spades.
sti-til-fil / spades.py tl 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. parvise end Les Overlapping

Flett par av DNA-sekvensen leser bruker FLASH (Fast Lengde justering av korte Leser) ²⁹ ved å skrive inn kommandolinje / sti til fil / flash. Spesifisere at 16 CPUer bør brukes ved hjelp -t 16 og utgangs prefikset ved å skrive -o ensilasje.
Identifiser trimmet leser ved å skrive silage_trimmed_R1.fastq silage_trimmed_R2.fastq
sti-til-fil / flash tl en6 -o blinket silage_read1_paired.fastq silage_read2_paired.fastq

12. taksonomisk klassifisering

Type / sti-til-fil / kraken og angi databasen ved å skrive --db / sti til fil / standard.
Definer at 16 CPUer skal brukes ved å skrive --threads 16 og identifisere en output mappe ved hjelp Output FLASHed_silage_extendedFrags_kraken.txt. Skriv inn filnavnet; FLASHed_silage.extendedFrags.fastq
sti-til-fil / kraken --db standard --thread 16 Output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
MERK: Klassifisering av sammensatte DNA sekvens stillaser bruker Kraken ⁷ ble gjennomført mot den siste, standard Kraken database som inneholdt alle tilgjengelige prokaryote genomsekvenser.
Overfør kolonne 2 og 3 fra utdatafilen og til en ny fil ved å skrive kutt -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

kutte -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

Importere den nye filen til Krona ¹² ved å skrive ktImportTaxonomy. Angi input filen ved å skrive FLASHed_silage_extendedFrags_kraken.int. Identifiser utdatafilen ved å skrive -o FLASHed_silage_extendedFrags_kraken.out.html.
sti-til-fil / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. Funksjonell Kommentar

Gå til MG-RAST ⁴⁷ nettside, http://metagenomics.anl.gov/. Registrer deg som ny bruker om nødvendig. Når du har logget inn, klikk på "Last opp" -knappen. Last den sammensatte stillasene fra trinn 10.
Når filene er lastet opp, klikk på "Send", og følg instruksjonene og avvente ferdigstillelse av analysen.
Etter at analysen er ferdig, se den tilsendt via email fra MG-RAST, eller alternativt, klikk på "Progress". Det er en liste over fullførte jobber. Klikk på den aktuelle jobben id og deretter på linken til "download side".
På nedlastingssiden, under overskriften "Protein Clustering 90%", klikk på protein-knappen for å laste ned antatte proteinet fil, 550.cluster.aa90.faa.
For å klassifisere de proteinene som putatively tilhører en bestemt cazy enzym klasse, sammenligne lastet ned proteiner til cazy database ^48. Last ned karbohydrat-aktive enzymer Database (cazy) fra filer er: AA.zip, CE.zip, GH.zip, GT.zip og PL.zip. Disse filene representerer følgende enzymklasser henholdsvis: Hjelpe Aktiviteter (AA), Karbohydrat esteraser (CE), Glycoside Hydrolases (GH), glykosyltransferaser (GT) og polysakkarid lyaser (PL).
Pakk databasefilene og kommentere proteiner ved å bestemme protein likhet med cazy database proteiner ved hjelp av USEARCH UBLAST Algorithm ^49. For å bruke en bash sløyfe (for jeg i * .txt) for å iterere gjennom fem databasen .txt filer type "for jeg i * .txt; gjøre".
Kjør USEARCH ved å skrive / sti-til-fil / usearch8 med parameteren -ublast for å bruke ublast algoritmen. Deretter skriver du inn navnet på proteinsekvensen fil lastet ned fra MG-RAST, "mgmXXXXXX.3.550.cluster.aa90.faa".
For å indikere databasefilen som skal brukes type "-db $ i" og å spesifisere E-verdien terskel på 1e ^-5, type "-evalue 1e-5".
For å avslutte søket etter oppdagelsen av et mål sekvens og derfor klassifisere som proteinsekvens som tilhørende målet enzymet klassen, f.eks GH, type "-masaccepts 1".
Hvis du vil definere som 16 prosessorer bør brukes type "-threads 16" og til å angi formatet på utdatafilen som ATAB separert teksttype "-blast6out". For å identifisere hva slags type fil "$ i.ublast". For å avslutte bash loop, type "; gjort"
for jeg i * .txt;
gjøre / sti-til-fil / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts en -threads 16 -blast6out $ i.ublast;
ferdig

14. Visualisering cazy Kommentar

For å visualisere resultatet fra cazy merknaden som et Venn-diagram, generere protein ID lister for hvert enzym klasse ved hjelp av et bash loop. Type "for jeg i * .ublast, gjøre".
Slik overfører kolonne 1 fra utdatafilen og til en ny fil, type "cat $ i | kutte -f en> $ i.list".
Avslutt loopen og type "; ferdig".
Åpne .list filene i en tekst editor. Gå til nettsiden, velg antall sett som 5 og lime inn innholdet i hver liste fil i en egen boks. Last ned den resulterende diagrammet som en SVG-fil.
for jeg i * .ublast;
gjøre cat $ i | kutte -f en> $ i.list;
ferdig

Representative Results

Før bioinformatiske behandlingen, leser rå sekvensen ble trimmet og adaptere ble fjernet ved hjelp Trimmomatic programvare ^28. Etter trimming og filtrering trinn, antallet lesninger ble redusert til 50% av sekvensen leser (tabell 1). Den gjennomsnittlige basis Phred poengsum var> 30 etter kvalitetskontroll (figur 2).

Par av DNA-sekvenser som hadde overlappende områder ble slått sammen ved hjelp av Flash-programvare ²⁹ for å generere enkelt lenger leser, leser ikke-overlappende ble holdt i en egen fil. 45.47% leser (105343) kombinert med hell. Etter overlapping av lyder ved hjelp av FLASH av lyder, de resulterende utvidede fragmenter gikk bakteriell taksonomisk klassifisering ved hjelp av Kraken programvare ⁷ og ble deretter visualisert med Krona programvare (figur 3).

figur 4. De mest tallrike artene i metagenome var Lactobacillus spp. (24%; firmicutes), Corynebacterium spp. (8%, aktinobakterier), Propionibacterium spp. (3%; aktinobakterier) og Prevotella spp. (3%; bacteroidetes). Arter som er viktige for dyrehelse og innblandet i sykdom ble også observert; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) ble anslått til å være til stede i ensilasje prøven.

Funksjonell merknaden ble utført på montert leser. Den metagenome ble satt sammen ved hjelp av spader assembler ³⁰ med trimmet og filtrertparvise end og uparede leser generere 92,284 stillaser. For å identifisere cellulaser, ble proteiner beregnet med MG-RAST og kommentert ved hjelp av karbohydrat-aktive enzymer Database (cazy). Av de antatte proteinene 97,562, 6357 ble kommentert som en antatt karbohydrat-aktivt enzym i en av de fem enzymklasser som utgjør cazy database (figur 5). Resultatene ble visualisert som et Venn-diagram ved hjelp InteractiVenn programvare ⁵⁰ viser fordelingen av protein merknader inkludert de som inneholder mer enn én cazy enzym klasse merknader. Av disse 3 861 ble forutsagt å ha glykosid hydrolase-aktivitet og vil bli ytterligere karakterisert i laboratoriet for å bekrefte funksjonen.

Figur 1
Figur 1: bioinformatiske metagenomikk Pipeline for analyse av Silo. To hovedtilnærminger varbrukes til å undersøke mikrobiomer av silofôr, taksonomisk klassifisering og funksjonell annotering. Klikk her for å se en større versjon av dette tallet.

Figur 2
Figur 2: Sekvens Quality Per-basen før og etter trimming og Adapter fjerning. Det per-basesekvens kvalitet plottet fra FASTQC viser gjennomsnitts Phred poengsum på tvers av lengden på sekvensen leser pre- og post-kvalitetskontroll. Klikk her for å se en større versjon av dette tallet.

Figur 3
Figur 3: taksonomiske klassifiseringensjon av bakteriell mikrobiomer av Solid Silo. Klassifisering av trimmet og overlappende sekvens leser fra FLASH ble utført ved hjelp Kraken ⁷ og deretter visualisert med krona. Klikk her for å se en større versjon av dette tallet.

Figur 4
Figur 4: Vitenskapelige klasse Fordeling av fire mest tallrike Phyla i Bakteriell mikrobiomer av Solid Silo. Prosentandelen av hver klasse av bakterier i de fire mest tallrike phyla. Firmicutes: Clostridier (rød) og basiller (mørk blå); Proteobacteria: delta / epsilon (rosa), alpha (lyseblå), gamma (oransje) og beta (turkis); Bacteroidetes: Flavobacteriia (mørk blå) og Bacteroidia(blek grønn); Aktinobakterier: Coriobacteriia (mørk lilla) og andre aktinobakterier (mørk grønn). Klikk her for å se en større versjon av dette tallet.

Figur 5
Figur 5: cazy Kommentar av Forut Proteome i Solid Silo mikrobiomer. Venn-diagram som viser fordelingen av de fem enzymklasser cazy merknader i spådd proteomet av solid surfôr mikrobiomer. Klikk her for å se en større versjon av dette tallet.

# Raw leser	# Filtrert leser (paret) # Filtrert leser	# Blinket leser
(Paret)	# Filtrert leser (paret) # Filtrert leser	# Blinket leser	(Uparet)
2374949 x2	231679 x2	1892534	105343

Tabell 1: Oppsummering Fortegn Sequencing Leser.

Discussion

Mens en i silico analyse kan gi en god innsikt til de mikrobielle samfunn som er til stede i miljøprøver, er det viktig at de taksonomiske klassifisering demonstrert bli utført i forbindelse med relevante kontrollene, og at en passende dybde av sekvensering er oppnådd for å fange hele befolkning til stede ^51.

Med noen matematisk analyse, er det mange ruter for å oppnå et lignende mål. Metodene som vi har brukt i denne studien er eksempler på egnede og enkle metoder, som har blitt brakt sammen for å oppnå en rekke analyser på surfôr mikrobiomer. En variasjon og et stadig økende antall bioinformatikk verktøy og teknikker er tilgjengelige for å analysere metagenomic data, for eksempel Phylosift ⁸ og MetaPhlAn2 ^52, og disse bør vurderes før etterforskningen for sin relevans til prøven og analysen required ^53. Metagenomic analysemetoder er begrenset av databaser for tilgjengelige for klassifisering, sekvensering dybden og kvaliteten av sekvensering.

Den bioinformatiske behandlingen demonstrert her ble utført på en lokal, høy drevet maskin; Men cloud-baserte systemer er også tilgjengelig. Disse nettskybaserte tjenester gir mulighet for leie av nødvendig datakraft uten å ha høye kostnader investering på en passende kraftig lokal arbeidsstasjon. En potensiell anvendelse av denne metode ville være å vurdere silo før dets anvendelse i jordbruket for å sikre at ingen potensielt skadelige bakterier er til stede og således hindre dem fra å komme inn i næringskjeden.

Materials

Name	Company	Catalog Number	Comments
FastDNA SPIN Kit for Soil	MP Bio	116560200	DNA Extraction
DNA FastPrep	MP Bio	116004500	DNA Extraction
Agencourt AMPure XP beads	Beckman Coulter	A63880	DNA Purification
Elution Buffer	Qiagen	19806	DNA Purification
Qubit Fluorometer	Thermo Fisher	Q33216	DNA Quantification
Qubit dsDNA HS Assay Kit	Thermo Fisher	Q32854	DNA Quantification
Nextera XT DNA Library Prep Kit	Illumina	FC-131-1024	Library Preparation
Nextera XT Index Kit	Illumina	FC-131-1001	Library Preparation
TapeStation 2200	Agilent	G2964AA	DNA Quantification
HS D100 ScreenTape	Agilent	5067-5584	DNA Quantification
HS D100 ScreenTape Reagents	Agilent	5067-5585	DNA Quantification
TapeStation Tips	Agilent	5067-5153	DNA Quantification
TapeStation Tubes	Agilent	401428 and 401425	DNA Quantification
HiSeq 2500	Illumina		DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation	Various		Local or cloud based, user preferred system