Metagenomic Analys av ensilage

1Biosciences, University of Exeter
Published 1/13/2017
0 Comments
  CITE THIS  SHARE 
Genetics
 

Summary

Cite this Article

Copy Citation

Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Introduction

Metagenomik är direkt analys av DNA renat från biologiska samhällen inom miljöprover 1 och användes ursprungligen för att upptäcka unculturable bakterier som finns i sedimenten 2. Metagenomik har använts i stor utsträckning för ett antal applikationer, såsom att identifiera den mänskliga microbiome 3, klassificera mikrobiella populationer i havet 4 och även för analys av bakterie samhällen som utvecklas på kaffemaskiner 5. Införandet av nästa generations sekvenseringsteknologier lett till större sekvense genomströmning och produktion. Följaktligen har DNA-sekvensering blir mer ekonomisk 6 och djupet av sekvensering som kan utföras har ökat kraftigt, vilket möjliggör metagenomik att bli ett kraftfullt, analytiskt verktyg.

"Front-end" förbättringar i den praktiska, molekylär aspekt av metagenomic sekvense har drivit tillväxten av isilico bioinformatiska verktyg tillgängliga för den taxonomiska klassificeringen 7-9, funktionell anteckning 10,11 och visuell representation 12,13 av DNA-sekvensdata. Det ökande antalet tillgängliga sekvens prokaryota och eukaryota 14 genomen tillåter ytterligare noggrannhet i klassificeringen av mikrobiella samhällen, som alltid utförs mot en "back-end" referensdatabas sekvensegenom 15. Två huvudmetoder kan antas för metagenomic analys.

Den mer konventionella metoden är analys av 16S rRNA-genen kodande regionen av bakteriella genomet. 16S rRNA är mycket konserverad mellan prokaryota arter men uppvisar nio hyper-variabla regioner (V1 - V9) som kan utnyttjas för identifiering 16 arter. Införandet av längre sekvensering (≤ 300 bp parade slut) tillåts för analys av DNA-sekvenser som spänner över två hyper-variabla regioner, i synnerhetV3 - V4-regionen 17. Framsteg i andra sekvenseringsteknologier, såsom Oxford nanopore 18 och PacBIO 19, tillåter hela 16S rRNA-genen som skall sekvenseras intill varandra.

Medan 16S rDNA baserade bibliotek ger en målinriktad strategi för artbestämning och möjliggöra detektering av lågt kopietal DNA som naturligt förekommer inom renade prover, hagelgevär sekvense bibliotek kan påvisas av arter som kan innehålla DNA-regioner som antingen inte amplifierbara av 16S rRNA markör primersekvenser används, eller på grund av skillnaderna mellan templatsekvensen och den förstärkande primersekvensen är alltför stora 20,21. Även om DNA-polymeraser har en high fidelity DNA-replikation, bas fel kan ändå förekomma under PCR-amplifiering och dessa inkorporerade fel kan leda till felaktiga klassificeringen av ursprungs arter 22. Bias i PCR-amplifieringen av templat sequences kan också förekomma; sekvenser av DNA med hög GC-halt kan vara underrepresenterade i den slutliga amplikonen poolen 23 och på liknande sätt onaturliga basmodifieringar, såsom tymin glykol, kan stoppa DNA-polymeraser som orsakar fel i amplifieringen av DNA-sekvenser 24. Däremot är ett hagelgevär-sekvensbestämning DNA-bibliotek ett DNA-bibliotek som har framställts genom att använda alla av den renade DNA som har extraherats från ett prov och därefter fragmenteras till kortare DNA-kedjelängder före beredning för sekvensering. Taxonomisk klassificering av DNA-sekvenser som genereras av shotgun-sekvensering är mer exakt jämfört med 16S rRNA amplikon sekvense 25, även om de finansiella kostnaderna som krävs för att nå en tillförlitlig sekvense djup är större än den för amplikon sekvense 26. Den största fördelen med hagelgevär sekvense metagenomik är att sekvense regioner i de olika genomen i provet är tillgängliga för gen prospektering när de har varithar taxonomiskt klassificerad 27.

Metagenomic sekvensdata analyseras av en ständigt ökande utbud av bioinformatiska verktyg. Dessa verktyg kan utföra en mängd olika tillämpningar, till exempel, kvalitetskontroll analys av råsekvensdata 28, överlappande av parade slut läser 29, de novo montering av sekvens läser till kontiger och ställningar 30,31, taxonomisk klassificering och visualisering sekvens läser och sammansatta sekvenser 7,12,32,33 och den funktionella anteckningen av sammansatta sekvenser 34,35.

Ensilage, som produceras av jordbrukare över hela världen från jästa spannmål såsom majs (Zea mays) är huvudsakligen används som kreatursfoder. Ensilage behandlas med bakterien Lactobacillus sp. för att underlätta fermenteringen 36 men hittills finns det begränsad kunskap om andra populationer av mikroorganismer som finns i ensilage. den fermentation process kan leda till oönskade och potentiellt skadliga mikroorganismer blir vanligare inom ensilaget 37. Förutom jäst och mögel, bakterier är särskilt anpassningsbara till den anaeroba miljön i fermen ensilage och är oftare associerade med sjukdomar hos boskap, snarare än nedbrytning av ensilaget 38. Smörsyrabakterier kan oavsiktligt tillsatta från jord kvar när fylla ensilagesilor och kan omvandla mjölksyra, en produkt av rötning, till smörsyra, vilket ökar pH i ensilaget 39. Denna ökning i pH kan leda till ett uppsving i nedbrytande bakterier som normalt inte skulle kunna upprätthålla tillväxten under optimala ensilagefermentationsbetingelser 38. Clostridium spp. , Listeria spp. och Bacillus spp. är av särskilt intresse, särskilt i ensilage för foder mjölkkor, som bakteriesporer som har överlevt gastrointestinal kanalen 40 kan komma in i livsmedelskedjan leda till mat förstörs och i sällsynta fall, till djur och mänskliga dödsfall 37,39,41-44. Dessutom medan det är svårt att uppskatta den exakta ekonomiska effekten av veterinärbehandling och boskap skada som orsakats av ensilage förruttnelse, är det sannolikt att vara till skada för en gård om ett utbrott skulle inträffa.

Det antas att vi med hjälp av en metagenomic tillvägagångssätt kan klassificera mikrobiella populationer som finns i ensilageprov och dessutom identifiera mikrobiella samhällen som är förknippade med ensilage nedbrytning som skulle i sin tur kunna ha en skadlig effekt på boskap, vilket möjliggör avhjälpande åtgärder för att vara tas före ensilaget skall användas som en näringskälla.

Protocol

1. Site plats

  1. Samla ensilageprov från en lämplig plats, såsom en gård. Här var gården ligger i Ballydulea, Co. Cork, Irland (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA-extraktion

OBS: DNA-extraktion utfördes med användning av ett kommersiellt kit enligt tillverkarens instruktioner. En negativ kontroll, som inte innehöll någon prov, användes i hela biblioteket framställningsmetod.

  1. Lägg 100-400 mg prov till 978 mikroliter natriumfosfatbuffert och 122 mikroliter jord lysbuffert i de medföljande lys rören.
  2. Homogenisera prover genom att placera lys rören in i homogenisator under 40 s vid en hastighet av 6,0 m / s.
  3. Centrifugera lysat vid 14.000 xg i 15 min och överför supernatanten till en ren mikro centrifugrör innehållande 250 mikroliter av proteinfällningen Solution (PPS). Blanda lösningen genom att vända 10 gånger och centrifugvid 14.000 xg under 5 min.
  4. Lägg supernatanten till 1 ml DNA-bindningsmatrisen i en ren 15 ml centrifugrör. Blanda lösningen genom att vända röret ständigt i 3 min. Låta blandningen sedimentera under 3 min, sedan kasta 500 mikroliter av supernatant Blanda den återstående supernatanten.
  5. Överföra 600 mikroliter av suspensionen till en spinnfiltret och centrifugera vid 14.000 xg under 1 min. Kassera filtratet och upprepa processen med den återstående suspensionen.
  6. Tillsätt 500 pl tvättbuffert till den DNA-bindande matris i spinnfiltret, blanda genom pipettering, centrifugera sedan vid 14.000 xg i 1 min.
  7. Kassera filtratet och centrifugera spinnfiltret igen vid 14000 x g i 2 min för att säkerställa att all tvättbuffert avlägsnas. Torka spinnfilter vid 23 C under 5 min.
  8. Pre-varm (70 c) DNas-fritt vatten (DES) och återsuspendera den DNA-bindande matrisen i 100 mikroliter av DES i spinnfilter. Överför spinnfilter till en ren 1,5 ml mikro-centrifug tuvara och centrifugera vid 14.000 xg under 1 min för att eluera DNA. Lagra den renade DNA vid -20 C fram till analysen skall utföras.

3. DNA-rening med användning av DNA-rening Pärlor

OBS: Före metagenomic bibliotek beredningen extraherade DNA renades med användning av renings pärlor för att säkerställa en ren DNA-prov erhölls.

  1. Inkubera pärlorna vid 23 C under 30 min före användning. Tillsätt 2 volymer av pärlor att DNA-provet och inkubera lösningen vid 23 C under 5 min.
  2. Placera proverna på en separations magnet för 5 min och sedan kassera supernatanten. Tvätta pärlor två gånger med 200 | il färskt 80% etanol (EtOH). Lufttorka pärlorna under 10 min.
  3. Avlägsna proven från separationsmagneten och tillsätt 50 pl elueringsbuffert (EB), blanda genom pipettering.
  4. Inkubera suspensionen vid 23 C under 5 minuter, varefter placera proverna tillbaka till separations magnet för 3 min.
  5. transfer supernatanten, som innehåller DNA, till ett rent rör. Kassera pärlorna.
  6. Kvantifiera det renade DNA enligt avsnitt fyra.

4. Kvantifiering av renat DNA

OBS: Renat DNA kvantifierades med användning av en fluorometer och dubbelsträngat (dsDNA) Hög känslighet (HS) analyssats enligt tillverkarens instruktioner.

  1. Bered en arbetslösning med användning av 199: 1 förhållande av buffert till reagens.
  2. Tillsätt 10 mikroliter av varje DNA-standard till 190 mikroliter av arbetslösning.
  3. Tillsätt 10 mikroliter av renat DNA till 190 | il av arbetslösning. Den slutliga volymen bör vara 200 mikroliter. Inkubera standard och DNA-prover vid 23 ° C under 2 min.
  4. Analysera standarder innan DNA-prov på fluorometer med hjälp av instruktionerna på skärmen.

5. Shotgun Sequencing Library Framställning

OBS: shotgun-sekvensering bibliotek framställdes med användning av enkommersiell beredning bibliotek kit enligt tillverkarens instruktioner.

  1. Späd DNA-proven till 0,2 ng / mikroliter med användning av EB. Alla prov som redan under denna koncentration, det vill säga den negativa kontrollen, lämnas på sin nuvarande koncentration.
  2. Blanda 5 | il av det renade DNA med 10 mikroliter buffert och 5 mikroliter enzymblandning. Inkubera proverna vid 55 ° C under 5 min.
  3. Tillsätt 5 mikroliter av neutraliserande buffert och inkubera lösningen vid 23 C under 5 min.
  4. Tillsätt 5 mikroliter av var och en av prov specifika sekvense indexen och 15 mikroliter av PCR-masterblandning.
  5. I en termocykler, inkubera proverna vid 72 C under 3 min, 95 C under 30 s, före 12 cykler av 95 C under 10 s, 55 C i 30 s och 72 C under 30 s. Inkubera proverna slutligen vid 72 C under 5 minuter.
  6. Rena den framställda DNA med användning vulsten rening som tidigare men med en slutlig eluering av 30 mikroliter av EB.

6. Library kvantitet och kvalitet Check

OBS: mängden och kvaliteten på de framställda bibliotek bedömdes med hjälp av ett kommersiellt kit och instrumentering.

  1. Inkubera kitkomponenterna vid 23 C under 30 min före användning.
  2. Lägg 2 mikroliter av DNA till 2 mikroliter av buffert och vortex under 1 min vid 2000 rpm.
  3. Centrifugera ner provet för att säkerställa att det är vid botten av röret.
  4. Sätt provrören, analys band och tips i instrumentet, och utföra analys enligt anvisningar från programvaran.

7. DNA-sekvensering

  1. Överför förberedda och kvantifierade DNA-sekvenserings bibliotek prover till en sekvense service och sekvens med hjälp av 300 bp parade slut sekvensering 45.

8. Analys av rå sekvensdata

OBSERVERA: Kommandon för varje program med en Linux operativsystem visas nedan protokollsteget. Rörledningen som används för sequence dataanalys visas i figur 1. Programmen ska installeras av användaren före analys. Denna process ska utföras individuellt för varje prov.

  1. Analysera och visualisera DNA-sekvensdata med hjälp av FastQC 46 genom att skriva in kommandoraden / sökväg till fil / fastqc, följt av fram- och back rå läser raw_read1.fastq raw_read2.fastq.
  2. Ange en output mapp genom att skriva -o output_fastqc och filformatet av rå läsa filer från -f fastq.
  3. Visa utdatafilen (Figur 2).
    väg till fil / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. Kvalitetskontroll Trimning och filtrering sekvensdata

  1. Kör trimnings programmet Trimmomatic 28 genom att skriva in kommandoraden java-jar / sökväg till fil / trimmomatic-0.35.jar.
  2. Ange filerna parade slut filer genom att skriva "PE". Anger att 16 central processing enheter (CPU) bör användas av programmet genom att skriva -threads 16.
  3. Ange de två filerna till QC kontroll genom att skriva namnen på rå framåt och bakåt läser. Prefixet av utdatafiler bestäms genom att skriva -baseout ensilage.
  4. Definiera alternativen för programmet genom att skriva ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEDANDE: 3 Trailing: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 MINLEN: 36.
  5. När du är klar, analysera trimmade sekvenser med användning FastQC som tidigare och jämföra utsignalen till råsekvensdata för att säkerställa trimning har utförts framgångsrikt.
    OBS: verktyg, Trimmomatic, trimmas läser vidare genom att avlägsna ledande låg kvalitet eller N baser (nedan kvalitet 3), ta bort avslutande låg kvalitet eller N baser (nedan kvalitet 3) och skanning varje läsa med en 4-bas bred skjutfönster. Parametrarna sattes för att skära när den genomsnittliga kvaliteten per bas sjunker under 20 och sedan att släppa någon läser under 36 baser lång. Slutligen tillsattes 15 baser beskärs frOm chefen för varje läsa och läser var beskärs för att hålla 200 baser från början av läsning. Denna sista steget utfördes för att övervinna en del kvalitetsproblem när sekvense lång (> 200 bp) läser. Dessa kan justeras för specifika prover 28.
    java-jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout ensilage ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEDANDE: 3 Trailing: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 MINLEN: 36

10. Metagenome Assembly

  1. Sammanfoga den oparade, trimmas läser genom att skriva cat följt av oparade läser; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Skriv filerna till en ny fil genom att skriva> silage_merged_unpaired.fastq
    cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
  2. Till de novo montera sekvens DNA, använder spadar (St Petersburg genom assembler) 30 genom att skriva / sökväg till-file / spades.py. Specificera att 16 CPU: erna är avsedda att användas genom att skriva -t 16 och att metagenomic parametern ska tillämpas genom att skriva --meta.
  3. Identifiera den trimmade framåt läser använder -1 silage_read1_paired.fastq och omvänt läser med -2 ​​silage_read2_paired.fastq. Den sammanslagna oparade läser specificeras av -s silage_merged_unpaired.fastq.
  4. Definiera produktionen mappen genom att skriva -o silage_spades.
    väg till fil / spades.py -t 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. parade slutet Läs Overlap

  1. Merge par av DNA-sekvensen läser använder FLASH (Snabb Längd anpassning av korta Läser) 29 genom att skriva in kommandoraden / sökväg till fil / blixt. Ange att 16 processorer ska användas genom att använda -t 16 och utgångs prefix genom att skriva -o ensilage.
  2. Identifiera trimmas läser genom att skriva silage_trimmed_R1.fastq silage_trimmed_R2.fastq
    väg till fil / blixt -t 16 -o snabbavdrivet silage_read1_paired.fastq silage_read2_paired.fastq

12. taxonomisk

  1. Typ / sökväg till fil / kraken och ange databasen genom att skriva --db / sökväg till fil / standard.
  2. Definiera att 16 processorer ska användas genom att skriva --threads 16 och identifiera en output mapp med --output FLASHed_silage_extendedFrags_kraken.txt. Skriv ingångs filnamnet; FLASHed_silage.extendedFrags.fastq
    väg till fil / kraken --db standard --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
    OBS: Klassificering av sammansatta DNA-sekvens ställningar med hjälp av Kraken 7 fördes mot den senaste standard Kraken databas som innehöll alla tillgängliga prokaryot genomsekvenser.
  3. Överför kolumnerna 2 och 3 från utdatafilen och till en ny fil genom att skriva snitt -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  4. skära -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  5. Importera den nya filen till Krona 12 genom att skriva ktImportTaxonomy. Ange indatafilen genom att skriva FLASHed_silage_extendedFrags_kraken.int. Identifiera utdatafilen genom att skriva -o FLASHed_silage_extendedFrags_kraken.out.html.
    väg till fil / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. Funktionell Notering

  1. Gå till MG-RAST 47 webbplats, http://metagenomics.anl.gov/. Registrera dig som ny användare om det behövs. När du har loggat in, klicka på "Ladda upp" -knappen. Ladda upp sammansatta ställningar från steg 10.
  2. När filerna har laddats upp, klicka på "Skicka" och följ instruktionerna och invänta slutförandet av analysen.
  3. När analysen är klar, se länk som skickas via email från MG-RAST, eller alternativt klicka på "Progress". Det finns en lista över slutförda jobb. Klicka på respektive jobb-ID och sedan på länken till "nedladdningssidan".
  4. På nedladdningssidan, under rubriken "Protein Clustering 90%", klicka på knappen protein för att hämta den förutsagda protein filen 550.cluster.aa90.faa.
  5. Att klassificera proteiner som förmodat tillhör en viss Cazy enzymklass, jämför de nedladdade proteiner till Cazy databasen 48. Ladda ner Kolhydrater-aktiva enzymer Database (Cazy) från filer är: AA.zip, CE.zip, GH.zip, GT.zip och PL.zip. Dessa filer representerar följande enzymklasser respektive: serviceverksamhet (AA), kolhydrater Esteraser (CE), glykosid Hydrolaser (GH), glykosyltransferaser (GT) och polysackarid lyaser (PL).
  6. Packa databasfilerna och kommentera proteinerna genom att bestämma protein likhet med databasproteinerna Cazy använder USEARCH UBLAST Algorithm 49. Om du vill använda en bash slinga (for i in * .txt) för att iterera igenom fem databasen .txt-filer typ "for i in * .txt, gör".
  7. Kör USEARCH genom att skriva / sökväg till fil / usearch8 med parametern -ublast för att använda ublast algoritm. Skriv sedan in namnet på proteinsekvensen filen ner från MG-RAST "mgmXXXXXX.3.550.cluster.aa90.faa".
  8. För att indikera databasfilen som ska användas typ "-db $ i" och för att ange tröskelvärdet E-värde vid 1e -5, typ "-evalue 1e-5".
  9. För att avsluta sökandet efter upptäckten av en målsekvens och därför klassificera det proteinsekvens som hör till målenzymet klassen, t.ex. GH, typ "-masaccepts en".
  10. Att definiera det 16 processorer ska användas typ "-threads 16" och för att ange formatet på utdata filen som ATAB separerad text typ "-blast6out". För att identifiera vilken typ av fil "$ i.ublast". För att avsluta bash slingan, typ "; gjort"
    for i in * .txt;
    gör / sökväg till fil / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts en -threads 16 -blast6out $ i.ublast;
    Klart

14. Visualisera Cazy Notering

  1. Att visualisera utsignalen från Cazy annotering som ett Venn-diagram, generera protein ID listor för varje enzym klass med hjälp av ett våldsamt slag slinga. Skriv "for i in * .ublast, gör".
  2. För att överföra kolumn 1 från utdatafilen och en ny fil, typ "cat $ i | skär -f 1> $ i.list".
  3. Avsluta slingan och skriv ", gjort".
  4. Öppna .list filer i en textredigerare. Gå till webbplatsen, välj antalet uppsättningar som 5 och klistra in innehållet i varje listfil i en separat låda. Ladda ner den resulterande diagram som .SVG fil.
    for i in * .ublast;
    göra cat $ i | klippa -f 1> $ i.list;
    Klart

Representative Results

Före bioinformatisk bearbetning, läser råsekvensen trimmades och adaptrar avlägsnades med hjälp av Trimmomatic programvara 28. Efter trimning och filtreringssteget, antalet läsningar reducerades till 50% av sekvensen lyder (tabell 1). Den genomsnittliga bas Phred poäng var> 30 efter kvalitetskontroll (Figur 2).

Par av DNA-sekvenser som hade överlappande områden slogs samman med hjälp av Flash-programvara 29 att generera enda längre läser, läser icke-överlappande hölls i en separat fil. 45,47% läser (105.343) i kombination med framgång. Efter överlappning av läser använder FLASH av läser de resulterande förlängda fragmenten genomgick bakteriell taxonomisk klassificeringen enligt Kraken programvara 7 och därefter visualiseras med Krona programvara (Figur 3).

fig 4. De vanligast förekommande arterna i metagenome var Lactobacillus spp. (24%; Firmicutes), Corynebacterium spp. (8%, aktinobakterier), Propionibacterium spp. (3%, aktinobakterier) och Prevotella spp. (3%; Bacteroidetes). Arter som är viktiga för djurhälsa och inblandade i sjukdomsobserverades också; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) förutsades vara närvarande i ensilaget provet.

Funktionell anteckning utfördes på monterade läser. Den metagenome monterades med hjälp av spadar assembler 30 med hjälp av den trimmade och filtrerasparade slut och oparade läser genererar 92,284 ställningar. För att identifiera cellulaser, var proteiner förutspått med hjälp av MG-RAST och kommenterad med hjälp av kolhydrat-aktiva enzymer Database (Cazy). Av de 97,562 förutsagda proteinerna, var 6357 annoterade som en förmodad kolhydrat-aktivt enzym i en av de fem enzymer klasser som utgör Cazy databasen (figur 5). Resultaten visualiserades som ett Venn-diagram med användning InteractiVenn programvara 50 visar fördelningen av protein annoteringar inklusive sådana som har mer än en Cazy enzymklass annotering. Av dessa var 3861 förutspås ha glykosidhydrolas aktivitet och kommer att kännetecknas vidare i laboratoriet för att bekräfta funktionen.

Figur 1
Figur 1: Bioinformatisk metagenomik Pipeline för analys av ensilage. Två huvudsakliga tillvägagångssätt varanvänds för att undersöka microbiome av ensilage, taxonomisk klassificering och funktionell anteckning. Klicka här för att se en större version av denna siffra.

figur 2
Figur 2: Sekvens kvalitet Per-bas före och efter Trimning och adapter borttagning. Den per-bassekvensen kvalitet diagram från FASTQC visar den genomsnittliga Phred Poängen över längden av sekvensen lyder före och efter kvalitetskontroll. Klicka här för att se en större version av denna siffra.

Figur 3
Figur 3: Taxonomisk Classificaning av den bakteriella Microbiome av Solid ensilage. Klassificering av trimmas och överlappande sekvens läser från FLASH utfördes med hjälp av Kraken 7 och därefter visualiseras med krona. Klicka här för att se en större version av denna siffra.

figur 4
Figur 4: Taxonomisk klass Fördelning av fyra mest förekommande provinsar i Bacterial Microbiome av Solid ensilage. Den andel av varje klass av bakterier inom fyra mest förekommande phyla. Firmicutes: Clostridia (röd) och Bacilli (mörkblå); Proteobacteria: delta / epsilon (rosa), alfa (ljusblå), gamma (orange) och beta (turkos); Bacteroidetes: Flavobacteriia (mörkblå) och Bacteroidia(ljusgrön); Aktinobakterier: Coriobacteriia (mörklila) och andra aktinobakterier (mörkgrön). Klicka här för att se en större version av denna siffra.

figur 5
Figur 5: Cazy Notering av den förväntade Proteome i Solid Ensilage Microbiome. Venn-diagram som visar fördelningen av de fem enzymklasser Cazy annoteringar i den förutsagda proteomet av fast ensilage microbiome. Klicka här för att se en större version av denna siffra.

# Raw läser # Filtrerad läser (parade) # Filtrerad läser # Snabbavdrivet läser
(Parade) (Oparad)
2374949 x2 231679 x2 1892534 105343

Tabell 1: Sammanfattande tabell av sekvensavläsningar.

Discussion

Medan en in silico analys kan ge en god inblick i de mikrobiella samhällen som finns i miljöprover, är det viktigt att de taxonomiska klassificering visade utföras i samarbete med relevanta kontroller och att en lämplig djup sekvensering har uppnåtts för att fånga hela population som finns 51.

Med någon beräknings analys, det finns många vägar för att uppnå ett liknande mål. De metoder som vi har använt i denna studie är exempel på lämpliga och enkla metoder, som har förts samman för att uppnå en rad analyser på ensilage microbiome. En mängd och ett ständigt ökande antal bioinformatiska verktyg och tekniker finns tillgängliga för att analysera metagenomic uppgifter, till exempel Phylosift 8 och MetaPhlAn2 52, och dessa bör utvärderas innan undersökningen för deras relevans till provet och analysen required 53. Metagenomic analysmetoder är begränsade av databaserna för tillgängliga för klassificering, sekvensedjup och kvaliteten på sekvensbestämning.

Den bioinformatik behandling visade här utfördes på en lokal, hög motordriven maskin; men molnbaserade system är också tillgängliga. Dessa molnbaserade tjänster gör det möjligt att hyra av den nödvändiga beräkningskraft utan att ha hög investeringskostnad av en lämplig stark lokal arbetsstation. En potentiell tillämpning av denna metod skulle vara att bedöma ensilage innan dess användning inom jordbruket för att säkerställa att inga potentiellt skadliga bakterier förekommer därför hindrar dem från att komma in i livsmedelskedjan.

Materials

Name Company Catalog Number Comments
FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

DOWNLOAD MATERIALS LIST

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38, (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59, (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486, (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304, (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507, (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15, (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2, (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12, (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7, (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32, (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43, (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10, (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69, (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2, (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14, (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20, (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343, (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370, (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65, (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50, (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104, (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469, (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15, (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32, (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30, (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27, (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19, (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. metaSPAdes: a new versatile de novo metagenomics assembler. (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30, (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10, (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106, (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167, (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22, (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182, (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90, (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86, (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153, (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50, (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456, (7218), 53-59 (2008).
  46. Andrews, S. Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, Chapter 13 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, Database issue 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26, (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16, (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12, (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9, (9), 75-88 (2015).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Video Stats