Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.
En av de store spørsmålene i mikrobiell økologi er "hvem er det?" Dette spørsmålet kan besvares ved hjelp av ulike verktøy, men en av de langvarige gullstandard er å sekvensere 16S ribosomalt RNA (rRNA) genet amplikonene generert av domenenivå PCR reaksjoner forsterke fra genomisk DNA. Tradisjonelt ble dette utført av kloning og Sanger (kapillær elektroforese) sekvensering av PCR amplikonene. Ankomsten av neste generasjons sekvensering har enormt forenklet og økt sekvense dybde for 16S rRNA gensekvensering. Innføringen av stasjonære sequencere nå kan små laboratorier for å utføre sine 16S rRNA sekvensering i huset i løpet av noen dager. Her er en tilnærming for 16S rRNA-genet amplicon sekvensering ved hjelp av en benkeplate Bøk neste generasjons sequencer detaljert. Miljø DNA blir først forsterket av PCR ved hjelp av primere som inneholder sekvense adaptere og strekkoder. De blir deretter koplet til sfæriske partikler via emulsjon PCR. Partiklene er loaded på en engangs-brikken, og brikken blir satt inn i sekvenseringsmaskin hvoretter sekvensering er utført. Sekvensene blir hentet i fastq format, filtrert og strekkodene blir brukt til å etablere prøven medlemskap i leser. Den filtrerte og binned leser blir deretter analysert videre med offentlig tilgjengelige verktøy. Et eksempel analyse der leser ble klassifisert med en taksonomi-finding algoritme innen programvarepakken Mothur er gitt. Metoden skissert her er enkel, billig og grei og skal hjelpe mindre laboratorier for å dra nytte av den pågående genomisk revolusjon.
Metagenomic sekvensering er en svært kraftig teknologi som det er rettet mot helheten av den genetiske informasjonen i en miljøprøve. Det finnes ulike varianter av metagenomic sekvensering, inkludert hagle sekvensering, stor innsats biblioteker og amplicon sekvensering. Amplikon sekvensering har fordelen av å være relativt billig, rask og i stand til å produsere leser fra en enkelt genomisk region som kan være generelt justert. I tillegg er arbeidsflyten dataanalyse for amplikon sekvense hovedsakelig standardisert. Men siden det er basert på PCR, har den alle skjevheter knyttet til ufullstendig spesifisitet, ufullstendig dekning og primer penner 1,2, noe som gjør denne tilnærmingen semi-kvantitativ i beste fall. Flere genomiske regioner kan være målrettet for amplicon sekvense inkludert funksjonelle gener, men de mest populære alternativene er å bruke markørgener som 16S rRNA-genet til å generere et fellesskap profil. Tradisjonelt 16S rRNA-genet amplicon Sequencing ble utført ved hjelp av arbeidsintensive teknikker som inkluderte kloning i E. coli koloni plukking og plasmid ekstraksjon etterfulgt av Sanger-sekvensering av de isolerte plasmider, og følgelig, de fleste studiene analysert færre enn 100 kloner per prøve. Neste-generasjons sekvense brakt to store framskritt: massiv parallellisering av sekvense reaksjoner og, viktigst, klonal separasjon av maler uten behov for å sette inn genfragmenter i en vert. Dette har forenklet enormt sekvensering av 16S rRNA-genet amplikonene, som nå er tilbake som en rutinemessig funksjon i mange miljø mikrobiologi studier, noe som resulterer i en "renessanse" for 16S rRNA-genet amplicon sekvense tre.
Siden advent av Roche 454 sekvensering i 2005 4, har flere andre neste generasjons sekvensering teknologier dukket opp på markedet (f.eks, Illumina, Solid, PacBio). Mer nylig, innføring av benk-topp-sekvensenrs brakt til små laboratorier sekvensekapasitet gang eksklusivt til store sekvensesentre. Fem stasjonære maskiner er for tiden tilgjengelige: 454 GS Junior, den Ion Torrent Personal Genome Machine (PGM) og Proton, og Illumina MiSeq og NextSeq 500. Mens alle disse sequencere tilbyr mindre leser per kjøring og færre baser per dollar enn de fleste full skala sequencere, de er mer fleksibel, rask, og deres lave oppkjøps og kjøre kostnader gjør dem rimelig for små akademiske laboratorier. Stasjonære sequencers er spesielt godt egnet for amplikon, lite genom og lav kompleksitet metagenome sekvense i miljøstudier mikrobiologi, fordi denne type studier generelt krever ikke en ekstrem dybde på sekvensering. For eksempel er det generelt enighet om at for 16S rDNA-sekvenseringsstudier antall leser per prøve er ikke av vesentlig betydning, da ~ 1000 leser kan generere de samme mønstre som flere millioner leser datasettene 5. Når det er sagt, benkeplate Bøk neste generatio n sequencere fortsatt generere store mengder sekvensdata, med maksimal avkastning av ~ 35 Mbp (454 GS Junior), ~ 2 GBP (Ion Torrent PGM), ~ 10-15 GBP (Ion Torrent Proton), ~ 10 GBP (Illumina MiSeq) og ~ 100 GBP (Illumina Neste Seq 500), som er mer enn nok for de fleste miljø mikrobiologi studier.
Neste-generasjons sekvensering av 16S rRNA amplikonene bruker stasjonære sequencere har nylig blitt brukt til en rekke miljøer. For eksempel har den Ion Torrent PGM blitt brukt for samfunnet analyser av uran gruveavfall som hadde spesielt høy pH og lav permeabilitet 6 av resirkuleringsteknologi 7, av hydrokarbonforurenset arktiske jord 8,9, av oljesand gruve berørt sedimenter og biofilm fra Athabasca River 10,11, av rhizosphere av piletrær plantet i forurenset jord 12, av mennesker og dyr organer 13-16 og anaerobe råtne 17.
jove_content "> I dette bidraget vi detalj vår tilnærming med å sekvensere 16S rRNA-genet amplikonene i huset ved hjelp av en benkeplate Bøk neste generasjons sequencer (Ion Torrent PGM). Etter DNA-ekstraksjon, 16S rRNA gener blir forsterket ved hjelp av domenenivå bakterielle primere som inneholder sekvense adaptere og unike, sample-spesifikke sekvenser (strekkoder). Are The amplikonene renset, kvantifiseres og samlet på en ekvimolar ratio. Den samleprøver blir deretter clonally forsterkes i en emulsjon PCR og sekvensert. anholding sekvenser analysert ved hjelp av offentlig tilgjengelige bioinformatikk ( f.eks Mothur).Metoden som presenteres her er enkel og billig, og bør tillate mange laboratorier for å få tilgang til kraften i metagenomic sekvensering. Selv om det varierer avhengig av sekvenseplattform som brukes, når bibliotekene er konstruert svært lite hands-on tid er nødvendig, med det meste av prosessen blir automatisert. For sekvense plattformen som brukes her (Ion Torrent PGM), kan hele prosedyren utføres innen to dager med arbeid. På tidspunktet for å skrive (september 2013), reagens- kostnader knyttet til eksemplet beskrevet ovenfor var som følger: PCR forsterkning av 36 prøver: $ 25, gel rensing og PicoGreen DNA kvantifisering av 36 prøver: $ 125, emulsjon PCR for en pooled fragment prøve : $ 150 og sekvense reagenser: $ 250, for totalt $ 550 eller $ 15 per prøve eller $ 0,0015 per kvalitets filtrert lese. Denne prisen inkluderer ikke instrument servicekontrakt, instrument avskrivninger, tekniker lønn og laboratorieplass bruk.
telt "> En av de viktigste trinn er å samle alle produkter i en ekvimolar forhold, for å kunne hente lik antallet avlesinger for hver av prøvene. PicoGreen kvantifisering ble brukt her, men også andre metoder kan være passende, skjønt mindre nøyaktige (for eksempel UV-kvantifisering, gel-basert kvantifisering). Selv ved å gjøre den mest mulig nøyaktig kvantifisering og pooling, det er en viss variasjon i antall leser per prøve, og i det typiske kjøre beskrevet i tabell 2, er det i området fra 4380 til 32750 leser, med et gjennomsnitt på 10 338 leser. Hvis behandlingen stort antall prøver (mer enn 40 til 50), kan enkelt kolonne gel rensing erstattes av gel-rensing i plate eller rensing ved hjelp av perler med en strengstørrelse cutoff (f.eks AMPure perler) .Til dags dato er det mest brukte neste generasjons sekvensering teknologi for 16S rRNA-genet 454. Den Ion Torrent sekvensering teknologi som brukes i denne protokollen er konseptuelt svært liktil 454, og begge teknologier er utsatt for samme type sekvensfeil. Ikke overraskende ble det vist at Ion Torrent sekvense resulterte i sekvense resultatene svært lik 454 sekvense 10. Nylig har mange forskere utforsket bruk av Illumina teknologi for 16S rRNA-genet amplicon sekvense 18,19. I alle fall ville det være lett å tilpasse gjeldende protokoll for andre stasjonære sequencere som Illumina MiSeq eller 454 GS Junior ved å endre fusjons primer sekvenser å matche adaptere og strekkoder trengs for disse sekvensering teknologier, som i metoden nylig beskrevet for Illumina MiSeq 19. Alternativt kunne forskerne følge trinn 1 og 2 i protokollen detaljert her og sende de samlede amplikonene til en sekvensering senter hvor emulsjonen PCR og sekvensering vil bli utført.
16S rRNA-genet leser ble trimmet og klassifisert ved hjelp Mothur, men mange andre analyser kan utføres på16S rRNA-genet amplikonene. For eksempel kan beta mangfold evalueres ved å beregne Unifrac avstandene mellom hver prøve paret ved hjelp av fremgangsmåten beskrevet i http://unifrac.colorado.edu/ 20. Alpha diversitetsindekser og antall operative taksonomiske enheter av hver prøve kan beregnes ved hjelp av verktøy innen QIIME som AmpliconNoise 21 eller ved hjelp av prosedyren skissert av Huse et al. 22 og tilgjengelig innen Mothur.
Primere som brukes her forsterket de variable områder 3 og 4 fra 16S rRNA-genet, men mange andre regioner kan bli målrettet. I denne studien ble 16S rRNA gener forsterket fra plantemateriale og valg av primer ble gjort for å unngå forsterkning av kloroplast 16S rRNA-genet 23,24. Det er et bredt utvalg av andre primere tilgjengelige som varierer i term av produktlengden, taksonomisk kraft og nytten 25,26. Men i alle tilfeller 200-400 bp leser av 16S rRNA-genet kan ikke pålitelig klassifisert på artsnivå, og analysene er begrenset til slekten og høyere taksonomiske nivåer. Andre gener kan være mer hensiktsmessig hvis artsnivå informasjon er nødvendig, som cpn60 og rpoB gener 27,28. Fremtidige drastiske fall i kostnadene for sekvensering og øker i kraft av analytiske verktøy kan gjøre det mulig å erstatte 16S rRNA-genet sekvensering ved å hagle metagenomikk, men inntil da 16S rRNA gensekvensering fortsatt gullstandarden for miljømikrobiologi.
The authors have nothing to disclose.
Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.
Reagent | Company | Catalog Number |
Ion 314 Chip Kit v2 | Life Technologies | 4482261 |
Ion PGM Sequencing 200 Kit v2 | Life Technologies | 4482006 |
Ion PGM Template OT2 200 Kit | Life Technologies | 4480974 |
HotStarTaq Plus Master Mix Kit | Qiagen | 203646 |
Primers and probes | IDT | NA |
Qiaquick Gel Extraction Kit | Qiagen | 28704 |
BSA 20 mg/ml | Roche | 10,711,454,001 |
Dynabeads MyOne Streptavidin C1 | Life Technologies | 65001 |