Detta protokoll beskriver en omfattande strategi för odling, sekvensering och de novo hybrid genom montering av urinvägsbakterier. Det ger ett reproducerbart förfarande för generering av kompletta, cirkulära genomsekvenser som är användbara för att studera både kromosomala och extrakromosomala genetiska element som bidrar till urinkolonisering, patogenes och antimikrobiell resistens spridning.
Kompletta genomsekvenser ger värdefulla data för förståelse av genetisk mångfald och unika koloniseringsfaktorer för urinmikrober. Dessa data kan omfatta mobila genetiska element, såsom plasmider och extrakromosomal, som bidrar till spridning av antimikrobiell resistens och ytterligare komplicerar behandlingen av urinvägsinfektion (UTI). Förutom att ge fin upplösning av genomstrukturen möjliggör kompletta, slutna genom detaljerade jämförande genomik och evolutionära analyser. Genereringen av kompletta genom de novo har länge varit en utmanande uppgift på grund av begränsningar av tillgänglig sekvenseringsteknik. Parad nästa generations sekvensering (NGS) ger korta avläsningar av hög kvalitet som ofta resulterar i exakta men fragmenterade genomenheter. Tvärtom ger Nanopore sekvensering långa avläsningar av lägre kvalitet som normalt leder till felbenägna kompletta sammansättningar. Sådana fel kan hämma genomomfattande associationsstudier eller ge vilseledande analysresultat. Därför har hybridmetoder som kombinerar både korta och långa läsningar dykt upp som tillförlitliga metoder för att uppnå mycket exakta slutna bakteriegenom. Rapporteras häri är en omfattande metod för odling av olika urinbakterier, art identifiering av 16S rRNA gen sekvensering, extraktion av genomisk DNA (gDNA), och generering av korta och långa läsningar av NGS respektive Nanopore plattformar. Dessutom beskriver denna metod en bioinformatisk pipeline av kvalitetskontroll, montering och gen förutsägelse algoritmer för generering av kommenterade kompletta genomsekvenser. Kombinationen av bioinformatiska verktyg möjliggör val av högkvalitativa läsdata för hybridgenommontering och nedströmsanalys. Den strömlinjeformade metoden för hybrid de novo genom montering som beskrivs i detta protokoll kan anpassas för användning i alla odlingsbara bakterier.
Urinmikrobiomet är ett framväxande forskningsområde som har krossat en årtionden lång missuppfattning om att urinvägarna är sterila hos friska individer. Medlemmar av urinmikrobiotan kan tjäna till att balansera urinmiljön och förhindra urinvägsinfektion (UTI)1,2. Uropathogena bakterier invaderar urinvägarna och använder olika virulensmekanismer för att förskjuta den bosatta mikrobiotan, kolonisera urotheliumet, undvika immunsvar och motverka miljötryck3,4. Urin är ett relativt näringsbegränsat medium som kännetecknas av hög osmolaritet, begränsad kväve- och kolhydrattillgänglighet, låg syresättning och lågt pH5,6,7. Urin anses också vara antimikrobiell, bestående av höga koncentrationer av hämmande urea och antimikrobiella peptider såsom den mänskliga cathelicidin LL-378. Att undersöka mekanismer som används av både bosatta bakterier och uropatogener för att kolonisera urinvägarna är avgörande för att ytterligare förstå urinvägarnas hälsa och utveckla nya strategier för UTI-behandling. Dessutom, när misslyckandet med främre antimikrobiella terapier blir vanligare, blir det allt viktigare att övervaka spridningen av mobila genetiska element som bär antimikrobiell resistensdeterminanter inom populationer av urinbakterier9,10.
För att undersöka genotyper och fenotyper av urinbakterier är deras framgångsrika kultur och efterföljande helgenomsekvensering (WGS) absolut nödvändigt. Kulturberoende metoder är nödvändiga för att upptäcka och identifiera livskraftiga mikrober i urinprov11. Standard klinisk urinkultur innebär att urine på 5% fårblod agar (BAP) och MacConkey agar och inkubation aerobiskt vid 35 °C för 24 h12. Med en detektionströskel på ≥10 5 CFU/mL13rapporteras dock inte många medlemmar av urinfloran med denna metod. Förbättrade odlingstekniker som enhanced quantitative urine culture (EQUC)11 använder olika kombinationer av olika urinvolymer, inkubationstider, kulturmedier och atmosfäriska förhållanden för att identifiera mikrober som ofta missas av vanlig urinkultur. Beskrivs i detta protokoll är en modifierad version av EQUC, som kallas här Modified Enhanced Urine Culture protokoll, som möjliggör odling av olika urinbakterier och uropathogener med hjälp av selektiva medier och optimala atmosfäriska förhållanden men är inte i sig kvantitativ. Den framgångsrika isoleringen av urinbakterier möjliggör utvinning av genomiskt DNA (gDNA) för nedströms WGS och genommontering.
Genomaggregat, kompletta sammansättningar i synnerhet, möjliggör upptäckt av genetiska faktorer som kan bidra till kolonisering, nischunderhåll och virulens bland både bosatta mikrobiota och uropatiska bakterier. Utkastgenomsammansättningar innehåller ett varierat antal sammanhängande sekvenser (contigs) som kan innehålla sekvenseringsfel och saknar orienteringsinformation. I en komplett genommontering har både orienteringen och noggrannheten hos varje baspar verifierats14. Dessutom ger erhållande av kompletta genomsekvenser insikt i genomstruktur, genetisk mångfald och mobila genetiska element15. Korta läsningar ensam kan identifiera närvaron eller frånvaron av viktiga gener men kanske inte fastställa deras genomiska sammanhang16. Med möjliggörande långläsande sekvenseringsteknik som Oxford Nanopore och PacBio, kräver det inte längre ansträngande metoder som manuell stängning av de novo-sammansättningar av multiplex PCR17,18. Kombinationen av nästa generations kortläsningssekvensering och Nanopore långläsande sekvenseringsteknik möjliggör enkel generering av exakta, kompletta och slutna bakteriegenomaggregat till relativt låga kostnader19. Kortläst sekvensering ger exakta men fragmenterade genomenheter som i allmänhet består av i genomsnitt 40-100 contigs, medan Nanopore sekvensering genererar långa avläsningar på ca 5-100 kb i längd som är mindre exakta men kan fungera som byggnadsställningar för att sammanfoga contigs och lösa genomisk synteni. Hybridmetoder som använder både kortläst och långläsningsteknik kan producera exakta och kompletta bakteriegenom19.
Beskrivs här är ett omfattande protokoll för isolering och identifiering av bakterier från mänsklig urin, genomisk DNA-extraktion, sekvensering och fullständig genommontering med hjälp av en hybridmonteringsmetod. Detta protokoll ger särskild tonvikt på de steg som krävs för att korrekt modifiera avläsningar som genereras av kortläsning och långläsningssekvensering för korrekt montering av en sluten bakteriekromosom och extrakromosomala element som plasmider.
Det omfattande hybrid genom montering protokollet beskrivs här erbjuder en strömlinjeformad strategi för framgångsrik odling av olika urin microbiota och uropathogens, och fullständig montering av deras genom. Framgångsrika WGS av bakteriella genom börjar med isolering av olika och ibland kräsna mikrober för att extrahera deras genomiska DNA. Hittills saknar befintliga urinodlingsprotokoll antingen den nödvändiga känsligheten för att upptäcka många urinarter eller involverar långa och omfattande tillvägagångssätt som kräver längre tid och resurser11. Den modifierade förbättrade urin kultur metoden beskrivs erbjuder ett förenklat men omfattande protokoll för framgångsrik isolering av bakterier som tillhör 17 vanliga urinvägssläkten, inklusive potentiellt patogena eller fördelaktiga commensal arter, och både fakultetsmässiga och obligatoriska aeroba eller anaeroba bakterier. Detta ger i sin tur det nödvändiga utgångsmaterialet för noggrann sekvensering och montering av bakteriella genom och för kritiska fenotypiska experiment, vilket bidrar till förståelsen av urinhälsa och sjukdom. Dessutom ger denna modifierade kulturmetod en mer definierad klinisk diagnos av livskraftiga mikroorganismer som finns i urinprover och möjliggör biobankning för framtida genomiska studier. Detta protokoll är dock inte utan begränsningar. Det kan kräva långa inkubationstider beroende på organismen samt användning av resurser såsom en hypoxikammare eller kontrollerade inkubatorer som kanske inte är lättillgängliga. Användningen av anaeroba GasPaks erbjuder en alternativ lösning, men dessa är kostsamma och producerar inte alltid en hållbar och kontrollerad miljö. Slutligen kan kulturbias och provdiversitet göra det möjligt för vissa organismer och uropatogener att konkurrera ut kräsna bakterier. Trots dessa begränsningar möjliggörs en kultur av olika urinbakterier genom detta tillvägagångssätt.
Genomisk sekvensering har blivit populär med utvecklingen av nästa generations sekvenseringsteknik som oerhört ökade både avkastningen och noggrannheten hos sekvenseringsdata14,15. Tillsammans med utvecklingen av algoritmer för databehandling och de novo-montering är kompletta genomsekvenser till hands för nybörjare och expertforskare både15,45. Kunskap om övergripande genomorganisation som tillhandahålls av kompletta genom erbjuder viktiga evolutionära och biologiska insikter, inklusive genduplicering, genförlust och horisontell genöverföring14. Dessutom är gener som är viktiga för antimikrobiell resistens och virulens ofta lokaliserade på mobila element, som vanligtvis inte löses i utkastgenomaggregat15,16.
Protokollet häri följer en hybridmetod för kombinationen av sekvenseringsdata från kortlästa och långlästa plattformar för att generera kompletta genomenheter. Medan fokus på urinbakteriella genom, detta förfarande kan anpassas till olika bakterier från olika isoleringskällor. Kritiska steg i detta tillvägagångssätt inkluderar att följa adekvat steril teknik och använda lämpliga media och kultur villkor för isolering av rena urinvägsbakterier. Dessutom är extraktion av intakt, högavkastande gDNA avgörande för att generera sekvenseringsdata utan förorenande läsningar som kan hämma monteringsframgång. Efterföljande biblioteksförberedande protokoll är avgörande för generering av kvalitetsläsningar av tillräcklig längd och djup. Därför är det av yttersta vikt att hantera gDNA med omsorg under biblioteksförberedelser för långläsningssekvensering i synnerhet, eftersom denna tekniks största fördel är genereringen av långa läsningar utan teoretisk övre längdgräns. Också skisseras är avsnitt för lämplig kvalitetskontroll (QC) av sekvenseringsläsningar som eliminerar bullriga data och förbättrar monteringsresultatet.
Trots framgångsrik DNA-isolering, biblioteksberedning och sekvensering kan naturen hos genomisk arkitektur hos vissa arter fortfarande utgöra ett hinder för generering av en sluten genommontering45,46. Repetitiva sekvenser komplicerar ofta sammansättningsberäkningen och trots långa läsdata kan dessa regioner lösas med lågt förtroende eller inte alls. Långa läsningar måste därför vara i genomsnitt längre än den största upprepningsregionen i genomet eller täckningen måste vara hög (>100x)19. Vissa genom kan förbli ofullständiga och kräva manuella metoder för slutförande. Hybridmonterade ofullständiga genom består dock vanligtvis av färre contigs än kortlästa utkastgenom. Att justera standardparametrarna för monteringsalgoritmen eller följa strängare bryten för läst QC kan hjälpa. Alternativt är en föreslagen metod att kartlägga långa läsningar till de ofullständiga regionerna på jakt efter bevis för den mest sannolika monteringsvägen och sedan bekräfta sökvägen med PCR och Sanger-sekvensering av den förstärkta regionen. Kartläggning av läsningar med Minimap2 föreslås och Bandage erbjuder ett användbart verktyg för visualisering av mappade läsningar längs monterade contigs som ger bevis för contig linkage47.
En ytterligare utmaning för att generera kompletta genom ligger i förtrogenhet och komfort med kommandoradsverktyg. Många bioinformatiska verktyg är utvecklade för att erbjuda beräkningsmöjligheter för alla användare; Deras användning bygger dock på en förståelse med grunderna i UNIX och programmering. Detta protokoll syftar till att tillhandahålla tillräckligt detaljerade instruktioner för att göra det möjligt för individer utan föregående kommandoradserfarenhet att generera slutna genomsamlingar och kommentera dem.
The authors have nothing to disclose.
Vi tackar Dr. Moutusee Jubaida Islam och Dr. Luke Joyce för deras bidrag till detta protokoll. Vi vill också uppmärksamma University of Texas vid Dallas Genome Center för deras feedback och support. Detta arbete finansierades av Welch Foundation, tilldelningsnummer AT-2030-20200401 till N.J.D., av National Institutes of Health, tilldelningsnummer R01AI116610 till K.P., och av Felecia och John Cain Chair in Women’s Health, som innehas av P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |