Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Hybrid De Novo Genom Assembly til generering af komplette genomer af urinbakterier ved hjælp af kort- og langlæste sekventeringsteknologier

Published: August 20, 2021 doi: 10.3791/62872

Summary

Denne protokol beskriver en omfattende tilgang til dyrkning, sekventering, og de novo hybrid genom samling af urinbakterier. Det giver en reproducerbar procedure for generering af komplette, cirkulære genomsekvenser, der er nyttige til at studere både kromosomale og ekstrakromosomgene genetiske elementer, der bidrager til urinkolonisering, patogenese og antimikrobiel resistensformidling.

Abstract

Komplette genomsekvenser giver værdifulde data til forståelse af genetisk mangfoldighed og unikke koloniseringsfaktorer af urinmikrober. Disse data kan omfatte mobile genetiske elementer, såsom plasmider og ekstrakromosom phage, der bidrager til udbredelsen af antimikrobiel resistens og yderligere komplicere behandling af urinvejsinfektion (UTI). Ud over at give fin opløsning af genomstrukturen giver komplette, lukkede genomer mulighed for detaljerede komparative genomforskninger og evolutionære analyser. Generering af komplette genomer de novo har længe været en udfordrende opgave på grund af begrænsninger af tilgængelig sekventeringsteknologi. Paired-end Next Generation Sekventering (NGS) producerer korte aflæsninger af høj kvalitet, hvilket ofte resulterer i nøjagtige, men fragmenterede genomsamlinger. Tværtimod giver Nanopore sekventering lange aflæsninger af lavere kvalitet, der normalt fører til fejlbehæftede komplette samlinger. Sådanne fejl kan hæmme foreningsundersøgelser for hele genomet eller give vildledende analyseresultater for varianter. Derfor hybrid tilgange kombinerer både korte og lange læser har vist sig som pålidelige metoder til at opnå meget præcise lukkede bakterielle genomer. Rapporteret heri er en omfattende metode til kultur af forskellige urinbakterier, artsidentifikation af 16S rRNA-gensekvensering, ekstraktion af genomisk DNA (gDNA) og generering af henholdsvis korte og lange læsninger af henholdsvis NGS- og Nanopore-platforme. Derudover beskriver denne metode en bioinformatisk pipeline af kvalitetskontrol, samling og genforudsigelsesalgoritmer til generering af kommenterede komplette genomsekvenser. Kombination af bioinformatiske værktøjer gør det muligt at vælge læsedata af høj kvalitet til hybridgenommontering og downstream-analyse. Den strømlinede tilgang til hybrid de novo genomsamlingen, der er beskrevet i denne protokol, kan tilpasses til brug i eventuelle kultter.

Introduction

Urinmikrobiomet er et nyt forskningsområde, der har knust en årtier lang misforståelse om, at urinvejene er sterile hos raske individer. Medlemmer af urinmikrobiota kan tjene til at afbalancere urinmiljøet og forhindre urinvejsinfektion (UTI)1,2. Uropatogene bakterier invaderer urinvejene og anvender forskellige virulensmekanismer til at fortrænge det residente mikrobiota, kolonisere urotelet, undgå immunrespons og modvirkemiljøbelastninger 3,4. Urin er et relativt næringsrigt medium karakteriseret ved høj osmolaritet, begrænset kvælstof- og kulhydrattilgængelighed, lav iltning og lav pH5,6,7. Urin anses også for at være antimikrobiel, der består af høje koncentrationer af hæmmende urinstof og antimikrobielle peptider som den menneskelige cathelicidin LL-378. Undersøgelsesmekanismer, der anvendes af både hjemmehørende bakterier og uropathogener til at kolonisere urinvejene er afgørende for yderligere at forstå urinvejs sundhed og udvikle nye strategier for UTI behandling. Desuden, som svigt af front-line antimikrobielle behandlinger bliver mere almindelige, er det stadig vigtigere at overvåge udbredelsen af mobile genetiske elementer, der bærer antimikrobiel resistens determinanter i populationer af urinbakterier9,10.

At undersøge genotyper og fænotyper af urinbakterier, deres succesfulde kultur og efterfølgende hele genom sekventering (WGS) er bydende nødvendigt. Kulturafhængige metoder er nødvendige for at opdage og identificere levedygtige mikrober i urinprøver11. Standard klinisk urin kultur indebærer plating urin på 5% får blod agar (BAP) og MacConkey agar og inkubation aerobt ved 35 °C for 24 timer12. Men med en detektionstærskel på ≥10 5 CFU/mL13, mange medlemmer af urinmikrobiota er ikke rapporteret af denne metode. Forbedrede dyrkningsteknikker som forbedret kvantitativ urinkultur (EQUC)11 anvender forskellige kombinationer af forskellige urinmængder, inkubationstider, kulturmedier og atmosfæriske forhold for at identificere mikrober, der almindeligvis savnes af standard urinkultur. Beskrevet i denne protokol er en modificeret version af EQUC, der her kaldes Modified Enhanced Urine Culture protocol, der muliggør dyrkning af forskellige urinbakterier og uropatogener ved hjælp af selektive medier og optimale atmosfæriske forhold, men er ikke i sagens natur kvantitativ. Den vellykkede isolering af urinbakterier muliggør udvinding af genomisk DNA (gDNA) til downstream WGS og genomsamling.

Genom forsamlinger, komplette samlinger i særdeleshed, muliggøre opdagelsen af genetiske faktorer, der kan bidrage til kolonisering, niche vedligeholdelse, og virulens blandt både hjemmehørende mikrobiota og uropatogene bakterier. Udkast til genomsamlinger indeholder et varieret antal sammenhængende sekvenser (kontiger), der kan indeholde sekventeringsfejl og manglende orienteringsoplysninger. I en komplet genomsamling er både retningen og nøjagtigheden af hvert basispar blevet verificeret14. Desuden giver opnåelse af komplette genomsekvenser indsigt i genomstruktur, genetisk mangfoldighed og mobile genetiske elementer15. Korte læser alene kan identificere tilstedeværelsen eller fraværet af vigtige gener, men kan ikke lokalisere deres genomiske sammenhæng16. Med muliggør langaflæste sekventering teknologier såsom Oxford Nanopore og PacBio, generere lukkede de novo samlinger af bakterielle genomer ikke længere kræver anstrengende metoder såsom manuel lukning af de novo samlinger af multiplex PCR17,18. Kombinationen af Next Generation kortlæst sekventering og Nanopore langaflæste sekventering teknologier giver mulighed for letkøbt generation af nøjagtige, komplette og lukkede bakterielle genom samlinger med relativt lave omkostninger19. Kortlæst sekventering producerer nøjagtige, men fragmenterede genomsamlinger, der generelt består af et gennemsnit på 40-100 kontiger, mens Nanopore sekventering genererer lange aflæsninger på ca. 5-100 kb i længden, der er mindre nøjagtige, men kan tjene som stilladser til at slutte sig til kontigs og løse genomisk synteny. Hybride tilgange, der anvender både kortlæste og langlæste teknologier, kan producere nøjagtige og komplette bakterielle genomer19.

Beskrevet her er en omfattende protokol for isolering og identifikation af bakterier fra human urin, genomisk DNA-ekstraktion, sekventering, og komplet genom samling ved hjælp af en hybrid samling tilgang. Denne protokol lægger særlig vægt på de nødvendige skridt til korrekt at ændre aflæsninger genereret af kortlæst og langlæst sekventering for nøjagtig samling af et lukket bakteriekromosom og ekstrakromosomelementer som plasmid.

Protocol

Bakterier blev kultiveret fra urin indsamlet fra samtykkende kvinder som en del af institutionelle review board-godkendte undersøgelser 19MR0011 (UTD) og STU 032016-006 (UTSW).

1. Modificeret forbedret urinkultur

BEMÆRK: Alle kulturtrin skal udføres under sterile forhold. Steriliser alle instrumenter, løsninger og medier. Rengør arbejdsområdet med 70% ethanol, opsæt derefter en Bunsen-brænder, og arbejd forsigtigt tæt på flammen for at reducere risikoen for forurening. Alternativt kan et klasse II biosikkerhedskab anvendes til at opretholde et sterilt miljø. Brug passende personlige værnemidler (PPE) for at undgå eksponering for potentielt patogene mikrober.

  1. Plating glycerol-lager urin og koloni isolation
    1. Optø glycerol-lager urin ved stuetemperatur (RT). Når optøet, hvirvler prøven i 5 s til at blande. I sterile mikrocentrifugerør fremstilles 1:3 og 1:30 fortyndinger af urinen i sterile 1x Fosfatbuffered Saline (PBS) til et endeligt volumen på 100 μL.
      BEMÆRK: Glycerol-lagret urin fremstilles ved at blande 500 μL ufortyndet urin og 500 μL på 50 % steril glycerol i kryovialer og opbevares ved -80 °C.
    2. Forvarm agarplader ved 37 °C i 15 min før brug. Se figur 1 for medietyper og kulturforhold, der er egnede til almindelige urinbakterielle slægter. Bland den fortyndede urin godt ved pipetter før plating, plade 100 μL af den fortyndede urin på den ønskede agarplade og fordel prøven ved hjælp af sterile glasperler. Plade 100 μL af 1x PBS fortyndingsmiddel på en separat plade som en no growth control.
      BEMÆRK: Hvis man forsøger at dyrke almindelige uropatogene arter (f.eks. Escherichia coli, Klebsiella spp., Enterococcus fækalis osv.), anbefales det at anvende kromogen agar (Materialetabel), da det gør det let at identificere uropaogene bakteriearter (figur 1). Colistin Nalidixic Acid (CNA) eller MRS agar er nyttige til isolering af kræsne Gram-positive arter (f.eks. Lactobacillus spp.)fra urin, der vides at indeholde Gram-negative uropatogener, som kan udkonkurrere de kræsne arter i ikke-selektive agarer.
    3. Inkuberes pladen vendt i den ønskede atmosfæriske tilstand ved 35 °C i en periode på 24 timer for uropatogener og 3-5 dage for kræsne bakterier (Figur 1).
    4. Efter inkubationsperioden fjernes pladerne fra inkubatoren. Fra hver plade skal du vælge de kolonier, der udviser en unik farve, morfologi eller hæmolytiske mønstre.
    5. Re-streak bakterielle koloni ved hjælp af en steril sløjfe på den tilsvarende agar og inkubere pladen inverteret i 2-5 dage i den ønskede atmosfære for at opnå godt isolerede kolonier.
      BEMÆRK: Hvis du bruger BAP til primær kultur, kan lappekolonier på kromogen agar give nyttige oplysninger om bakteriepopulationens heterogenitet i prøven.
  2. Dyrkning i flydende bouillon og glycerol-strømpe bakterieisolater
    1. Når de isolerede kolonier, der matcher morfologien i moderkolonien, er opnået, skal du vælge en enkelt koloni og pode i 3 mL flydende bouillon ved hjælp af en steril podningsløkke. Henvis til figur 1 for bouillon, der kan understøtte væksten af almindelige mikrobiota slægter i urin urinen. Forsegl agarpladerne med parafilm, og opbevar dem ved 4 °C i 2-4 dage. Inkuber flydende kulturer under de ønskede atmosfæriske forhold i 1-5 dage, indtil kulturen er synligt uklar.
    2. Efter vækst er observeret, hvirvle kulturen, og derefter tilføje 1 mL af natten kultur til 500 μL af sterile 50% glycerol i en 2 mL cryovial; tætning og forsigtigt blandes ved inversion. Forbered to glycerollagre til hver koloni (den ene fungerer som backup) og opbevares ved -80 °C.

2. Identifikation af bakteriearter med 16S rRNA gen Sanger sekventering

BEMÆRK: Mikrobiel identitet kan alternativt bekræftes ved hjælp af Matrix-Assisted Laser Desorption Ionization Time of Flight Mass Spectrometry (MALDI-TOF)20.

  1. Koloni-Polymerase kædereaktion (PCR)
    1. Der fremstilles 25 μL af PCR-reaktionen i PCR-rør ved tilsætning af 12,5 μL 2x Taq Polymerase Master Mix, 0,5 μL på 10 μM 8F primer, 0,5 μL på 10 μM 1492R primer (Materialetabel) og 11,5 μL nucleasefrit vand21.
      BEMÆRK: Hvis du udfører PCR til flere prøver, skal du lave en reaktionsmasterblanding af Taq Polymerase-blanding, primere og sterilt nukleasefrit vand. Derefter aliquot 25 μL i hvert PCR rør.
    2. Hvis du vil udføre kolon-PCR, skal du stryge en velisoleret koloni fra re-streak ved hjælp af en steril tandstikker eller pipettespids. Brug kolonien i PCR-reaktionsblandingen, der blev udarbejdet i trin 2.1.1, resuspend. Bland forsigtigt. Saml væsken i bunden af røret med et hurtigt spin ved 2000 x g.
      BEMÆRK: Sørg for, at prøven er fri for luftbobler. Medtag en NTC-prøve (No-template Control), der indeholder PCR-reaktionsmikset alene.
    3. Prøverørene anbringes i termocyklussen, og kør følgende program: 95 °C i 3 min. 40 cyklusser på: 95 °C for 30 s, 51 °C for 30 s og 72 °C i 1 min 30 s; 72 °C i 10 min; hold ved 10 °C.
  2. Geludvinding og identifikation af arter
    1. Når PCR-kørslen er afsluttet, skal du kontrollere PCR-produktet på en 1% agarosegel, der er fremstillet i 0,5x Tris-Borate-EDTA (TBE) buffer. Før du støber gelen, tilsættes ethidiumbromid (EtBr). Derefter kastes gelen ved hjælp af kamme til brønde, der holder mindst 20 μL prøvevolumen.
      ADVARSEL: EtBr er et interkalerende middel, der mistænkes for at være kræftfremkaldende. Brug altid handsker og værnemidler, når du håndterer det, og kassér materialer, der indeholder EtBr i henhold til institutionens retningslinjer.
    2. Når gelen er indstillet, skal gelen placeres i elektroforesetanken fyldt med 0,5x TBE-buffer og fjerne kammen. Læg 1 kb stigen i den første brønd og 10-20 μL af PCR-reaktionen i efterfølgende brønde. Kør ved 100-140 V, indtil det er løst. Visualiser gelen under UV-lys og bekræft tilstedeværelsen af et klart defineret bånd ved ~ 1,5 kb, der er fraværende i NTC-brønden.
      FORSIGTIG: UV-stråler er skadelige for hud og øjne, brug en passende vagt, når du visualiserer gelen og bærer passende PPE.
      BEMÆRK: Colony PCR kan være forgæves for nogle bakterier; fortsætte med PCR fra isolerede gDNA er en alternativ mulighed22.
    3. Punktafgifter ~ 1,5 kb bånd ved hjælp af en barbermaskine og overføre gel stiklinger i rene mikrocentrifuge rør. Fortsæt med geludvindingsprotokollen i henhold til producentens anvisninger (Materialetabel). Mål koncentrationen af det rensede DNA med mikrovolumspektrofotometer.
      BEMÆRK: En koncentration >10 ng/μL er ønskelig, og A260/280 mellem 1,7-2,0 er acceptabel.
    4. Forbered to Sanger sekventering reaktioner for hver prøve, den ene ved hjælp af 8F og den anden ved hjælp af 1492R primer i nuclease-fri vand i henhold til retningslinjerne for enhver valgt Sanger sekventering service.
    5. Når sekventering data er modtaget, uploade DNA-sekvenser til NCBI Basic Local Alignment Search Tool (BLAST) hjemmeside (blast.ncbi.nlm.nih.gov/Blast.cgi), skal du vælge Nukleotid BLAST (blastn), skal du vælge rRNA / ITS database 16S ribosomale RNA sekvenser (Bakterier og Archaea), og køre Megablast program. Isolaten kan identificeres ved, at den højeste kvalitet rammes af en reference fra databasen.
      BEMÆRK: Nogle bakteriearter udviser høj identitet i deres 16S rRNA-sekvenser og kan ikke skelnes alene ved denne metode. Speciation vil kræve DNA-homologi og biokemiske analyser til trygt at skelne medlemmer af samme slægt23.

3. Udvinding af genomisk DNA (gDNA)

BEMÆRK: Dette afsnit anvender reagenser og spin-kolonner, der leveres i gDNA-ekstraktionssættet, der henvises til i materialetabellen til højtydende ekstraktion af genomisk DNA af høj kvalitet fra forskellige bakteriearter. Nedenfor er anbefalede ændringer og instruktioner.

  1. Forbered kit reagenser pr producentens anvisninger.
  2. Forbered 3-10 mL-kulturer i passende steril bouillon (Figur 1) ved at pode bakterier fra velisolerede kolonier i medierne og inkubere ved den temperatur og atmosfæriske tryk, der er angivet i figur 1, indtil der observeres tilstrækkelig vækst.
  3. Efter inkubation måles den optiske tæthed ved 600 nm (OD600)af kulturen ved hjælp af et spektrofotometer24.
    1. Forbered prøven til kvantificering ved at udvande natten kulturer i 1:10 forhold. Medtag også et tom af de sterile kulturmedier til måling. Den optiske massefylde beregnes ved at trække den tomme aflæsning fra prøveaflæsningen og multiplicere med fortyndingsfaktoren på ti.
  4. Ved hjælp af OD600-målingen og et på forhånd fastlagt OD600 til CFU/mL-forhold for arten beregnes det, hvor mange milliliter kultur der er nødvendige for at opnå 2 x 109 celler.
  5. Centrifuge den nødvendige kultur volumen i 5 min ved 5000 x g til pellet. Aspirere supernatant og genbruge pellet i 200 μL kold TE buffer (pre-chill på is i begyndelsen af proceduren).
  6. Centrifuge prøven i 2 min ved 5000 x g. Fjern supernatanten, og lad derefter pelleten genbruges i 180 μL enzymatisk lysisbuffer (ELB), og der tilsættes 20 μL forkogt RNase A (10 mg/mL). For effektive lysis af Gram-positive bakterier tilsættes 18 μL mutanolysin (25 kU/mL). Vortex godt, og derefter inkubere prøverne ved 37 °C på rotator i 2 timer.
    BEMÆRK: Det anbefales at udnytte elb beskrevet i producentens protokol for både Gram-positive og Gram-negative bakterier.
  7. Fortsæt i overensstemmelse med producentens anvisninger.
    BEMÆRK: Gentag elutionstrinnene en eller to gange mere for at opnå ekstra gDNA-udbytte, hvis det ønskes.
  8. Vurdere kvaliteten af udvundet gDNA som anvist i afsnit 4 og opbevar gDNA ved 4 °C, hvis det vil blive brugt inden for 1 uge. Alternativt kan du holde gDNA ved -20 °C til langtidsopbevaring.

4. Vurdering af kvaliteten af udvundet gDNA

  1. For at vurdere kvaliteten ved gelelektroforese fremstilles 1% agarosegel som beskrevet i underafsnit 2.2. Prøven forberedes i et rent rør: Bland 1-2 μL ekstraheret gDNA og 3 μL 2x læssefarve på parafilm. Kør gelen, når den er indlæst, og visualiser den derefter under UV-lys.
    BEMÆRK: Vellykket gDNA-udvinding vil være tydelig ved et diskret bånd øverst på gelen og minimal udtværing (Figur 2A). Udtværing er tegn på klipning. Hvis der ikke er noget gDNA-bånd, og/eller udtværing er væsentligt, gentages gDNA-ekstraktionen. Overvej at reducere inkubationstiderne i RNase A og Proteinase K. Hvis der observeres to bånd omkring 1,5-3 kb, tyder dette på RNA-forurening (Figur 2B). Forbered frisk RNase A og gentag ekstraktion.
  2. For at vurdere kvaliteten ved mikrovolum spektrofotometer, måle gDNA koncentration og absorbans forhold A260/280 ved mikrovolum spektrofotometer. Koncentrationer >50 ng/μL og A260/280 mellem 1,7-2,0 er acceptable.
    BEMÆRK: Lavt gDNA-udbytte kan skyldes lav indførsel, høj tilførsel, forurening af nukleaser, utilstrækkelig lysis. Absorbansforhold over intervallet indikerer RNA-forurening. Gentag ekstraktionen, hvis gDNA-kvaliteten er dårlig.
  3. For at vurdere kvaliteten ved fluorometer skal du følge fabrikantens anvisninger for at kvantificere gDNA-koncentrationen ved hjælp af analysesæt med høj følsomhed og fluorometerinstrument (Materialetabel). Koncentration >50 ng/μL er ønskelig.

5. Parret-end næste generation kortlæst sekventering og bibliotek forberedelse

BEMÆRK: Kortlæst rækkefølge kan udføres på forskellige instrumenter med forskellige læselængder og retninger. 150 bp (300 cyklus) parring-end sekventering anbefales til bakteriel WGS. Både biblioteksforberedelse og sekventering kan outsources til kernefaciliteter eller kommercielle laboratorier.

  1. Forbered sekventeringsbibliotek i overensstemmelse med producentens anvisninger (Materialetabel). Følg producentens anbefalede koncentration af det endelige indlæsningsbibliotek. En anbefalet ændring er dog at indlæse det poolede bibliotek på 1,8 pM for optimal læsegenerering på NextSeq-instrumenter.
  2. Selvom det er valgfrit, skal du bruge en Bioanalyzer (Tabel over materialer) til at vurdere den samlede biblioteksfragmenteringsfordeling og sikre, at fragmentstørrelsen i gennemsnit er 600 bp.

6. Nanopore MinION sekventering bibliotek forberedelse

  1. Forbered sekventeringsbiblioteket i henhold til producentens protokol (Materialetabel). Brug af to stregkodeudvidelsessæt giver mulighed for multiplexing af op til 24 prøver på en enkelt flowcelle. Det anbefales at udføre biblioteksforberedelse i to dele, 12 prøver ad gangen, hvor 24 prøver multiplexes. Alle 24 prøver kan samles som beskrevet nedenfor.
    BEMÆRK: Prøver kan opbevares ved 4 °C natten over, når native stregkode ligation er færdig - dette giver et stoppunkt i protokollen, hvis det er nødvendigt. I slutningen af den oprindelige stregkodesektion i bibliotekets forberedelsesprotokol anbefales det at samle tilsvarende mængder af hver prøve op til den maksimale DNA-masse (ng) muligt.
    1. For at gøre dette skal du kvantificere alle prøverne efter stregkode ligation ved hjælp af et fluorometer (Tabel over materialer) pr. fabrikantens anvisninger. Vurder prøvens volumen med den laveste dsDNA-koncentration, og beregn derefter det samlede dsDNA, der findes i denne stikprøve. Brug dette tal til at bestemme de tilsvarende mængder af alle de andre prøver, der samles.
      BEMÆRK: Da equimolarberegningen maksimerer mængden af samlet dsDNA og dermed giver en storvolumenpulje (>65 μL), er oprydning nødvendig for at koncentrere puljen.
  2. dsDNA pool oprydning og koncentration
    1. Tilsæt 2,5x volumen af paramagnetiske perler (Tabel over materialer) til DNA-puljen, og derefter forsigtigt svirp røret for at blande indholdet. Placer røret i rotatoren i 5 min ved RT. Drej prøven ned ved 2000 x g og pellet på en magnet.
    2. Tilsæt 250 μL frisklavet 70% ethanol (i nucleasefrit vand), idet der ikke forstyrres pelleten. Aspirere ethanol og gentage ethanol vask én gang.
    3. Efter den anden aspiration, drej ned prøven på 2000 x g og placere den tilbage på magneten. Pipette enhver rest ethanol og lad prøven tørre i ca 30 s.
    4. Røret fjernes fra magneten, og lad feltet genbruges i 60-70 μL kernefrit vand. Inkuber på RT i 2 min. Pille prøven på magneten, indtil elute er klar, og derefter fjerne elute og overføre til en ren 1,5 mL mikrocentrifuge rør.
    5. Kvantificer den koncentrerede pulje ved hjælp af et fluorometer, og forbered derefter en aliquot for at gå videre til adapter ligation trin: forberede 700 ng af prøven i 65 μL sidste volumen. Behold resten af puljen ved 4 °C i et andet løb, der skal fuldføres, når den første kørsel er afsluttet.
    6. Fortsæt med adapter ligation som anvist af fabrikanten og læg prøven på flowcellen. Start rækkefølgen.
      BEMÆRK: Aspiratluft og ~200 μL lagerbuffer fra flowcellens primingport før prøvebelastning. Dette er afgørende for den vellykkede flowcelle priming og prøvebelastning. Brug en p1000 pipette og tips, når du tegner og deponerer opløsninger gennem strømningscellens primingport.
  3. Sekvens biblioteket i henhold til producentens anvisninger.
    1. Åbn driftssoftwaren til rækkefølge, og klik på Start. Indtast et navn til eksperimentet, en anbefalet nomenklatur omfatter kørselsdato og brugerens navn. Klik på Fortsæt med at sætte markering, vælg det relevante bibliotek prep kit og stregkode ekspansion pack (r) bruges, og klik derefter på Fortsæt med at køre indstillinger.
    2. Juster kørelængden til 48 timer, hvis du planlægger at forberede tilstrækkeligt bibliotek til en anden kørsel (ellers forlade som standard 72 timer). Klik på Fortsæt med at Basecalling.
    3. Kontroller indstillingen Config: Fast Basecalling, og sørg for, at Stregkode er angivet til Aktiveret, så output FASTQ-filer beskæres af stregkodesekvenserne og demultiplexed i separate mapper baseret på stregkode. Klik på Fortsæt for at udskrive.
    4. Vælg, hvor outputsekvenseringsdata skal gemmes. Forvent ca. 30-50 Gb data, hvis der kun gemmes FASTQ-output, og > 500 Gb data, hvis der også gemmes FAST5-output. Fjern markeringen i feltet Filtrering Qscore: 7 | Læs også: Ufiltreret, hvis du planlægger at fortsætte med filtrering beskrevet i afsnit 7.2, ellers lad den være markeret, og juster Læslength til 200.
    5. Klik på Fortsæt for at køre installationsprogrammet, og gennemse alle indstillingerne. Hvis indstillingerne er korrekte, skal du klikke på Start, ellers klikke på Tilbage og foretage de nødvendige justeringer.
    6. Hvis det ønskes, kan flowcellen vaskes efter producentens anvisninger og genindlæses med den resterende pulje. Gentag trinnene i 6.2 for den resterende pulje, når den første kørsel er fuldført, og flowcellen er blevet vasket.
      BEMÆRK: Når du indstiller den anden kørsel, skal du justere Bias-spændingen til -250 mV pr. producentens anbefalinger til flowceller, der tidligere blev brugt i kørsler over 48 timer.

7. Vurdering og forberedelse af læser

BEMÆRK: En anbefalet mappestruktur er afbildet i figur 4. Opret mapperne i skrivebordet, nemlig Long_Reads, Short_Reads og Trimmed_Reads, før du fortsætter med beregningstrinnene nedenfor.

  1. Korte læser (Figur 3)
    BEMÆRK: Korte læsninger genereres i FASTQ-format. Filerne indeholder 4000 maksimale aflæsninger pr FASTQ. Disse er ofte zippet (.gz arkiv) og organiseret i flere filer. Afhængigt af platformen trimmes stregkoder typisk. Nogle programmer accepterer filer i zip-format, andre kan kræve deres udvinding før import. Læserne skal bestå kvalitetskontroltrin (QC) for at sikre datanøjagtighed under genomassemblyen. Hvis CLC Genomics Workbench ikke er tilgængelig, kan alternative programmer bruges til at trimme og QC korte læser såsom Trimmomatic25 eller Trim Galore (https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/) til trimning og FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) til evaluering af læsekvalitet. Gennemsnitlig kort læsedækning, anslået ved at multiplicere antallet af aflæsninger med gennemsnitlig læselængde og dividere med genomstørrelsen, anbefales at være >100x.
    1. Åbn Genomforskning Workbench software (Tabel over materialer) og importere alle parrede-end kortlæste FASTQ filer. Parrede filer genereres automatisk.
      1. Opret en ny mappe under CLC_Data ved at klikke på Den Nye øverst på værktøjslinjen og vælge Mappe... for at gemme filerne. Navngiv mappen efter ønske, en anbefalet konvention bruger eksempel-id'et. Gem alt outputtet fra følgende trin i denne mappe.
      2. Klik på knappen Importer på den øverste værktøjslinje, og vælg Illumina... Gå til og vælg alle kortlæste filer, der svarer til eksemplet. Kontroller, at indstillingen for parrede læser er markeret, og fjern markeringen af indstillingen Fjern mislykkede læsninger. Klik på Næste, vælg Gem, og klik på Næste igen. Vælg at gemme de importerede filer i den nye mappe, der blev oprettet i forrige trin, og klik på Udfør.
    2. Opret en sekvensliste over alle parrede filer til isolaten. Dette vil sammenkæde læsedata i en enkelt fil for enkelhed i analysen.
      1. Klik på knappen Ny på den øverste værktøjslinje, og vælg Sekvensliste... Vælg de filer, der skal sammenkædes, på mappelisten til venstre, og brug pilene til at flytte dem til listen over markerede filer til højre. Klik på Næste, vælg Gem, og klik på Næste igen. Vælg at gemme sekvenslisten, og klik på Udfør.
      2. Når sekvenslisten er genereret, skal du straks omdøbe den med eksempel-id'et.
    3. Kør værktøjet QC til sekventering af læser på sekvenslisten: Denne procedure vurderer de overordnede kvalitetsparametre for de aflæsninger, der genereres af kortlæste NGS.
      1. Søg efter værktøjet QC til sekvensering af læser i værktøjskassemenuen (nederste venstre vindue). Dobbeltklik på værktøjet, og vælg derefter den sekvensliste, der skal analyseres, og klik på Næste.
      2. Kontroller, at alle outputindstillinger er markeret, og vælg Gem under Resultathåndtering. Klik på Næste, og angiv for at gemme outputfilerne, og klik derefter på Udfør.
    4. Kør værktøjet Trim Reads på sekvenslisten: Trimning udføres ud fra kvalitet, længde og tvetydighed. Denne proces forudsætter, at de stregkoder, der bruges til rækkefølge, er blevet trimmet før dette trin.
      1. Søg efter værktøjet Trim Reads i værktøjskassen (nederste venstre vindue). Dobbeltklik på Trim Reads , og vælg derefter den sekvensliste, der skal analyseres,og klik på Næste.
      2. Kvalitetstrimning: Sæt kvalitetsscoregrænsen til 0,01 og lad tvetydige nukleotider være på 2. Klik på Næste.
        BEMÆRK: Parametre kan justeres efter brugerens skøn; Dette er de anbefalede indstillinger.
      3. Fjern markeringen i automatisk trimning af læsekort (gør det kun, hvis adapterne er blevet trimmet fra læserne før import til CLC). Klik på Næste og tjek Slet læser under længde, brug standard 15.
      4. Klik på Næste, markér Opret rapport, og vælg derefter Gem. Klik på Næste, og angiv, hvor outputfilerne skal gemmes. Klik på Udfør.
    5. Eksporter den trimmede sekvensliste: Efterfølgende hybridmontering og -analyse vil blive afsluttet uden for CLC og kræver, at trimmede kortlæste filer eksporteres.
      1. Vælg den trimmede fil, der blev genereret i trin 7.1.4, i mappenavigationen øverst til venstre, og klik derefter på Eksporter øverst på værktøjslinjen. Vælg Fastq for eksportfiltypen , og klik på Næste. Kontroller eksporter parret sekvensliste til to filer. Klik derefter på Næste, og vælg den Trimmed_Reads mappe, filerne skal eksporteres til. Klik på Udfør. Kontroller, at de trimmede kortlæste filer blev eksporteret som to filer (R1 og R2) med filtypenavnet .fastq.
        BEMÆRK: Den trimmede sekvensliste skal eksporteres til to filer, der typisk er angivet af CLC som R1 og R2. Dette er afgørende, da downstream hybridassembly kræver, at der som sådan konfigureres kortlæste datainput.
      2. Omdøb de eksporterede filer, skal du afstå fra brugen af mellemrum og specialtegn i filnavne. For nemheds skyld er et anbefalet format trimmed_short_file. R1.fastq.
  2. Lang (MinION) lyder (Figur 3)
    BEMÆRK: Følgende pipeline til forberedelse af Long (MinION) sekventering læser for hybrid samling udnytter NanoFilt og Nanostat programmer26 udført af kommandolinjen. Installer værktøjerne, før du fortsætter, og vær fortrolig med det grundlæggende i UNIX for at udføre disse kommandoer. Standardterminaler og Bash Shell anbefales. En lektion guide til fælles terminal kommandoer og brug findes på Software Tømrerarbejde27. Instruktionerne nedenfor forudsætter, at de genererede filer vil blive navngivet med stregkode nomenklaturen (NB01, NB02, osv.) og gemmes i Long_Reads mappe. Du kan også udføre læsefiltrering ved hjælp af MinKNOW, når rækkefølgen konfigureres. Gennemsnitlig lang læsedækning anbefales at være >100x. Anbefalet gennemsnitlig læselængde er >2000 bp; Derfor er antallet af lange læsninger, der er behov for, lavere end antallet af korte læsninger.
    1. Opret nye mapper for hver stregkode, der bruges i kørslen (stregkode01, stregkode02 osv.) i Long_Reads mappe (Figur 4). Kopier alle de .fastq-filer, der svarer til hver stregkode, til den relevante mappe. Kombiner alle .fastq-filer for hver stregkode fra hver kørsel.
    2. Åbn Terminal, og naviger til stregkodemapperne i mappen Long_Reads ved hjælp af cd-kommandoen: cd Desktop/Long_Reads/barcode01
    3. Sammenkæde alle .fastq-filer pr. stregkode til en enkelt .fastq-fil ved at udføre følgende kommando: kat *.fastq > NB01.fastq
      BEMÆRK: Denne kommando kombinerer alle læserne fra hver af FASTQ-filerne i en stor, enkelt FASTQ ved navn NB01.fastq.
    4. Brug NanoStat til at vurdere prøvens læsekvalitet ved at udføre følgende kommando: NanoStat --fastq NB01.fastq
    5. Registrer resultaterne ved at kopiere outputtet til en tekst eller Word-fil til fremtidig reference.
    6. Brug NanoFilt til at filtrere MinION læser kassere læser med Q < 7 og længde < 200 ved at udføre kommandoen: NanoFilt -q 7 -l 200 bp NB01.fastq | gzip > NB01 _trimmed.fastq.gz
    7. Kør NanoStat på den trimmede fil, der blev genereret i trin 7.2.6 ved at udføre kommandoen: NanoStat --fastq NB01 _trimmed.fastq.gz
    8. Registrer resultaterne ved at kopiere outputtet til en tekst- eller Word-fil, og sammenlign med resultaterne fra trin 7.2.4 for at sikre, at filtreringen lykkedes (tabel 1).
    9. Gentag trin 7.2.2 til 7.2.8 for hver stregkode, der bruges i rækkefølgen.
      BEMÆRK: Den NB01_trimmed.fastq.gz fil, der blev genereret i trin 7.2.6, bruges til hybridmontering.

8. Generering af hybridgenomsamling

BEMÆRK: Følgende montagepipeline anvender Unicycler19,28,29,30 til at kombinere korte og lange aflæsninger, der er udarbejdet i afsnit 7.1 og 7.2 ( figur3). Installer Unicycler og dens afhængigheder, og udfør kommandoerne nedenfor. Kortlæste filer, der eksporteres i trin 7.1.5, antages at hedde trimmed_short_file. R1.fastq og trimmed_short_file. R2.fastq for enkelhed.

  1. Organiser de kortlæste filer og længe læste filer i en enkelt mappe med navnet Trimmed_Reads. Mappen skal indeholde følgende:
    1. En .fastq.gz fil til trimmede lange læsninger (genereret i trin 7.2.6).
    2. To .fastq-filer (R1 og R2) til trimmede korte læsninger (genereret i trin 7.1.5).
  2. Gå til den mappe, Trimmed_Reads, der gemmer læsefilerne ved hjælp af cd-kommandoen i Terminal: cd Desktop/Trimmed_Reads
    1. Når du er i den rigtige mappe, skal du zip de to kortlæste filer, så de også er i .fastq.gz-format ved at udføre følgende kommando: gzip trimmed_short_file. R1.fastq
  3. Gentag trin 8.2 for både R1 og R2. Kontroller, at alle læsefilerne nu er i .fastq.gz-format, og kontroller, at alle filerne svarer til den samme isolere.
  4. Start hybridassemblyen ved hjælp af Unicycler ved at køre følgende kommando:
    unicycler -1 trimmed_short_file. R1.fastq.gz -2 trimmed_short_file. R2.fastq.gz -l NB01 _trimmed.fastq.gz -o unicycler_output_directory
    BEMÆRK: -o angiver den mappe, hvor Unicycler-outputtet gemmes, opretter Unicycler denne mappe, når kommandoen er udført. ikke generere mappen på forhånd. Køretiden varierer efter beregningskraften på den anvendte computer samt genomstørrelsen og antallet af læsninger. Dette kan tage alt fra 4 timer til 1 eller 2 dage. Denne protokol blev udført på en CentOS Linux 7-maskine med 250 Gb RAM, Intel Xeon (R) CPU med 2,5 GHz 12 praktiske kerner og 48 virtuelle kerner. Alternativt kan pc'er med 16 GB RAM og 2,6 GHz 6-kerneprocessorer beregne disse assemblies på længere behandlingstid.
  5. Når kørslen er fuldført, skal du gennemse unicycler.log-filen for at sikre, at der ikke opstår fejl - registrer antallet, størrelsen og statussen (fuldført, ufuldstændig) for de genererede konns.
    1. Hvis der identificeres ufuldstændige kontiger (angivet som ufuldstændige i Unicycler-logfilen), skal du køre Unicycler igen med fed skrift ved at føje følgende flag til kommandoen i trin 8.4: --mode fed.
      BEMÆRK: Fed tilstand sænker den kvalitetstærskel, der accepteres for langlæste broer under assemblyen. Dette kan give en komplet samling, men montagekvaliteten kan blive formindsket. Det anbefales kun at bruge fed tilstand, når det er nødvendigt, og som foreløbige beviser for, at contig-sammenføjning senere bekræftes af PCR.

9. Vurdering af montagekvaliteten

BEMÆRK: Følgende protokol bruger Bandage31 og QUAST32, to programmer, der skal konfigureres før brug (Figur 2 og Figur 4). Bandage kræver ikke installation, når den er hentet, og QUAST kræver kendskab til grundlæggende brug af kommandolinjen. Det anbefales også at vurdere genom fuldstændighed ved hjælp af Benchmarking Universal Single-Copy Orthologs (BUSCO)33.

  1. Bandage: Klik på fil. Vælg derefter Indlæs graf, og vælg den assembly.gfa-fil, der blev gemt for at unicycler_output_directory genereret af Unicycler i trin 8.4. Når den er indlæst, skal du klikke på knappen Tegn graf på venstre værktøjslinje og se på, hvordan kontigerne (kaldet noder) er tilsluttet og organiseret for at vurdere, om assemblyen er fuldført (Figur 5).
    BEMÆRK: Komplette samlinger repræsenteres af enkelte cirkulære snørkler, der er sammenkædet i begge ender (Figur 5A, B). Ufuldstændige assemblies har flere sammenhængende enheder eller er lineære (Figur 5C). Små lineære spor er muligvis ikke ufuldstændige, da de kan indikere lineære ekstrakromosomelementer. Dækning, også kaldet dybde, vil blive noteret i bandage og repræsenterer den relative overflod af contigs til kromosomet, normaliseret i Unicycler til 1x.
  2. QUAST
    1. Gå til den mappe, hvor outputtet Unicycler gemmes ved hjælp af cd-kommandoen: cd Desktop/Trimmed_Reads/unicycler_output_directory
      BEMÆRK: Mellemrum er ikke tilladt på stien til, hvor samlingen er placeret, dvs. Du kan også kopiere filen assembly.fasta til skrivebordet, så du har nem adgang.
    2. Kør QUAST ved at udføre følgende kommando: quast assembly.fasta -o quast_output_directory
    3. Gennemse de rapporter, der er genereret af QUAST i outputmappen quast_output_directory.

10. Genomanmærkning

BEMÆRK: Nedenstående anmærkningspipeline bruger Prokka34, et kommandolinjeværktøj, der skal installeres før brug. Alternativt kan du bruge Prokka via den automatiserede GUI K-Base (Tabel over materialer) eller anmærke genomer via webserveren RAST35. Hvis genomer deponeres i NCBI, kommenteres de automatisk ved hjælp af Prokaryotic Genome Annotation Pipeline (PGAP)36.

  1. Naviger i Terminalen til den mappe, hvor Outputtet i Unicycler gemmer ved hjælp af cd-kommandoen (se trin 9.2.1). Kør derefter Prokka ved at udføre følgende kommando: prokka --præfiks sample_ID --outdir prokka_output_directory assembly.fasta
    BEMÆRK: --præfikset navngiver alle outputfiler baseret på den angivne sample_ID. --outdir opretter en outputmappe med det angivne navn, hvor alle Prokka-outputfiler gemmes; opret ikke en outputmappe til Prokka på forhånd.
  2. Gennemse anmærkningerne ved at åbne tabellen .tsv og/eller ved at overføre den .gff-fil, der er genereret, til en sekvensanalysesoftware for at visualisere og analysere anmærkningerne (Figur 6).
  3. Specifikke typer anmærkninger kan genereres afhængigt af genetiske faktorer af interesse. Det anbefales at starte med de brugervenlige værktøjer på Center for Genomisk Epidemiologi (www.genomicepidemiology.org/) webserver til foreløbig analyse37,38,39,40,41. Yderligere værktøjer til påvisning af CRISPR-cas-systemer og prophage er tilgængelige (Figur 3)42,43.

11. Foreslået praksis for data demokratisering

  1. Når det er muligt, skal du deponere alle de rå læsedata samt samlede genomer i et offentligt lager som NCBI Sequence Read Archive (SRA) og Genbank. Genomer kommenteres automatisk via PGAP-rørledningen under NCBI-aflejringsprocessen.

Representative Results

Denne protokol er optimeret til kultur og sekventering af urinbakterier, der tilhører de slægter, der er anført i figur 1. Ikke alle urinbakterier kan kult med denne metode. Kulturmedier og -betingelser er specificeret af slægten i figur 1. Eksemplariske gelelektroforesevurderinger af gDNA-integritet er afbildet i figur 2. En oversigt over bioinformatikrørledningen til sekventering af læsebehandling, genomassembly og anmærkning er beskrevet i figur 3. Der findes en vejledning i beregningsmappestruktur i figur 4 for både at forenkle protokolforståelsen og skabe rammer for en vellykket organisation. Desuden indgår er repræsentative komplette genomer af to Klebsiella spp., K. pneumoniae og K. oxytoca, der blev genereret af denne protokol. En repræsentation af disse forsamlinger findes i figur 5 og indeholder også et yderligere ufuldstændigt eksempel K. pneumoniae genom. En detaljeret oversigt over hvert fuldt kommenteret komplet genom er vist i figur 6. Endelig findes der et resumé af sekventeringslæsningsstatistikkerne i tabel 1 for at give en bred forståelse af rådata og trimmede data, der er tilstrækkelige til generering af lukkede genomsamlinger af høj kvalitet. Derudover udfylder nøgleparametrene for de to repræsentative Klebsiella spp. genomer er angivet. Genomer og rådata blev deponeret i Genbank under BioProject PRJNA683049.

Figure 1
Figur 1: Modificeret forbedret urinkultur af forskellige uringener. Diagram for agar og flydende bouillon, der kan bruges til at dyrke forskellige urin slægter. Alle dyrkninger foreslås udført ved 35 °C som beskrevet i underafsnit 1.1. Cirkler repræsenterer medier, der er egnede til dyrkning af en bestemt slægt, farver blev vilkårligt valgt for at skelne en medietype fra en anden. CDC-AN BAP (rød), CDC Anaerobe Får Blood Agar; 5% Får-BAP (orange), Får Blood Agar; BHI (grøn), Hjernehjerte infusion; TSB (gul), Tryptic Soja Bouillon; ChroMagar Orientering (blå). enGardnerella vaginalis bør dyrkes på HBT Bilayer G. vaginalis Selektiv agar i mikroaerophilic atmosfære og under særlige bouillon kultur krav44. bLactobacillus iners bør dyrkes på 5% Kanin-BAP plader og NYCIII bouillon i mikroaerophilic atmosfære. cLactobacillus spp. kan dyrkes på MRS under mikroaerfile forhold. Klik her for at se en større version af dette tal.

Figure 2
Figur 2: Genomisk DNA-ekstraktion agarose gel billeder. Repræsentative gelbilleder, der skildrer gDNA-udvindingsresultater. (A) Lane 1: 1 kb stige, Lane 2: intakt gDNA repræsenterer vellykket udvinding, Lane 3: udtværing angiver fragmenteret gDNA. (B) Vognbane 1: 1 kb stige, Vognbane 2 &3: rRNA forurening betegnet med to bånd mellem 1,5 kb og 3 kb. Klik her for at se en større version af dette tal.

Figure 3
Figur 3: Arbejdsgang for hybridgenomassembly. Skema over trin fra læsekvalitetskontrol og forudbehandling til assemblyanmærkning. Læs trimning fjerner tvetydige og aflæsse af lav kvalitet. Q-score- og længdeparametre er angivet og repræsenterer de læsninger, der bevares. Assembly bruger både korte og lange læser til at generere en hybrid de novo genom samling. Montagekvalitet evalueres ud fra fuldstændighed og korrekthed ved hjælp af angivne værktøjer og parametre. Den endelige genomsamling kommenteres for alle gener og specifik loci af interesse. Klik her for at se en større version af dette tal.

Figure 4
Figur 4: Vejledning ibiblioteksstruktur for bioinformatik. Et skema over anbefalet mappe- og filorganisation til behandling af korte og lange læsninger, hybridassembly og genomanmærkning og QC. Vigtige kommandolinjedatabehandlingstrin fremhæves ud for tilsvarende filer og mapper. Fremkalde kommandoer og flag (fed), inputfiler (blå), outputfiler eller mapper (rød), brugerinput, f.eks. Klik her for at se en større version af dette tal.

Figure 5
Figur 5: Genomsamlingsgrafer af Bandage. Repræsentativt komplet genomsamlingsgrafer af (A) Klebsiella oxytoca KoPF10 og (B) Klebsiella pneumoniae KpPF25 og ufuldstændig genomsamling af (C) Klebsiella pneumoniae KpPF46. Det komplette genom af KoPF10 demonstrerer et enkelt lukket kromosom, og kpPF25's komplette genom består af et lukket kromosom og fem lukkede plasmider. KpPF46's ufuldstændige kromosom består af to indbyrdes forbundne sammenhængende sammenhængende. Unicycler hybrid de novo assembly genererer en samlingsgraf, der visualiseres af Bandage. Samlingsgrafen indeholder et forenklet skema over genomet, der angiver lukket kromosom eller plasmider af en linker, der forbinder to ender af en enkelt kontig. Tilstedeværelsen af mere end ét sammenkoblet sammenhængende antal angiver ufuldstændig samling. Contig størrelse og dybde kan bemærkes i Bandage så godt. Klik her for at se en større version af dette tal.

Figure 6
Figur 6: Komplette genomkort over kommenterede hybridsamlinger. Assemblykort genereret af Geneious Prime for det komplette genom af (A) K. oxytoca KoPF10 og (B) K. pneumoniae KpPF25, der viser kommenterede gener betegnet med farvede pile langs plasmid rygraden. Kromosomer viser kun rRNA og tRNA gener for enkelhed. Genomanmærkninger blev udført ved hjælp af Prokka som angivet i afsnit 10 i denne protokol. Klik her for at se en større version af dette tal.

Table 1
Tabel 1: Repræsentant Klebsiella spp. Assemblyparametre for K. oxytoca-stammen KoPF10 og K. pneumoniae stamme KpPF25. Tiltrædelsesnumre for de deponerede data om NCBI leveres. Antallet af aflæsninger både før og efter trimning er angivet for begge sekventeringsteknologier. N50 er kun til rådighed for lange læser, da korte læser er af en kontrolleret længde. Plasmid replicon forudsagt ved hjælp af PlasmidFinder v2.1 Enteroebacteriaceae database med parametre indstillet til 80% identitet og 60% længde. en MLST, Multilocus-sekvenstype. b CDS, kodningssekvenser. c Plasmid replicon forudsagt ved hjælp af PlasmidFinder v2.1 Enterobacteriaceae database med parametre indstillet til 80% identitet og 60% længde. d Oxford Nanopore Technologies (ONT) deponerede læsedata. e Illumina deponerede læsedata. Klik her for at downloade denne tabel.

Discussion

Den omfattende hybrid genom samling protokol beskrevet her tilbyder en strømlinet tilgang til en vellykket dyrkning af forskellige urinmikrobiota og uropathogener, og den komplette samling af deres genomer. Vellykket WGS af bakterielle genomer begynder med isolering af forskellige og til tider kræsne mikrober for at udtrække deres genomiske DNA. Til dato mangler eksisterende urinkulturprotokoller enten den nødvendige følsomhed til at opdage mange urinarter eller involverer langvarige og omfattende tilgange, der kræver forlænget tid og ressourcer11. Den beskrevne metode for modificeret forbedret urinkultur tilbyder en forenklet, men omfattende protokol for vellykket isolering af bakterier, der tilhører 17 almindelige uringener, herunder potentielt patogene eller gavnlige commensale arter og både fakultetsmæssige og obligatoriske aerobe eller anaerobe bakterier. Dette giver igen det nødvendige udgangsmateriale til nøjagtig sekventering og samling af bakterielle genomer og til kritiske fænotypiske eksperimenter, som bidrager til forståelsen af urin sundhed og sygdom. Desuden giver denne ændrede kulturtilgang mulighed for en mere defineret klinisk diagnose af levedygtige mikroorganismer, der findes i urinprøver, og giver mulighed for deres biobanking til fremtidige genomiske undersøgelser. Denne protokol er dog ikke uden begrænsninger. Det kan kræve lange inkubationstider afhængigt af organismen samt brug af ressourcer såsom et hypoxikammer eller kontrollerede inkubatorer, der måske ikke er let tilgængelige. Brugen af anaerobe GasPaks tilbyder en alternativ løsning, men disse er dyre og giver ikke altid et vedvarende og kontrolleret miljø. Endelig kan kultur bias samt prøve mangfoldighed give mulighed for særlige organismer og uropathogener at udkonkurrere kræsne bakterier. På trods af disse begrænsninger, en kultur af forskellige urinbakterier er muliggjort af denne tilgang.

Genomisk sekventering har vundet popularitet med udviklingen af Next Generation Sekventering teknologier, som enormt øget både udbytte og nøjagtigheden af sekventering data14,15. Kombineret med udviklingen af algoritmer til databehandling og de novo-samling er komplette genomsekvenser lige ved hånden på både nybegyndere og ekspertforskere15,45. Kendskab til den samlede genomorganisation, der leveres af komplette genomer, giver vigtig evolutionær og biologisk indsigt, herunder genduplikation, gentab og horisontal genoverførsel14. Derudover er gener, der er vigtige for antimikrobiel resistens og virulens, ofte lokaliseret på mobile elementer, som typisk ikke løses i udkast til genomsamlinger15,16.

Protokollen heri følger en hybrid tilgang til kombinationen af sekventering af data fra kortlæste og langlæste platforme til at generere komplette genomsamlinger. Mens fokuseret på urinbakterielle genomer, denne procedure kan tilpasses forskellige bakterier fra forskellige isolationskilder. Kritiske skridt i denne tilgang omfatter følgende passende steril teknik og udnytte passende medier og kultur betingelser for isolering af rene urinbakterier. Desuden er ekstraktion af intakt, højtydende gDNA afgørende for at generere sekventeringsdata uden forurenende aflæsninger, der kan hæmme montagesuccesen. Efterfølgende bibliotek forberedelse protokoller er afgørende for generering af kvalitet læser af tilstrækkelig længde og dybde. Derfor er det af total betydning at håndtere gDNA med omhu under biblioteksforberedelse til langlæst sekventering i særdeleshed, da denne teknologis største fordel er den generation af lange læser uden teoretisk øvre længdegrænse. Også skitseret er sektioner for passende kvalitetskontrol (QC) af sekventering læser, der eliminerer støjende data og forbedrer montageresultatet.

På trods af vellykket DNA-isolation, biblioteksforberedelse og sekventering kan arten af genomisk arkitektur af nogle arter stadig udgøre en hindring for dannelsen af en lukket genomsamling45,46. Gentagne sekvenser komplicerer ofte montageberegningen, og på trods af lange læsedata kan disse områder løses med lav tillid eller slet ikke. Lange aflæsninger skal således i gennemsnit være længere end den største gentagne region i genomet, eller dækningen skal være høj (>100x)19. Nogle genomer kan forblive ufuldstændige og kræver manuelle tilgange til færdiggørelse. Ikke desto mindre består hybridsamlede ufuldstændige genomer typisk af færre kontiger end kortlæste udkast til genomer. Det kan hjælpe at justere standardparametrene for assemblyalgoritmen eller følge strengere skæringer for læsning af QC. Alternativt er en foreslået tilgang at kortlægge lange læser til de ufuldstændige regioner på jagt efter beviser for den mest sandsynlige samling sti, og derefter bekræfte stien udnytte PCR og Sanger sekventering af den forstærkede region. Kortlægning læser ved hjælp af Minimap2 foreslås, og Bandage tilbyder et nyttigt værktøj til visualisering af kortlagte læser langs samlede contigs giver bevis for contig linkage47.

En yderligere udfordring med at generere komplette genomer ligger i fortrolighed og komfort med kommandolinjeværktøjer. Mange bioinformatiske værktøjer er udviklet til at tilbyde beregningsmæssige muligheder for enhver bruger; Deres udnyttelse afhænger dog af en forståelse med det grundlæggende i UNIX og programmering. Denne protokol har til formål at give tilstrækkeligt detaljerede instruktioner til at gøre det muligt for personer uden forudgående kommandolinjeerfaring at generere lukkede genomsamlinger og anmærke dem.

Disclosures

Forfatterne har intet at afsløre.

Acknowledgments

Vi takker Dr. Moutusee Jubaida Islam og Dr. Luke Joyce for deres bidrag til denne protokol. Vi vil også gerne anerkende University of Texas i Dallas Genome Center for deres feedback og støtte. Dette arbejde blev finansieret af Welch Foundation, tildelingsnummer AT-2030-20200401 til NJD, af National Institutes of Health, tildelingsnummer R01AI116610 til K.P., og af Felecia og John Cain Chair in Women's Health, der ejes af P.E.Z.

Materials

Name Company Catalog Number Comments
Equipment:
Bioanalyzer 2100 Agilent G29398A Optional but recommended
Centrifuge Eppendorf -- Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R)
Electrophoresis BioRad Laboratories 1645070
Gel Imaging System BioRad Laboratories ChemiDoc models
Incubator ThermoFisher Scientific -- Any CO2 Incubator (e.g. Thermo Forma model 3110)
Magnetic Rack New England BioLabs S15095 12-tube rack
MinION Oxford Nanopore Technologies --
Nanodrop ThermoFisher Scientific ND-ONE-W
NextSeq 500 Illumina SY-415-1002 Other Illumina models are acceptable
Plate Reader BioTek -- Synergy H1
Qubit fluorometer ThermoFisher Scientific Q33238
Rotator Benchmark Scientific H2024
Thermocycler ThermoFisher Scientific -- Any thermocycler for PCR reactions (e.g. ProFlex PCR system)
Materials:
10X Phosphate Buffered Saline (PBS) Fisher Scientific BP3991
10X TBE buffer -- -- 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0)
1429R primer Sigma Aldrich (Custom oligos) -- GGTTACCTTGTTACGACTT
1kb Ladder VWR 101228-494
1M Tris-Cl (pH 7.5) ThermoFisher Scientific 15567027
6x Loading dye Fisher Scientific NC0783588
8F primer Sigma Aldrich (Custom oligos) -- AGAGTTTGATCCTGGCTCAG
Agar Fisher Scientific BP1423-2
Agarose BioRad Laboratories 63001
AMPure XP Beads Beckman Coulter A63880
Anaerobe Pouch System - GasPak EZ BD Diagnostic Systems B260683
Boric Acid Fisher Scientific A73-500
Brain Heart Infusion Broth BD Diagnostic Systems 212304
CDC Anaerobe 5% Sheep Blood Agar BD Diagnostic Systems L007357
CHROMagar Orientation BD Diagnostic Systems PA-257481.04
DNeasy Blood & Tissue QIAGEN 69504
DreamTaq Master Mix ThermoFisher Scientific K1081
Dry Anaerobic Indicator Strips BD Diagnostic Systems 271051
EDTA Fisher Scientific S311-500
Ethanol 200 Proof Sigma Aldrich E7023 For molecular biology
Ethidium Bromide ThermoFisher Scientific BP130210
Flow cell priming kit Oxford Nanopore Technologies EXP-FLP002
Flow cell wash kit Oxford Nanopore Technologies EXP-WSH003
Gel Extraction Miniprep Kit BioBasic BS654
Ligation sequencing kit Oxford Nanopore Technologies SQK-LSK109
Lysozyme Research Products International Corp L381005.05
Mutanolysin Sigma Aldrich M9901-5KU
Native barcoding expansion 1-12 Oxford Nanopore Technologies EXP-NBD104
NEB Blunt/TA Ligase Master Mix New England BioLabs M0367L
NEBNext FFPE DNA Repair Mix New England BioLabs M6630L
NEBNext quick ligation buffer New England BioLabs B6058S
NEBNext Ultra II End repair / dA-tailing module New England BioLabs E7546L
Nextera DNA CD Indexes Illumina 20018708
Nextera DNA Flex Library Prep - (M) Tagmentation Illumina 20018705
Nuclease-free water Sigma Aldrich W4502
Qubit 1X dsDNA HS Assay Kit ThermoFisher Scientific Q33230
Qubit Assay Tubes ThermoFisher Scientific Q32856
Quick T4 DNA Ligase New England BioLabs E6056L
R9 Flow cell Oxford Nanopore Technologies FLO-MIN106D
RNase A ThermoFisher Scientific EN0531
Sheep Blood Hemostat Laboratories DS13250
TE buffer -- -- 10mM Tris, 1mM EDTA (pH 8.0)
Triton X-100 Sigma Aldrich T8787
Tryptic Soy Broth BD Diagnostic Systems 211825
Software & Bioinformatic Tools:
Bandage -- -- https://rrwick.github.io/Bandage/
Center for Genomic Epidemiology -- -- http://www.genomicepidemiology.org/
CLC Genomics Workbench 12 QIAGEN --
CRISPRcasFinder -- -- https://crisprcas.i2bc.paris-saclay.fr/
FastQC -- -- https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Geneious Prime Geneious --
gVolante (BUSCO) -- -- https://gvolante.riken.jp/
Kbase Prokka Wrapper -- -- https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release
Minimap2 -- -- https://github.com/lh3/minimap2
MinKNOW Oxford Nanopore Technologies --
NanoFilt -- -- https://github.com/wdecoster/nanofilt
NanoStat -- -- https://github.com/wdecoster/nanostat
PHASTER -- -- https://phaster.ca/
Prokka -- -- https://github.com/tseemann/prokka
QUAST -- -- http://quast.sourceforge.net/quast
Trim Galore -- -- https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/
Trimmomatic -- -- http://www.usadellab.org/cms/?page=trimmomatic
Unicycler -- -- https://github.com/rrwick/Unicycler#necessary-read-length

DOWNLOAD MATERIALS LIST

References

  1. Brubaker, L., Wolfe, A. The urinary microbiota: a paradigm shift for bladder disorders. Current Opinion in Obstetrics & Gynecology. 28 (5), 407-412 (2016).
  2. Neugent, M. L., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., De Nisco, N. J. Advances in understanding the human urinary microbiome and its potential role in urinary tract infection. mBio. 11 (2), (2020).
  3. Klein, R. D., Hultgren, S. J. Urinary tract infections: microbial pathogenesis, host-pathogen interactions and new treatment strategies. Nature Reviews. Microbiology. 18 (4), 211-226 (2020).
  4. Horsley, H., et al. Enterococcus faecalis subverts and invades the host urothelium in patients with chronic urinary tract infection. PLoS One. 8 (12), 83637 (2013).
  5. Reitzer, L., Zimmern, P. Rapid growth and metabolism of uropathogenic Escherichia coli in relation to urine composition. Clinical Microbiology Reviews. 33 (1), 00101-00119 (2019).
  6. Snyder, J. A., et al. Transcriptome of uropathogenic Escherichia coli during urinary tract infection. Infection and Immunity. 72 (11), 6373-6381 (2004).
  7. Ipe, D. S., Horton, E., Ulett, G. C. The basics of bacteriuria: Strategies of microbes for persistence in urine. Frontiers in Cellular and Infection Microbiology. 6, 14 (2016).
  8. Babikir, I. H., et al. The impact of cathelicidin, the human antimicrobial peptide LL-37 in urinary tract infections. BMC Infectious Diseases. 18 (1), 17 (2018).
  9. Jancel, T., Dudas, V. Management of uncomplicated urinary tract infections. The Western Journal of Medicine. 176 (1), 51-55 (2002).
  10. Ventola, C. L. The antibiotic resistance crisis: part 1: causes and threats. P & T. 40 (4), 277-283 (2015).
  11. Price, T. K., et al. The clinical urine culture: Enhanced techniques improve detection of clinically relevant microorganisms. Journal of Clinical Microbiology. 54 (5), 1216-1222 (2016).
  12. Kass, E. H. Asymptomatic infections of the urinary tract. Transactions of the Association of American Physicians. 69, 56-64 (1956).
  13. Garcia, L. S. Clinical microbiology procedures handbook. 3rd edn. , ASM Press. (2010).
  14. Fraser, C. M., Eisen, J. A., Nelson, K. E., Paulsen, I. T., Salzberg, S. L. The value of complete microbial genome sequencing (you get what you pay for). Journal of Bacteriology. 184 (23), 6403-6405 (2002).
  15. Chen, Z., Erickson, D. L., Meng, J. Benchmarking hybrid assembly approaches for genomic analyses of bacterial pathogens using Illumina and Oxford Nanopore sequencing. BMC Genomics. 21 (1), 631 (2020).
  16. Greig, D. R., Dallman, T. J., Hopkins, K. L., Jenkins, C. MinION nanopore sequencing identifies the position and structure of bacterial antibiotic resistance determinants in a multidrug-resistant strain of enteroaggregative Escherichia coli. Microbial Genomics. 4 (10), 000213 (2018).
  17. Carraro, D. M., et al. PCR-assisted contig extension: stepwise strategy for bacterial genome closure. Biotechniques. 34 (3), 626-628 (2003).
  18. Tettelin, H., Radune, D., Kasif, S., Khouri, H., Salzberg, S. L. Optimized multiplex PCR: efficiently closing a whole-genome shotgun sequencing project. Genomics. 62 (3), 500-507 (1999).
  19. Wick, R. R., Judd, L. M., Gorrie, C. L., Holt, K. E. Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads. PLoS Computational Biology. 13 (6), 1005595 (2017).
  20. Singhal, N., Kumar, M., Kanaujia, P. K., Virdi, J. S. MALDI-TOF mass spectrometry: an emerging technology for microbial identification and diagnosis. Frontiers in Microbiology. 6, 791 (2015).
  21. Turner, S., Pryer, K. M., Miao, V. P., Palmer, J. D. Investigating deep phylogenetic relationships among cyanobacteria and plastids by small subunit rRNA sequence analysis. The Journal of Eukaryotic Microbiology. 46 (4), 327-338 (1999).
  22. Weisburg, W. G., Barns, S. M., Pelletier, D. A., Lane, D. J. 16S ribosomal DNA amplification for phylogenetic study. Journal of Bacteriology. 173 (2), 697-703 (1991).
  23. Janda, J. M., Abbott, S. L. 16S rRNA gene sequencing for bacterial identification in the diagnostic laboratory: pluses, perils, and pitfalls. Journal of Clinical Microbiology. 45 (9), 2761-2764 (2007).
  24. Stevenson, K., McVey, A. F., Clark, I. B. N., Swain, P. S., Pilizota, T. General calibration of microbial growth in microplate readers. Science Reports. 6, 38828 (2016).
  25. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  26. De Coster, W., D'Hert, S., Schultz, D. T., Cruts, M., Van Broeckhoven, C. NanoPack: visualizing and processing long-read sequencing data. Bioinformatics. 34 (15), 2666-2669 (2018).
  27. Wilson, G., et al. The UNIX Shell. Zenodo. , (2019).
  28. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  29. Vaser, R., Sovic, I., Nagarajan, N., Sikic, M. Fast and accurate de novo genome assembly from long uncorrected reads. Genome Research. 27 (5), 737-746 (2017).
  30. Walker, B. J., et al. Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement. PLoS One. 9 (11), 112963 (2014).
  31. Wick, R. R., Schultz, M. B., Zobel, J., Holt, K. E. Bandage: interactive visualization of de novo genome assemblies. Bioinformatics. 31 (20), 3350-3352 (2015).
  32. Gurevich, A., Saveliev, V., Vyahhi, N., Tesler, G. QUAST: quality assessment tool for genome assemblies. Bioinformatics. 29 (8), 1072-1075 (2013).
  33. Simao, F. A., Waterhouse, R. M., Ioannidis, P., Kriventseva, E. V., Zdobnov, E. M. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics. 31 (19), 3210-3212 (2015).
  34. Seemann, T. Prokka: rapid prokaryotic genome annotation. Bioinformatics. 30 (14), 2068-2069 (2014).
  35. Aziz, R. K., et al. The RAST server: rapid annotations using subsystems technology. BMC Genomics. 9, 75 (2008).
  36. Tatusova, T., et al. NCBI prokaryotic genome annotation pipeline. Nucleic Acids Research. 44 (14), 6614-6624 (2016).
  37. Carattoli, A., Hasman, H. PlasmidFinder and In Silico pMLST: Identification and Typing of Plasmid Replicons in Whole-Genome Sequencing (WGS). Methods in Molecular Biology. 2075, 285-294 (2020).
  38. Carattoli, A., et al. In silico detection and typing of plasmids using PlasmidFinder and plasmid multilocus sequence typing. Antimicrobial Agents and Chemotherapy. 58 (7), 3895-3903 (2014).
  39. Larsen, M. V., et al. Multilocus sequence typing of total-genome-sequenced bacteria. Journal of Clinical Microbiology. 50 (4), 1355-1361 (2012).
  40. Bortolaia, V., et al. ResFinder 4.0 for predictions of phenotypes from genotypes. The Journal of Antimicrobial Chemotherapy. 75 (12), 3491-3500 (2020).
  41. Joensen, K. G., et al. Real-time whole-genome sequencing for routine typing, surveillance, and outbreak detection of verotoxigenic Escherichia coli. Journal of Clinical Microbiology. 52 (5), 1501-1510 (2014).
  42. Arndt, D., et al. PHASTER: a better, faster version of the PHAST phage search tool. Nucleic Acids Research. 44 (1), 16-21 (2016).
  43. Couvin, D., et al. CRISPRCasFinder, an update of CRISRFinder, includes a portable version, enhanced performance and integrates search for Cas proteins. Nucleic Acids Research. 46 (1), 246-251 (2018).
  44. Totten, P. A., Amsel, R., Hale, J., Piot, P., Holmes, K. K. Selective differential human blood bilayer media for isolation of Gardnerella (Haemophilus) vaginalis. Journal of Clinical Microbiology. 15 (1), 141-147 (1982).
  45. Nagarajan, N., Pop, M. Sequence assembly demystified. Nat Reviews. Genetics. 14 (3), 157-167 (2013).
  46. Phillippy, A. M., Schatz, M. C., Pop, M. Genome assembly forensics: finding the elusive mis-assembly. Genome Biology. 9 (3), 55 (2008).
  47. Wick, R. R. Unicycler Wiki. , Available from: https://github.com/rrwick/Unicycler/wiki (2017).

Tags

Genetik urinvejsinfektion bakterier hybrid genom samling Nanopore sekventering 16S rRNA næste generation sekventering mobile genetiske element antimikrobiel resistens
Hybrid <em>De Novo</em> Genom Assembly til generering af komplette genomer af urinbakterier ved hjælp af kort- og langlæste sekventeringsteknologier
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sharon, B. M., Hulyalkar, N. V.,More

Sharon, B. M., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., Palmer, K. L., De Nisco, N. J. Hybrid De Novo Genome Assembly for the Generation of Complete Genomes of Urinary Bacteria using Short- and Long-read Sequencing Technologies. J. Vis. Exp. (174), e62872, doi:10.3791/62872 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter