Lang lese sekvenser i stor grad lette monteringen av komplekse genomer og karakterisering av strukturelle variasjon. Vi beskriver en metode for å generere svært lange sekvenser av nanopore-baserte sekvensering plattformer. Tilnærmingen vedtar en optimalisert DNA utvinning etterfulgt av endrede biblioteket forberedelser til å generere hundrevis av kilobase med moderat dekning fra menneskelige celler.
Tredje generasjon enkelt-molekylet DNA sekvensering teknologi tilbyr betydelig lenger lese lengde som kan lette monteringen av komplekse genomer og analyse av kompliserte strukturelle varianter. Nanopore plattformer utføre én-molekylet sekvensering av direkte måling gjeldende endringer formidlet av DNA passasje gjennom porene og kan generere hundrevis av kilobase (kb) med minimal kapitalkostnad. Denne plattformen har blitt adoptert av mange forskere for en rekke applikasjoner. Oppnå lengre sekvensering Les gjør er den mest kritiske faktoren for å utnytte verdien av nanopore sekvensering plattformer. Vil generere svært lange leser, kreves spesielle hensyn å unngå DNA skader og få effektivitet for å generere produktiv sekvensering maler. Her gir vi detaljerte protokollen for svært lang DNA sekvensering inkludert høy molekylvekt (HMW) DNA utvinning fra friske eller frosne celler, bibliotek bygging av mekanisk klipping eller transposase fragmentering, og sekvensering på en nanopore enhet. Fra 20-25 µg HMW DNA, metoden kan oppnå N50 lese lengden på 50-70 kb med mekanisk klippe og N50 90-100 KB lese lengde med transposase mediert fragmentering. Protokollen kan brukes til DNA utvunnet fra pattedyrceller utføre hele genomet sekvensering for påvisning av strukturelle varianter og genom montering. Ytterligere forbedringer på DNA utvinning og enzymatiske reaksjoner vil ytterligere øke Les lengden og utvide bruksområdet.
Det siste tiåret, parallell massivt og svært nøyaktig andregenerasjons høy gjennomstrømming sekvensering teknologi har drevet en eksplosjon av biomedisinsk oppdagelsen og teknologisk innovasjon1,2,3. Til tross for tekniske fremskritt, kort-lese dataene som genereres ved andregenerasjons plattformene er ineffektive å løse komplekse genomisk regioner og er begrenset i deteksjon av genomisk strukturelle varianter (SVs), som spiller viktige roller i menneskelige evolusjon og sykdommer4,5. Videre kort-lese data ikke kan løse gjenta variasjon og egner seg til kresne haplotype utfasing av genetisk varianter6.
Framskritt i enkelt-molekylet sekvensering tilbyr betydelig lengre lese lengde, som kan lette oppdagelsen av hele spekteret av SVs7,8,9, og tilbyr nøyaktige og fullstendige samlingen av kompleks mikrobiell og pattedyr genomer6,10. Den nanopore plattformen utfører enkelt-molekylet sekvensering ved direkte måling gjeldende endringer formidlet av DNA passasje gjennom porene11,12,13. I motsetning til noen eksisterende DNA sekvensering kjemi, nanopore sekvensering kan generere lang (titalls tusenvis av kilobases) leser i sanntid uten å stole på polymerase kinetics eller kunstig forsterkningen av DNA-prøve. Derfor nanopore lang lese sekvensering (Review-seq) har store løftet for å generere svært lang lese lengder godt utover 100 kb, som sterkt forhånd genomisk og biomedisinsk analyser14, spesielt i lite komplekse eller gjenta-rike regioner av genomer15.
Det enestående ansiktstrekk av nanopore sekvensering er dens potensial for å generere lang leser uten en teoretisk lengden begrensninger. Les lengden er derfor avhengig av fysiske lengden av DNA som er direkte berørt av DNA integritet og sekvensering mal kvaliteten. Videre, avhengig av manipulasjon og antall trinn involvert, som pipettering styrker og utvinning betingelser, kvaliteten på DNA er svært variabel. Derfor er det utfordrende å gi lange leser ved å bare bruke standard DNA utvinning protokoller og produsentens angitte biblioteket konstruksjonsmetoder. Mot dette formål, har vi utviklet en metode for å generere svært lang lese (hundrevis av kilobases) sekvensering data fra høstet celle pellets. Vi vedtatt flere forbedringer i DNA utvinning og biblioteket forberedelse prosedyrene. Vi strømlinjeformet protokollen for å utelate unødvendige prosedyrer at DNA fornedrelse og skader. Denne protokollen er sammensatt av høy molekylvekt (HMW) DNA utvinning, svært lange DNA biblioteket konstruksjon og sekvensering på en nanopore plattform. For godt trente molekylær biolog tar det vanligvis 6t fra cellen høsting til ferdigstillelse av HMW DNA utvinning, 90 min eller 8t biblioteket bygging avhengig av metoden klipping, og en ytterligere 48t for DNA sekvensering. Bruk av protokollen vil styrke genomics samfunnet å forbedre vår forståelse av genomet kompleksitet og få ny innsikt i genomet variasjon i menneskelige sykdommer.
I prinsippet er nanopore sekvensering i stand til å generere 100 kb til megabase leser i lengde11,12,13. Fire viktige faktorer påvirker ytelsen til sekvensering kjøre og data kvaliteten: 1) aktiv pore tall og aktiviteten i porene; 2) motor protein, som kontrollerer hastigheten på DNA passerer gjennom nanopore; 3) DNA mal (lengde, renhet, kvalitet, masse); 4) sekvensering kortet ligation effektivitet, som bestemmer brukbar DNA fra input eksempel. De første to faktorene avhengig av versjonen av flyt cellen og sekvensering kit leveres av produsenten. De andre to faktorene er avgjørende skritt i denne protokollen (HMW DNA utvinning, klipping og hemorroider).
Denne protokollen krever tålmodighet og praksis. Kvaliteten på HMW DNA er viktig for svært lang DNA biblioteker6. Protokollen starter med celler samlet med høy levedyktighet (> 85% levedyktig celle foretrukket), begrense degradert DNA fra døde celler. Noen harde prosess som kan presentere skader for DNA (f.eks sterk urovekkende, rister, vortex, flere pipettering, gjentatt frysing og tining) bør unngås. I utformingen av protokollen utelater vi pipettering i hele prosessen med DNA utvinning. Bredt bar tips må brukes når pipettering er nødvendig etter mekanisk klipping under bibliotek konstruksjon og sekvenser. Nanopores er følsomme for kjemikalier i kammeret buffer12, skal det være så få gjenværende forurensninger (f.eks vaskemidler, tensider, fenol, etanol, proteiner RNAs, etc.) som mulig i DNA. Vurderer lengden og avkastning viser den fenol utvinning metoden beste og mest reproduserbar resultatene sammenliknet med flere forskjellige utvinning metoder testet så langt.
Til tross for denne protokollen evnen til å produsere lang lese sekvenser, fortsatt flere begrensninger. Først var denne protokollen optimalisert basert på nanopore sekvensering enheten tilgjengelig når publikasjonen. Således, det er begrenset til selektiv nanopore-baserte sekvensering kjemi og kunne suboptimal når utført i andre typer lang lese sekvensering enheter. Andre er utfallet svært avhengig av kvaliteten på DNA utvunnet av utgangsmaterialet (vev eller celler). Les lengden vil brytes hvis Start DNA er allerede degradert eller skadet. Tredje, selv om flere QC trinn er innlemmet i protokollen å sjekke DNA kvaliteten, den endelige kapasitet og lengde i lyder kan påvirkes av flyt cellen og pore aktivitet, som kan være variabel i en tidlig fase av nanopore sekvensering plattform utvikling.
Protokollen beskrevet bruker her menneskelige suspensjon celle line-eksempler for DNA utvinning. Vi har optimalisert bestått klokkeslett i p klipping, forholdet mellom HMW DNA til transposase og ligatur tid å produsere beskrevet resultatene. Protokollen kan utvides på fire måter. Brukere kan først starte med andre kulturperler pattedyrceller og annen mengde celler, vev, klinisk prøver eller andre organismer. Ytterligere optimalisering på inkubasjon lyseringstid, reaksjon volum og sentrifugering vil være nødvendig. Det andre, er det vanskelig å forutsi målet størrelsen for svært lang lese sekvensering. Hvis Les lengder er kortere enn forventet, kan brukerne justere bestått ganger i mekanisk klipping-basert metode eller endre forholdet mellom HMW DNA til transposase i transposase fragmentering-basert metode. Lengre bindende og elueringsrør tid under opprydding tiltak er nyttige fordi HMW DNA er svært tyktflytende. Tredje, med ulike nanopore sekvensering enheter, man kan justere mengden og volumet av DNA å møte kriteriene i sequenceren. Fjerde, bare de DNA samskrevet sekvensering nettverkskort vil være sekvensielt. For ytterligere å forbedre ligation effektivitet, kan en prøve å sjarmere adapter og ligase konsentrasjonen. Modifisert ligation tid og molekylære stimlet stoffer som PEG18 kan brukes i fremtiden. Svært lang DNA sekvensering protokollen kombinert med CRISPR19,20 kan tilby et effektivt verktøy for målet berikelse sekvensering.
The authors have nothing to disclose.
Forfatterne takker Y. Zhu for hennes kommentarer på manuskriptet. Forskningen i denne publikasjonen ble delvis støttet av National Cancer Institute av National Institutes of Health under prisen nummer P30CA034196. Innholdet er ansvar forfattere og representerer ikke nødvendigvis den offisielle synet til National Institutes of Health.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |