Ultra-long Read Sequencing for Whole Genomic DNA Analysis

Liang Gong; Chee-Hong Wong; Jennifer Idol; Chew  Yee Ngan; Chia-Lin Wei

doi:10.3791/58954

JoVE Journal > Bioengineering

Bioengineering

Svært lang lese sekvenser for hele genomisk DNA-analyse

Published: March 15, 2019

doi:

10.3791/58954

Liang Gong, Chee-Hong Wong, Jennifer Idol, Chew Yee Ngan, Chia-Lin Wei

¹Genome Technologies,Jackson Laboratory for Genomic Medicine

Summary

Lang lese sekvenser i stor grad lette monteringen av komplekse genomer og karakterisering av strukturelle variasjon. Vi beskriver en metode for å generere svært lange sekvenser av nanopore-baserte sekvensering plattformer. Tilnærmingen vedtar en optimalisert DNA utvinning etterfulgt av endrede biblioteket forberedelser til å generere hundrevis av kilobase med moderat dekning fra menneskelige celler.

Abstract

Tredje generasjon enkelt-molekylet DNA sekvensering teknologi tilbyr betydelig lenger lese lengde som kan lette monteringen av komplekse genomer og analyse av kompliserte strukturelle varianter. Nanopore plattformer utføre én-molekylet sekvensering av direkte måling gjeldende endringer formidlet av DNA passasje gjennom porene og kan generere hundrevis av kilobase (kb) med minimal kapitalkostnad. Denne plattformen har blitt adoptert av mange forskere for en rekke applikasjoner. Oppnå lengre sekvensering Les gjør er den mest kritiske faktoren for å utnytte verdien av nanopore sekvensering plattformer. Vil generere svært lange leser, kreves spesielle hensyn å unngå DNA skader og få effektivitet for å generere produktiv sekvensering maler. Her gir vi detaljerte protokollen for svært lang DNA sekvensering inkludert høy molekylvekt (HMW) DNA utvinning fra friske eller frosne celler, bibliotek bygging av mekanisk klipping eller transposase fragmentering, og sekvensering på en nanopore enhet. Fra 20-25 µg HMW DNA, metoden kan oppnå N50 lese lengden på 50-70 kb med mekanisk klippe og N50 90-100 KB lese lengde med transposase mediert fragmentering. Protokollen kan brukes til DNA utvunnet fra pattedyrceller utføre hele genomet sekvensering for påvisning av strukturelle varianter og genom montering. Ytterligere forbedringer på DNA utvinning og enzymatiske reaksjoner vil ytterligere øke Les lengden og utvide bruksområdet.

Introduction

Det siste tiåret, parallell massivt og svært nøyaktig andregenerasjons høy gjennomstrømming sekvensering teknologi har drevet en eksplosjon av biomedisinsk oppdagelsen og teknologisk innovasjon¹^,²^,³. Til tross for tekniske fremskritt, kort-lese dataene som genereres ved andregenerasjons plattformene er ineffektive å løse komplekse genomisk regioner og er begrenset i deteksjon av genomisk strukturelle varianter (SVs), som spiller viktige roller i menneskelige evolusjon og sykdommer⁴^,⁵. Videre kort-lese data ikke kan løse gjenta variasjon og egner seg til kresne haplotype utfasing av genetisk varianter⁶.

Framskritt i enkelt-molekylet sekvensering tilbyr betydelig lengre lese lengde, som kan lette oppdagelsen av hele spekteret av SVs⁷^,⁸^,⁹, og tilbyr nøyaktige og fullstendige samlingen av kompleks mikrobiell og pattedyr genomer⁶^,¹⁰. Den nanopore plattformen utfører enkelt-molekylet sekvensering ved direkte måling gjeldende endringer formidlet av DNA passasje gjennom porene¹¹^,¹²^,¹³. I motsetning til noen eksisterende DNA sekvensering kjemi, nanopore sekvensering kan generere lang (titalls tusenvis av kilobases) leser i sanntid uten å stole på polymerase kinetics eller kunstig forsterkningen av DNA-prøve. Derfor nanopore lang lese sekvensering (Review-seq) har store løftet for å generere svært lang lese lengder godt utover 100 kb, som sterkt forhånd genomisk og biomedisinsk analyser¹⁴, spesielt i lite komplekse eller gjenta-rike regioner av genomer¹⁵.

Det enestående ansiktstrekk av nanopore sekvensering er dens potensial for å generere lang leser uten en teoretisk lengden begrensninger. Les lengden er derfor avhengig av fysiske lengden av DNA som er direkte berørt av DNA integritet og sekvensering mal kvaliteten. Videre, avhengig av manipulasjon og antall trinn involvert, som pipettering styrker og utvinning betingelser, kvaliteten på DNA er svært variabel. Derfor er det utfordrende å gi lange leser ved å bare bruke standard DNA utvinning protokoller og produsentens angitte biblioteket konstruksjonsmetoder. Mot dette formål, har vi utviklet en metode for å generere svært lang lese (hundrevis av kilobases) sekvensering data fra høstet celle pellets. Vi vedtatt flere forbedringer i DNA utvinning og biblioteket forberedelse prosedyrene. Vi strømlinjeformet protokollen for å utelate unødvendige prosedyrer at DNA fornedrelse og skader. Denne protokollen er sammensatt av høy molekylvekt (HMW) DNA utvinning, svært lange DNA biblioteket konstruksjon og sekvensering på en nanopore plattform. For godt trente molekylær biolog tar det vanligvis 6t fra cellen høsting til ferdigstillelse av HMW DNA utvinning, 90 min eller 8t biblioteket bygging avhengig av metoden klipping, og en ytterligere 48t for DNA sekvensering. Bruk av protokollen vil styrke genomics samfunnet å forbedre vår forståelse av genomet kompleksitet og få ny innsikt i genomet variasjon i menneskelige sykdommer.

Protocol

Merk: Review-seq protokollen består av tre sammenhengende trinn: 1) utvinning av høy-molekylær vekt (HMW) genomisk DNA; 2) svært lange DNA biblioteket konstruksjon, som inkluderer fragmentering av HMW DNA til de ønskede størrelsene og ligation av sekvensering adaptere DNA slutter. og 3) lasting av kort-samskrevet DNA på matriser av nanopores (figur 1). 1. HMW DNA utvinning Oppsett av reagens. Gjøre 1 x fosfat bufrede saltvann (PBS) buffer (1000 mL) ved å legge til 100 mL PBS (10 x) til 900 mL vann og bland godt. Gjøre lyseringsbuffer (50 mL) ved å legge 43.5 mL vann til en 50 mL tube. Legg til 500 μL Tris (1 M, pH 8.0), 1 mL av natriumklorid (NaCl) (5 M), 2,5 mL av ethylenediaminetetraacetic syre (EDTA) (0,5 M, pH 8.0) og 2,5 mL av natrium dodecyl sulfate (SDS) (10%, wt/vol) til røret og bland godt.Merk: Denne PBS bufferen kan lagres på 4 ° C i opptil 6 måneder. Forhåndslagde lyseringsbuffer kan lagres på RT for opptil 2 måneder. Sjekk celle dødeligheten og telle celler. Kontroller at live er > 85% og total-cellen er 30 x 106.Merk: Cellene som brukes i denne protokollen er fra HG00733 celle linjen, en menneskelig lymphoblastoid celle linje puertoricanske opprinnelsesland mye brukt i 1000 Genome konsortiet for strukturelle variant analyse (se tabell over materiale bestiller), som tilhører Internasjonale genomet eksempel ressurs. Samle inn cellene ved sentrifugering 200 x g i 5 min på RT. Forkast mediet og resuspend celle pellet (30 x 106 celler) med 5 mL 1 x PBS buffer. Sentrifuge igjen på 200 x g i 5 min på RT og kast nedbryting.Merk: 25-35 x 106 celler er akseptable for denne tilnærmingen. Mer trenger variasjon i celler som brukes ytterligere optimalisering. Cellen pellets kan lagres på −80 ° C i opptil 6 måneder. Resuspend celle pellet i 200 μL 1 x PBS bufferen. Hvis bruker frosne celle pellets, vask med 5 mL 1 x PBS bufferen. Sentrifuge løsningen på 200 x g i 5 min på RT, forkaste nedbryting og resuspend cellene i 200 μL av 1 x PBS buffer. Forberede 10 mL lyseringsbuffer i en 50 mL tube. Legge til 200 μL celle suspensjon lyseringsbuffer og vortex med høyeste hastighet for 3 s. Incubate løsning på 37 ° C i 1 time. Tilsett 2 μL av RNase A (100 mg/mL) i lysate. Forsiktig rotere 50 mL tube å blande prøven. Ruge i løsning på 37 ° C i 1 time. Legge til 50 μL proteinasen K (20 mg/mL) i den lysate. Forsiktig rotere 50 mL tube å blande prøven. Inkuber løsningen ved 50 ° C i 2 timer. Under inkubasjonen, bland forsiktig prøven enhver 30 min. Fjern 50 mL tube fra 50 ° C og la stå på RT i 5 minutter. Legge 10 mL av fenol laget av fenol: kloroform: isoamyl alkohol (25:24:1, vol-/ vol-/ vol) til den lysate og rotere røret på en rotator mikser (se Tabell for materiale) ved RT i avtrekksvifte på 20 rpm for 10 min. vikle tube hetten med parafilm å hindre lekkasje under rotasjon. Klargjør to 50 mL gel rør (se Tabell for materiale) ved sentrifugering 1500 x g i 2 minutter på RT.Merk: Gel danner en stabil barriere mellom den nukleinsyre inneholder vandige fasen og den organiske løsemidler. Hell utvalg/fenol løsningen i en av de forberedt 50 mL gel rør fra trinn 1.10. Sentrifuge løsningen på 3000 x g i 10 min på RT. Hell nedbryting i en ny 50 mL tube. Legg til 10 mL av fenol laget av fenol: kloroform: isoamyl alkohol (25:24:1, vol-/ vol-/ vol) og rotere røret på en rotator mikser på RT i avtrekksvifte på 20 rpm for 10 min. Gjenta trinn 1.11 én gang med andre forberedt gel rør. Hell nedbryting i en ny 50 mL tube. Legg til 25 mL av iskalde 100% etanol og forsiktig rotere røret for hånd til DNA precipitates (figur 2).Merk: Nedbør tilnærming bidrar til å stabilisere HMW DNA. Bøye en 20 μL tips for å gjøre en krok. Forsiktig ta HMW DNA med krok og slapp flytende drop. Plass HMW DNA i en 50 mL tube som inneholder 40 mL av 70% etanol. Vask DNA ved å forsiktig snu røret 3 ganger. Gjenta trinn 1.15 når samle DNA fra 70% etanol røret. Plass HMW DNA i en 2 mL tube med 1,8 mL av 70% etanol. Sentrifuge vasket HMW DNA 10.000 x g for 3 s på rett fjerne så mye av den gjenværende etanol som mulig av pipettering.Merk: Ikke forstyrr DNA pellet når pipettering gjenværende etanol. Inkuber 2 mL røret ved 37 ° C i 10 min med lokk åpent tørke prøven. Hvis du fortsetter med trinn 2.1 (med mekanisk klipping og 1 D Ligation sekvensering Kit), Legg 1 mL av TE (10 mM Tris og 1 mM EDTA, pH 8.0) til 2 mL røret. Hvis du fortsetter med trinn 2.2 (med transposase-baserte fragmentering og rask sekvensering Kit), tilsett 200 μL av 10 mM Tris (pH 8.0) med 0,02% Triton X-100.Merk: Ikke forstyrr DNA-pellets. La røret stå på 4 ° C i mørket for 48 timer vil hjelpe prøven fullt resuspend. HMW DNA kan lagres på 4 ° C 2 uker. Lengre lagringstid eller andre lagringsforhold kan introdusere mer kort fragmenter. 2. svært lange DNA biblioteket konstruksjon Merk: Det er to måter å konstruere svært lange DNA bibliotekene basert på to forskjellige klipping metoder kombinert med nanopore sekvensering kits. Et mekanisk klipping-baserte bibliotek produserer data med en N50 50-70 kB, tar ca 8 timer for biblioteket bygging. En transposase fragmentering-basert bibliotek produserer en N50 90-100 kb data, tar bare 90 minutter for biblioteket bygging. Mekanisk klipping protokollen gir høyere avkastning fra samme DNA med identiske versjoner av sekvensering adapter og kvaliteten på nanopore flyt celler. Mekanisk klipping-baserte biblioteket konstruksjon Tine og bland reagensene fra ligation kit (se Tabell for materiale). Tin FFPE DNA reparasjon buffer og slutten reparasjon/dA-tailing buffer på is, deretter vortex og spinne ned blanding. Tine kortet blanding (AMX) og kortet perle bindende buffer (ABB) på is, deretter pipette og spinn ned for å blande. Tine kjører buffer med drivstoff blanding (RBF) og elueringsrør buffer (ELB) RT, så vortex og spinn ned for å blande. Tine bibliotekinnlasting perler (LLB) på RT og pipette å blande før bruk. Når tint, holde alle Utstyrskomponenter på is. Ta ut enzymene bare når behøvde. Bringe de magnetiske perlene til RT for bruk.Merk: For anbefalinger om de magnetiske perlene å bruke se tabellen av materialer. Sjekk kvaliteten og kvantiteten av HMW DNA fra trinn 1.21.1. Pipetter ut 20 μL DNA i nye 1,5 mL rør fra tre ulike steder i HMW DNA røret med P200 bredt bar tips. Ta 1 μL fra de tre dele å oppdage konsentrasjonen med en fluorometer og kvaliteten med en UV lesing. Sjekk flere ganger for å bekrefte resultatene.Merk: Forventede resultater er vist i figur 3A. OD260/280 verdien er ca 1.9 OD260/230 verdien er ca 2,3. Overføre de resterende 940 μL HMW DNA i en 50 mL tube lue med en P1000 bredt bar tips. Sug opp alle DNA 1 mL sprøyter uten nålen til. Sette 27 G nålen på sprøyten og løs ut alle DNA i hetten sakte og forsiktig (~ 10 s). Ta av 27 G nålen fra sprøyten. Gjenta trinn 2.1.4 og 2.1.5 for 29 ganger totalt 30 passerer gjennom nålen.Merk: Skråstilte HMW DNA kan lagres på 4 ° C i mørket, for opptil 24 h. kvalitetskontroll (QC) anbefales av pulserende-feltet gel geleelektroforese, men det er kostbar og tidkrevende. Hvis utfører QC på en automatisert puls feltet gel geleelektroforese maskin bruker en 5-150 kb protokoll for en 20 h kjøre. Forventede resultater er vist i Figur 4. Forberede DNA reparasjon reaksjonen i en 0,2 mL tube ved å legge til 100 μL skråstilte HMW DNA (20 μg), 15 μL FFPE DNA reparasjon buffer, 12 μL FFPE DNA reparasjon blanding og 16 μL nuclease-fritt vann. Bland reaksjonen ved å sveipe forsiktig 6 ganger og spinne ned Fjern bobler. Inkuber reaksjonen ved 20 ° C i 60 min. overføring prøven inn i en ny 1,5 mL tube med P200 bredt bar tips. Resuspend magnetiske perler av pipettering eller vortexing. Legge til 143 μL perler (1 x) til DNA reparasjon reaksjon og bland forsiktig ved å sveipe røret 6 ganger. Rotere røret på en rotator mikser på RT på 20 rpm i 30 min. Nedspinning prøven 1000 x g 2 s på rett sted røret på en magnetisk rack på 10 min. holde røret på magnetiske stativet og forkaste nedbryting. Holde røret på magnetiske stativet, Legg til 400 μL nylagde 70% etanol uten å forstyrre pellet. Fjerne 70% etanol etter 30 s. Gjenta trinn 2.1.11 en gang. Nedspinning prøven 1000 x g 2 s på rett sted tuben tilbake på magnetiske stativet. Fjern alle gjenværende etanol og lufttørke for 30 s. Ikke tørr pellet over. Fjern røret ut magnetiske og legge 103 μL TE (10 mM Tris og 1 mM EDTA, pH 8.0). Forsiktig flick røret for å sikre at perler er dekket i bufferen, og ruge på en rotator mikser på RT for 30 min. forsiktig sveip røret hver 5 min hjelp rørets av pellet. Pellets perler på magnetiske stativet for minst 10 min. overføre 100 μL av eluate med en P200 bredt bar tips til en 0,2 mL tube. Forberede slutten reparasjon og dA tailing reaksjon i en 0,2 mL tube av 100 μL reparerte HMW DNA, 14 μL slutten reparasjon/dA-tailing buffer og 7 μL slutten reparasjon/dA-tailing blanding. Bland reaksjonen ved å sveipe forsiktig 6 ganger, og spinne ned Fjern bobler. Inkuber reaksjonen ved 20 ° C for 60 min etterfulgt av 65 ° C for 20 min, og hold på 22° C. Overføre prøven inn i en ny 1,5 mL tube med en P200 bredt bar tips. Resuspend magnetiske perler av pipettering eller vortexing. Tilsett 48 μL av perler (0,4 x) til slutt reparasjon/dA-tailing reaksjon og bland forsiktig ved å sveipe røret 6 ganger. Rotere røret på en rotator mikser på RT på 20 rpm i 30 min. Gjenta trinn 2.1.10-2.1.13 en gang. Fjern røret ut magnetiske og legge 33 μL TE (10 mM Tris og 1 mM EDTA, pH 8.0). Forsiktig flick røret for å sikre at perler er dekket i bufferen, og ruge på en rotator mikser på RT for 30 min. forsiktig sveip røret hver 5 min hjelp rørets av pellet. Pellets perler på magnetiske stativet for minst 10 min. overføre 30 μL av eluate med en P200 bredt bar tips til en ny 1,5 mL tube. Ta ekstra 1-2 μL å oppdage konsentrasjonen med en fluorometer.Merk: Utvinning av 5-6 μg på dette trinnet er forventet. Forberede ligation reaksjon i 1,5 mL eksempel røret ved å legge 30 μL slutten-reparert HMW DNA, 20 μL av kortet (AMX 1D), og 50 μL blunt/TA ligation master mix. Bland reaksjonen ved å sveipe forsiktig 6 ganger mellom sekvensielle tillegg og spinn ned Fjern bobler. Inkuber reaksjonen på RT for 60 min. Resuspend magnetiske perler av pipettering eller vortexing. Legge til 40 μL perler (0,4 x) til hemorroider reaksjon og bland forsiktig ved å sveipe røret 6 ganger. Rotere røret på en rotator mikser på RT på 20 rpm i 30 min. Gjenta trinn 2.1.10 en gang. Legge til 400 μL kortet perle binding (ABB) bufferen i røret. Sveip røret forsiktig 6 ganger til resuspend perler. Sett røret på magnetiske rack å skille perler fra bufferen og forkaste nedbryting. Gjenta trinn 2.1.26 en gang. Nedspinning prøven 1000 x g 2 s på rett sted tuben tilbake på magnetiske stativet. Fjern alle gjenværende buffer og lufttørke for 30 s. Ikke tørr pellet over. Fjern røret ut magnetiske og resuspend pellet i 43 μL elueringsbufferen. Forsiktig flick røret for å sikre at perler er dekket i bufferen og ruge på en rotator mikser på RT for 30 min. forsiktig sveip røret hver 5 min hjelp rørets av pellet. Pellets perler på magnetiske stativet for minst 10 min. overføre 40 μL av eluate med en P200 bredt bar tips til en ny 1,5 mL tube. Ta ekstra 1-2 μL å oppdage konsentrasjonen med en fluorometer.Merk: Utvinning av 1-2 μg på dette trinnet er forventet. Mekanisk klipping-baserte biblioteket er klart for lasting. Biblioteket kan lagres på is opptil 2 timer før lasting for sekvensering hvis nødvendig. Transposase fragmentering-basert bibliotek konstruksjon Tine reagensene fra transposase kit (se Tabell for materiale). Tine fragmentering blanding (FRA) og rask adapter (RAP) på is og pipette å blande. Tine sekvensering buffer (SQB), lasting perler (LB), tømme bufferen (FLB) og tømme tjore (FLT) på RT og Pipetter for å blande. Tine lasting perler (LB) RT og pipette å blande før bruk. Når tint, holde alle Utstyrskomponenter på is. Ta ut enzymene bare når behøvde. Sjekk kvaliteten og kvantiteten av HMW DNA fra trinn 1.21.2. Pipetter ut 20 μL DNA i nye 1,5 mL rør fra tre ulike steder i HMW DNA røret med P200 bredt bar tips. Ta 1 μL fra de tre dele å oppdage konsentrasjonen med en fluorometer og kvaliteten med en UV lesing. Sjekk flere ganger for å bekrefte resultatene.Merk: Forventede resultater er vist i figur 3B. OD260/280 verdien er ca 1.9 OD260/230 verdien er ca 2,3. Forberede DNA tagmentation reaksjonen i en 0,2 mL tube ved å legge til 22 μL HMW DNA, 1 μL 10 mM Tris (pH 8.0) med 0,02% Triton X-100 og 1 μL av fragmentering blande (FRA). Blandingen av pipettering med en P200 bredt bar tips så sakte som mulig 6 ganger, ta vare ikke for å introdusere bobler. Inkuber reaksjonen på 30 ° C i 1 min etterfulgt av 80 ° C i 1 min, og hold på 4 ° C. Overføring blandingen til en ny 1,5 mL tube med en P200 bredt bar tips og gå til neste steg umiddelbart. Tilsett 1 μL rask adapter (RAP) til 1,5 mL eksempel røret. Blandingen av pipettering med en P200 bredt bar tips så sakte som mulig 6 ganger, ta vare ikke for å introdusere bobler. Inkuber reaksjonen på RT for 60 min.Merk: Transposase fragmentering-basert biblioteket er klar for lasting. Biblioteket kan lagres på is opptil 2 timer før lasting for sekvensering hvis nødvendig. 3. sekvensering på nanopore enheten Sjekk nanopore sekvensering enheten (se Tabell for materiale). Kontroller at både programvare og maskinvare fungerer og det er nok lagringsplass. Kontrollere flyt cellen. Åpne en ny flyt celle og flyt cellen inn i den nanopore enheten. Sjekk boksen hvor flyt cellen ble satt inn i (X1-X5). Velg flyter cellen. Klikk på Sjekk Flow celler arbeidsflyten. Klikk Start Test -knappen for å starte strømmen cellen QC analyser.Merk: Hvis rapportert totalt aktive pore tallet er mindre enn 800, bruke en annen ny flyt celle for sekvenser. Forberede grunning bufferen. En mekanisk klipping-baserte bibliotek, legge 576 μL buffer med drivstoff blanding (RBF) og 624 μL nuclease-fritt vann i en 1,5 mL tube. Vortex og spinn ned blanding grunning bufferen. For en transposase fragmentering-basert bibliotek, legge 30 μL flush tjore (FLT) til tube flush buffer (FLB). Vortex og spinn ned blanding grunning bufferen. Flyt cellen, Flytt portdeksel grunning klokken å avsløre grunning porten. Angi en P1000 pipette til 100 μL og stikk til grunning porten. Trekke tilbake en liten mengde buffer (mindre enn 30 μL) fjerne bobler flyt cellen. Stopp pipettering når en liten mengde av gul væske inn spissen. Bruk en P1000 pipette for å belaste 800 μL grunning blandingen inn i flyten cellen via grunning porten. Hvis du vil unngå å introdusere bobler, legge 30 μL grunning mix dekker toppen av grunning porten først, så stikk til grunning porten og sakte legge til resten av grunning mix. Ta ut spissen når det er ca 50 μL venstre. Tilsett resten av grunning på grunning porten. Væsken vil gå inn i seg selv. La setup å ruge i 5 min. I mellomtiden Forbered biblioteket blandingen i 1,5 mL tube med biblioteket.Merk: For en mekanisk klipping-baserte biblioteket legge 35 µL av kjører buffer med drivstoff blanding (RBF) til 40 µL av DNET bibliotek. For en transposase fragmentering-basert biblioteket legge 34 µL sekvensering bufferen (SQB) og 16 µL nuclease-gratis vann til 25 µL av DNET bibliotek. Åpne flyt celle utvalg port dekselet forsiktig å avsløre eksempel porten. Bruk en P1000 pipette 200 μL av grunning miksen gjennom grunning port inn i flyten cellen som beskrevet i trinn 3.5. Kontroller at grunning mix ikke lastes inn i flyten cellen gjennom eksempel port. Angi en P200 pipette 80 μL. Bland biblioteket forsiktig med et bredt bar tips av pipettering opp og ned 6 ganger like før lasting. Legg biblioteket mix dropwise gjennom eksempel port i flyt cellen. Legge til hver dråpe bare etter forrige drop er fullstendig lastet i porten. Sett tilbake eksempel port dekselet forsiktig og sørge for eksempel porten er helt dekket. Flytte portdeksel grunning mot urviseren for å dekke grunning porten. Lukk enheten lokket. Klikk på Nytt eksperiment arbeidsflyten. Skriv inn bibliotek, velger den riktige kit i henhold til prosedyrer brukes og kontroller at innstillingene er riktige (48 h kjører, sanntid base-calling ON). Klikk Start Kjør. Etter 10 min, registrere flyt mobiltelefon-ID og aktiv nanopore tallene (antall og hver fire grupper tall) kjøre informasjonen. Dataanalyse. Kopiere dataene til en lokal datamaskin eller en klynge når som helst sekvensering eller når fullført. Bruke Minimap216 (https://github.com/lh3/minimap2) til å justere sekvens data til referanse genomet. Oppsummere sekvensering ytelsen fra rå sekvens data og justeringer av NanoPlot17 (https://github.com/wdecoster/NanoPlot).

Representative Results

Svært lang DNA sekvensering protokollen gjelder HMW DNA biblioteket konstruksjon. Derfor er det viktig å velge godt kulturperler celler med live forholdet > 85% på cellen høsting trinn. Mengden av celler brukes for DNA utvinning påvirker kvaliteten og antallet HMW DNA. Cellen lysis fungerer ikke bra hvis starter med for mange celler. Bruke for få celler genererer ikke nok DNA biblioteket bygging fordi HMW DNA nedbør utføres med mild rotasjon for hånd i stedet for høyhastighets sentrifugering. Et eksempel på HMW DNA etter tilføyer iskald 100% etanol og rotere vises som hvite bomullsaktig bunnfall i figur 2. Det er viktig å sjekke kvaliteten på inndataene DNA før begynnelsen biblioteket konstruksjon. Fornedrelse, feil kvantifisering, kontaminering (f.eks proteiner, RNAs, vaskemidler, surfactant, og gjenværende fenol eller etanol) og lav molekylvekt DNA kan ha en betydelig effekt på de påfølgende prosedyrene og finalen lese lengde. Vi anbefaler utføre QC analyser med DNA fra tre ulike steder i røret som inneholder HMW DNA. Fra UV leser resultatene for HMW DNA, OD260/OD280 verdien er cirka 1,9 og OD260/OD230 verdien er ca 2,3 (figur 3AB). Disse forhold verdiene er konsekvent blant tre testene for en god HMW DNA-prøve. Klipping metoder krever ulike mengder inn DNA. Konsentrasjonen av HMW DNA må > 200 ng/µL for mekanisk fjerning mens det må være > 1 µg/µL for transposase fragmentering. Konsentrasjonen oppdaget av en fluorometer er litt lavere enn UV lesing. Men må variasjonskoeffisienten av konsentrasjonen av den samme HMW DNA-prøven være mindre enn 15% med både i fluorometer og UV lesing analyser. Mekanisk klipping gjelder en sprøyte med en nål å bryte HMW DNA slik at antall passerer gjennom nålen vil påvirke størrelsen på skråstilte DNA og finalen lese lengde. Det anbefales å utføre størrelse QC etter nålen klipping slik fleste av HMW DNA er større enn 50 kb som vist i Figur 4. I mekanisk klipping metoden generert 30 passerer beste sekvensering resultatene vurderer både lengde og produksjon. N50 av et mekanisk klipping-baserte bibliotek er 50-70 kb mens en transposase fragmentering-basert biblioteket er 90-100 kb. Resultatene av fire kjører ved hjelp av HG00733 celle linjen er vist i tabell 1. Alle fire renn har over 2300 leser med lengde lengre enn 100 kb. Maksimumslengden er lengre i transposase fragmentering-basert biblioteker (455 kb og 489 kb) sammenlignet med mekanisk klipping-baserte bibliotekene (348 kb og 387 kb) mens sistnevnte produsert mer totalt leser, som indikerer en høyere yield. Transposase fragmentering-basert bibliotek byggingen har færre trinn og kortere Forberedelsestid slik at det vil introdusere færre kort fragmenter. To traseer bruker transposase har en lengre gjennomsnittlig lengde (> 30 kb) og median lengde (> 10 kb). I tillegg viser dataene konsistent høy kvalitet i alle kjører (betyr kvalitet score er ca 10.0, ~ 90% base nøyaktighet). Mer enn 97% av totale baser ble justert til menneskelig referanse genomet (hg19) med Minimap216 med standardinnstillingene. Den forventede størrelse distribusjonen i rå lyder er vist i figur 5. Alle kjører har en stor andel av data over 50 kb mens transposase fragmentering-basert biblioteker har en høyere andel av svært lange leser (f.eks > 100 kb). Denne protokollen har vært anvendt i flere humane cellelinjer (supplerende tabell 1). Figur 1: skjematisk oversikt over nanopore lang lese sekvensering (Review-seq) arbeidsflyten. Orange, transposase kompleks. Gul-grønn, nanopore kortet. Klikk her for å se en større versjon av dette tallet. Figur 2: representant DNA nedbør fra fenol-kloroform utvinning metoden. Den hvite pilen viser HMW DNA. Klikk her for å se en større versjon av dette tallet. Figur 3: eksempel QC resultatene av HMW DNA fra UV lesing. (A) HMW DNA fra trinn 1.21.1 klar for mekanisk klipping-baserte biblioteket bygging. (B) HMW DNA fra trinn 1.21.2 transposase fragmentering-basert bibliotek bygging. Klikk her for å se en større versjon av dette tallet. Figur 4: QC resultatene av nålen skåret HMW DNA av pulserende-feltet gel geleelektroforese. L1: Raske opplaste 1 kb DNA stigen; L2: Raske opplaste 1 kb utvide DNA stigen. 1 – 8: DNA med forskjellige bestått tidspunkter gjennom nål shearing. 1-3, ingen klipping; 4, 10 ganger; 5, 20 ganger. 6: 30 ganger; 7, 40 ganger; 8, 50 ganger. Denne QC er valgfritt. Klikk her for å se en større versjon av dette tallet. Figur 5: forventet størrelse distribusjoner nanopore svært lange DNA bibliotekene. MS, mekanisk klipping-basert biblioteker. TF, transposase fragmentering-basert biblioteker. Klikk her for å se en større versjon av dette tallet. Mekaniske shearing_rep1 Mekaniske shearing_rep2 Transposase fragmentation_rep1 Transposase fragmentation_rep2 Cellen linje HG00733 HG00733 HG00733 HG00733 N50 i lyder 55,180 63,007 98,237 95,629 Antall leseoperasjoner lengre enn 100 Kb 2500 3,082 2,386 2,355 Antall totalt leser 97,859 80,465 24,166 21,032 Maksimal lengde (bp) 348,482 387,113 454,660 489,426 Gjennomsnittlig lengde (bp) 17,861 20,395 33,528 38,175 Median lengde (bp) 5,335 5,894 10,249 15,656 Bety kvalitet i lyder 10.0 10.1 9,9 10.0 Totalt baser av rå 1,747,849,822 1,641,058,932 810,229,733 802,886,304 Totalt baser av justert 1,693,300,832 1,607,975,925 791,422,077 778,417,627 Tilordnede andelen totale baser (hg19, Minimap2) 96.9% 98,0% 97.7% 97.0% Antall aktive porene 1225: 480, 402, 254, 89 1058: 480, 356, 176, 46 958: 452, 328, 148, 30 1092: 487, 367, 195, 43 Tabell 1: Resultatberegninger Sammendrag fra kjører med forskjellige klipping protokoller. Biblioteket 1 Biblioteket 2 Cellen linje K562 GM19240 Cellen bestillingsinformasjon ATCC, katten. nei. CCL-243 Coriell Institute, katten. nei. GM19240 Protokollen mekanisk skråstilling mekanisk skråstilling N50 i lyder 60,063 55,295 Antall totalt leser 193,783 120,807 Median lengde (bp) 1,843 4,688 Gjennomsnittlig lengde (bp) 9,825 17,408 Maksimal lengde (bp) 548,780 212,338 Totalt baser av rå 1,903,989,686 2,103,015,331 Totalt baser av justert 1,837,350,047 1,997,419,761 Tilordnede andelen totale baser (hg19, Minimap2) 96.6% 95.0% Antall aktive porene 1111: 482, 371, 203, 55 1032: 447, 333, 196, 56 Supplerende tabell 1: Sammendrag av to Review-seq kjører andre linjer med mekanisk klipping protokollen.

Discussion

I prinsippet er nanopore sekvensering i stand til å generere 100 kb til megabase leser i lengde¹¹^,¹²^,¹³. Fire viktige faktorer påvirker ytelsen til sekvensering kjøre og data kvaliteten: 1) aktiv pore tall og aktiviteten i porene; 2) motor protein, som kontrollerer hastigheten på DNA passerer gjennom nanopore; 3) DNA mal (lengde, renhet, kvalitet, masse); 4) sekvensering kortet ligation effektivitet, som bestemmer brukbar DNA fra input eksempel. De første to faktorene avhengig av versjonen av flyt cellen og sekvensering kit leveres av produsenten. De andre to faktorene er avgjørende skritt i denne protokollen (HMW DNA utvinning, klipping og hemorroider).

Denne protokollen krever tålmodighet og praksis. Kvaliteten på HMW DNA er viktig for svært lang DNA biblioteker⁶. Protokollen starter med celler samlet med høy levedyktighet (> 85% levedyktig celle foretrukket), begrense degradert DNA fra døde celler. Noen harde prosess som kan presentere skader for DNA (f.eks sterk urovekkende, rister, vortex, flere pipettering, gjentatt frysing og tining) bør unngås. I utformingen av protokollen utelater vi pipettering i hele prosessen med DNA utvinning. Bredt bar tips må brukes når pipettering er nødvendig etter mekanisk klipping under bibliotek konstruksjon og sekvenser. Nanopores er følsomme for kjemikalier i kammeret buffer¹², skal det være så få gjenværende forurensninger (f.eks vaskemidler, tensider, fenol, etanol, proteiner RNAs, etc.) som mulig i DNA. Vurderer lengden og avkastning viser den fenol utvinning metoden beste og mest reproduserbar resultatene sammenliknet med flere forskjellige utvinning metoder testet så langt.

Til tross for denne protokollen evnen til å produsere lang lese sekvenser, fortsatt flere begrensninger. Først var denne protokollen optimalisert basert på nanopore sekvensering enheten tilgjengelig når publikasjonen. Således, det er begrenset til selektiv nanopore-baserte sekvensering kjemi og kunne suboptimal når utført i andre typer lang lese sekvensering enheter. Andre er utfallet svært avhengig av kvaliteten på DNA utvunnet av utgangsmaterialet (vev eller celler). Les lengden vil brytes hvis Start DNA er allerede degradert eller skadet. Tredje, selv om flere QC trinn er innlemmet i protokollen å sjekke DNA kvaliteten, den endelige kapasitet og lengde i lyder kan påvirkes av flyt cellen og pore aktivitet, som kan være variabel i en tidlig fase av nanopore sekvensering plattform utvikling.

Protokollen beskrevet bruker her menneskelige suspensjon celle line-eksempler for DNA utvinning. Vi har optimalisert bestått klokkeslett i p klipping, forholdet mellom HMW DNA til transposase og ligatur tid å produsere beskrevet resultatene. Protokollen kan utvides på fire måter. Brukere kan først starte med andre kulturperler pattedyrceller og annen mengde celler, vev, klinisk prøver eller andre organismer. Ytterligere optimalisering på inkubasjon lyseringstid, reaksjon volum og sentrifugering vil være nødvendig. Det andre, er det vanskelig å forutsi målet størrelsen for svært lang lese sekvensering. Hvis Les lengder er kortere enn forventet, kan brukerne justere bestått ganger i mekanisk klipping-basert metode eller endre forholdet mellom HMW DNA til transposase i transposase fragmentering-basert metode. Lengre bindende og elueringsrør tid under opprydding tiltak er nyttige fordi HMW DNA er svært tyktflytende. Tredje, med ulike nanopore sekvensering enheter, man kan justere mengden og volumet av DNA å møte kriteriene i sequenceren. Fjerde, bare de DNA samskrevet sekvensering nettverkskort vil være sekvensielt. For ytterligere å forbedre ligation effektivitet, kan en prøve å sjarmere adapter og ligase konsentrasjonen. Modifisert ligation tid og molekylære stimlet stoffer som PEG¹⁸ kan brukes i fremtiden. Svært lang DNA sekvensering protokollen kombinert med CRISPR¹⁹^,²⁰ kan tilby et effektivt verktøy for målet berikelse sekvensering.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Forfatterne takker Y. Zhu for hennes kommentarer på manuskriptet. Forskningen i denne publikasjonen ble delvis støttet av National Cancer Institute av National Institutes of Health under prisen nummer P30CA034196. Innholdet er ansvar forfattere og representerer ikke nødvendigvis den offisielle synet til National Institutes of Health.

Materials

Reagents
Absolute ethanol	Sigma-Aldrich	E7023
Agencourt AMPure XPbeads	Beckman	A63881	magnetic beads for cleanup
BD conventional needles	Becton Dickinson	305136	27G, for mechanical shearing
BD Luer-Lok syringe	Becton Dickinson	309628	for mechanical shearing
Blunt/TA Ligase Master Mix	NEB	M0367S
Countess Cell Counting Chamber Slides	Invitrogen	C10228	for cell counting
EDTA	Invitrogen	AM9261	pH 8.0, 0.5 M, 500 mL
Flow Cell	Oxford Nanopore Technologies	FLO-MIN106	R9.4.1
HG00773 cells	Coriell Institute	HG00733	cells used in this protocol
Ligation Sequencing Kit 1D	Oxford Nanopore Technologies	SQK-LSK108	nanopore ligation kit
MaXtract High Density tubes	Qiagen	129073	gel tubes
NEBNext FFPE DNA Repair Mix	NEB	M6630S
NEBNext Ultra II End Repair/dA-Tailing Module	NEB	M7546S
Nuclease-free water	Invitrogen	AM9937
Phosphate-Buffered Saline, PBS	Gibco	70011044	10X, pH 7.4
Phenol:chloroform:IAA	Invitrogen	AM9730
Proteinase K	Qiagen	19131	20 mg/mL
Qubit dsDNA BR Assay Kit	Invitrogen	Q32850	fluorometer assays for DNA quantification
Rapid Sequencing Kit	Oxford Nanopore Technologies	SQK-RAD004	nanopore transposase kit
RNase A	Qiagen	19101	100 mg/mL
SDS	Invitrogen	AM9822	10% (wt/vol)
Sodium chloride solution	Invitrogen	AM9759	5.0 M
TE buffer	Invitrogen	AM9849	pH 8.0
Tris	Invitrogen	AM9856	pH 8.0, 1 M
Triton X-100 solution	Sigma-Aldrich	93443	~10%
Name	Company	Catalog Number	Comments
Equipment
Bio-Rad C1000 Thermal Cycler	Bio-Rad	1851196EDU
Centrifuge 5810R	Eppendorf	22628180
Countess II FL Automated Cell Counter	Life Technologies	AMQAF1000	for cell counting
DynaMag-2 Magnet	Life Technologies	12321D	magnetic rack
Eppendorf ThermoMixer	Eppendorf	5382000023	for incubation
Freezer	LabRepCo	LHP-5-UFMB
GridION	Oxford Nanopore Technologies	GridION X5	nanopore device used in this protocol
HulaMixer Sample Mixer	Thermo Fisher Scientific	15920D	rotator mixer
MicroCentrifuge	Benchmark Scientific	C1012
NanoDrop ND-1000 Spectrophotometer	Thermo Fisher Scientific	ND-1000	for UV reading
Pippin Pulse	Sage Science	PPI0200	pulsed-field gel electrophoresis instrument
Qubit 3.0 Fluorometer	Invitrogen	Q33216	fluorometer
Refrigerator	LabRepCo	LABHP-5-URBSS
Vortex-Genie 2	Scientific Industries	SI-A236
Water bath	VWR	89501-464

References

Mardis, E. R. Next-generation sequencing platforms. Annual Review of Analytical Chemistry. 6, 287-303 (2013).
Goodwin, S., McPherson, J. D., McCombie, W. R. Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics. 17 (6), 333-351 (2016).
Shendure, J., et al. DNA sequencing at 40: past, present and future. Nature. 550 (7676), 345-353 (2017).
Alkan, C., Coe, B. P., Eichler, E. E. Genome structural variation discovery and genotyping. Nature Reviews Genetics. 12 (5), 363-376 (2011).
Weischenfeldt, J., Symmons, O., Spitz, F., Korbel, J. O. Phenotypic impact of genomic structural variation: insights from and for human disease. Nature Reviews Genetics. 14 (2), 125-138 (2013).
Pollard, M. O., Gurdasani, D., Mentzer, A. J., Porter, T., Sandhu, M. S. Long reads: their purpose and place. Human Molecular Genetics. 27 (R2), R234-R241 (2018).
Cretu Stancu, M., et al. Mapping and phasing of structural variation in patient genomes using nanopore sequencing. Nature Communications. 8 (1), 1326 (2017).
Gong, L., et al. Picky comprehensively detects high-resolution structural variants in nanopore long reads. Nature Methods. 15 (6), 455-460 (2018).
Sedlazeck, F. J., et al. Accurate detection of complex structural variations using single-molecule sequencing. Nature Methods. 15 (6), 461-468 (2018).
Jain, M., et al. Nanopore sequencing and assembly of a human genome with ultra-long reads. Nature Biotechnology. 36 (4), 338-345 (2018).
Jain, M., et al. Improved data analysis for the MinION nanopore sequencer. Nature Methods. 12 (4), 351-356 (2015).
Deamer, D., Akeson, M., Branton, D. Three decades of nanopore sequencing. Nature Biotechnology. 34 (5), 518-524 (2016).
Jain, M., Olsen, H. E., Paten, B., Akeson, M. The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community. Genome Biology. 17 (1), 239 (2016).
Editorial, The long view on sequencing. Nature Biotechnology. 36 (4), 287 (2018).
Jain, M., et al. Linear assembly of a human centromere on the Y chromosome. Nature Biotechnology. 36 (4), 321-323 (2018).
Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34, 3094-3100 (2018).
De Coster, W., D’Hert, S., Schultz, D. T., Cruts, M., Van Broeckhoven, C. NanoPack: visualizing and processing long-read sequencing data. Bioinformatics. 34, 2666-2669 (2018).
Akabayov, B., Akabayov, S. R., Lee, S. J., Wagner, G., Richardson, C. C. Impact of macromolecular crowding on DNA replication. Nature Communications. 4, 1615 (2013).
Gabrieli, T., Sharim, H., Michaeli, Y., Ebenstein, Y. Cas9-Assisted Targeting of CHromosome segments (CATCH) for targeted nanopore sequencing and optical genome mapping. bioRxiv. , (2017).
Gabrieli, T., et al. Selective nanopore sequencing of human BRCA1 by Cas9-assisted targeting of chromosome segments (CATCH). Nucleic Acids Research. , (2018).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Gong, L., Wong, C., Idol, J., Ngan, C. Y., Wei, C. Ultra-long Read Sequencing for Whole Genomic DNA Analysis. J. Vis. Exp. (145), e58954, doi:10.3791/58954 (2019).

Svært lang lese sekvenser for hele genomisk DNA-analyse

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Svært lang lese sekvenser for hele genomisk DNA-analyse

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below