Lång-Läs sekvenser i hög grad underlätta monteringen av komplexa genomen och karakterisering av strukturell variation. Vi beskriver en metod för att generera ultralång sekvenser av nanopore-baserade sekvensering plattformar. Metoden antar en optimerad DNA-extraktion som följt av modifierade bibliotek preparat att generera hundratals kilobase läsningar med måttlig täckning från mänskliga celler.
Tredje generationen singel-molekylen DNA sekvensering teknik erbjuda betydligt längre Läs längd som kan underlätta monteringen av komplexa genomen och analys av komplexa strukturella varianter. Nanopore plattformar utföra singel-molekyl sekvensering genom att direkt mäta de aktuella ändringarna medieras av DNA passage genom porerna och kan generera hundratals kilobase (kb) läser med minimal kapitalkostnad. Denna plattform har antagits av många forskare för en mängd tillämpningar. Att uppnå längre sekvensering Läs längder är den mest kritiska faktorn att utnyttja värdet av nanopore sekvensering plattformar. Generera ultralång läsningar, krävs särskild hänsyn att undvika DNA brytskador och ökar effektiviteten för att generera produktiva sekvensering mallar. Här, tillhandahåller vi detaljerade protokollet av extremt lång DNA-sekvensering inklusive hög molekylvikt (HMW) DNA-extraktion från färska eller frysta celler, bibliotek konstruktion av mekaniska klippning eller transposase fragmentering, och sekvensering på en nanopore enhet. Från 20-25 µg HMW DNA, metoden kan uppnå N50 Läs längd 50-70 kB med mekanisk klippning och N50 90-100 kb Läs längd med transposase medierad fragmentering. Protokollet kan tillämpas på DNA extraheras från däggdjursceller att utföra hela Genomsekvensering för att upptäcka strukturella varianter och genomet montering. Ytterligare förbättringar på DNA-extraktion och enzymatiska reaktioner kommer att ytterligare öka Läs längden och expandera sin verktyg.
Under det senaste årtiondet, parallella massivt och noggranna andra generationens hög genomströmning sekvensering teknik har drivit en explosion av biomedicinska upptäckten och teknisk innovation1,2,3. Trots de tekniska framstegen, de kort-Läs data som genereras av de andra generationens plattformarna är ineffektiva i att lösa komplexa genomisk regioner och är begränsade för detektion av genomisk strukturella varianter (SVs), som spelar viktiga roller i mänskliga evolution och sjukdomar4,5. Dessutom kort-läsa data inte kan lösa återkommande variation och är olämpliga för kräsna haplotyp utfasning av genetiska varianter6.
Senaste framsteg i singel-molekyl sekvensering erbjuder betydligt längre Läs längd, som kan underlätta upptäckt av hela spektrumet av SVs7,8,9, och erbjuder korrekt och komplett montering av komplex mikrobiell och däggdjur genom6,10. Nanopore plattformen utför singel-molekyl sekvensering genom att direkt mäta de aktuella ändringarna medieras av DNA passage genom porer11,12,13. Till skillnad från någon befintlig DNA sekvensering kemi, nanopore sekvensering kan generera långa (TEN till tusentals kilobases) läser i realtid utan att förlita sig på polymeras kinetik eller konstgjorda amplifiering av DNA-provet. Därför nanopore lång-Läs sekvensering (NLR-seq) rymmer mycket lovande för att generera ultralång Läs längder långt utöver 100 kb, som skulle kraftigt förväg genomisk och biomedicinska analyser14, särskilt i låg-komplexitet eller repeat-rika regioner av genomen15.
Det unika med nanopore sekvensering är dess potential att generera långa läser utan en teoretisk längd begränsning. Läs längd är därför beroende av den fysiska längden av DNA som påverkas direkt av DNA integritet och sekvensering mall kvaliteten. Dessutom, beroende på omfattningen av manipulation och antalet steg inblandade, såsom pipettering styrkor och utvinning, kvaliteten på DNA är mycket varierande. Därför är det svårt för en att ge lång läser genom att bara tillämpa standardprotokollen DNA extraktion och tillverkarens medföljande bibliotek byggmetoder. Mot detta har vi utvecklat en robust metod att generera extremt lång läsa (hundratals kilobases) sekvensering data från skördade cell pellets. Vi antog flera förbättringar i DNA extraktion och bibliotek förberedelse. Vi effektiviserat protokollet för att utesluta onödiga förfaranden som orsakar DNA nedbrytning och skador. Detta protokoll är sammansatt av hög molekylvikt (HMW) DNA-extraktion, ultralång DNA bibliotek konstruktion och sekvensering på en nanopore plattform. För välutbildade molekylärbiolog tar det vanligtvis 6 h från cellen skörd till avslutningen av HMW DNA extraktion, 90 min eller 8 h för bibliotek konstruktion beroende på metoden klippning, och upp till en ytterligare 48 h för DNA-sekvensering. Användning av protokollet kommer att ge genomik gemenskapen att förbättra vår förståelse av genomet komplexitet och få nya insikter i genomet variation i mänskliga sjukdomar.
Nanopore-sekvensering är i princip kunna generera 100 kb megabase lydelse i längd11,12,13. Fyra viktiga faktorer kommer att påverka prestanda av sekvensering kör och data kvalitet: 1) aktiv pore siffror och aktiviteten av porerna; (2) motor protein, som styr hastigheten av DNA som passerar genom nanopore; (3) DNA mall (längd, renhet, kvalitet, massa); (4) sekvensering adapter ligering effektivitet, som bestämmer den användbara DNA från ingång provet. De två första faktorerna beror på vilken version av cellen flöde och sekvensering kit som tillhandahålls av tillverkaren. De andra två faktorerna är viktiga steg i detta protokoll (HMW DNA-extraktion, klippning och ligatur).
Detta protokoll kräver tålamod och öva. Kvaliteten på HMW DNA är viktigt för ultralång DNA bibliotek6. Protokollet börjar med celler som samlas in med hög lönsamhet (> 85% livskraftiga cell program), begränsa försämrat DNA från döda celler. Alla hårda process som kan införa skador i DNA (t.ex. stark störande, skakar, vortex, flera pipettering, upprepad frysning och upptining) bör undvikas. I utformningen av protokollet utelämnar vi pipettering i hela processen för DNA-extraktion. Brett bore tips behöver användas när pipettering är nödvändigt efter mekanisk klippning under bibliotek konstruktion och sekvensering. Som nanopores är känsliga för de kemiska sammansättningar i kammaren buffert12, bör det finnas så få kvarvarande föroreningar (t.ex. rengöringsmedel, ytaktiva ämnen, fenol, etanol, proteiner RNAs, etc.) som möjligt i DNA. Med tanke på längden och avkastning visar fenol utvinning metoden de bästa och mest reproducerbara resultat jämfört med flera olika extraktionsmetoder testat hittills.
Trots detta protokoll förmåga att producera långa-Läs sekvenser, kvar flera begränsningar fortfarande. Först, detta protokoll var optimerad utifrån nanopore sekvensering enheten tillgänglig vid tidpunkten för offentliggörandet. Således, den är begränsad till selektiv nanopore-baserade sekvensering kemi och kan vara suboptimal när de utförs i andra typer av lång-Läs sekvensering enheter. Det andra är resultatet starkt beroende av kvaliteten på DNA extraheras från utgångsmaterialet (vävnader eller celler). Läs längd kommer att äventyras om start DNA är redan förstörd eller skadad. För det tredje, även om flera QC steg ingår i protokollet att kontrollera DNA kvaliteten, den slutliga avkastning och längd av läser kan påverkas av cellen flöde och pore aktivitet, vilket kunde vara variabel i detta tidiga skede av nanopore sekvensering plattform utveckling.
Protokollet beskrivs använder här mänskliga suspension cell linje prover för DNA-extraktion. Vi har optimerat de förbigående gånger i nålen klippning, förhållandet mellan HMW DNA till transposase och ligatur tid att producera beskrivs resultaten. Protokollet kan byggas på fyra sätt. Först, förbrukaren kanna börja med andra odlade däggdjursceller och med olika mängd celler, vävnader, kliniska prover eller andra organismer. Att kommer behövas ytterligare optimering på LYS inkubationstiden, reaktionsvolym och centrifugering. Andra, det är svårt att förutsäga målstorleken för ultralång Läs sekvensering. Om Läs längderna är kortare än väntat, kan användarna justera de förbigående gånger i mekanisk klippning-baserade metoden eller ändra förhållandet mellan HMW DNA till transposase i metoden transposase fragmentering-baserade. Bindande och eluering längre under rensning steg är användbara eftersom HMW DNA är mycket trögflytande. För det tredje, med olika nanopore sekvensering enheter, man kan justera mängden och mängden DNA att uppfylla kriterierna i sequencer. För det fjärde kommer endast de DNA sammanskrivna till sekvensering adaptrar sekvenseras. För att ytterligare effektivisera ligatur, kan man försöka titrera adapter och ligase koncentrationerna. Modifierade ligering tid och molekylär trängsel medel såsom PEG18 kan tillämpas i framtiden. Ultra lång DNA sekvensering protokollet kombinerat med CRISPR19,20 kan erbjuda ett effektivt verktyg för målet anrikning sekvensering.
The authors have nothing to disclose.
Författarna vill tacka Y. Zhu för hennes synpunkter på manuskriptet. Forskning som redovisas i denna publikation var delvis stöds av National Cancer Institute av det nationella Institutes of Health under Award nummer P30CA034196. Innehållet ansvarar enbart för författarna och representerar inte nödvändigtvis officiella ståndpunkter av National Institutes of Health.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |