Her præsenterer vi en dyb sekventering tilgang, der giver en objektiv bestemmelse af spirende 3′-termini og mutationsmønstre profiler af enkeltstrenget DNA molekyler. Den vigtigste anvendelse er karakterisering af spirende retroviral supplerende DNAs (cDNAs), de mellemprodukter, der er genereret i løbet af processen af retroviral reverse transkription.
Overvågning af nukleinsyre mellemprodukter under virus replikering giver indsigt i effekt og virkningsmekanisme af antivirale forbindelser og vært celle proteiner på viral DNA syntese. Her afhjælpe vi manglen på en celle-baseret, høj dækning og høj opløsning assay, der er i stand til at definere retroviral reverse transkription mellemprodukter inden for fysiologiske virusinfektion. Metoden beskrevet indfanger 3′-termini af spirende supplerende DNA (cDNA) molekyler i HIV-1-inficerede celler med enkelt nucleotid opløsning. Protokollen indebærer høst af hele celle DNA, målrettet berigelse af viral DNA via hybrid capture, adapter ligatur, størrelse fraktionering af gel rensning, PCR forstærkning, dyb sekvensering og dataanalyse. Et vigtigt skridt er den effektiv og fordomsfri ligatur af adapter molekyler til at åbne 3′-DNA termini. Anvendelse af den beskrevne metode bestemmer overfloden af reverse udskrifter af hver enkelt bestemt længde i en given prøve. Det indeholder også oplysninger om (interne) sekvens variation i omvendt udskrifter og dermed enhver potentiel mutationer. I almindelighed, er analysen egnet til spørgsmål vedrørende DNA 3′-udvidelse, forudsat at skabelon sekvensen er kendt.
For at dissekere og forstår viral replikation fuldt, stadig mere raffinerede teknikker, fange replikering er mellemprodukter påkrævet. Især den præcise definition af viral nukleinsyre arter inden for rammerne af inficerede celler kan give ny indsigt, da mange virusreplikation mekanismer har til dato været undersøgt i isolerede in vitro- reaktioner. Et godt eksempel er processen med reverse transkription i retrovira, såsom human immundefekt virus 1 (HIV-1). De forskellige trin af HIV-1 omvendt transkription, hvorunder viral enzym reverse transkriptase (RT) kopierer enkeltstrenget RNA genom til dobbelt-strenget DNA, har været undersøgt primært i primer udvidelse assays med oprenset protein og nukleinsyre syrer1,2,3,4,5. Mens grundlæggende principper blev fastlagt, sådan assays indarbejde ikke alle viral og cellulær komponenter og kan ikke afspejle biologisk relevante stoichiometries af involverede faktorer. Derfor, vi har udviklet en effektiv teknik til at bestemme spektre af reverse transkription mellemprodukter med deres præcise cDNA 3′-termini (dvs. bestemmelse af deres nøjagtige længde) og nukleotidsekvenser i forbindelse med infektioner i levende celler6. Indsamling af data fra tid kursus eksperimenter kan udnyttes til at sammenligne profil af udskrifter under forskellige forhold, såsom tilstedeværelsen af antivirale molekyler eller proteiner, der kan påvirke effektivitet og processivity af DNA-syntese og ophobning. Dette giver mulighed for en mere detaljeret forståelse af naturlige patogen livscyklus, som ofte er grundlaget for en målrettet drug design og vellykket terapeutisk intervention.
HIV-1 omvendt transkription består af en række successive begivenheder initieret af Udglødning af en tRNA primer til skabelonen genomisk RNA, som derefter udvides af RT til at producere en kort enkeltstrenget cDNA udskrift kaldet et minus-strand stærk-stop (-sss) (jf. Figur 1). Efterfølgende – sss cDNA overføres fra 5′-lange terminal Gentag (LTR) til 3′-LTR af genomisk RNA, hvor det anneals og tjener som primer for fortsatte RT medieret brudforlængelse på minus strand DNA (Se anmeldelser på reverse transkription1 , 2 , 3 , 4). denne første strand overførsel er en af de hastighedsbegrænsende trin i reverse transkription; Derfor er – sss cDNA kendt at akkumulere. Den grundlæggende workflow og bibliotek design til at fange omvendt transkription produkterne i inficerede celler er skitseret i figur 2a. De specifikke primere og analyser indstillinger, der er brugt i protokollen og i tabel 1 anførte målrette alle tidligt reverse transkription cDNA mellemprodukter inden for længde rækkevidde af 23 til ~ 650 nt, som omfatter 180-182 nt – sss DNA. Dog vil passende mindre tilpasninger af strategien tillade programmet ikke kun slutningen reverse transkription produkter, men også andre vira og systemer, hvor målet er at opdage 3′-OH indeholdende DNA ender. Vigtige begrænsninger at overveje omfatter længde rækkevidde af den endelige PCR produkt i biblioteket; især vil skabeloner, hvor afstanden mellem adapter på åben 3′-terminus og webstedet opstrøms primer overstiger ~ 1000 nt sandsynligvis være mindre effektivt sekventeret, potentielt at indføre vildledende tekniske bias under bibliotek forberedelse ( Se diskussion for flere detaljer og tilpasning forslag).
Tidligere har rapporteret teknikker til systematisk bestemmelse af 3′-termini af nukleinsyre-strenge fokuseret på RNA, ikke DNA, molekyler. Et eksempel er 3′ RACE (hurtige forstærkning af cDNA ender)7, som bygger på polyadenylation af mRNA. Derudover blev adapter ligatur-baserede strategier beskæftiger RNA ligases udviklet, som har medtaget RLM-RACE (RNA ligase-medieret RACE)8 eller blonder (ligering-baseret forstærkning af cDNA ender)9. Det er vigtigt at understrege, at ligatur-baserede klarlægger er følsomme over for enhver form for partiskhed indført ved ligatur reaktion, selv. For eksempel, kan ligatur være mere eller mindre effektiv afhængig af en bestemt nukleotidsekvens i positionen 3′, sekvens, samlede molekyle længde eller lokale struktur. Sådanne ligase præferencer føre til ufuldstændig erobringen af molekyler og vildledning i udlæsning, som vi og andre har observeret9,10. For at minimere ligatur bias under adapter tilføjelse trin i protokollen beskrevet heri, vi har testet en række ligatur strategier og fandt brugen af T4 DNA ligase med en hårnål enkeltstrenget DNA adapter (som beskrevet af Kwok mfl. 11) at være den eneste procedure med nær kvantitative ligatur, der ikke resulterede i betydelige forskelle i ligatur effektivitet når vurderet med et specifikt udvalgt sæt af kontrol oligonukleotider6. Valget af denne ligatur strategi er derfor et centralt element i succesen af denne protokol.
Til dato, overvågning af HIV-1 RT progression i inficerede celler er primært opnået ved at måle reverse transkription produkter af forskellige længde med kvantitativ PCR (qPCR) ved hjælp af primer-sonde sæt, der entydigt måler kortere eller længere tid (tidlig og sent, henholdsvis) cDNA produkter12,13,14. Mens denne qPCR tilgang er hensigtsmæssig til bestemmelse iboende effektivitetsgevinster af reverse transkription proces i cellulære systemer, er output relativt lav opløsning, med ingen sekvens oplysninger at blive afledt. Vores nye tilgang, baseret på optimeret adapter ligatur, PCR-medieret bibliotek generation og dyb sekventering adresser teknologikløft og tilbyder mulighed for at overvåge reverse transkription i HIV-1 infektion kvantitativt og på single nucleotid opløsning.
Vi har illustreret nytten af denne metode i en undersøgelse, der skelnes mellem to foreslåede modeller for kapaciteten af HIV-1 begrænsning faktor APOBEC3G (apolipoprotein B mRNA redigering enzym katalytisk polypeptid-lignende 3G) til at blande sig med den produktion af viral omvendt udskrifter6.
Tilgængeligheden af hurtig, pålidelig og omkostningseffektiv dyb sekventering har revolutioneret mange aspekter inden for biovidenskab, så stor dybde i sekventering-baserede analyser. En resterende udfordring ligger i innovative design og skabelse af repræsentant sekventering biblioteker. Her beskriver vi en protokol for at fange spirende viral cDNA molekyler, specielt mellemprodukter af HIV-1 omvendt transkription proces.
Det mest afgørende skridt i denne strategi er ligatur af en adapter til åben 3′-termini i en kvantitativ og saglig måde. Effektiviteten af ligations mellem to ssDNA termini, begge inter- og intramolekylære, er blevet undersøgt og optimeret til forskellige applikationer11,26,27,28,29. Valget mellem at bruge en hårnål adapter med T4 DNA ligase på betingelser beskrevet taktfast 3.3 er resultatet af empiriske optimering hvor vi evalueret forskellige ligases, adaptere og reagenser til ligatur af syntetiske oligonukleotider repræsenterer HIV-1 sekvenser (tabel 2) (data ikke vist). I disse in vitro- test reaktioner bekræftede vi, T4 DNA ligase medieret ligatur af hårnål adapteren, som beskrevet af Kwok mfl. 11, har en meget lav bias, og opnår nær komplet ligatur af acceptoren molekyler når Overgangsstikket bruges i overskud. Ligatur effektivitet var upåvirket ved tilsætning af nucleotidsekvensen at gengive adapteren kompatibel for multiplex primer system (Se figur 4). I sammenligning fandt vi, at en termostabil 5′ DNA/RNA ligase (“Ligase A”, se Tabel af materialer for nøjagtige ligases sammenlignet her), som er en manipuleret RNA ligase der blev udviklet en del at forbedre ligatur effektivitet med ssDNA som acceptoren 27, var faktisk mere effektivt på ligating to ssDNA molekyler end RNA ligase (“Ligase B”) men havde en betydelig skævhed, med stærke forskelle i ligatur effektivitet selv mellem oligonukleotider med enkelt base længde forskelle [tabel 2 ; HTP con midten af G (a) og (b)]. Derudover fandt vi kun en minimal skævhed i reaktioner med “Ligase C” kombineret med en adaptor, transporterer en randomiseret 5′-termini (en strategi anvendes til at udligne kendte nukleotid bias “Ligase c”; Se f.eks Ding mfl. 30)., “Ligase C”-medieret intermolekylære ligations var ufuldstændige, rendering T4 DNA ligase system det overlegne valg.
Flere kvalitetskontrol trin over løbet af protokollen og inddragelse af positive og negative kontroller giver mulighed for påvisning af potentielle problemer før assay fortsættelse og give vejledning til fejlfinding bestræbelser. QPCR kvantificeringer i trin 2.2.2 og 2.3.12 sikre, at mængden af tilført materiale er tilstrækkeligt. Typiske cDNA kopi numre i 200 µL eluering (fra trin 2.1) spænder fra omkring 10.000 til 300.000 pr. µL. Hybrid capture trin kan resultere i tab af overordnede HIV-1 cDNA mængde men bør resultere i en stærk tilsætning af specifikke HIV-1 cDNA over cellulære DNA, hvilket kan fastslås ved hjælp af passende primere til at kvantificere genomisk DNA før og efter tilsætning af qPCR eller ved at måle samlede DNA koncentration. Gendannede HIV-1 cDNA efter hybride capture skridt bør være mindst 10% af input. Lav starter materiale kan ellers forklare en vellykket oligonukleotid positiv kontrol (Se trin 3.3.2) men kun begrænset læser opnåede i prøverne. Lav læse numre samlede kunne også forklares ved overvurdering af bibliotek koncentrationen på grund af tilstedeværelsen af irrelevante DNA arter uden MiSeq adaptere. Dette ville resultere i lav klynge tæthed og kan forbedres ved bestemmelse af koncentrationen af HIV-1 sekvenser i biblioteket af qPCR ud over den samlede DNA-mængde af fluorometriske assays. På grund af den meget følsomme karakter af metoden tages særlig pleje til at undgå selv low-level forurening, begge fra andre prøver (især fra høj koncentration kontrol oligonukleotid bestande) samt fra laboratorieudstyr. Arbejder i en UV sterilisering PCR arbejdsstation er gavnlig i denne henseende. Automatiseret gelelektroforese af den endelige bibliotek (trin 6.1.2) er en yderligere kvalitetskontrol foranstaltning. Nukleinsyre størrelsesområde typisk observeret er mellem 150-500 nt. primere, der kan påvises i den valgfri kontrol efter PCR, og før rensning (se note i trin 5.2) bør nu være fraværende. I et repræsentativt resultat, prøve intensitet kurve er et højdepunkt omkring 160-170 nt og en anden skarpere peak omkring 320-350 nt. Dette afspejler sandsynligvis den ses ofte højere overflod i både relativt korte (1 til 20 nt Indsæt længde) omvendt udskrifter og fuld længde stærk-stop (180 til 182 nt Indsæt længde) (fig. 3b).
Mens præsenteres protokol og valgte primere er specifikke for tidlige HIV-1 omvendt transkription konstruktioner, er metoden generelt gælder for enhver undersøgelse, med henblik på at bestemme åben 3′-termini af DNA. De vigtigste ændringer, der kræves i andre sammenhænge bliver være metoden for hybrid capture og primer design strategi. For eksempel, hvis målet er tilpasses til sen HIV-1 udskrifter, et større antal forskellige fanger biotinylated oligonukleotider udglødning på tværs af længden af cDNA ville være tilrådeligt og vil sandsynligvis reducere tabet i hybrid capture trin. Som nævnt i indledningen, er det vigtigt at overveje begrænsninger, når designe rækken, 3′-termini er at blive opdaget for at undgå forskellige kilder af bias. Først, der kan være en bias i PCR-reaktionerne hvis skabeloner med adapteren er af meget varierende længde. Andet, sekventering platformen bruges her (f.eks. MiSeq) har en foretrukken Indsæt længdeinterval for optimal klyngedannelse, og betydeligt kortere og længere produkter kan ikke blive sekventeret med samme effektivitet. Delvis, dette kan løses beregningsmæssigt, som blev gjort ved at beregne en korrektionsfaktor for lineær længde bias (Se figur 4, nederste graf). Men, hvis regionen hvor 3′-termini kortlægning ønskes er lang (> 1000 nt), det er mere hensigtsmæssigt at opdele reaktioner med de sammenskrevne udskrifter og bruge flere opstrøms primere til at vurdere 3′-termini i sektioner.
Programmet analyse var skrevet internt til det specifikke formål at analysere både den sidste nukleotid af HIV-1 sekvens støder op til den faste adapter sekvens og base variationen af alle baser til at identificere enhver mutationer. De enkelte trin omfatter følgende: først, adaptor sekvenser er trimmet ved hjælp af værktøjssættet fastx-0.0.13; derefter, nogen sekvenser, der er duplikeret (hvilket betyder identisk sekvenser herunder stregkoden) er fjernet. Alle resterende unikke læser derefter justeres til HIV-1 sekvens med Butterfly (http://bowtie-bio.sourceforge.net/index.shtml) med den maksimale uoverensstemmelse på tre baser. Skabelon sekvens består af de første 635 nt af HIV-1 cDNA (NL4.3 stamme), som omfatter – sss sekvens og den første strand overførsel vare op til polypurine spor (U5-R-U3-PPT, se figur 1). Dermed, er medfølgende software og skabeloner kun direkte egnet, hvis metoden, der bruges til det samme program (påvisning af tidlige omvendt udskrifter af HIV-1NL4.3). Justeringer bliver nødt til at være lavet for andre mål sekvenser. Holdninger af 3′-termini for hvert Læs blev bestemt af positionen i justeringen. Base opkald for hver position registreres og mutation priser beregnes ud fra den samlede dækning af hvert base, som varierer, som læser er af forskellige længder og lange skær kan ikke være helt dækket af 125-base sequencing i Read2.
Afslutningsvis mener vi den beskrevne metode til at være et værdifuldt redskab for mange typer af undersøgelser. Indlysende anvendelser omfatter undersøgelser af de underliggende reverse transkription hæmning gennem antiretroviral medicin eller cellulære begrænsning faktorer mekanismer. Kun relativt mindre justeringer bør dog nødvendigt at tilpasse systemet til 3′-termini kortlægning inden for andre enkeltstrenget DNA viral mellemprodukter, som er til stede, for eksempel i parvovirus replikering. Desuden kan princippet om metoden, især dens optimeret ligatur skridt, give en central del af bibliotek forberedelse design til karakterisering af 3′-DNA udvidelser, herunder forlængelser katalyseret af cellulære dobbelt-strenget DNA polymeraser.
The authors have nothing to disclose.
Forfatterne anerkender støtten fra medlemmerne af Malim-laboratorium, Luis Apolonia, Jernej Ule, og Rebecca Oakey. Forfatterne takke Matt Arno på King’s College London genomisk centrum og Debbie Hughes på University College London (UCL), Institut for neurologi næste Generation Sequencing facilitet, for at få hjælp med MiSeq sekventering kører. Arbejdet var støttet af den britiske Medical Research Council (G1000196 og hr./M001199/1 til M.M.), Wellcome Trust (106223/Z/14/Z til M.M.), Europa-Kommissionens syvende rammeprogram (FP7/2007-2013) under tilskudsaftalen ingen. PIIF-GA-2012-329679 (til DP), og af Department of Health via en nationale institutter for sundhed Research omfattende Biomedical Research Center award til fyr og St. Thomas’ NHS Foundation Trust i partnerskab med King’s College London og kongens College Hospital NHS Foundation Trust.
293T cells | ATCC | CRL-3216 | |
Dulbecco's Modified Eagle's Medium | Gibco | 31966-021 | |
Penicillin/Streptomycin | Gibco | 15150-122 | |
Fetal Bovine Serum | Gibco | 10270-106 | |
HeraCell Vios 250i CO2 Incubator | Thermo Scientific | 51030966 | |
Laminar flow hood – CAS BioMAT2 | Wolflabs | CAS001-C2R-1800 | |
10mm TC-treated culture dish | Corning | 430167 | |
TrypLE™ Express (1x), Stable Trypsin Replacement Enzyme | Gibco | 12605-010 | |
OptiMEM® (Minimal Essential Medium) | Gibco | 31985-047 | |
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) | NIH Aids reagent program | 114 | |
Polyethylenimine (PEI) – MW:25000 | PolySciences Inc | 23966-2 | dissolved at 1mg/ml and adjusted to pH7 |
RQ1- Rnase free Dnase | Promega | M6101 | |
Filter 0.22 μm | Triple Red Limited | FPE404025 | |
15 mL polypropylene tubes | Corning | CLS430791 | |
Sucrose | Calbiochem | 573113 | |
Phosphate Buffered Saline (1x) | Gibco | 14190-094 | |
Ultracentrifuge tubes | Beckman Coulter | 344060 | |
Ultracentrifuge | Sorval | WX Ultra Series | Th-641 Rotor |
Alliance HIV-1 p24 antigen ELISA kit | Perkin Elmer | NEK050001KT | |
CEM-SS cells | NIH Aids reagent program | 776 | |
Roswell Park Memorial Institute Medium | Gibco | 31870-025 | |
CoStar® TC treated multiple well plates | Corning | CLS3513-50EA | |
Benchtop centrifuge: Heraus™ Multifuge™ X3 FR | Thermo Scientific | 75004536 | |
TX-1000 Swinging Bucket Rotor | Thermo Scientific | 75003017 | |
Microcentrifuge: 5424R | Eppendorf | 5404000060 | |
Total DNA extraction kit (DNeasy Blood and Tissue kit) | Qiagen | 69504 | |
Nuclease free H2O | Ambion | AM9937 | |
Cutsmart buffer | New England Biolabs (part of DpnI enzyme) | R0176S | |
DpnI restriction enzyme | New England Biolabs | R0176S | |
Oligonucleotides for qPCR | MWG Eurofins | N/A | HPSF purification |
TaqMan PCR Universal Mastermix | Thermo | 4304437 | |
LoBind Eppendorf® tubes | Eppendorf | 30108078 | |
Axygen™ aerosol filter pipette tips, 1000 μL | Fisher Scientific | TF-000-R-S | |
Axygen™ aerosol filter pipette tips, 200 μL | Fisher Scientific | TF-200-R-S | |
Axygen™ aerosol filter pipette tips, 20 μL | Fisher Scientific | TF-20-R-S | |
Axygen™ aerosol filter pipette tips, 10 μL | Fisher Scientific | TF-10-R-S | |
PCR clean hood | LabCaire | Model PCR-62 | |
DynaMag™2-magnet | Thermo | 12321D | |
Streptavidin MagneSphere® paramagnetic particles | Promega | Z5481 | |
Casein | Thermo Scientific | 37582 | |
End over end rotator, Revolver™ 360° | Labnet | H5600 | |
Tris-Base | Fisher Scientific | BP152-5 | |
Hydrochloric Acid | Sigma | H1758-100ML | |
EDTA disodium salt dihydrate | Electran (VWR) | 443885J | |
Sodium Chloride | Sigma | S3014 | |
Dri-Block® Analog Block Heater | Techne | UY-36620-13 | |
PCR tubes and domed caps | Thermo Scientific | AB0266 | |
PCR machine | Eppendorf | Mastercycler® series | |
T4 DNA ligase | New England Biolabs | M0202M | |
40% Polyethylene glycol solution (PEG) in H2O, MW: 8000 | Sigma | P1458-25ML | |
Betaine solution, 5M | Sigma | B0300-1VL | |
Gel loading buffer II (formamide buffer) | Thermo Scientific | AM8546G | |
Precast 6% TBE urea gels | Invitrogen | EC6865BOX | |
Mini cell electrophoresis system | Invitrogen, Novex | XCell SureLock™ | |
Tris/Borate/EDTA solution (10x) | Fisher Scientific | 10031223 | |
Needle 21 G x1 1/2 | VWR | 613-2022 | |
SYBR Gold nucleic acid stain (10000x) | Life Technologies | S11494 | |
Dark Reader DR46B transilluminator | Fisher Scientific | NC9800797 | |
Ammonium acetate | Merck | 101116 | |
SDS solution 20% (w/v) | Biorad | 161-0418 | |
Centrifuge tube filter | Appleton Woods | BC591 | |
Filter Glass Fibre Gf/D 10mm | Whatman (VWR) | 512-0427 | |
polyadenylic acid (polyA) RNA | Sigma | 10108626001 | |
Glycogen, molecular biology grade | Thermo Scientific | R0561 | |
Isopropanol (2-propanol) | Fisher Scientific | 15809665 | |
Ethanol, molecular biology grade | Fisher Scientific | 10041814 | |
Accuprime™ Supermix I (DNA polymerase premix) | Life Technologies | 12342-010 | |
NEBNext® Multiplex Oligo for Illumina (Index Primer Set 1 and 2) | New England Biolabs | E7335S; E7500S | |
Tapestation D1000 Screentape High sensitivity | Agilent Technologies | 5067- 5584 | |
Tapestation D1000 Reagents | Agilent Technologies | 5067- 5585 | |
2200 Tapestation – automated gel electrophoresis system | Agilent Technologies | G2965AA | |
Agencourt® AMPure® beads XP | Beckman Coulter | A63880 | |
Qubit™ dsDNA HS Assay Kit | Invitrogen | Q32851 | |
Qubit™ 2.0 Fluorometer | Invitrogen | Q32866 | |
Topo™ TA cloning Kit | Invitrogen | 450071 | |
Sequencing platform: MiSeq System | Illumina | ||
Experiment Manager (Sample sheet software) | Illumina | Note: Use TruSeq LT as a template | |
Miseq™ Reagent kit V3 (150 cycle) | Illumina | MS-102-3001 | |
Sequencing hub: Basespace | Illumina | https://basespace.illumina.com | |
Ligase A: Thermostable 5’ App DNA/RNA ligase | NEB | M0319S | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase B: T4 RNA ligase 1 | NEB | M0204 | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase C: CircLigase | Epicentre | CL4111K | Not used in this protocol, but tested in optimization process with results described in the discussion. |