Här presenterar vi en djupsekvensering strategi som ger en objektiv bestämning av begynnande 3′-termini samt mutationsanalys profiler enkelsträngat DNA-molekyler. Huvudprogrammet är karakterisering av begynnande retrovirala kompletterande DNAs (cDNAs), de intermediärer som genereras under processen för retrovirala omvänd Transkription.
Övervakning av nukleinsyra intermediärer under virusreplikation ger insikter om de effekter och verkningsmekanismer av antivirala substanser och värd cellproteiner på virala DNA-syntes. Här åtgärda vi bristen på en cell-baserat, hög-täckning och högupplösta analysen som kan definiera retrovirala omvänd Transkription intermediärer inom fysiologiska samband med virusinfektion. Den beskrivna metoden fångar 3′-termini begynnande kompletterande DNA (cDNA)-molekyler inom HIV-1 infekterade celler enda nukleotid upplösning. Protokollet innebär skörd hela cellens DNA, riktade anrikning av virala DNA via hybrid capture, adapter ligatur, storlek fraktionering av gel rening, PCR-amplifiering, djupsekvensering och dataanalys. Ett viktigt steg är den effektiv och opartisk ligering av adapter molekyler att öppna 3′-DNA termini. Tillämpningen av den beskrivna metoden avgör överflödet av omvänd avskrifter av varje särskild längd i ett givet prov. Det ger också information om (intern) sekvens variationen i omvänd avskrifter och därmed eventuella potentiella mutationer. I allmänhet är analysen lämplig för alla frågor som avser DNA 3′-extension, förutsatt att sekvensen mall är kända.
För att analysera och förstå virusreplikation helt, allt mer raffinerade metoder som fångar replikering krävs intermediärer. Särskilt den exakta definitionen av viral nukleinsyra arter inom ramen av infekterade celler kan ge nya insikter, eftersom många virusreplikation mekanismer har hittills varit undersökt i isolerade in vitro- reaktioner. Ett paradexempel är processen för omvänd Transkription i retrovirus, såsom humant immunbristvirus 1 (HIV-1). De olika stegen i HIV-1 omvänd Transkription, under vilken den virala enzymet omvänt transkriptas (RT) kopierar enkelsträngat RNA genomet till dubbelsträngat DNA, har varit studerade framförallt primer filändelsen analyser med renade proteiner och nucleic syror1,2,3,4,5. Medan grundläggande principer fastställdes, sådana analyser införliva inte alla viral och cellulära komponenter och kanske inte återspeglar biologiskt relevanta stoichiometries inblandade faktorer. Därför utformade vi en kraftfull teknik för att bestämma spektra av omvänd Transkription intermediärer med sin precisa cDNA 3′-termini (dvs. att bestämma deras exakta längder) och nukleotidsekvenser i samband med infektioner i levande celler6. Insamling av data från tid kursen experiment kan utnyttjas för att jämföra profilen för utskrifter på olika villkor, till exempel förekomsten av antivirala molekyler eller proteiner, som kan påverka effektiviteten och processivity av DNA-syntes och ackumulation. Detta tillåter en mer detaljerad förståelse av naturliga patogen livscykel, som ofta ligger till grund för riktade läkemedelsdesign och framgångsrika terapeutisk intervention.
HIV-1 omvänd Transkription består av en serie på varandra följande händelser som initierats av glödgning av en tRNA primer till genomisk RNA mallen som förlängs sedan med RT att producera en kort enkelsträngat cDNA avskrift kallas minus-strand stark-stopp (-sss) (se (Se figur 1). Därefter, den – sss cDNA överförs från 5′-lång terminalen upprepa (LTR) till den 3′-LTR av genomisk RNA, där det anneals och serverar som primer för fortsatt RT medierad töjning av minus strand DNA (se recensioner på omvänd Transkription1 , 2 , 3 , 4). denna första strand-överföring är en av de hastighetsbegränsande stegen i omvänd Transkription; Därför kallas den – sss cDNA ansamlas. Den grundläggande arbetsflöde och bibliotek designen att fånga omvänd Transkription produkter i infekterade celler beskrivs i figur 2a. Den specifika primers och analys inställningar som används i protokollet och som anges i tabell 1 rikta alla tidigt omvänd Transkription cDNA intermediärer inom intervallet längd på 23 till ~ 650 nt, som inkluderar de 180-182 nt – sss DNA. Lämpliga mindre anpassningar till strategin kommer dock tillåta program att inte bara sena omvänd Transkription produkter, men även andra virus och system, där målet är att upptäcka 3′-OH innehållande DNA-ändarna. Viktiga begränsningar att tänka inkludera längd spänna av den slutliga PCR-produkten i biblioteket. i synnerhet kommer mallar där avståndet mellan adaptern på den öppna 3′-terminus och webbplatsen uppströms primer överstiga ~ 1000 nt sannolikt mindre effektivt sekvenseras, potentiellt införa vilseledande tekniska fördomar under bibliotek förberedelse ( Se diskussion för mer detaljer och anpassning förslag).
Tidigare har rapporterade metoder för systematisk bestämning av 3′-termini nukleinsyra kardeler fokuserat på RNA, inte DNA, molekyler. Ett exempel är 3′ RACE (snabb förstärkning av cDNA slutar)7, som bygger på polyadenylation mRNA. Dessutom utvecklades adapter ligation-baserade strategier anställa RNA ligases, som har inkluderat RLM-RACE (RNA ligase-medierad RACE)8 eller spetsar (ligation-baserade förstärkning av cDNA slutar)9. Det är viktigt att betona att ligation-baserade kompletteringar är känsliga för någon bias som införts av ligering reaktionen själv. Till exempel kan ligering vara mer eller mindre effektiv beroende på en viss nukleotid i position 3′, sekvens, totala molekyl längd eller lokala struktur. Sådan ligase inställningar leda till ofullständig fånga av molekyler och förvrängning i utläsningen, som vi och andra har observerat9,10. För att minimera ligering bias under adapter tillägg stegen i det protokoll som beskrivs häri, vi testat ett antal ligering strategier och hittade användningen av T4 DNA-ligase med en hårnål enkelsträngat DNA adapter (som beskrivs av Kwok et al. 11) vara det enda förfarandet med nära kvantitativa ligering som inte ledde till betydande skillnader i ligatur effektivitet när bedömas med en särskilt vald uppsättning kontroll oligonukleotider6. Valet av denna ligatur strategi är därför en viktig del i framgången för detta protokoll.
Hittills har övervakningen av HIV-1 RT progression i infekterade celler har främst åstadkommits genom att mäta omvänd Transkription produkter av olika längd med kvantitativ PCR (qPCR) använda primer-probe uppsättningar som unikt mäter kortare eller längre (tidiga och sent, respektive) cDNA produkter12,13,14. Medan detta qPCR tillvägagångssätt är lämpligt att fastställa inneboende effektivitetsvinster av omvänd Transkription processen i cellulära system, är utdata av relativt låg upplösning, utan sekvens information kommer. Vår nya strategi, baserad på optimerad adapter ligatur, PCR-medierad bibliotek generation och djupsekvensering adresser teknikklyftan och erbjuder en möjlighet att övervaka omvänd Transkription under HIV-1 infektion kvantitativt och på enda nukleotid upplösning.
Vi har illustrerat nyttan av denna metod i en studie som skiljer mellan två föreslagna modeller med kapacitet av HIV-1 begränsning faktorn APOBEC3G (apolipoprotein B mRNA redigering enzym katalytisk polypeptid-liknande 3G) att ingripa med den produktion av viral omvänd avskrifter6.
Tillgängligheten för snabb, tillförlitlig och kostnadseffektiv djupsekvensering har revolutionerat många aspekter inom biovetenskap, vilket gör att djupet i sekvensering-baserade analyser. En återstående utmaning ligger i den innovativa design och skapande av representant sekvensering bibliotek. Här beskriver vi ett protokoll för att fånga begynnande viral cDNA molekyler, särskilt intermediärer av HIV-1 omvänd Transkription processen.
Det mest kritiska steget i denna strategi är ligering av en adapter till de öppna 3′-termini i ett kvantitativt och objektivt sätt. Effektivitetsvinsterna av nering mellan två ssDNA termini, både inter- och intramolekylära, har undersökt och optimerad för olika tillämpningar11,26,27,28,29. Val av att använda en hårnål adapter med T4 DNA-ligase enligt de villkor som beskrivs i steg 3.3 är resultatet av empiriska optimering där vi utvärderade olika ligases, adaptrar och reagenser för ligering av syntetiska oligonukleotider som representerar HIV-1 sekvenser (tabell 2), (inga data anges). I dessa in vitro- test reaktioner bekräftat vi att den T4 DNA-ligase medierad ligering av hårnål adaptern, som beskrivs av Kwok et al. 11, har en mycket låg bias, och uppnår nära komplett ligering av acceptor molekyler när adaptern används i överskott. Ligatur effektivitet var opåverkad genom tillsats av nukleotidsekvensen att återge adaptern kompatibel för multiplex primer system (se figur 4). I jämförelse fann vi att en termostabila 5′ DNA/RNA ligase (”Ligase A”, se Tabell för material för exakta ligases jämfört med här), som är en konstruerad RNA ligase som utvecklades delvis förbättra ligering effektivitet med ssDNA som acceptorn 27, var verkligen effektivare på ligating två ssDNA molekyler än RNA ligase (”Ligase B”) men hade en betydande bias, med starka skillnader i ligatur effektivitet även mellan oligonukleotider med enda bas längd skillnader [tabell 2 ; HTP con mid G (a) och (b)]. Vidare, Vi hittade endast en minimal bias i reaktioner med ”Ligase C” kombinerat med en adapter som transporterar en randomiserad 5′-termini (en strategi användas för att avräkna kända nukleotid bias av ”Ligase C”; se till exempel Ding et al. 30). dock ”Ligase C”-medierad intermolekylära nering var ofullständiga, rendering systemets T4 DNA-ligase överlägsna valet.
Flera kvalitetskontroll steg över loppet av protokollet och införlivandet av positiva och negativa kontroller möjliggör upptäckt av potentiella problem innan assay fortsättning och ge vägledning för felsökning ansträngningar. De qPCR kvantifieringar i steg 2.2.2 och 2.3.12 säkerställa att kvantiteten av det ingående materialet är tillräcklig. Typiska cDNA kopia nummer i intervallet 200 µL eluering (från steg 2.1) från omkring 10.000 till 300.000 per µL. Steget hybrid capture kan resultera i vissa förlust av övergripande HIV-1 cDNA kvantitet men bör resultera i en stark berikning av specifika HIV-1 cDNA över cellulär DNA, vilket kan avgöras genom att använda lämpliga grundfärger för att kvantifiera genomiskt DNA före och efter anrikning av qPCR eller genom mätning av totala DNA-koncentration. Återvunna HIV-1 cDNA efter hybrid capture steg bör vara minst 10% av indata. Låg som utgångsmaterial kan annars förklara en framgångsrik oligonukleotiden positiv kontroll (se punkt 3.3.2) men endast begränsat läsningar som uppnåtts i proven. Låg Läs siffror övergripande kan också förklaras av överskattning av bibliotek koncentrationen på grund av förekomsten av irrelevanta DNA arter utan MiSeq adaptrar. Detta skulle resultera i kluster med låg densitet och kan förbättras genom att bestämma koncentrationen av HIV-1 sekvenser i biblioteket av qPCR utöver det totala beloppet som DNA av fluorometric analyser. Mycket känsliga pågrund av metoden, bör särskild försiktighet iakttas för att ens lågaktivt kontaminering, både från andra prover (särskilt från hög koncentration kontroll oligonukleotiden bestånden) as well as från laboratorieutrustning. Arbetar i en UV-sterilisering PCR-arbetsstation är fördelaktigt i detta avseende. Den automatiserade gelelektrofores av slutliga biblioteket (steg 6.1.2) är en ytterligare åtgärd för kvalitetskontroll. Nukleinsyra storleksintervallet vanligtvis observeras är mellan 150 till 500 nt. Primers som kan upptäckas i kontrollen efter PCR och innan rening (se anmärkning i steg 5.2) ska nu vara frånvarande. I representativa resultat, prov intensitet kurvan har en topp runt 160-170 nt och en andra skarpare topp omkring 320 till 350 nt. Detta avspeglar sannolikt ofta sett högre överflödet i både relativt kort (1 till 20 nt infoga längd) omvänd avskrifter och fullängds stark-stop (180 – 182 nt infoga längd) (figur 3b).
Medan presenteras protokoll och valda grundfärger är specifika för tidig HIV-1 omvänd Transkription konstruktioner, är metoden allmänt tillämpliga på någon studie som syftar till att fastställa öppna 3′-termini av DNA. De viktigaste ändringarna som krävs i andra sammanhang blir metoden för hybrid capture och primer designstrategi. Till exempel om målet är anpassas till sena HIV-1 avskrifter, ett större antal olika erövrare biotinylerade oligonukleotider glödgning över längden av cDNA vore tillrådligt och kommer sannolikt att minska förlusten i hybrid capture steg. Som nämnts i inledningen, är det viktigt att överväga begränsningar när du utformar spänna över vilka 3′-termini är att upptäcka för att undvika olika källor av partiskhet. Först, det kan finnas en bias i PCR-reaktioner om mallarna med adaptern är av kraftigt varierande längd. Andra, sekvensering plattformen används här (t.ex. MiSeq) har en rekommenderad infoga längdintervall för optimal klustring och betydligt kortare och längre produkter inte kan sekvenseras med samma effektivitet. Delvis, detta kan åtgärdas computationally, vilket gjordes genom att beräkna en korrektionsfaktor för linjär längd bias (se figur 4, nedre diagrammet). Emellertid, om regionen där 3′-termini mappning önskas är lång (> 1000 nt), är det mer lämpligt att dela reaktioner med ligated avskrifter och använda flera uppströms grundfärger för att bedöma 3′-termini i sektioner.
Analys programmet skrevs internt för det specifika syftet att analysera de båda sista nukleotid av HIV-1 sekvens intill sekvensen fast adaptern samt bas variationen i alla baser för att identifiera alla mutationer. De enskilda stegen omfatta följande: först sekvenserna som adaptern trimmas med fastx-0.0.13 toolkit; sedan tas några sekvenser som är duplicerade (dvs identiska sekvenser inklusive streckkoden) bort. Alla återstående unika läsningar justeras sedan sekvensen HIV-1 med Bowtie (http://bowtie-bio.sourceforge.net/index.shtml) med en maximal felmatchning vid tre baser. Sekvensen mallen består av de första 635 nt av HIV-1 cDNA (NL4.3-stam), som innehåller sekvensen – sss och den första strand transfer produkten upp till polypurine spåret (U5-R-U3-PPT, se figur 1). Därmed, är den medföljande programvaran och mallar endast direkt lämplig om metoden som används för samma program (identifiering av tidiga omvänd avskrifter av de HIV-1NL4.3). Justeringar får göras för andra mål sekvenser. Positionerna för 3′-termini för varje Läs bestämdes av positionen i anpassningen. Bas samtal för varje position registreras och mutation priser beräknas från den totala täckningen för varje base, som varierar, som läser är av olika längder och långa skär inte helt täckas av 125-base sekvensering i Read2.
Avslutningsvis anser vi att den beskrivna metoden vara ett värdefullt verktyg för många typer av studier. Uppenbara applikationer inkluderar undersökningar av mekanismerna bakom omvänd Transkription hämning genom antiretrovirala läkemedel eller cellulära begränsning faktorer. Endast relativt små justeringar bör dock nödvändigt att anpassa systemet till 3′-termini kartläggning inom andra enkelsträngat DNA viral intermediärer, som är närvarande, till exempel i parvovirus replikering. Dessutom kan principen om metoden, särskilt dess optimerade ligering steg, ge en central del av biblioteket förberedelse design för karakterisering av alla 3′-DNA tillägg, inklusive elongationer katalyseras av cellulära dubbelsträngat DNA polymeraser.
The authors have nothing to disclose.
Författarna bekräftar stödet från medlemmar av Malim laboratorium, Luis Apolonia, Jernej Ule och Rebecca Oakey. Författarna tackar Matt Arno vid King’s College London genomisk centrum och Debbie Hughes vid University College London (UCL), Institutet för neurologi nästa generations sekvensering anläggning, för hjälp med MiSeq sekvensering körs. Arbetet stöddes av den brittiska Medicinska forskningsrådet (G1000196 och MR/M001199/1 till M.M.), Wellcome Trust (106223/Z/14/Z till M.M.), Europeiska kommissionens sjunde ramprogram (FP7/2007-2013) enligt bidragsavtalet ingen. PIIF-GA-2012-329679 (till DP) och till hälsodepartementet via ett nationellt institut för hälsa forskning omfattande Biomedical Research Center award till Guy’s and St. Thomas’ NHS Foundation Trust i samarbete med King’s College London och kungens College Hospital NHS Foundation Trust.
293T cells | ATCC | CRL-3216 | |
Dulbecco's Modified Eagle's Medium | Gibco | 31966-021 | |
Penicillin/Streptomycin | Gibco | 15150-122 | |
Fetal Bovine Serum | Gibco | 10270-106 | |
HeraCell Vios 250i CO2 Incubator | Thermo Scientific | 51030966 | |
Laminar flow hood – CAS BioMAT2 | Wolflabs | CAS001-C2R-1800 | |
10mm TC-treated culture dish | Corning | 430167 | |
TrypLE™ Express (1x), Stable Trypsin Replacement Enzyme | Gibco | 12605-010 | |
OptiMEM® (Minimal Essential Medium) | Gibco | 31985-047 | |
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) | NIH Aids reagent program | 114 | |
Polyethylenimine (PEI) – MW:25000 | PolySciences Inc | 23966-2 | dissolved at 1mg/ml and adjusted to pH7 |
RQ1- Rnase free Dnase | Promega | M6101 | |
Filter 0.22 μm | Triple Red Limited | FPE404025 | |
15 mL polypropylene tubes | Corning | CLS430791 | |
Sucrose | Calbiochem | 573113 | |
Phosphate Buffered Saline (1x) | Gibco | 14190-094 | |
Ultracentrifuge tubes | Beckman Coulter | 344060 | |
Ultracentrifuge | Sorval | WX Ultra Series | Th-641 Rotor |
Alliance HIV-1 p24 antigen ELISA kit | Perkin Elmer | NEK050001KT | |
CEM-SS cells | NIH Aids reagent program | 776 | |
Roswell Park Memorial Institute Medium | Gibco | 31870-025 | |
CoStar® TC treated multiple well plates | Corning | CLS3513-50EA | |
Benchtop centrifuge: Heraus™ Multifuge™ X3 FR | Thermo Scientific | 75004536 | |
TX-1000 Swinging Bucket Rotor | Thermo Scientific | 75003017 | |
Microcentrifuge: 5424R | Eppendorf | 5404000060 | |
Total DNA extraction kit (DNeasy Blood and Tissue kit) | Qiagen | 69504 | |
Nuclease free H2O | Ambion | AM9937 | |
Cutsmart buffer | New England Biolabs (part of DpnI enzyme) | R0176S | |
DpnI restriction enzyme | New England Biolabs | R0176S | |
Oligonucleotides for qPCR | MWG Eurofins | N/A | HPSF purification |
TaqMan PCR Universal Mastermix | Thermo | 4304437 | |
LoBind Eppendorf® tubes | Eppendorf | 30108078 | |
Axygen™ aerosol filter pipette tips, 1000 μL | Fisher Scientific | TF-000-R-S | |
Axygen™ aerosol filter pipette tips, 200 μL | Fisher Scientific | TF-200-R-S | |
Axygen™ aerosol filter pipette tips, 20 μL | Fisher Scientific | TF-20-R-S | |
Axygen™ aerosol filter pipette tips, 10 μL | Fisher Scientific | TF-10-R-S | |
PCR clean hood | LabCaire | Model PCR-62 | |
DynaMag™2-magnet | Thermo | 12321D | |
Streptavidin MagneSphere® paramagnetic particles | Promega | Z5481 | |
Casein | Thermo Scientific | 37582 | |
End over end rotator, Revolver™ 360° | Labnet | H5600 | |
Tris-Base | Fisher Scientific | BP152-5 | |
Hydrochloric Acid | Sigma | H1758-100ML | |
EDTA disodium salt dihydrate | Electran (VWR) | 443885J | |
Sodium Chloride | Sigma | S3014 | |
Dri-Block® Analog Block Heater | Techne | UY-36620-13 | |
PCR tubes and domed caps | Thermo Scientific | AB0266 | |
PCR machine | Eppendorf | Mastercycler® series | |
T4 DNA ligase | New England Biolabs | M0202M | |
40% Polyethylene glycol solution (PEG) in H2O, MW: 8000 | Sigma | P1458-25ML | |
Betaine solution, 5M | Sigma | B0300-1VL | |
Gel loading buffer II (formamide buffer) | Thermo Scientific | AM8546G | |
Precast 6% TBE urea gels | Invitrogen | EC6865BOX | |
Mini cell electrophoresis system | Invitrogen, Novex | XCell SureLock™ | |
Tris/Borate/EDTA solution (10x) | Fisher Scientific | 10031223 | |
Needle 21 G x1 1/2 | VWR | 613-2022 | |
SYBR Gold nucleic acid stain (10000x) | Life Technologies | S11494 | |
Dark Reader DR46B transilluminator | Fisher Scientific | NC9800797 | |
Ammonium acetate | Merck | 101116 | |
SDS solution 20% (w/v) | Biorad | 161-0418 | |
Centrifuge tube filter | Appleton Woods | BC591 | |
Filter Glass Fibre Gf/D 10mm | Whatman (VWR) | 512-0427 | |
polyadenylic acid (polyA) RNA | Sigma | 10108626001 | |
Glycogen, molecular biology grade | Thermo Scientific | R0561 | |
Isopropanol (2-propanol) | Fisher Scientific | 15809665 | |
Ethanol, molecular biology grade | Fisher Scientific | 10041814 | |
Accuprime™ Supermix I (DNA polymerase premix) | Life Technologies | 12342-010 | |
NEBNext® Multiplex Oligo for Illumina (Index Primer Set 1 and 2) | New England Biolabs | E7335S; E7500S | |
Tapestation D1000 Screentape High sensitivity | Agilent Technologies | 5067- 5584 | |
Tapestation D1000 Reagents | Agilent Technologies | 5067- 5585 | |
2200 Tapestation – automated gel electrophoresis system | Agilent Technologies | G2965AA | |
Agencourt® AMPure® beads XP | Beckman Coulter | A63880 | |
Qubit™ dsDNA HS Assay Kit | Invitrogen | Q32851 | |
Qubit™ 2.0 Fluorometer | Invitrogen | Q32866 | |
Topo™ TA cloning Kit | Invitrogen | 450071 | |
Sequencing platform: MiSeq System | Illumina | ||
Experiment Manager (Sample sheet software) | Illumina | Note: Use TruSeq LT as a template | |
Miseq™ Reagent kit V3 (150 cycle) | Illumina | MS-102-3001 | |
Sequencing hub: Basespace | Illumina | https://basespace.illumina.com | |
Ligase A: Thermostable 5’ App DNA/RNA ligase | NEB | M0319S | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase B: T4 RNA ligase 1 | NEB | M0204 | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase C: CircLigase | Epicentre | CL4111K | Not used in this protocol, but tested in optimization process with results described in the discussion. |