Biology

Förstärkning, Nästa generations sekvensering, och Genomic DNA Kartläggning av retroviral integration webbplatser

Published: March 22, 2016 doi: 10.3791/53840

Erik Serrao¹, Peter Cherepanov², Alan N. Engelman¹

¹Department of Cancer Immunology and AIDS, Dana-Farber Cancer Institute, ²Chromatin Structure and Mobile DNA, The Francis Crick Institute

Abstract

Retrovirus uppvisar integration signaturer på både lokala och globala skalor. Här presenterar vi ett detaljerat protokoll för (1) generering av olika bibliotek av retrovirala integrationsställen med hjälp av ligation-medierad PCR (LM-PCR) och nästa generations sekvensering (NGS), (2) kartlägga iska platsen för varje virus- värd korsningen med hjälp BEDTools, och (3) analys av data för statistisk relevans. Genomiskt DNA extraherat från infekterade celler är fragmenteras genom spjälkning med restriktionsenzymer eller genom sonikering. Efter lämplig DNA end-reparation, är dubbelsträngade linkers ligerades på DNA-ändar, och semi-innesluten PCR utförs med användning av primrar som är komplementära till både den långa terminala upprepningen (LTR) änden av viruset och det ligerade linker-DNA. PCR-primers bära sekvenser som krävs för DNA-klustring under NGS, motverkar kravet på separat adapter ligatur. Kvalitetskontroll (QC) utförs för att bedöma DNA-fragment storleksfördelning och anpassarer DNA inkorporering före NGS. Sekvens utdatafiler filtreras för LTR-innehållande läser, och sekvenserna som definierar LTR och länk beskärs bort. Trimmad värdcellssekvenser mappas till en referens genom användning av BLAT och filtreras för minimal 97% identitet med en unik punkt i referens genomet. Unika integrationsställen granskas för angränsande nukleotid (nt) sekvens och distribution i förhållande till olika iska funktioner. Användning av detta protokoll, kan integrationsstället bibliotek av hög komplexitet vara konstruerat av genomiskt DNA i tre dagar. Hela protokoll som omfattar exogen virusinfektion av mottagliga vävnadskulturceller till integrationsstället analys kan därför utföras i ungefär en till två veckor. Nya tillämpningar av denna teknik avser longitudinell analys av integrationsställen från HIV-infekterade patienter.

Introduction

Integration av viralt DNA (vDNA) in i värdcellgenomet är ett väsentligt steg i den retrovirala livscykeln. Integration åstadkommes genom viral enzymet integras (IN), som genomför två distinkta katalytiska processer som leder till upprättandet av stabilt införas proviruset ^en. IN subenheter ingriper med ändarna av den linjära vDNA som genereras genom omvänd transkription, bildar den högre ordningens intasome med vDNA ändar hålls samman av ett IN multimer ^2-4. IN klyver 3 'ändarna av vDNA: t nedströms från invarianta 5'-CA-3' sekvenser i en process som kallas 3'-bearbetning, vilket lämnar urtagna 3'-ändar med reaktiva hydroxylgrupper vid varje vDNA terminus ^5-8. Den intasome därefter importeras in i kärnan som en del av ett stort aggregat av värd och virala proteiner kända som den preintegration komplex (PIC) ^9-11. Efter att ha mött cellulärt mål-DNA (tDNA), använder i vDNA 3'-hydroxyl groups att klyva tDNA övre och nedre strängarna på ett förskjutet sätt och samtidigt sammanfogar vDNA till tDNA 5 'fosfatgrupper genom processen att strängöverföring ^12,13.

Retrovirus uppvisar integrationsplatsinställningar på de lokala och global skala. Lokalt konsensusintegrationsställen består av svagt konserverade palindromiska tDNA sekvenser som spänner från ungefär 9:55 bp uppströms och nedströms från vDNA insättningsställen ^14,15. Globalt retrovirus målspecifika kromatin kommentarer ^16. Det finns sju olika retroviral släkten - alfa genom epsilon, Lenti, och Spuma. De lentivirus, som inkluderar HIV-1, gynnar integrationen inom kropparna av aktivt transkriberade gener ^17, medan gammaretroviruses företrädesvis integreras i transkriptionsstartställen (TSSs) och aktiva enhancer regioner ^18-20. I skarp kontrast, är spumavirus starkt förspänd mot heterochromATIC regioner, såsom gen-dålig lamina associerade domänerna ^21. Lokala tDNA bas preferenser till stor del dikteras av särskilda nätverk av nukleoprotein kontakter mellan IN och tDNA ^13,22,23. För lentivirus och gammaretroviruses, är integration i förhållande till genomiska kommentarer till stor del styrs av samspelet mellan IN och besläktade cellulära faktorer ^24-27. Ändra detaljerna i IN-tDNA interaktion nätverk ^13,22,23,28 och störa eller re-engineering IN-värdfaktor interaktioner ^25-27,29-32 är beprövade strategier för att omfördelning integration på lokal och global nivå, respektive.

Kraften i DNA-sekvenseringsförfaranden som används för att katalogisera retrovirala integrationsställen har ökat enormt under de senaste årtiondena. Integrations platser återfanns i banbrytande arbete med mödosam rening och manuella kloningsteknik för att ge en handfull unika platser per studie ^33,34.Kombinationen av LM-PCR-förstärkning av LTR-värd-DNA korsningar med förmågan att kartlägga enskilda integrationsställen till mänskliga och utkast mus genomen trans fältet med antalet platser som återvunnits från exogen vävnadsodlingscell infektioner ökar till flera hundra till tusentals ^{17 18.} Den senare kombinationen av LM-PCR med NGS metodik har sänt bibliotek djup skyhöga. Specifikt Pyrosequencing gav i storleksordningen tiotusentals unika integrationsställen ^30,35-38, medan biblioteken sekvens genom användning av DNA-klustring kan ge miljontals unika sekvenser ^19-21,39. Här beskriver vi en optimerad LM-PCR-protokoll för att förstärka och sekvensera retrovirala integrationsställen med hjälp av DNA-kluster NGS. Metoden inkorporerar krävs adaptersekvenser i PCR-primers och därmed direkt i de amplifierade DNA-molekyler, vilket utesluter kravet på en extra adapter ligeringssteget före sequencing ^40. Den bioinformatisk pipeline analys, från tolkning av råsekvensdata för LTR-värd-DNA korsningar till kartläggning av unika platser integrations Relevanta iska funktioner är också allmänt beskrivits. I enlighet med företräde etablerad från tidigare metodologiska protokoll på detta område ^36,38,41-43 kan anpassade skript utvecklas för att underlätta genomförandet av specifika åtgärder i bioinformatik pipeline. Användbarheten och känslighet av protokollet är illustrerad med representativa data genom amplifiering, sekvensering och kartläggning HIV-1 integrationsställen från vävnadsodlingsceller som infekterats vid den ungefärliga infektionsmultiplicitet (MOI) av 1,0, såväl som en titrering serie av detta DNA utspädd genom oinfekterade cellulära DNA i 5-faldig steg till en maximal utspädning av 1: 15.625 för att ge den ungefärliga motsvarande MOI av 6,4 x 10 ^-5.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Generera virusförråd

Obs: Ett flödesschema av den våta bänk aspekten av detta protokoll visas i figur 1 Detaljerna i viral lager produktion och efterföljande infektion av vävnadsodlingsceller i allmänhet tillämpas på olika typer av retrovirus.. För vissa försök kan målcellen uttrycker inte den endogena virala receptor (s), och i sådana fall konstruktionen av pseudotypade retrovirala partiklar som härbärgerar heterologt viralt höljesglykoprotein, t.ex. G-glykoproteinet från vesikulärt stomatitvirus (VSV-G), kommer att vara krävs för infektion ^44,45.

Notera: Försiktighet bör iakttas vid arbete med HIV-1. Även specifika riktlinjer kommer att variera från institution till institution, bör alla virusbaserat arbete utföras i en särskild, operatör begränsad biologisk säkerhet skåp (typiskt kallad en vävnadsodling huva). Korrekt personlig skyddsutrustningsom innehåller ansiktsskydd, skoskydd, en dubbel handske lager, och en full body overall kostym bör bäras vid alla tillfällen. Allt flytande avfall som härrör från virusrelaterade försök bör inaktiveras med blekmedel (10% slutkoncentration), och allt avfall, inklusive fasta ämnen skall autoklaveras före avyttring.

En dag före transfektion, platta 3,3 x 10 ⁶ HEK293T-celler i 10 ml Dulbeccos Modified Eagle Medium (DMEM) kompletterat med 10% (volym / volym) fetalt bovint serum och 1% (volym / volym) penicillin / streptomycin (10000 U / ml lager) i var och en av fem 100 mm skålar.
Obs: Kompletterat-DMEM kallas DMEM-FPS från denna punkt på.
På följande dag, transfektera cellerna med 10 mikrogram av plasmid som bär fullängds retrovirala molekylära kloner eller 9 pg av kuvert utgår enkla runda vektorer med ett mikrogram av en VSV-G expressionskonstruktionen med hjälp av kommersiellt tillgängliga transfektionsreagens eller kalciumfosfat.
1. Inkubera calnar vid 37 ° C i en fuktad cellodling inkubator med 5% _CO2 (detta villkor nedan kallad "vävnadsodlingsinkubator"). Efter ca 48 timmar, skörda virusinnehållande cell media med en volymetrisk pipett och passera den genom ett 0,45 um filter genom gravitationsflöde.
2. Koncentrera viruset genom ultracentrifugering vid 200.000 xg under 1 h vid 4 ° C. Resuspendera viruset pelleten i 500 | j, l DMEM-FPS innehållande 20 U DNas, och inkubera i 1 timme vid 37 ° C.
  Obs: DNas steget hjälper till att reducera återhämtningen av oönskade plasmidsekvenser genom att eliminera bördan av plasmid-DNA som kvarstår från transfektion förfarande.
Bestämma p24 koncentration ⁴⁶ med hjälp av en HIV-1 p24 antigen fånga kit enligt tillverkarens anvisningar.
Obs: Virus koncentration kan också bestämmas genom omvänt transkriptas-aktivitet analys ^47,48. Alternativt, nivån av funktionella virus kanbestämmas genom att mäta MOI. Detta är lättast görs med hjälp av fluorescensaktiverad cellsortering med virus som uttrycker fluorescerande reportergener såsom förbättrade grönt fluorescerande protein. MOI bestämningen kan vara särskilt användbart när man arbetar med primära celler som inte kan stödja samma infektion som optimerade cellinjer.

2. infektera celler med virus

Platta 3,0 x 10 ⁵ HEK293T celler per brunn i en 6-brunnsplatta i 2,5 ml DMEM-FPS och inkubera över natten i en vävnadsodlingsinkubator.
Notera: Antalet unika integrationsställen som återvunnits med detta protokoll är direkt proportionell mot antalet celler och mängden av aktivt virus som används i infektionen.
Infektera celler med en slutlig viralt p24 koncentration av 500 ng / ml i en slutlig volym av 500 | il färskt DMEM-FPS under 2 h i en vävnadsodlingsinkubator, tillsätt sedan 2 ml DMEM-FPS värmts upp till 37 ° C per brunn och fortsätta inkubationen.
På48 h efter infektion, ta bort media och tvätta cellerna med 2 ml fosfatbuffrad saltlösning (PBS). Tillsätt 0,5 ml trypsin-EDTA förvärmda till 37 ° C, och efter ett par sekunder visuellt inspektera brunnarna för cell förskjutning.
Tillsätt 2 ml förvärmas DMEM-FPS och resuspendera cellerna genom varsam upp / ner pipettering med en volym pipett ~ 10 gånger. Överför lösningen till en 75 cm ² vävnadsodlingskolv innehållande 18 ml förvärmda DMEM-FPS, och inkubera cellerna i en vävnadsodlingsinkubator.
Efter minimalt fem dagar från början av infektionen, samla cellerna genom att ta bort media, tvätta med 5 ml PBS, tillsätt 2 ml förvärmda trypsin-EDTA, och återsuspendera med 5 ml förvärmda DMEM-FPS genom pipettering. Centrifugera lösningen under 5 min vid rumstemperatur vid 2500 x g och kasta supernatanten.
Obs: Även om integration under dessa förhållanden platåer vid ungefär 48 timmar efter infektion ^49,50, är ytterligare 3 dagars odling erfordras för att sufficiently späda ut koncentrationen av ointegrerade DNA-molekyler som är resultatet av cellbaserad DNA-rekombination eller viral-medierad autointegration.
Utdrag iskt DNA från cellpelleten med ett kommersiellt tillgängligt kit (t.ex. se ^51). Eluera DNA från den medföljande jonbyteskolonnen med 200 | il av 10 mM Tris-HCl, pH 8,5.
Obs: En delmängd av celler bör fördelas på 48 timmar efter infektion (steg 2,3) för en infektionsanalys för att säkerställa korrekt virusinfektion före NGS.

3. Fragment Genomiskt DNA genom sonikering eller genom restriktionsenzym Digest

Obs: sonication fragment iskt DNA i en så gott som sekvensoberoende sätt och är därmed att föredra splittring när sekvense prover med en låg förväntad återvinningsgrad (t.ex. infekterade patientceller eller infektioner som initieras vid relativt låg MOI). Dessutom tillåter ultraljudsbehandling en skilja PCR dubbletter av en partiCular integrationsstället sekvens från unika integrationer på samma plats, vilket är avgörande för att skilja klonal expansion av provirussekvenser innehållande celler i infekterade patienter (se steg 11 nedan) ^39,52-54.
Obs: Den DNA ska klyvas omedelbart nedströms från den uppströms belägna LTR för att minska förstärkningen av interna virala sekvenser under LM-PCR. Restriktionsenzymet Bglll som ligger 43 bp nedströms från den uppströms belägna U5-sekvens och som är inkompatibel för efterföljande ligering med Msel-genererade DNA-ändar fungerar bra med många HIV-1-stammar (Figur 1B). Vid framställning av DNA genom ultraljudsbehandling, bör den interna klyvningsrestriktionsenzymet appliceras efter länkligation (se figur 1C - E och steg 4,3 nedan).

För sonikering, blanda 10 ^ g av genomiskt DNA i nukleasfritt vatten till en slutlig volym av 120 | il. Sonikera med hjälp av parametrar för en genomsnittlig paus storlek på 500 bp (två omgångar av följande parameter: Höjdpunkter: 5%; intensitet: 3; cykler per burst: 200; tid: 80 sek).
Rena sonikerade DNA med en PCR-reningskit. Reparera DNA-ändar med hjälp av en DNA-end-reparationssats och rena DNA med en PCR-reningskit. A-svans DNA med användning av Klenow exo ^- enzym och rena A-tailed DNA med en PCR-reningskit. Se ^51,52 för ytterligare detaljer om kit användning.
För digerering med restriktionsendonukleas, skär 10 ^ g av genomiskt DNA över natt vid 37 ° C i en volym av 100 | il med buffert som tillhandahålls av tillverkaren och en cocktail av enzymer (100 U vardera) som genererar 5'-TA överhäng, liksom en oförenligt enzym såsom Bglll som klyver nedströms från uppströms virala LTR. Rena DNA nästa dag med användning av en PCR-reningskit.
Obs: Ingen av restriktionsenzymer bör skära i terminalen ~ 30 bp av den virala DNA-ände som förstärks av LM-PCR-protokoll. Detta protokoll förstärker specifikt U5änden av HIV-1-DNA.

4. glödgning länkoligonukleotider och Ligera till Fragmenterad Iskt DNA

Obs: Förbered en asymmetrisk linker innehållande ett överhäng som är kompatibelt med de ovan nämnda DNA-fragment (se tabell 1 för sekvenser av oligonukleotider som används i detta protokoll). Linkern som skall användas med sonikerat DNA måste innehålla ett kompatibelt T-3 'överhäng, medan linker för Msel-digererad DNA måste innehålla en kompatibel 5'-TA överhäng (figur 1). Den korta linker-strängen måste dessutom innehålla en icke-utsträckbar kemisk modifiering, såsom 3'-amin, för att begränsa de efterföljande amplifieringsreaktioner mot DNA av intresse.
Obs: Vid framställning av flera olika integrationsstället bibliotek parallellt och / eller när multiplexering unika prover på samma sekvenseringskörning, är det rekommenderat att använda unika linkers för varje prov för att begränsa risken för provkors contamination under PCR. Detta innebär dessutom användning av unika länk primrar för varje prov under semi-innesluten PCR (beskriven nedan). Unika länk strängar och länk primers kan utformas genom att förvränga de länkande oligonukleotidsekvenser som anges i tabell 1 medan liknande övergripande% GC-innehåll och gällande överhäng positioner bibehålls.

Annelera de korta och långa linker-strängarna i 35 pl av 10 mM Tris-HCl, pH 8,0 till 0,1 mM EDTA (slutkoncentration av 10 ^ M av varje oligonukleotid) genom upphettning till 90 ° C och långsam kylning till rumstemperatur i steg om 1 ° C per min.
Bered minst fyra parallella ligeringsreaktioner per genomisk DNA-prov, som innehåller 1,5 iM ligerade länk, 1 ng fragmenterat DNA, och 800 U T4 DNA-ligas i 50 pl. Ligera natten vid 12 ° C. Rena den nästa dag med en PCR-reningskit.
För prover framställda genom ultraljudsbehandling, smälta den renade ligeringsreaktion med 100 U av en RESTRICtionsenzym som klyver nedströms från uppströms LTR (t.ex. Bglll för HIV-1) under tillverkarens rekommenderade betingelser över natten. Rena DNA med användning av ett PCR-reningskit.

5. Amplify virala LTR-Host Genomic DNA knutpunkter genom Semi-kapslad PCR

OBS: För att säkerställa optimal bibliotek mångfald, åtminstone 4-8 parallella PCR, beroende på DNA-koncentration av den återvunna ligeringsreaktionen, bör utarbetas för varje prov för både PCR-rundor. DNA-schablon koncentrationen bör kvantifieras genom spektrofotometri. I detta protokoll den första och andra omgångar av PCR använder kapslade LTR-specifika primrar, men samma linker-specifik primer används för båda omgångarna (tabell 1). Den andra omgången LTR-specifik primer och de länkspecifik primer koda adaptersekvenser för DNA-klustring samt sekvenseringsprimer-bindningsställen. Den kapslade LTR-specifik primer kodar också en sex nt index sekvens, WHich kan varieras mellan olika primers för multiplexering bibliotek inom samma sekvenseringskörning.

Förbered första omgången PCR innehåller ingredienser per rör enligt tabell 2.
Obs: linker-specifik primer härbärgerar 22 nt av komplementaritet till linkern, en smälttemperatur av 53 ° C, en GC-halt av 45%, och dess 3'-ände är belägen 15-16 baspar uppströms från 3 'termini av de olika länk långa trådar (tabell 1). Den första omgången 27 nt LTR primern har en smälttemperatur av 59 ° C, en GC-halt av 48%, och dess 3'-ände är belägen 34 bp uppströms från den HIV-1 U5 terminus. Regionen av den andra omgången 26 nt LTR-primer som är komplementär till HIV-1-LTR har en smälttemperatur av 60 ° C, en GC-halt av 50%, och dess 3'-ände är belägen 18 bp uppströms från det virala U5 terminal. Det rekommenderas att oligonukleotid smälttemperatur och GC-innehåll bör efterlikna dessa parametrar om användarekonstruktion PCR-primers med förändrade sekvenser (inklusive för användning med andra retrovirus) ^21.
Köra första PCR-omgången under följande termocykelparametrar: En cykel: 94 ° C under 2 min; 30 cykler: 94 ° C under 15 sekunder, 55 ° C under 30 sek, 68 ° C under 45 sek; en cykel: 68 ° C under 10 min.
Pool reaktioner och rena med hjälp av en PCR-reningskit. Förbered andra omgången PCR som innehåller ingredienser per rör enligt tabell 3. Kör den andra omgången av PCR med användning av termo parametrar som beskrivs i steg 5,2. Pool reaktionerna och rena DNA med användning av ett kommersiellt PCR-reningskit enligt tillverkarens instruktioner.
Obs: En mängd olika rekommenderade index sekvenser som är kompatibla med DNA klustring NGS finns ^71.

6. Utför QC och NGS (Vanligtvis kompletteras med en Sequencing Facility)

(QC analys # 1) Bekräfta Steg 5,3 bibliotek DNA-koncentration med hjälp av en fluormätaren ^55. Kortfattat, förbereda standarder och experimentprover i en slutlig volym av 200 | j, l nukleasfritt vatten. Vortexrör 2-3 sek, inkubera vid rumstemperatur under 2 min, och sedan läsa proverna i fluorometern.
Notera: Prov bör innehålla en minsta koncentration av 2 nM biblioteks-DNA i en minimal volym av 15 | il.
(QC analys # 2) Bekräfta DNA-fragment storleksfördelning med hjälp av en bandbaserad analys ^56.
Notera: En idealisk fördelning är en relativt bred DNA-topp centre omkring 500 bp i längd. Om en signifikant mängd av materialet är större än 1 kb, är det rekommenderat att införliva en procedur storleksurvalet för att eliminera längre DNA-arter, vilket kommer att hindra bryggan amplifiering under klustring. Om däremot en betydande topp är uppenbar omkring 100 till 200 bp, en primer-dimer kan ha bildats under PCR. I detta fall förfarandet bör optimeras för att minimera bildningen av primerdimerer.
(QC analys # 3) Confirm korrekt införlivande av adaptrar i DNA-bibliotek genom kvantitativ PCR ^57.
Utför NGS enligt tillverkarens ansökan litteratur. Utnyttja en spik-in på 10% (vikt / vikt) X174 DNA, som kommer att optimera realtidskvalitetsmått genom att tillhandahålla balanserad baskomposition till sekvenseringskörning.
Obs: integrationsstället sekvense experiment vanligtvis utsätts för enstaka ände 150 bp (SE150) eller parade end 150 bp (PE150) sekvensering. PE150 är speciellt användbar för att fånga linkern fästpunkten på varje DNA-molekyl (t.ex. vid granskande integrationsställen för bevis av värdcell klonal expansion).

7. Använd en anpassad Python eller Perl-skript för att tolka sekvensdata för LTR-innehållande sekvenser, Beskär bort LTR och linkersekvenser, och Karta till referens Genome med BLAT

Scan FASTA-filer för LTR-innehållande sekvensen läser, gröda LTR och linkersekvenser bort från värd genomisk DNA-sekvens, ochexportera dessa sekvenser till en ny FASTA fil. Karta beskäras läser både en referens genom (t.ex. människans genom versioner hg19 eller GRCh38) och det virala genomet med hjälp av BLAT ^58, med utgångsintegrationsstället koordinater exporteras till en separat .txt-fil, med följande inställningar:
stepsize = 6, minIdentity = 97, och maxIntron = 0
Tolka BLAT utdata TXT-fil, ta bort autointegrations (dvs bevis på att LTR tanden har integrerats i en inre region av det virala DNA-genomet) och andra sekvenser avbildning till den HIV-1-genomet, och skapa en separat utgång .txt fil där alla dubbletter integrationsställen har kondenserats till en enda, unika koordinat träffar.

8. Skapa .bed filer som innehåller 15-Nt Intervall Omgivande Integrations, omvandla dessa till FASTA filer och Construct Sequence Logos till Display Base Inställningar Omgivande Integration webbplatser

Skapa .bed filer som listar ett intervall av baser förvarje integrationsstället. Minst 15 baser (5 uppströms och 10 nedströms) föreslås för sekvens logo generation. Skapa en FASTA fil från dessa .bed filer med hjälp av fastaFromBed funktion från BEDTools ⁵⁹ och detta kommando:
fastaFromBed -Fi / katalog / att / referens / genomet / -name -s -säng 15_base_pair_file.bed FO output_file.fasta
Obs: Den invarianta viral 5'-CA-3 'dinukleotid är sammanfogad med värd-DNA under integration, och verifiering av korsningen av LTR terminalen till cellulärt DNA är ett viktigt första filter för att identifiera bona fide integrationsställen. Vi sammanställer dessutom sekvens logotyper från denna värd DNA-sekvens befolkningen att kontrollera de experimentella resultaten. Som retrovirus visar signatur bas preferenser kring deras integrationsplatser ^14,15, sekvens logotyper tjänar till att validera att de mappade iska platser uppstod genom IN-medierad integration jämfört med andra rekombination mekanismer som icke-homolog DNAavsluta sammanfogning ^60,61.
Använd WebLogo 3 (http://weblogo.threeplusone.com/create.cgi) för att skapa sekvens logotyper från FASTA filer. Klicka på "Välj fil" för att ladda upp FASTA fil, och använd följande inställningar: Visningsformat, PDF (vektor); Logo storlek, stor; Första positionsnummer, -5; Logo intervall, -5 till 5; Y-axeln skala, 0,1, Y-axeln tic avstånd, 0,5, färgschema, classic (NA).

9. Skapa Central baspar .bed filer, Kontrollera Sample korskontamination, och Karta Fördelning av unika integrering platser förhållande till relevant Iska funktioner

Eftersom retroviral integration förekommer i ett sicksack sätt över tDNA strängarna, justera de exakta koordinaterna för integrationsplatser för att återspegla den centrala bp av målstället dubbel för korrekt kartläggning av genomisk fördelning i förhållande till genomiska funktioner.
1. Därför, för 5 bp duplicera virus som HIV-1, skapa en .bed fil med den centrala bp förskjuten från den i:Integrationen plats av två baser nedströms för integrationer kartläggning till plussträngen, och två baser uppströms för integrationer kartläggning till minussträngen.
För att kontrollera för provkorskontaminering, beräkna antalet integrationsställen gemensamma mellan de olika biblioteken genom att använda BEDTools skär funktion att skära central bp .bed filer för två olika prover och genom att följa det här kommandot:
bedtools intersect -a central_basepair_1.bed -b central_basepair_2.bed -f 1,00 -r -s> overlap1v2.txt
Räkna antalet linjer inom produktionen overlap1v2.txt filen för att kvantifiera det exakta antalet platser vanligt bland de två biblioteken genom att använda följande kommando:
wc -l overlap1v2.txt
Ladda ner RefSeq anteckning .bed fil för den version av referens genomet som användes för integrationsstället kartläggning från UCSC Genome Notering Database (t.ex. http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database) ^62.
1. Beräkna antalet integrationsställen som omfattas RefSeq gener genom att använda BEDTools skär funktion att skära den centrala baspar .bed fil som genererades för provet med RefSeq .bed filen efter detta kommando:
  bedtools intersect -a central_basepair_1.bed -b RefSeq_hg38.bed -u> RefSeq_sample1.bed
Räkna antalet linjer inom produktionen RefSeq_sample1.bed filen för att kvantifiera det exakta antalet platser faller i RefSeq gener genom att använda följande kommando:
wc -l RefSeq_sample1.bed
Upprepa steg 9,3 och 9,4 för kartläggning integrationsplatser till någon annan anteckning av intresse för vilken ett intervall .bed fil kan. Ladda ner den senaste CpG-ö anteckning .bed fil för referens genomet av intresse från UCSC Genome Notering databas enligt anvisningarna i steg 9,4.
1. Beräkna antalet integrationsställen faller inom en viss dihållning (illustrerad i detta exempel är en 5 kb fönster) av CpG-öar med hjälp av BEDTools fönsterfunktionen och efter detta kommando:
  bedtools fönster -w 2500 central_basepair_1.bed -b CpG_hg38.bed -u> CpG_sample1.bed
Räkna antalet linjer inom produktionen CpG_sample1.bed filen för att kvantifiera det exakta antalet platser som omfattas av 2,5 kb uppströms eller nedströms CpG-öar med hjälp av följande kommando:
wc -l CpG_sample1.bed
Upprepa steg 9,6 och 9,7 för kartläggning integrationsställen i närheten TSSs. Generera en alternativ version av RefSeq.bed filen, där genomisk samordnar kartläggning till mer än en gen har justerats för att återspegla en enda gen som är närvarande i den positionen. Detta förhindrar överskattning av genen densitet kring integrationsplatser. Beräkna genen tätheten i en Mb region som omger varje integrationsstället med hjälp av BEDTools fönsterfunktionen och efter detta kommando:
Beräkna den genomsnittliga genen täthet för alla integrationer i datamängden genom att följa det här kommandot:
awk '(summa + = $ 7) END (print "Average =", summa / NR) GeneDensity_sample1.bed

10. Statist Jämför Integration Site Distributions bland Prover med två-tailed Fishers exakta test och tvåsidiga Wilcoxon rangsummetest i R

Notera: Använd Fishers exakta test för jämförelse av andelen av integrationsställen inom RefSeq gener eller inom ett fönster av CpG-öar eller TSSs, men använda Wilcoxon rangsummetest för jämförelse av fördelningen i genen densitets omger integrationsställen. R Programmet finns på http://www.r-project.org/.
Tvåsidiga Fishers exakta test:

Med hjälp av numren som beräknats enligt instruktionerna i steg 9,4 och 9,7, speate matriser för varje jämförelse i R observerade förekomster (integrationer inom en anteckning eller i ett fönster som omger en anteckning) kontra återstående platser genom att följa det här kommandot:
(Annotation_of_interest <- matris (c (SampleA # i, SampleA # återstående, SampleB # i, återstående SampleB #), nrow = 2, dimnames = lista (c ( "centrum", "Återstår"), c ( 'SampleA', 'SampleB'))))
Beräkna P-värde för jämförelse med två-tailed Fishers exakta test med följande kommando:
fisher.test (annotation_of_interest, alternativ = 'two.sided) $ p.value
Tvåsidiga Wilcoxon rangsummetest:
Skapa en tabbavgränsad txt-fil där varje kolumn innehåller provet namn i den översta cellen, följt nedan av genen densitetsvärden för alla integrationsplatser i det biblioteket (erhållen från .bed fil som genereras i steg 9,9). Importera tabbavgränsade txt-fil till R med följande kommando och navigating till rätt fil katalog:
FILNAMN <- as.data.frame (read.delim (file.choose (), header = T, check.names = FALSKT, fylla = SANT september = ' t'))
Beräkna P-värde för jämförelse med tvåsidiga Wilcoxon rangsummetest med följande kommando:
wilcox.test (Filnamns $ SampleA, FILNAMN $ SampleB alternativa = "two.sided ', parat = F, exakt = T) $ p.value
Obs: P-värden kan beräknas bara ner till en viss (extremt låg) gräns i R, varefter noll kommer att returneras av programmet. För massivt olika prover som ger ett P = 0 i R, uppskatta P-värde som <2,2 x 10 ^-308.

11. Undersök Raw sekvensdata för bevis av klonal expansion av celler som innehåller integrerade Viral DNA

Obs! En liten potential för mer än en integration på exakt samma nt i referens genomet. Alternativt kan en enda iintegration händelse kan bli redundant närvarande i sekvenseringsdata på grund av användningen av PCR under biblioteks beredning och / eller genom celldubbel före DNA-beredning. Nya analyser av genomiskt DNA från HIV-infekterade patienter har utmärkt dessa möjligheter genom att identifiera unika ultraljudsbehandling skjuvning punkter / länkfästpunkterna (som bara kan uppstå före PCR) i DNA-sekvenser som innehåller identiska integrationsställen ^52-54. Det är för närvarande en debatt om huruvida provirus hyste inom klonalt expanderade cellerna bidrar till den latenta virusreservoaren, och det är därför av särskilt intresse för att karaktärisera deras nivå expansion när man studerar integrationsställen i humana patienter.

I likhet med det förfarande som anges i steg 8,1, generera .bed filer notering ett intervall av baser som sträcker sig, i det här fallet, 25 nt nedströms från varje unik plats integration (uppströms baser är onödiga här). Skapa en FASTA fil från dessa .bed filer (enligt instruktionerna iSteg 8,1) med hjälp av fastaFromBed funktion BEDTools och efter detta kommando:
fastaFromBed -Fi / katalog / att / referens / genomet / -name -s -säng 25_base_pair_file.bed FO output_file.fasta
Obs! För att förbättra specificiteten hos varje sökning rekommenderas att extrahera åtminstone 25 nt nedströms från varje integrationsstället för klonal expansion analyser.
Företrädesvis med hjälp av en anpassad manus, sök råsekvensdata FASTA fil för alla strängar som innehåller en exakt matchning till 25 nt nedströms från varje unik plats integration, och deponera dessa sekvenser i en ny fil. Trim LTR och linkersekvenser från rå strängar. Merge PE sekvens läser genom att omvandla läser till det omvända komplementet, putsning LTR och linkersekvenser, och sedan tilldela READ2 strängar på sin READ1 par om strängarna delar åtminstone 20 överlappande nt.
Scan länk fästpunkter för varje integrationsstället blocket. Klassificera varje integration "klonalt expanderade &# 34; om länk fästpunkter är ≥3 bp isär.
Obs: Ett protokoll för klonal expansion analys utan sammanslagning sekvens läser har beskrivits ^52.
Obs: Fragmentering av genomet på exakt samma plats genom ultraljudsbehandling leder till en underskattning av omfattningen av klonal expansion, och metoder för att korrigera den resulterande experimentella partiskhet har beskrivits ^63,64.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Tabell 4 listar resultaten av ett representativt experiment för att illustrera känsligheten hos NGS för återvinning av integrationsställen från en kultur av infekterade celler. Oinfekterade cellulärt DNA användes för att seriellt späda iskt DNA från en infektion i vilken varje cell i genomsnitt innehöll en integration ^40. Spädframställdes i steg om fem till en maximal utspädning av 1: 15,625. Genomisk DNA i titreringen serien sedan fragmenteras genom ultraljudsbehandling eller genom digestion med restriktionsendonukleasema Msel och Bglll, följt av LM-PCR. Antalet unika integrationsställen, liksom antalet platser kartläggning proximal till utvalda iska anteckningar, beräknades enligt ovanstående protokoll. Dataanalys visade dussintals unika integrationsställen (1-2% av det belopp som återhämtat sig från ren iskt DNA) återhämtat sig från bibliotek framställda från celler där i teorin bara en i 15,625 var smittade. Vid analys av integrationsstället dataset, är det viktigt att jämföra data med en matchad uppsättning av slumpmässiga genomiska platser, som kallas en matchad slumpmässig kontroll eller MRC. Som representativa resultat klippt genomiskt DNA genom restriktionsenzymklyvning eller genom ultraljudsbehandling har två olika MRC datauppsättningar konstrueras. MRC _enz innehöll 50.000 unika iska platser som genereras av slumpmässigt välja platser från hg19 i närheten av de platser i Msel och Bglll restriktionsenzymklyvning, medan MRC _slump hyste 10.000 platser genereras utan normalisering för avstånd från som genom markörer. Endast de platser som kan kopplas till en unik genomisk plats bör användas i MRC datamängder. Som sonication sax iskt DNA väsentligen fri från sekvens bias, kan MRC _slump ses som mer gäller för datauppsättningar som produceras av fragmentering av DNA genom ultraljudsbehandling. Ett alternativ stil integrationskontrollsite dataset kan genereras in vitro genom att reagera rekombinant protein, intasome nukleoprotein komplex ²¹ eller PIC extraherade från akut infekterade celler ¹⁷ med avproteiniserad genomiskt DNA, och sedan efter det att LM-PCR och NGS protokoll ^21.

P-värden för jämförelse av fördelningen av integrationsställen utvanns genom sonikering kontra restriktionsklyvning (jämförelsen är mellan de oblandade proverna), samt för jämförelse med MRC _enz och MRC _{slumpmässigt,} visas i Figur 2. Fördelningen av integrationsställen återvinnas efter ultraljudsbehandling liknade dem som utvinns genom restriktionsenzym smälta för alla kommentarer undersökta med största variansen tydlig när det gäller närhet till CpG-öar. Som väntat ^18,65 båda datauppsättningar skiljer sig signifikant från MRC i termer av integrationer inom RefSeq gener och gen density kring den genomsnittliga platsen integration, medan de båda datauppsättningar liknade de MRC när det gäller fördelningen i förhållande till CpG-öar och TSSs. Eftersom relativt få HIV-1 integrationsställen karta inom 2,5 kb av en CpG-ö eller TSS, vilket ökar det totala antalet platser återvinns är sannolikt att minska variationen som kan uppstå mellan datamängder (tabell 4 och figur 2). Sekvens logotyper för att bekräfta äktheten av integrationsstället data visas i Figur 3. Konsensus HIV-1 integrationsstället ^14,22 (-3) TDG (G / V) TWA (C / B) CHA (7) ( skrivas med International Union of Biochemistry bas koder, backslash anger positionen för vDNA plussträngen att gå, och understrykningen anger 5-bp sekvens dupliceras efter HIV-1 integration och DNA-reparation) är uppenbar för bibliotek framställda av både splittertekniker, även om den grad av säkerhet minskar med ökande utspädning av infekterad cellDNA. De slumpmässiga platser i linje från MRC dataset däremot misslyckats med att generera betydande nivåer av grundinställningar.

Figur 1
Figur 1:. Flödesschema Illustration av integrationsstället Library Förberedelser (A) Generera virusförråd genom att transfektera HEK293T celler, skörd och filtrering supernatant 48 timmar senare, koncentrering genom ultracentrifugering, och infektera målceller med lämplig koncentration av virus. Minst fem dagar efter infektion, extrahera genomiskt DNA. Se avsnitt 1 och 2 i huvudtexten för ytterligare experimentella detaljer. (B och C) Fragment renas genom-DNA genom digerering med restriktionsenzymer eller genom sonikering. Restriktionsenzym cocktail bör innehålla ett enzym (t ex Bglll) som klyver nedströms från uppströms virala LTR att kontra väljer för LM-PCR-amplifiering av inre vDNA sekvenser. Grön asterisk och grenade pilen i (C) betecknar att Bglll bör tillämpas efter länkbindning. Röda höjdpunkter viral sekvens, medan svarta höjdpunkter värd cellulär sekvens. Implicit DNA brytpunkter (ej i skala) är markerade med "X" HIV-1 innehåller många Msel och Bglll-ställen; bara de delar som berör protokollet visas. Fästena ovanför kartorna betecknar U5-cellulär DNA-regioner företrädesvis förstärkta av LM-PCR. (D) Rena fragmenterat DNA (då slut reparation och A-svans när det gäller ultraljudsbehandling) och ligera till (E) kompatibla asymmetriska linkermolekyler (blåfärgad). Magenta cirklar i (D) indikerar integrationsstället som kommer att förstärkas. Asterisker vid 3'-ändarna av de länkande korta strängarna betecknar amino blockerande modifikationer. (F) Conduct första omgången av semi-innesluten PCR med användning av första omgången LTR primer (röd) och linker primer (blå). i thans PCR runda, kodar för linker primer för DNA-klustring och NGS primerbindande sekvenser (grupperade som en grön bihang till den blå linker primer), medan LTR primer saknar sådana sekvenser. (G) Rena första omgången PCR-produkt och utföra andra omgången av semi-kapslad PCR. I denna omgång av PCR, använda samma länk primer som i den första omgången (blå + grön bihang), tillsammans med den andra omgången LTR primer (röd) som bär DNA klustring och NGS primer bindande sekvenser samt en streckkod för multiplexering ( grupperade som en grön bihang till den röda LTR primer). (H) Rena andra omgången PCR-produkt som den slutliga integrationsstället biblioteket (förpackade i magenta, med integrationsstället markeras med magenta cirkel). Lämna prov sekvensering anläggning för QC och NGS. Klicka här för att se en större version av denna siffra.

"Bild Figur 2:. P Värden för jämförelse av integrations webbplatser Amplified Efter DNA-fragmentering genom sonikering eller genom restriktionsenzymdigestion kontra Respektive MRC Antal integrations platser inom RefSeq gener och närliggande CpG-öar och TSSs, samt regionala profiler gen densitet, redovisas i . tabell 4 P-värden ≥0.05 framhävs i fet och kursiv text ^en p-värden som beräknats av Fishers exakta test ^b P-värden som beräknats av Wilcoxon rangsummetest ^c MRC _enz... matchas slumpvis kontroll; en uppsättning av 50.000 unika integrationsställen producerades genom att slumpmässigt välja positioner i närheten av Msel / Bglll restriktionsställen i hg build 19. ^d MRC _random: matchas slumpvis kontroll innehållande 10.000 unika integrationsställen produceras av slumpmässigt selecting positioner i hg19 utan normalisering till restriktionsställe närhet. Klicka här för att se en större version av denna siffra.

Figur 3
Figur 3: Sekvens Logos Visa den HIV-1 Base Inställningar representativt experiment bibliotek Integrations platser från bibliotek framställda genom (A) spjälkning med restriktionsenzymer eller (B) ultraljudsbehandling var i linje med hjälp av WebLogo programvara.. Varje utspädning i titreringen serien visas, från ren DNA vid toppen av figuren till maximal utspädning om 1: 15,625 i botten. (C) Sekvens logotyp för MRC av 50.000 unika iska platser. Felstaplar representerar väsentligen standardavvikelsen i bas inkorporering vid någon särskild position. Mer specifikt, total höjd felstapeln motsvarar dubbla litet urval korrigering ^66, som styr för underskattning av entropi närvarande i relativt små datamängder. X-axeln representerar värdcellens genomiska DNA nt lägen i förhållande till platsen för integrationen på punkt noll. Klicka här för att se en större version av denna siffra.

Bord 1
. Tabell 1: oligonukleotidsekvenser för Linker Konstruktion och PCR-amplifiering Linker-specifika och andra omgången LTR primers kodar DNA-klustring adaptersekvenser, som är färgkodade enligt följande: svart, baser komplementära till länken eller till HIV-1-LTR; rött, unikt index eller streckkod; grön, sekvenseringsprimer-bindningsställen; blått, adaptersekvenser för DNA-klustring. Single-end (SE) sekvense reaTGÄRDER kommer att utnyttja den sekvenseringsprimer som hybridiserar till den andra omgången LTR primer READ1 (grön) sekvens, medan parade slut (PE) reaktioner kommer att använda både (READ1 och READ2) sekvenseringsprimrar. ^en länk korta strängar innehåller 3 'aminoblockerande modifiering. klicka här för att se en större version av denna tabell.

Reagens	Lägga till per reaktion
First Round LTR primer (15 ^ M):	2,5 ^
Linker-specifik primer (15 \| iM):	0,5 ^
10x PCR-buffert:	2,5 ^
dNTP (2,5 mM vardera)	0,5 ^
DNA-polymeras mix:	0,5 ^
Ligeringsreaktion:	100 ng
Nukleasfritt vatten:	upp till 25 \| j, l

Tabell 2:. Recept för första omgången PCR Mängden av varje specificerad reagens som skall tillsättas till varje enskild PCR-rör indikeras.

Reagens	Lägga till per reaktion
Andra omgången LTR primer (15 ^ M):	2,5 ^
Linker-specifik primer (15 \| iM):	0,5 ^
10x PCR-buffert:	2,5 ^
dNTP (2,5 mM vardera)	0,5 ^
DNA-polymeras mix:	0,5 ^
Första omgången PCR: 100 ng
Nukleasfritt vatten:	upp till 25 \| j, l

Tabell 3:. Andra omgången PCR Recept Mängden av varje reagens som skall sättas till varje PCR-rör indikeras.

<td> Digest, 1: 125

Bibliotek	#Unique webbplatser	% RefSeq ^en	% CpG +/- 2,5 kb ^b	% TSS +/- 2,5 kb ^c	Avg. Gen Densitet +/- 500 kb ^d
Ultraljudsbehandling, snyggt	3169	71,2	5,1	3,7	15,8
Sonikering, 1: 5	366	75,1	2,7	3	16,3
254	74	7,1	5,1	16,7
Sonikering, 1: 125	430	69,8	6,9	6	14,6
Sonikering, 1: 625	314	65,6	5,6	6,7	13,5
Sonikering, 1: 3125	116	73,6	3,5	2,5	13,1
Sonikering, 1: 15625	72	62,5	0	1,4	14,7
Digest, snyggt	7428	69,8	3,6	2,9	15,2
Digest, 1: 5	1460	71,4	4,4	3,4	14,9
Digest, 01:25	394	68,8	4,3	3,3	15,8
172	71	0	3	14
Digest, 1: 625	134	73,9	3,7	3,7	14,1
Digest, 1: 3125	100	83,1	6,4	5,2	19,1
Digest, 1: 15625	73	74	4,1	1,4	9,7
MRC _enz ^e	50000	44,7	4,2	4	8,7
MRC _random ^f	10000	41,3	5,3	4,2	8,6

Tabell 4: Genomisk Fördelning av integrations platser från representant Titrering serien procent av totala integrationsställen th.vid faller inom ^en RefSeq gener, ^b inom 2,5 kb av CpG-öar, och ^c inom 2,5 kb av TSSs ^d Genen tätheten inom 1 Mb omger den genomsnittliga platsen integration ^e MRC _enz.. matchas slumpvis kontroll; en uppsättning av 50.000 unika integrationsställen producerades genom att slumpmässigt välja positioner i närheten av Msel / Bglll-restriktionsställen i hg19 ^f MRC _random. matchas slumpvis kontroll innehållande 10.000 unika platser integreringsslumpmässigt välja positioner i hg19 utan normalisering till fasta positioner.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Ett protokoll för analysen av retrovirala integrationsställen, från den initiala virusinfektionen steg genom kartläggning av genomiska fördelningsmönster, beskrivs. Detta protokoll är tillämpligt på alla retrovirus och alla infekterbar celltyp. Dessutom är analysen pipeline ganska känslig, med möjligheten att återvinna ett tillfredsställande antal unika integrationsställen från serieutspädningar av genomiskt DNA som motsvarar en infektion initieras med en MOI av 6,4 x 10 ^-5. Denna känslighet gör protokollet speciellt användbar när den tillämpas på prover från infekterade patienter som kan innehålla en låg virusmängd, där endast en liten fraktion av celler kommer att hysa ett integrerat provirus. I överensstämmelse med tidigare metodik papper på detta område ^36,38,41-43 kommer flera steg i bioinformatik del av detta protokoll dra nytta av utvecklingen av skräddarsydda skript för att hantera stora filer av sekvensdata. Medan BLAT ⁵⁸ är mapping verktyg som beskrivs i detta protokoll, kan användarna Bowtie ⁶⁷ (http://bowtie-bio.sourceforge.net/index.shtml) vara ett lämpligt alternativ.

Ett alternativ bioinformatik pipeline rapporterades nyligen för bestämning av Moloney murint leukemivirus (MoMLV) integrationsställen ^19. Det pipeline är användbar i att det utvecklades till fristående programvara som är tillgänglig för allmänheten, och är ganska kraftfull i att den ursprungligen användes för att kartlägga hundratusentals unika platser MoMLV integration. Men var finns programvara som ursprungligen utformat för att åter analysera rapporterade MoMLV dataset, och så omprogrammering skulle vara nödvändigt att anpassa ledningen att alternera experimentell design (funktionaliteten av verktyget har nyligen utökats till att omfatta adenoassocierat virus och Tol2 och ac / Ds transposon vektorer ^68). Vidare beskrivs det protokollet genereringen av den preliminära integrationsställe .bedfil, men inte lägga ut särskilda åtgärder som krävs för kartsajter till relevant iska kommentarer. Läsarna kan hitta "Vector Integration Site Analysis" server ^69, som släpptes under översyn av den nuvarande manuskriptet, användbar för att analysera NGS sekvenserna som genereras med hjälp av det protokoll som beskrivs här.

Vissa punkter bör betonas när man använder ett protokoll för att analysera retrovirala integrationsstället dataset. Vid framställning av flera bibliotek i tandem, finns en betydande potential för provkorskontaminering. Även en mycket liten nivå av provet överhörning kan skymma resultaten till nivån för återgivning av NGS run oanvändbar. Därför bör alla våta bänkarbete fyllas i en steriliserad, dedikerad laminärt flöde huva eller PCR arbetsstation. En uppsättning pipetter och reagenser såsom nukleasfritt vatten bör som enbart integrationsstället amplifiering. Användningen av unika linkers för varje bibliotek beredning kan begränsa den potentiellaför kors förstärkning och även möjliggöra identifiering av crossover läser inom varje bibliotek i rå FASTA filer.

Det är viktigt att överväga för- och nackdelar med att använda ultraljudsbehandling mot restriktionsendonukleasdigerering att fragmentera iskt DNA. Å ena sidan ger sonikering en relativt slumpmässig fördelning av skjuv punkter, men de erforderliga därefter DNA-reparations och A-svans steg konsekvent minska utbytet av länk ligeringsprodukter jämfört med ligeringar som utförs med restriktionsenzym-genererade klibbiga ändar. Å andra sidan ger restriktionsenzymspjälkning en mindre utbetalda population av skjuvning punkter, som alltid kommer att införa några fördomar i återställd data. Utnyttjar ett restriktionsendonukleas att göra sig uppströms LTR-sekvenser kommer i båda fallen (Figur 1) resulterar i förlust av en liten fraktion av integrationsställen som ligger uppströms om det ställe i genomet. Alla uppgifter partiskhet som kan leda till kan vara adklädd genom att utelämna den enzymatiska nedbrytning av protokollet under biblioteket förberedelse och filtrera bort de många resulterande uppströms LTR-sekvenser från sekvensdata.

Även om nuvarande protokollet är ganska känslig och förmåga att generera miljontals unika integrationsställen ^21,40, bara ungefär en tredjedel av alla tillgängliga integrationer kan förväntas förstärkas i ett givet experiment även med de bästa av biblioteket preparat (ref. ⁷⁰ och opublicerade observationer). Detta kan leda till komplikationer vid analys av prover från låga MOI infektioner eller patienter som hyser låg virusmängd. Denna begränsning kan övervinnas delvis genom att upprepade gånger sekvensera samma bibliotek förberedelse och / eller sekvense flera bibliotek som härrör från samma DNA-prov parallellt. Framtida ökningar av analyskänsligheten kommer följaktligen att bli mycket fördelaktigt för främjandet translationella tillämpningar av retroviral integration site sekvensering.

Subscription Required. Please recommend JoVE to your librarian.

Acknowledgments

Vi är tacksamma till våra kolleger Stephen Hughes och Henry Levin för råd som var avgörande för att fastställa NGS protokoll för retroviral integration site sekvense i Engelman labbet. Detta arbete stöddes av amerikanska National Institutes of Health bidrag AI039394 och AI052014 (till ANE) och AI060354 (Harvard University Center for AIDS Research).

Materials

Name	Company	Catalog Number	Comments
DMEM	Gibco	11965-084	Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum	Thermo Scientific	SH 30088.03	Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin	Corning	30-002-Cl	Antibiotics to be added to DMEM
Phosphate-Buffered saline	Mediatech	21-040-CV	Used to wash cells
Trypsin EDTA	Corning	25-053-CI	Used to detach adherent cells from tissue culture plates
PolyJet	SignaGen Laboratories	SL100688	DNA transfection reagent
0.45 µm Filters	Thermo Scientific	09-740-35B	Used to filter virus particle-containing cell culture media
Turbo DNase	Ambion	AM2239	Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay	ABL Inc.	5447	Used to quantify yield of virus production
DNeasy Blood & Tissue Kit	Qiagen	69506	Used to purify genomic DNA from cells
Sonicator	Covaris	S2	With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water	GeneMate	G-3250-125	Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit	Qiagen	28106	Used to purify DNA during library construction
End-It DNA End-Repair Kit	Epicentre	ER81050	Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–)	New England Biolabs (NEB)	M0212S	Used with dATP to A-tail repaired DNA fragments
dATP	Thermo Scientific	R0141	Deoxyadenosine triphosphate
MseI	NEB	R0525L	Restriction endonuclease for genomic DNA cleavage
BglII	NEB	R0144L	Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase	NEB	M0202L/6218	Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides	Integrated DNA Technologies	custom	Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs
Advantage 2 Polymerase Mix	Clontech	639202	Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions)	Thermo Scientific	R0181	Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop	Thermo Scientific	NanoDrop 2000	Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter	Life Technologies	Qubit® 3.0	Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System	Agilent	G2964AA	Tape-based assay to confirm integration site library DNA size distribution
MiSeq	Illumina	SY-410-1003	Used for NGS