Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Förstärkning, Nästa generations sekvensering, och Genomic DNA Kartläggning av retroviral integration webbplatser

Published: March 22, 2016 doi: 10.3791/53840

Abstract

Retrovirus uppvisar integration signaturer på både lokala och globala skalor. Här presenterar vi ett detaljerat protokoll för (1) generering av olika bibliotek av retrovirala integrationsställen med hjälp av ligation-medierad PCR (LM-PCR) och nästa generations sekvensering (NGS), (2) kartlägga iska platsen för varje virus- värd korsningen med hjälp BEDTools, och (3) analys av data för statistisk relevans. Genomiskt DNA extraherat från infekterade celler är fragmenteras genom spjälkning med restriktionsenzymer eller genom sonikering. Efter lämplig DNA end-reparation, är dubbelsträngade linkers ligerades på DNA-ändar, och semi-innesluten PCR utförs med användning av primrar som är komplementära till både den långa terminala upprepningen (LTR) änden av viruset och det ligerade linker-DNA. PCR-primers bära sekvenser som krävs för DNA-klustring under NGS, motverkar kravet på separat adapter ligatur. Kvalitetskontroll (QC) utförs för att bedöma DNA-fragment storleksfördelning och anpassarer DNA inkorporering före NGS. Sekvens utdatafiler filtreras för LTR-innehållande läser, och sekvenserna som definierar LTR och länk beskärs bort. Trimmad värdcellssekvenser mappas till en referens genom användning av BLAT och filtreras för minimal 97% identitet med en unik punkt i referens genomet. Unika integrationsställen granskas för angränsande nukleotid (nt) sekvens och distribution i förhållande till olika iska funktioner. Användning av detta protokoll, kan integrationsstället bibliotek av hög komplexitet vara konstruerat av genomiskt DNA i tre dagar. Hela protokoll som omfattar exogen virusinfektion av mottagliga vävnadskulturceller till integrationsstället analys kan därför utföras i ungefär en till två veckor. Nya tillämpningar av denna teknik avser longitudinell analys av integrationsställen från HIV-infekterade patienter.

Introduction

Integration av viralt DNA (vDNA) in i värdcellgenomet är ett väsentligt steg i den retrovirala livscykeln. Integration åstadkommes genom viral enzymet integras (IN), som genomför två distinkta katalytiska processer som leder till upprättandet av stabilt införas proviruset en. IN subenheter ingriper med ändarna av den linjära vDNA som genereras genom omvänd transkription, bildar den högre ordningens intasome med vDNA ändar hålls samman av ett IN multimer 2-4. IN klyver 3 'ändarna av vDNA: t nedströms från invarianta 5'-CA-3' sekvenser i en process som kallas 3'-bearbetning, vilket lämnar urtagna 3'-ändar med reaktiva hydroxylgrupper vid varje vDNA terminus 5-8. Den intasome därefter importeras in i kärnan som en del av ett stort aggregat av värd och virala proteiner kända som den preintegration komplex (PIC) 9-11. Efter att ha mött cellulärt mål-DNA (tDNA), använder i vDNA 3'-hydroxyl groups att klyva tDNA övre och nedre strängarna på ett förskjutet sätt och samtidigt sammanfogar vDNA till tDNA 5 'fosfatgrupper genom processen att strängöverföring 12,13.

Retrovirus uppvisar integrationsplatsinställningar på de lokala och global skala. Lokalt konsensusintegrationsställen består av svagt konserverade palindromiska tDNA sekvenser som spänner från ungefär 9:55 bp uppströms och nedströms från vDNA insättningsställen 14,15. Globalt retrovirus målspecifika kromatin kommentarer 16. Det finns sju olika retroviral släkten - alfa genom epsilon, Lenti, och Spuma. De lentivirus, som inkluderar HIV-1, gynnar integrationen inom kropparna av aktivt transkriberade gener 17, medan gammaretroviruses företrädesvis integreras i transkriptionsstartställen (TSSs) och aktiva enhancer regioner 18-20. I skarp kontrast, är spumavirus starkt förspänd mot heterochromATIC regioner, såsom gen-dålig lamina associerade domänerna 21. Lokala tDNA bas preferenser till stor del dikteras av särskilda nätverk av nukleoprotein kontakter mellan IN och tDNA 13,22,23. För lentivirus och gammaretroviruses, är integration i förhållande till genomiska kommentarer till stor del styrs av samspelet mellan IN och besläktade cellulära faktorer 24-27. Ändra detaljerna i IN-tDNA interaktion nätverk 13,22,23,28 och störa eller re-engineering IN-värdfaktor interaktioner 25-27,29-32 är beprövade strategier för att omfördelning integration på lokal och global nivå, respektive.

Kraften i DNA-sekvenseringsförfaranden som används för att katalogisera retrovirala integrationsställen har ökat enormt under de senaste årtiondena. Integrations platser återfanns i banbrytande arbete med mödosam rening och manuella kloningsteknik för att ge en handfull unika platser per studie 33,34.Kombinationen av LM-PCR-förstärkning av LTR-värd-DNA korsningar med förmågan att kartlägga enskilda integrationsställen till mänskliga och utkast mus genomen trans fältet med antalet platser som återvunnits från exogen vävnadsodlingscell infektioner ökar till flera hundra till tusentals 17 18. Den senare kombinationen av LM-PCR med NGS metodik har sänt bibliotek djup skyhöga. Specifikt Pyrosequencing gav i storleksordningen tiotusentals unika integrationsställen 30,35-38, medan biblioteken sekvens genom användning av DNA-klustring kan ge miljontals unika sekvenser 19-21,39. Här beskriver vi en optimerad LM-PCR-protokoll för att förstärka och sekvensera retrovirala integrationsställen med hjälp av DNA-kluster NGS. Metoden inkorporerar krävs adaptersekvenser i PCR-primers och därmed direkt i de amplifierade DNA-molekyler, vilket utesluter kravet på en extra adapter ligeringssteget före sequencing 40. Den bioinformatisk pipeline analys, från tolkning av råsekvensdata för LTR-värd-DNA korsningar till kartläggning av unika platser integrations Relevanta iska funktioner är också allmänt beskrivits. I enlighet med företräde etablerad från tidigare metodologiska protokoll på detta område 36,38,41-43 kan anpassade skript utvecklas för att underlätta genomförandet av specifika åtgärder i bioinformatik pipeline. Användbarheten och känslighet av protokollet är illustrerad med representativa data genom amplifiering, sekvensering och kartläggning HIV-1 integrationsställen från vävnadsodlingsceller som infekterats vid den ungefärliga infektionsmultiplicitet (MOI) av 1,0, såväl som en titrering serie av detta DNA utspädd genom oinfekterade cellulära DNA i 5-faldig steg till en maximal utspädning av 1: 15.625 för att ge den ungefärliga motsvarande MOI av 6,4 x 10 -5.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Generera virusförråd

Obs: Ett flödesschema av den våta bänk aspekten av detta protokoll visas i figur 1 Detaljerna i viral lager produktion och efterföljande infektion av vävnadsodlingsceller i allmänhet tillämpas på olika typer av retrovirus.. För vissa försök kan målcellen uttrycker inte den endogena virala receptor (s), och i sådana fall konstruktionen av pseudotypade retrovirala partiklar som härbärgerar heterologt viralt höljesglykoprotein, t.ex. G-glykoproteinet från vesikulärt stomatitvirus (VSV-G), kommer att vara krävs för infektion 44,45.

Notera: Försiktighet bör iakttas vid arbete med HIV-1. Även specifika riktlinjer kommer att variera från institution till institution, bör alla virusbaserat arbete utföras i en särskild, operatör begränsad biologisk säkerhet skåp (typiskt kallad en vävnadsodling huva). Korrekt personlig skyddsutrustningsom innehåller ansiktsskydd, skoskydd, en dubbel handske lager, och en full body overall kostym bör bäras vid alla tillfällen. Allt flytande avfall som härrör från virusrelaterade försök bör inaktiveras med blekmedel (10% slutkoncentration), och allt avfall, inklusive fasta ämnen skall autoklaveras före avyttring.

  1. En dag före transfektion, platta 3,3 x 10 6 HEK293T-celler i 10 ml Dulbeccos Modified Eagle Medium (DMEM) kompletterat med 10% (volym / volym) fetalt bovint serum och 1% (volym / volym) penicillin / streptomycin (10000 U / ml lager) i var och en av fem 100 mm skålar.
    Obs: Kompletterat-DMEM kallas DMEM-FPS från denna punkt på.
  2. På följande dag, transfektera cellerna med 10 mikrogram av plasmid som bär fullängds retrovirala molekylära kloner eller 9 pg av kuvert utgår enkla runda vektorer med ett mikrogram av en VSV-G expressionskonstruktionen med hjälp av kommersiellt tillgängliga transfektionsreagens eller kalciumfosfat.
    1. Inkubera calnar vid 37 ° C i en fuktad cellodling inkubator med 5% CO2 (detta villkor nedan kallad "vävnadsodlingsinkubator"). Efter ca 48 timmar, skörda virusinnehållande cell media med en volymetrisk pipett och passera den genom ett 0,45 um filter genom gravitationsflöde.
    2. Koncentrera viruset genom ultracentrifugering vid 200.000 xg under 1 h vid 4 ° C. Resuspendera viruset pelleten i 500 | j, l DMEM-FPS innehållande 20 U DNas, och inkubera i 1 timme vid 37 ° C.
      Obs: DNas steget hjälper till att reducera återhämtningen av oönskade plasmidsekvenser genom att eliminera bördan av plasmid-DNA som kvarstår från transfektion förfarande.
  3. Bestämma p24 koncentration 46 med hjälp av en HIV-1 p24 antigen fånga kit enligt tillverkarens anvisningar.
    Obs: Virus koncentration kan också bestämmas genom omvänt transkriptas-aktivitet analys 47,48. Alternativt, nivån av funktionella virus kanbestämmas genom att mäta MOI. Detta är lättast görs med hjälp av fluorescensaktiverad cellsortering med virus som uttrycker fluorescerande reportergener såsom förbättrade grönt fluorescerande protein. MOI bestämningen kan vara särskilt användbart när man arbetar med primära celler som inte kan stödja samma infektion som optimerade cellinjer.

2. infektera celler med virus

  1. Platta 3,0 x 10 5 HEK293T celler per brunn i en 6-brunnsplatta i 2,5 ml DMEM-FPS och inkubera över natten i en vävnadsodlingsinkubator.
    Notera: Antalet unika integrationsställen som återvunnits med detta protokoll är direkt proportionell mot antalet celler och mängden av aktivt virus som används i infektionen.
  2. Infektera celler med en slutlig viralt p24 koncentration av 500 ng / ml i en slutlig volym av 500 | il färskt DMEM-FPS under 2 h i en vävnadsodlingsinkubator, tillsätt sedan 2 ml DMEM-FPS värmts upp till 37 ° C per brunn och fortsätta inkubationen.
  3. På48 h efter infektion, ta bort media och tvätta cellerna med 2 ml fosfatbuffrad saltlösning (PBS). Tillsätt 0,5 ml trypsin-EDTA förvärmda till 37 ° C, och efter ett par sekunder visuellt inspektera brunnarna för cell förskjutning.
  4. Tillsätt 2 ml förvärmas DMEM-FPS och resuspendera cellerna genom varsam upp / ner pipettering med en volym pipett ~ 10 gånger. Överför lösningen till en 75 cm 2 vävnadsodlingskolv innehållande 18 ml förvärmda DMEM-FPS, och inkubera cellerna i en vävnadsodlingsinkubator.
  5. Efter minimalt fem dagar från början av infektionen, samla cellerna genom att ta bort media, tvätta med 5 ml PBS, tillsätt 2 ml förvärmda trypsin-EDTA, och återsuspendera med 5 ml förvärmda DMEM-FPS genom pipettering. Centrifugera lösningen under 5 min vid rumstemperatur vid 2500 x g och kasta supernatanten.
    Obs: Även om integration under dessa förhållanden platåer vid ungefär 48 timmar efter infektion 49,50, är ytterligare 3 dagars odling erfordras för att sufficiently späda ut koncentrationen av ointegrerade DNA-molekyler som är resultatet av cellbaserad DNA-rekombination eller viral-medierad autointegration.
  6. Utdrag iskt DNA från cellpelleten med ett kommersiellt tillgängligt kit (t.ex. se 51). Eluera DNA från den medföljande jonbyteskolonnen med 200 | il av 10 mM Tris-HCl, pH 8,5.
    Obs: En delmängd av celler bör fördelas på 48 timmar efter infektion (steg 2,3) för en infektionsanalys för att säkerställa korrekt virusinfektion före NGS.

3. Fragment Genomiskt DNA genom sonikering eller genom restriktionsenzym Digest

Obs: sonication fragment iskt DNA i en så gott som sekvensoberoende sätt och är därmed att föredra splittring när sekvense prover med en låg förväntad återvinningsgrad (t.ex. infekterade patientceller eller infektioner som initieras vid relativt låg MOI). Dessutom tillåter ultraljudsbehandling en skilja PCR dubbletter av en partiCular integrationsstället sekvens från unika integrationer på samma plats, vilket är avgörande för att skilja klonal expansion av provirussekvenser innehållande celler i infekterade patienter (se steg 11 nedan) 39,52-54.
Obs: Den DNA ska klyvas omedelbart nedströms från den uppströms belägna LTR för att minska förstärkningen av interna virala sekvenser under LM-PCR. Restriktionsenzymet Bglll som ligger 43 bp nedströms från den uppströms belägna U5-sekvens och som är inkompatibel för efterföljande ligering med Msel-genererade DNA-ändar fungerar bra med många HIV-1-stammar (Figur 1B). Vid framställning av DNA genom ultraljudsbehandling, bör den interna klyvningsrestriktionsenzymet appliceras efter länkligation (se figur 1C - E och steg 4,3 nedan).

  1. För sonikering, blanda 10 ^ g av genomiskt DNA i nukleasfritt vatten till en slutlig volym av 120 | il. Sonikera med hjälp av parametrar för en genomsnittlig paus storlek på 500 bp (två omgångar av följande parameter: Höjdpunkter: 5%; intensitet: 3; cykler per burst: 200; tid: 80 sek).
  2. Rena sonikerade DNA med en PCR-reningskit. Reparera DNA-ändar med hjälp av en DNA-end-reparationssats och rena DNA med en PCR-reningskit. A-svans DNA med användning av Klenow exo - enzym och rena A-tailed DNA med en PCR-reningskit. Se 51,52 för ytterligare detaljer om kit användning.
  3. För digerering med restriktionsendonukleas, skär 10 ^ g av genomiskt DNA över natt vid 37 ° C i en volym av 100 | il med buffert som tillhandahålls av tillverkaren och en cocktail av enzymer (100 U vardera) som genererar 5'-TA överhäng, liksom en oförenligt enzym såsom Bglll som klyver nedströms från uppströms virala LTR. Rena DNA nästa dag med användning av en PCR-reningskit.
    Obs: Ingen av restriktionsenzymer bör skära i terminalen ~ 30 bp av den virala DNA-ände som förstärks av LM-PCR-protokoll. Detta protokoll förstärker specifikt U5änden av HIV-1-DNA.

4. glödgning länkoligonukleotider och Ligera till Fragmenterad Iskt DNA

Obs: Förbered en asymmetrisk linker innehållande ett överhäng som är kompatibelt med de ovan nämnda DNA-fragment (se tabell 1 för sekvenser av oligonukleotider som används i detta protokoll). Linkern som skall användas med sonikerat DNA måste innehålla ett kompatibelt T-3 'överhäng, medan linker för Msel-digererad DNA måste innehålla en kompatibel 5'-TA överhäng (figur 1). Den korta linker-strängen måste dessutom innehålla en icke-utsträckbar kemisk modifiering, såsom 3'-amin, för att begränsa de efterföljande amplifieringsreaktioner mot DNA av intresse.
Obs: Vid framställning av flera olika integrationsstället bibliotek parallellt och / eller när multiplexering unika prover på samma sekvenseringskörning, är det rekommenderat att använda unika linkers för varje prov för att begränsa risken för provkors contamination under PCR. Detta innebär dessutom användning av unika länk primrar för varje prov under semi-innesluten PCR (beskriven nedan). Unika länk strängar och länk primers kan utformas genom att förvränga de länkande oligonukleotidsekvenser som anges i tabell 1 medan liknande övergripande% GC-innehåll och gällande överhäng positioner bibehålls.

  1. Annelera de korta och långa linker-strängarna i 35 pl av 10 mM Tris-HCl, pH 8,0 till 0,1 mM EDTA (slutkoncentration av 10 ^ M av varje oligonukleotid) genom upphettning till 90 ° C och långsam kylning till rumstemperatur i steg om 1 ° C per min.
  2. Bered minst fyra parallella ligeringsreaktioner per genomisk DNA-prov, som innehåller 1,5 iM ligerade länk, 1 ng fragmenterat DNA, och 800 U T4 DNA-ligas i 50 pl. Ligera natten vid 12 ° C. Rena den nästa dag med en PCR-reningskit.
  3. För prover framställda genom ultraljudsbehandling, smälta den renade ligeringsreaktion med 100 U av en RESTRICtionsenzym som klyver nedströms från uppströms LTR (t.ex. Bglll för HIV-1) under tillverkarens rekommenderade betingelser över natten. Rena DNA med användning av ett PCR-reningskit.

5. Amplify virala LTR-Host Genomic DNA knutpunkter genom Semi-kapslad PCR

OBS: För att säkerställa optimal bibliotek mångfald, åtminstone 4-8 parallella PCR, beroende på DNA-koncentration av den återvunna ligeringsreaktionen, bör utarbetas för varje prov för både PCR-rundor. DNA-schablon koncentrationen bör kvantifieras genom spektrofotometri. I detta protokoll den första och andra omgångar av PCR använder kapslade LTR-specifika primrar, men samma linker-specifik primer används för båda omgångarna (tabell 1). Den andra omgången LTR-specifik primer och de länkspecifik primer koda adaptersekvenser för DNA-klustring samt sekvenseringsprimer-bindningsställen. Den kapslade LTR-specifik primer kodar också en sex nt index sekvens, WHich kan varieras mellan olika primers för multiplexering bibliotek inom samma sekvenseringskörning.

  1. Förbered första omgången PCR innehåller ingredienser per rör enligt tabell 2.
    Obs: linker-specifik primer härbärgerar 22 nt av komplementaritet till linkern, en smälttemperatur av 53 ° C, en GC-halt av 45%, och dess 3'-ände är belägen 15-16 baspar uppströms från 3 'termini av de olika länk långa trådar (tabell 1). Den första omgången 27 nt LTR primern har en smälttemperatur av 59 ° C, en GC-halt av 48%, och dess 3'-ände är belägen 34 bp uppströms från den HIV-1 U5 terminus. Regionen av den andra omgången 26 nt LTR-primer som är komplementär till HIV-1-LTR har en smälttemperatur av 60 ° C, en GC-halt av 50%, och dess 3'-ände är belägen 18 bp uppströms från det virala U5 terminal. Det rekommenderas att oligonukleotid smälttemperatur och GC-innehåll bör efterlikna dessa parametrar om användarekonstruktion PCR-primers med förändrade sekvenser (inklusive för användning med andra retrovirus) 21.
  2. Köra första PCR-omgången under följande termocykelparametrar: En cykel: 94 ° C under 2 min; 30 cykler: 94 ° C under 15 sekunder, 55 ° C under 30 sek, 68 ° C under 45 sek; en cykel: 68 ° C under 10 min.
  3. Pool reaktioner och rena med hjälp av en PCR-reningskit. Förbered andra omgången PCR som innehåller ingredienser per rör enligt tabell 3. Kör den andra omgången av PCR med användning av termo parametrar som beskrivs i steg 5,2. Pool reaktionerna och rena DNA med användning av ett kommersiellt PCR-reningskit enligt tillverkarens instruktioner.
    Obs: En mängd olika rekommenderade index sekvenser som är kompatibla med DNA klustring NGS finns 71.

6. Utför QC och NGS (Vanligtvis kompletteras med en Sequencing Facility)

  1. (QC analys # 1) Bekräfta Steg 5,3 bibliotek DNA-koncentration med hjälp av en fluormätaren 55. Kortfattat, förbereda standarder och experimentprover i en slutlig volym av 200 | j, l nukleasfritt vatten. Vortexrör 2-3 sek, inkubera vid rumstemperatur under 2 min, och sedan läsa proverna i fluorometern.
    Notera: Prov bör innehålla en minsta koncentration av 2 nM biblioteks-DNA i en minimal volym av 15 | il.
  2. (QC analys # 2) Bekräfta DNA-fragment storleksfördelning med hjälp av en bandbaserad analys 56.
    Notera: En idealisk fördelning är en relativt bred DNA-topp centre omkring 500 bp i längd. Om en signifikant mängd av materialet är större än 1 kb, är det rekommenderat att införliva en procedur storleksurvalet för att eliminera längre DNA-arter, vilket kommer att hindra bryggan amplifiering under klustring. Om däremot en betydande topp är uppenbar omkring 100 till 200 bp, en primer-dimer kan ha bildats under PCR. I detta fall förfarandet bör optimeras för att minimera bildningen av primerdimerer.
  3. (QC analys # 3) Confirm korrekt införlivande av adaptrar i DNA-bibliotek genom kvantitativ PCR 57.
  4. Utför NGS enligt tillverkarens ansökan litteratur. Utnyttja en spik-in på 10% (vikt / vikt) X174 DNA, som kommer att optimera realtidskvalitetsmått genom att tillhandahålla balanserad baskomposition till sekvenseringskörning.
    Obs: integrationsstället sekvense experiment vanligtvis utsätts för enstaka ände 150 bp (SE150) eller parade end 150 bp (PE150) sekvensering. PE150 är speciellt användbar för att fånga linkern fästpunkten på varje DNA-molekyl (t.ex. vid granskande integrationsställen för bevis av värdcell klonal expansion).

7. Använd en anpassad Python eller Perl-skript för att tolka sekvensdata för LTR-innehållande sekvenser, Beskär bort LTR och linkersekvenser, och Karta till referens Genome med BLAT

  1. Scan FASTA-filer för LTR-innehållande sekvensen läser, gröda LTR och linkersekvenser bort från värd genomisk DNA-sekvens, ochexportera dessa sekvenser till en ny FASTA fil. Karta beskäras läser både en referens genom (t.ex. människans genom versioner hg19 eller GRCh38) och det virala genomet med hjälp av BLAT 58, med utgångsintegrationsstället koordinater exporteras till en separat .txt-fil, med följande inställningar:
    stepsize = 6, minIdentity = 97, och maxIntron = 0
  2. Tolka BLAT utdata TXT-fil, ta bort autointegrations (dvs bevis på att LTR tanden har integrerats i en inre region av det virala DNA-genomet) och andra sekvenser avbildning till den HIV-1-genomet, och skapa en separat utgång .txt fil där alla dubbletter integrationsställen har kondenserats till en enda, unika koordinat träffar.

8. Skapa .bed filer som innehåller 15-Nt Intervall Omgivande Integrations, omvandla dessa till FASTA filer och Construct Sequence Logos till Display Base Inställningar Omgivande Integration webbplatser

  1. Skapa .bed filer som listar ett intervall av baser förvarje integrationsstället. Minst 15 baser (5 uppströms och 10 nedströms) föreslås för sekvens logo generation. Skapa en FASTA fil från dessa .bed filer med hjälp av fastaFromBed funktion från BEDTools 59 och detta kommando:
    fastaFromBed -Fi / katalog / att / referens / genomet / -name -s -säng 15_base_pair_file.bed FO output_file.fasta
    Obs: Den invarianta viral 5'-CA-3 'dinukleotid är sammanfogad med värd-DNA under integration, och verifiering av korsningen av LTR terminalen till cellulärt DNA är ett viktigt första filter för att identifiera bona fide integrationsställen. Vi sammanställer dessutom sekvens logotyper från denna värd DNA-sekvens befolkningen att kontrollera de experimentella resultaten. Som retrovirus visar signatur bas preferenser kring deras integrationsplatser 14,15, sekvens logotyper tjänar till att validera att de mappade iska platser uppstod genom IN-medierad integration jämfört med andra rekombination mekanismer som icke-homolog DNAavsluta sammanfogning 60,61.
  2. Använd WebLogo 3 (http://weblogo.threeplusone.com/create.cgi) för att skapa sekvens logotyper från FASTA filer. Klicka på "Välj fil" för att ladda upp FASTA fil, och använd följande inställningar: Visningsformat, PDF (vektor); Logo storlek, stor; Första positionsnummer, -5; Logo intervall, -5 till 5; Y-axeln skala, 0,1, Y-axeln tic avstånd, 0,5, färgschema, classic (NA).

9. Skapa Central baspar .bed filer, Kontrollera Sample korskontamination, och Karta Fördelning av unika integrering platser förhållande till relevant Iska funktioner

  1. Eftersom retroviral integration förekommer i ett sicksack sätt över tDNA strängarna, justera de exakta koordinaterna för integrationsplatser för att återspegla den centrala bp av målstället dubbel för korrekt kartläggning av genomisk fördelning i förhållande till genomiska funktioner.
    1. Därför, för 5 bp duplicera virus som HIV-1, skapa en .bed fil med den centrala bp förskjuten från den i:Integrationen plats av två baser nedströms för integrationer kartläggning till plussträngen, och två baser uppströms för integrationer kartläggning till minussträngen.
  2. För att kontrollera för provkorskontaminering, beräkna antalet integrationsställen gemensamma mellan de olika biblioteken genom att använda BEDTools skär funktion att skära central bp .bed filer för två olika prover och genom att följa det här kommandot:
    bedtools intersect -a central_basepair_1.bed -b central_basepair_2.bed -f 1,00 -r -s> overlap1v2.txt
  3. Räkna antalet linjer inom produktionen overlap1v2.txt filen för att kvantifiera det exakta antalet platser vanligt bland de två biblioteken genom att använda följande kommando:
    wc -l overlap1v2.txt
  4. Ladda ner RefSeq anteckning .bed fil för den version av referens genomet som användes för integrationsstället kartläggning från UCSC Genome Notering Database (t.ex. http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database) 62.
    1. Beräkna antalet integrationsställen som omfattas RefSeq gener genom att använda BEDTools skär funktion att skära den centrala baspar .bed fil som genererades för provet med RefSeq .bed filen efter detta kommando:
      bedtools intersect -a central_basepair_1.bed -b RefSeq_hg38.bed -u> RefSeq_sample1.bed
  5. Räkna antalet linjer inom produktionen RefSeq_sample1.bed filen för att kvantifiera det exakta antalet platser faller i RefSeq gener genom att använda följande kommando:
    wc -l RefSeq_sample1.bed
  6. Upprepa steg 9,3 och 9,4 för kartläggning integrationsplatser till någon annan anteckning av intresse för vilken ett intervall .bed fil kan. Ladda ner den senaste CpG-ö anteckning .bed fil för referens genomet av intresse från UCSC Genome Notering databas enligt anvisningarna i steg 9,4.
    1. Beräkna antalet integrationsställen faller inom en viss dihållning (illustrerad i detta exempel är en 5 kb fönster) av CpG-öar med hjälp av BEDTools fönsterfunktionen och efter detta kommando:
      bedtools fönster -w 2500 central_basepair_1.bed -b CpG_hg38.bed -u> CpG_sample1.bed
  7. Räkna antalet linjer inom produktionen CpG_sample1.bed filen för att kvantifiera det exakta antalet platser som omfattas av 2,5 kb uppströms eller nedströms CpG-öar med hjälp av följande kommando:
    wc -l CpG_sample1.bed
  8. Upprepa steg 9,6 och 9,7 för kartläggning integrationsställen i närheten TSSs. Generera en alternativ version av RefSeq.bed filen, där genomisk samordnar kartläggning till mer än en gen har justerats för att återspegla en enda gen som är närvarande i den positionen. Detta förhindrar överskattning av genen densitet kring integrationsplatser. Beräkna genen tätheten i en Mb region som omger varje integrationsstället med hjälp av BEDTools fönsterfunktionen och efter detta kommando:
  9. Beräkna den genomsnittliga genen täthet för alla integrationer i datamängden genom att följa det här kommandot:
    awk '(summa + = $ 7) END (print "Average =", summa / NR) GeneDensity_sample1.bed

10. Statist Jämför Integration Site Distributions bland Prover med två-tailed Fishers exakta test och tvåsidiga Wilcoxon rangsummetest i R

Notera: Använd Fishers exakta test för jämförelse av andelen av integrationsställen inom RefSeq gener eller inom ett fönster av CpG-öar eller TSSs, men använda Wilcoxon rangsummetest för jämförelse av fördelningen i genen densitets omger integrationsställen. R Programmet finns på http://www.r-project.org/.
Tvåsidiga Fishers exakta test:

  1. Med hjälp av numren som beräknats enligt instruktionerna i steg 9,4 och 9,7, speate matriser för varje jämförelse i R observerade förekomster (integrationer inom en anteckning eller i ett fönster som omger en anteckning) kontra återstående platser genom att följa det här kommandot:
    (Annotation_of_interest <- matris (c (SampleA # i, SampleA # återstående, SampleB # i, återstående SampleB #), nrow = 2, dimnames = lista (c ( "centrum", "Återstår"), c ( 'SampleA', 'SampleB'))))
  2. Beräkna P-värde för jämförelse med två-tailed Fishers exakta test med följande kommando:
    fisher.test (annotation_of_interest, alternativ = 'two.sided) $ p.value
    Tvåsidiga Wilcoxon rangsummetest:
  3. Skapa en tabbavgränsad txt-fil där varje kolumn innehåller provet namn i den översta cellen, följt nedan av genen densitetsvärden för alla integrationsplatser i det biblioteket (erhållen från .bed fil som genereras i steg 9,9). Importera tabbavgränsade txt-fil till R med följande kommando och navigating till rätt fil katalog:
    FILNAMN <- as.data.frame (read.delim (file.choose (), header = T, check.names = FALSKT, fylla = SANT september = ' t'))
  4. Beräkna P-värde för jämförelse med tvåsidiga Wilcoxon rangsummetest med följande kommando:
    wilcox.test (Filnamns $ SampleA, FILNAMN $ SampleB alternativa = "two.sided ', parat = F, exakt = T) $ p.value
    Obs: P-värden kan beräknas bara ner till en viss (extremt låg) gräns i R, varefter noll kommer att returneras av programmet. För massivt olika prover som ger ett P = 0 i R, uppskatta P-värde som <2,2 x 10 -308.

11. Undersök Raw sekvensdata för bevis av klonal expansion av celler som innehåller integrerade Viral DNA

Obs! En liten potential för mer än en integration på exakt samma nt i referens genomet. Alternativt kan en enda iintegration händelse kan bli redundant närvarande i sekvenseringsdata på grund av användningen av PCR under biblioteks beredning och / eller genom celldubbel före DNA-beredning. Nya analyser av genomiskt DNA från HIV-infekterade patienter har utmärkt dessa möjligheter genom att identifiera unika ultraljudsbehandling skjuvning punkter / länkfästpunkterna (som bara kan uppstå före PCR) i DNA-sekvenser som innehåller identiska integrationsställen 52-54. Det är för närvarande en debatt om huruvida provirus hyste inom klonalt expanderade cellerna bidrar till den latenta virusreservoaren, och det är därför av särskilt intresse för att karaktärisera deras nivå expansion när man studerar integrationsställen i humana patienter.

  1. I likhet med det förfarande som anges i steg 8,1, generera .bed filer notering ett intervall av baser som sträcker sig, i det här fallet, 25 nt nedströms från varje unik plats integration (uppströms baser är onödiga här). Skapa en FASTA fil från dessa .bed filer (enligt instruktionerna iSteg 8,1) med hjälp av fastaFromBed funktion BEDTools och efter detta kommando:
    fastaFromBed -Fi / katalog / att / referens / genomet / -name -s -säng 25_base_pair_file.bed FO output_file.fasta
    Obs! För att förbättra specificiteten hos varje sökning rekommenderas att extrahera åtminstone 25 nt nedströms från varje integrationsstället för klonal expansion analyser.
  2. Företrädesvis med hjälp av en anpassad manus, sök råsekvensdata FASTA fil för alla strängar som innehåller en exakt matchning till 25 nt nedströms från varje unik plats integration, och deponera dessa sekvenser i en ny fil. Trim LTR och linkersekvenser från rå strängar. Merge PE sekvens läser genom att omvandla läser till det omvända komplementet, putsning LTR och linkersekvenser, och sedan tilldela READ2 strängar på sin READ1 par om strängarna delar åtminstone 20 överlappande nt.
  3. Scan länk fästpunkter för varje integrationsstället blocket. Klassificera varje integration "klonalt expanderade &# 34; om länk fästpunkter är ≥3 bp isär.
    Obs: Ett protokoll för klonal expansion analys utan sammanslagning sekvens läser har beskrivits 52.
    Obs: Fragmentering av genomet på exakt samma plats genom ultraljudsbehandling leder till en underskattning av omfattningen av klonal expansion, och metoder för att korrigera den resulterande experimentella partiskhet har beskrivits 63,64.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Tabell 4 listar resultaten av ett representativt experiment för att illustrera känsligheten hos NGS för återvinning av integrationsställen från en kultur av infekterade celler. Oinfekterade cellulärt DNA användes för att seriellt späda iskt DNA från en infektion i vilken varje cell i genomsnitt innehöll en integration 40. Spädframställdes i steg om fem till en maximal utspädning av 1: 15,625. Genomisk DNA i titreringen serien sedan fragmenteras genom ultraljudsbehandling eller genom digestion med restriktionsendonukleasema Msel och Bglll, följt av LM-PCR. Antalet unika integrationsställen, liksom antalet platser kartläggning proximal till utvalda iska anteckningar, beräknades enligt ovanstående protokoll. Dataanalys visade dussintals unika integrationsställen (1-2% av det belopp som återhämtat sig från ren iskt DNA) återhämtat sig från bibliotek framställda från celler där i teorin bara en i 15,625 var smittade. Vid analys av integrationsstället dataset, är det viktigt att jämföra data med en matchad uppsättning av slumpmässiga genomiska platser, som kallas en matchad slumpmässig kontroll eller MRC. Som representativa resultat klippt genomiskt DNA genom restriktionsenzymklyvning eller genom ultraljudsbehandling har två olika MRC datauppsättningar konstrueras. MRC enz innehöll 50.000 unika iska platser som genereras av slumpmässigt välja platser från hg19 i närheten av de platser i Msel och Bglll restriktionsenzymklyvning, medan MRC slump hyste 10.000 platser genereras utan normalisering för avstånd från som genom markörer. Endast de platser som kan kopplas till en unik genomisk plats bör användas i MRC datamängder. Som sonication sax iskt DNA väsentligen fri från sekvens bias, kan MRC slump ses som mer gäller för datauppsättningar som produceras av fragmentering av DNA genom ultraljudsbehandling. Ett alternativ stil integrationskontrollsite dataset kan genereras in vitro genom att reagera rekombinant protein, intasome nukleoprotein komplex 21 eller PIC extraherade från akut infekterade celler 17 med avproteiniserad genomiskt DNA, och sedan efter det att LM-PCR och NGS protokoll 21.

P-värden för jämförelse av fördelningen av integrationsställen utvanns genom sonikering kontra restriktionsklyvning (jämförelsen är mellan de oblandade proverna), samt för jämförelse med MRC enz och MRC slumpmässigt, visas i Figur 2. Fördelningen av integrationsställen återvinnas efter ultraljudsbehandling liknade dem som utvinns genom restriktionsenzym smälta för alla kommentarer undersökta med största variansen tydlig när det gäller närhet till CpG-öar. Som väntat 18,65 båda datauppsättningar skiljer sig signifikant från MRC i termer av integrationer inom RefSeq gener och gen density kring den genomsnittliga platsen integration, medan de båda datauppsättningar liknade de MRC när det gäller fördelningen i förhållande till CpG-öar och TSSs. Eftersom relativt få HIV-1 integrationsställen karta inom 2,5 kb av en CpG-ö eller TSS, vilket ökar det totala antalet platser återvinns är sannolikt att minska variationen som kan uppstå mellan datamängder (tabell 4 och figur 2). Sekvens logotyper för att bekräfta äktheten av integrationsstället data visas i Figur 3. Konsensus HIV-1 integrationsstället 14,22 (-3) TDG (G / V) TWA (C / B) CHA (7) ( skrivas med International Union of Biochemistry bas koder, backslash anger positionen för vDNA plussträngen att gå, och understrykningen anger 5-bp sekvens dupliceras efter HIV-1 integration och DNA-reparation) är uppenbar för bibliotek framställda av både splittertekniker, även om den grad av säkerhet minskar med ökande utspädning av infekterad cellDNA. De slumpmässiga platser i linje från MRC dataset däremot misslyckats med att generera betydande nivåer av grundinställningar.

Figur 1
Figur 1:. Flödesschema Illustration av integrationsstället Library Förberedelser (A) Generera virusförråd genom att transfektera HEK293T celler, skörd och filtrering supernatant 48 timmar senare, koncentrering genom ultracentrifugering, och infektera målceller med lämplig koncentration av virus. Minst fem dagar efter infektion, extrahera genomiskt DNA. Se avsnitt 1 och 2 i huvudtexten för ytterligare experimentella detaljer. (B och C) Fragment renas genom-DNA genom digerering med restriktionsenzymer eller genom sonikering. Restriktionsenzym cocktail bör innehålla ett enzym (t ex Bglll) som klyver nedströms från uppströms virala LTR att kontra väljer för LM-PCR-amplifiering av inre vDNA sekvenser. Grön asterisk och grenade pilen i (C) betecknar att Bglll bör tillämpas efter länkbindning. Röda höjdpunkter viral sekvens, medan svarta höjdpunkter värd cellulär sekvens. Implicit DNA brytpunkter (ej i skala) är markerade med "X" HIV-1 innehåller många Msel och Bglll-ställen; bara de delar som berör protokollet visas. Fästena ovanför kartorna betecknar U5-cellulär DNA-regioner företrädesvis förstärkta av LM-PCR. (D) Rena fragmenterat DNA (då slut reparation och A-svans när det gäller ultraljudsbehandling) och ligera till (E) kompatibla asymmetriska linkermolekyler (blåfärgad). Magenta cirklar i (D) indikerar integrationsstället som kommer att förstärkas. Asterisker vid 3'-ändarna av de länkande korta strängarna betecknar amino blockerande modifikationer. (F) Conduct första omgången av semi-innesluten PCR med användning av första omgången LTR primer (röd) och linker primer (blå). i thans PCR runda, kodar för linker primer för DNA-klustring och NGS primerbindande sekvenser (grupperade som en grön bihang till den blå linker primer), medan LTR primer saknar sådana sekvenser. (G) Rena första omgången PCR-produkt och utföra andra omgången av semi-kapslad PCR. I denna omgång av PCR, använda samma länk primer som i den första omgången (blå + grön bihang), tillsammans med den andra omgången LTR primer (röd) som bär DNA klustring och NGS primer bindande sekvenser samt en streckkod för multiplexering ( grupperade som en grön bihang till den röda LTR primer). (H) Rena andra omgången PCR-produkt som den slutliga integrationsstället biblioteket (förpackade i magenta, med integrationsstället markeras med magenta cirkel). Lämna prov sekvensering anläggning för QC och NGS. Klicka här för att se en större version av denna siffra.

"Bild Figur 2:. P Värden för jämförelse av integrations webbplatser Amplified Efter DNA-fragmentering genom sonikering eller genom restriktionsenzymdigestion kontra Respektive MRC Antal integrations platser inom RefSeq gener och närliggande CpG-öar och TSSs, samt regionala profiler gen densitet, redovisas i . tabell 4 P-värden ≥0.05 framhävs i fet och kursiv text en p-värden som beräknats av Fishers exakta test b P-värden som beräknats av Wilcoxon rangsummetest c MRC enz... matchas slumpvis kontroll; en uppsättning av 50.000 unika integrationsställen producerades genom att slumpmässigt välja positioner i närheten av Msel / Bglll restriktionsställen i hg build 19. d MRC random: matchas slumpvis kontroll innehållande 10.000 unika integrationsställen produceras av slumpmässigt selecting positioner i hg19 utan normalisering till restriktionsställe närhet. Klicka här för att se en större version av denna siffra.

Figur 3
Figur 3: Sekvens Logos Visa den HIV-1 Base Inställningar representativt experiment bibliotek Integrations platser från bibliotek framställda genom (A) spjälkning med restriktionsenzymer eller (B) ultraljudsbehandling var i linje med hjälp av WebLogo programvara.. Varje utspädning i titreringen serien visas, från ren DNA vid toppen av figuren till maximal utspädning om 1: 15,625 i botten. (C) Sekvens logotyp för MRC av 50.000 unika iska platser. Felstaplar representerar väsentligen standardavvikelsen i bas inkorporering vid någon särskild position. Mer specifikt, total höjd felstapeln motsvarar dubbla litet urval korrigering 66, som styr för underskattning av entropi närvarande i relativt små datamängder. X-axeln representerar värdcellens genomiska DNA nt lägen i förhållande till platsen för integrationen på punkt noll. Klicka här för att se en större version av denna siffra.

Bord 1
. Tabell 1: oligonukleotidsekvenser för Linker Konstruktion och PCR-amplifiering Linker-specifika och andra omgången LTR primers kodar DNA-klustring adaptersekvenser, som är färgkodade enligt följande: svart, baser komplementära till länken eller till HIV-1-LTR; rött, unikt index eller streckkod; grön, sekvenseringsprimer-bindningsställen; blått, adaptersekvenser för DNA-klustring. Single-end (SE) sekvense reaTGÄRDER kommer att utnyttja den sekvenseringsprimer som hybridiserar till den andra omgången LTR primer READ1 (grön) sekvens, medan parade slut (PE) reaktioner kommer att använda både (READ1 och READ2) sekvenseringsprimrar. en länk korta strängar innehåller 3 'aminoblockerande modifiering. klicka här för att se en större version av denna tabell.

Reagens Lägga till per reaktion
First Round LTR primer (15 ^ M): 2,5 ^
Linker-specifik primer (15 | iM): 0,5 ^
10x PCR-buffert: 2,5 ^
dNTP (2,5 mM vardera) 0,5 ^
DNA-polymeras mix: 0,5 ^
Ligeringsreaktion: 100 ng
Nukleasfritt vatten: upp till 25 | j, l

Tabell 2:. Recept för första omgången PCR Mängden av varje specificerad reagens som skall tillsättas till varje enskild PCR-rör indikeras.

Reagens Lägga till per reaktion
Andra omgången LTR primer (15 ^ M): 2,5 ^
Linker-specifik primer (15 | iM): 0,5 ^
10x PCR-buffert: 2,5 ^
dNTP (2,5 mM vardera) 0,5 ^
DNA-polymeras mix: 0,5 ^
Första omgången PCR: 100 ng
Nukleasfritt vatten: upp till 25 | j, l

Tabell 3:. Andra omgången PCR Recept Mängden av varje reagens som skall sättas till varje PCR-rör indikeras.

<td> Digest, 1: 125
Bibliotek #Unique webbplatser % RefSeq en % CpG +/- 2,5 kb b % TSS +/- 2,5 kb c Avg. Gen Densitet +/- 500 kb d
Ultraljudsbehandling, snyggt 3169 71,2 5,1 3,7 15,8
Sonikering, 1: 5 366 75,1 2,7 3 16,3
254 74 7,1 5,1 16,7
Sonikering, 1: 125 430 69,8 6,9 6 14,6
Sonikering, 1: 625 314 65,6 5,6 6,7 13,5
Sonikering, 1: 3125 116 73,6 3,5 2,5 13,1
Sonikering, 1: 15625 72 62,5 0 1,4 14,7
Digest, snyggt 7428 69,8 3,6 2,9 15,2
Digest, 1: 5 1460 71,4 4,4 3,4 14,9
Digest, 01:25 394 68,8 4,3 3,3 15,8
172 71 0 3 14
Digest, 1: 625 134 73,9 3,7 3,7 14,1
Digest, 1: 3125 100 83,1 6,4 5,2 19,1
Digest, 1: 15625 73 74 4,1 1,4 9,7
MRC enz e 50000 44,7 4,2 4 8,7
MRC random f 10000 41,3 5,3 4,2 8,6

Tabell 4: Genomisk Fördelning av integrations platser från representant Titrering serien procent av totala integrationsställen th.vid faller inom en RefSeq gener, b inom 2,5 kb av CpG-öar, och c inom 2,5 kb av TSSs d Genen tätheten inom 1 Mb omger den genomsnittliga platsen integration e MRC enz.. matchas slumpvis kontroll; en uppsättning av 50.000 unika integrationsställen producerades genom att slumpmässigt välja positioner i närheten av Msel / Bglll-restriktionsställen i hg19 f MRC random. matchas slumpvis kontroll innehållande 10.000 unika platser integreringsslumpmässigt välja positioner i hg19 utan normalisering till fasta positioner.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Ett protokoll för analysen av retrovirala integrationsställen, från den initiala virusinfektionen steg genom kartläggning av genomiska fördelningsmönster, beskrivs. Detta protokoll är tillämpligt på alla retrovirus och alla infekterbar celltyp. Dessutom är analysen pipeline ganska känslig, med möjligheten att återvinna ett tillfredsställande antal unika integrationsställen från serieutspädningar av genomiskt DNA som motsvarar en infektion initieras med en MOI av 6,4 x 10 -5. Denna känslighet gör protokollet speciellt användbar när den tillämpas på prover från infekterade patienter som kan innehålla en låg virusmängd, där endast en liten fraktion av celler kommer att hysa ett integrerat provirus. I överensstämmelse med tidigare metodik papper på detta område 36,38,41-43 kommer flera steg i bioinformatik del av detta protokoll dra nytta av utvecklingen av skräddarsydda skript för att hantera stora filer av sekvensdata. Medan BLAT 58 är mapping verktyg som beskrivs i detta protokoll, kan användarna Bowtie 67 (http://bowtie-bio.sourceforge.net/index.shtml) vara ett lämpligt alternativ.

Ett alternativ bioinformatik pipeline rapporterades nyligen för bestämning av Moloney murint leukemivirus (MoMLV) integrationsställen 19. Det pipeline är användbar i att det utvecklades till fristående programvara som är tillgänglig för allmänheten, och är ganska kraftfull i att den ursprungligen användes för att kartlägga hundratusentals unika platser MoMLV integration. Men var finns programvara som ursprungligen utformat för att åter analysera rapporterade MoMLV dataset, och så omprogrammering skulle vara nödvändigt att anpassa ledningen att alternera experimentell design (funktionaliteten av verktyget har nyligen utökats till att omfatta adenoassocierat virus och Tol2 och ac / Ds transposon vektorer 68). Vidare beskrivs det protokollet genereringen av den preliminära integrationsställe .bedfil, men inte lägga ut särskilda åtgärder som krävs för kartsajter till relevant iska kommentarer. Läsarna kan hitta "Vector Integration Site Analysis" server 69, som släpptes under översyn av den nuvarande manuskriptet, användbar för att analysera NGS sekvenserna som genereras med hjälp av det protokoll som beskrivs här.

Vissa punkter bör betonas när man använder ett protokoll för att analysera retrovirala integrationsstället dataset. Vid framställning av flera bibliotek i tandem, finns en betydande potential för provkorskontaminering. Även en mycket liten nivå av provet överhörning kan skymma resultaten till nivån för återgivning av NGS run oanvändbar. Därför bör alla våta bänkarbete fyllas i en steriliserad, dedikerad laminärt flöde huva eller PCR arbetsstation. En uppsättning pipetter och reagenser såsom nukleasfritt vatten bör som enbart integrationsstället amplifiering. Användningen av unika linkers för varje bibliotek beredning kan begränsa den potentiellaför kors förstärkning och även möjliggöra identifiering av crossover läser inom varje bibliotek i rå FASTA filer.

Det är viktigt att överväga för- och nackdelar med att använda ultraljudsbehandling mot restriktionsendonukleasdigerering att fragmentera iskt DNA. Å ena sidan ger sonikering en relativt slumpmässig fördelning av skjuv punkter, men de erforderliga därefter DNA-reparations och A-svans steg konsekvent minska utbytet av länk ligeringsprodukter jämfört med ligeringar som utförs med restriktionsenzym-genererade klibbiga ändar. Å andra sidan ger restriktionsenzymspjälkning en mindre utbetalda population av skjuvning punkter, som alltid kommer att införa några fördomar i återställd data. Utnyttjar ett restriktionsendonukleas att göra sig uppströms LTR-sekvenser kommer i båda fallen (Figur 1) resulterar i förlust av en liten fraktion av integrationsställen som ligger uppströms om det ställe i genomet. Alla uppgifter partiskhet som kan leda till kan vara adklädd genom att utelämna den enzymatiska nedbrytning av protokollet under biblioteket förberedelse och filtrera bort de många resulterande uppströms LTR-sekvenser från sekvensdata.

Även om nuvarande protokollet är ganska känslig och förmåga att generera miljontals unika integrationsställen 21,40, bara ungefär en tredjedel av alla tillgängliga integrationer kan förväntas förstärkas i ett givet experiment även med de bästa av biblioteket preparat (ref. 70 och opublicerade observationer). Detta kan leda till komplikationer vid analys av prover från låga MOI infektioner eller patienter som hyser låg virusmängd. Denna begränsning kan övervinnas delvis genom att upprepade gånger sekvensera samma bibliotek förberedelse och / eller sekvense flera bibliotek som härrör från samma DNA-prov parallellt. Framtida ökningar av analyskänsligheten kommer följaktligen att bli mycket fördelaktigt för främjandet translationella tillämpningar av retroviral integration site sekvensering.

Subscription Required. Please recommend JoVE to your librarian.

Acknowledgments

Vi är tacksamma till våra kolleger Stephen Hughes och Henry Levin för råd som var avgörande för att fastställa NGS protokoll för retroviral integration site sekvense i Engelman labbet. Detta arbete stöddes av amerikanska National Institutes of Health bidrag AI039394 och AI052014 (till ANE) och AI060354 (Harvard University Center for AIDS Research).

Materials

Name Company Catalog Number Comments
DMEM Gibco 11965-084 Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum Thermo Scientific SH 30088.03 Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin Corning 30-002-Cl Antibiotics to be added to DMEM
Phosphate-Buffered saline Mediatech 21-040-CV Used to wash cells
Trypsin EDTA Corning 25-053-CI Used to detach adherent cells from tissue culture plates
PolyJet SignaGen Laboratories SL100688 DNA transfection reagent
0.45 µm Filters Thermo Scientific 09-740-35B Used to filter virus particle-containing cell culture media
Turbo DNase Ambion AM2239 Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay ABL Inc. 5447 Used to quantify yield of virus production
DNeasy Blood & Tissue Kit Qiagen 69506 Used to purify genomic DNA from cells
Sonicator Covaris S2 With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water GeneMate G-3250-125 Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit Qiagen 28106 Used to purify DNA during library construction
End-It DNA End-Repair Kit Epicentre ER81050 Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–) New England Biolabs (NEB) M0212S Used with dATP to A-tail repaired DNA fragments
dATP Thermo Scientific R0141 Deoxyadenosine triphosphate
MseI NEB R0525L Restriction endonuclease for genomic DNA cleavage
BglII NEB R0144L Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase NEB M0202L/6218 Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides Integrated DNA Technologies custom Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs 
Advantage 2 Polymerase Mix Clontech 639202 Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions) Thermo Scientific R0181 Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop Thermo Scientific NanoDrop 2000 Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter Life Technologies Qubit® 3.0 Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System Agilent G2964AA Tape-based assay to confirm integration site library DNA size distribution
MiSeq Illumina SY-410-1003 Used for NGS

DOWNLOAD MATERIALS LIST

References

  1. Craigie, R., Bushman, F. D. HIV DNA integration. Cold Spring Harb. Perspect. Med. 2, a006890 (2012).
  2. Li, M., Mizuuchi, M., Burke, T. R. J., Craigie, R. Retroviral DNA integration: reaction pathway and critical intermediates. EMBO J. 25, 1295-1304 (2006).
  3. Hare, S., Gupta, S. S., Valkov, E., Engelman, A., Cherepanov, P. Retroviral intasome assembly and inhibition of DNA strand transfer. Nature. 464, 232-236 (2010).
  4. Hare, S., Maertens, G. N., Cherepanov, P. 3'-processing and strand transfer catalysed by retroviral integrase in crystallo. EMBO J. 31, 3020-3028 (2012).
  5. Fujiwara, T., Mizuuchi, K. Retroviral DNA integration: structure of an integration intermediate. Cell. 54, 497-504 (1988).
  6. Roth, M. J., Schwartzberg, P. L., Goff, S. P. Structure of the termini of DNA intermediates in the integration of retroviral DNA: dependence on IN function and terminal DNA sequence. Cell. 58, 47-54 (1989).
  7. Brown, P. O., Bowerman, B., Varmus, H. E., Bishop, J. M. Retroviral integration: structure of the initial covalent product and its precursor, and a role for the viral IN protein. Proc. Natl. Acad. Sci. USA. 86, 2525-2529 (1989).
  8. Pauza, C. D. Two bases are deleted from the termini of HIV-1 linear DNA during integrative recombination. Virology. 179, 886-889 (1990).
  9. Bowerman, B., Brown, P. O., Bishop, J. M., Varmus, H. E. A nucleoprotein complex mediates the integration of retroviral DNA. Genes Dev. 3, 469-478 (1989).
  10. Bukrinsky, M. I., et al. Active nuclear import of human immunodeficiency virus type 1 preintegration complexes. Proc. Natl. Acad. Sci. USA. 89, 6580-6584 (1992).
  11. Miller, M. D., Farnet, C. M., Bushman, F. D. Human immunodeficiency virus type 1 preintegration complexes: studies of organization and composition. J. Virol. 71, 5382-5390 (1997).
  12. Engelman, A., Mizuuchi, K., Craigie, R. HIV-1 DNA integration: mechanism of viral DNA cleavage and DNA strand transfer. Cell. 67, 1211-1221 (1991).
  13. Maertens, G. N., Hare, S., Cherepanov, P. The mechanism of retroviral integration from X-ray structures of its key intermediates. Nature. 468, 326-329 (2010).
  14. Holman, A. G., Coffin, J. M. Symmetrical base preferences surrounding HIV-1, avian sarcoma/leukosis virus, and murine leukemia virus integration sites. Proc. Natl. Acad. Sci. USA. 102, 6103-6107 (2005).
  15. Wu, X., Li, Y., Crise, B., Burgess, S. M., Munroe, D. J. Weak palindromic consensus sequences are a common feature found at the integration target sites of many retroviruses. J. Virol. 79, 5211-5214 (2005).
  16. Kvaratskhelia, M., Sharma, A., Larue, R. C., Serrao, E., Engelman, A. Molecular mechanisms of retroviral integration site selection. Nucleic Acids Res. 42, 10209-10225 (2014).
  17. Schroder, A. R., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110, 521-529 (2002).
  18. Wu, X., Li, Y., Crise, B., Burgess, S. M. Transcription start regions in the human genome are favored targets for MLV integration. Science. 300, 1749-1751 (2003).
  19. LaFave, M. C., et al. MLV integration site selection is driven by strong enhancers and active promoters. Nucleic Acids Res. 42, 4257-4269 (2014).
  20. De Ravin, S. S., et al. Enhancers are major targets for murine leukemia virus vector integration. J. Virol. 88, 4504-4513 (2014).
  21. Maskell, D. P., et al. Structural basis for retroviral integration into nucleosomes. Nature. 523, 366-369 (2015).
  22. Serrao, E., et al. Integrase residues that determine nucleotide preferences at sites of HIV-1 integration: implications for the mechanism of target DNA binding. Nucleic Acids Res. 42, 5164-5176 (2014).
  23. Aiyer, S., et al. Structural and sequencing analysis of local target DNA recognition by MLV integrase. Nucleic Acids Res. 43, 5647-5663 (2015).
  24. Ciuffi, A., et al. A role for LEDGF/p75 in targeting HIV DNA integration. Nat. Med. 11, 1287-1289 (2005).
  25. Sharma, A., et al. BET proteins promote efficient murine leukemia virus integration at transcription start sites. Proc. Natl. Acad. Sci. USA. 110, 12036-12041 (2013).
  26. Gupta, S. S., et al. Bromo- and extraterminal domain chromatin regulators serve as cofactors for murine leukemia virus integration. J. Virol. 87, 12721-12736 (2013).
  27. De Rijck, J., et al. The BET family of proteins targets moloney murine leukemia virus integration near transcription start sites. Cell Rep. 5, 886-894 (2013).
  28. Demeulemeester, J., et al. HIV-1 integrase variants retarget viral integration and are associated with disease progression in a chronic infection cohort. Cell Host Microbe. 16, 651-662 (2014).
  29. Meehan, A. M., et al. LEDGF/p75 proteins with alternative chromatin tethers are functional HIV-1 cofactors. PLoS Pathog. 5, e1000522 (2009).
  30. Ferris, A. L., et al. Lens epithelium-derived growth factor fusion proteins redirect HIV-1 DNA integration. Proc. Natl. Acad. Sci. USA. 107, 3135-3140 (2010).
  31. Gijsbers, R., et al. LEDGF hybrids efficiently retarget lentiviral integration into heterochromatin. Mol. Ther. 18, 552-560 (2010).
  32. Aiyer, S., et al. Altering murine leukemia virus integration through disruption of the integrase and BET protein family interaction. Nucleic Acids Res. 42, 5917-5928 (2014).
  33. Jahner, D., Jaenisch, R. Integration of Moloney leukaemia virus into the germ line of mice: correlation between site of integration and virus activation. Nature. 287, 456-458 (1980).
  34. Stevens, S. W., Griffith, J. D. Human immunodeficiency virus type 1 may preferentially integrate into chromatin occupied by L1Hs repetitive elements. Proc. Natl. Acad. Sci. USA. 91, 5557-5561 (1994).
  35. Wang, G. P., Ciuffi, A., Leipzig, J., Berry, C. C., Bushman, F. D. HIV integration site selection: analysis by massively parallel pyrosequencing reveals association with epigenetic modifications. Genome Res. 17, 1186-1194 (2007).
  36. Wang, G. P., et al. DNA bar coding and pyrosequencing to analyze adverse events in therapeutic gene transfer. Nucleic Acids Res. 36, e49 (2008).
  37. Roth, S. L., Malani, N., Bushman, F. D. Gammaretroviral integration into nucleosomal target DNA in vivo. J. Virol. 85, 7393-7401 (2011).
  38. Ciuffi, A., Barr, S. D. Identification of HIV integration sites in infected host genomic DNA. Methods. 53, 39-46 (2011).
  39. Gillet, N. A., et al. The host genomic environment of the provirus determines the abundance of HTLV-1-infected T-cell clones. Blood. 117, 3113-3122 (2011).
  40. Matreyek, K. A., et al. Host and viral determinants for MxB restriction of HIV-1 infection. Retrovirology. 11, 90 (2014).
  41. Ciuffi, A., et al. Methods for integration site distribution analyses in animal cell genomes. Methods. 47, 261-268 (2009).
  42. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39, e72 (2011).
  43. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol. Biol. 1185, 321-344 (2014).
  44. Page, K. A., Landau, N. R., Littman, D. R. Construction and use of a human immunodeficiency virus vector for analysis of virus infectivity. J. Virol. 64, 5270-5276 (1990).
  45. Emi, N., Friedmann, T., Yee, J. K. Pseudotype formation of murine leukemia virus with the G protein of vesicular stomatitis virus. J. Virol. 65, 1202-1207 (1991).
  46. Wehrly, K., Chesebro, B. p24 antigen capture assay for quantification of human immunodeficiency virus using readily available inexpensive reagents. Methods. 12, 288-293 (1997).
  47. Goff, S., Traktman, P., Baltimore, D. Isolation and properties of Moloney murine leukemia virus mutants: use of a rapid assay for release of virion reverse transcriptase. J. Virol. 38, 239-248 (1981).
  48. Willey, R. L., et al. In vitro mutagenesis identifies a region within the envelope gene of the human immunodeficiency virus that is critical for infectivity. J. Virol. 62, 139-147 (1988).
  49. Butler, S. L., Hansen, M. S., Bushman, F. D. A quantitative assay for HIV DNA integration in vivo. Nat. Med. 7, 631-634 (2001).
  50. Brussel, A., Sonigo, P. Analysis of early human immunodeficiency virus type 1 DNA synthesis by use of a new sensitive assay for quantifying integrated provirus. J. Virol. 77, 10119-10124 (2003).
  51. Serrao, E., Ballandras-Colas, A., Cherepanov, P., Maertens, G. N., Engelman, A. N. Key determinants of target DNA recognition by retroviral intasomes. Retrovirology. 12, 39 (2015).
  52. Maldarelli, F., et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345, 179-183 (2014).
  53. Wagner, T. A., et al. HIV latency. Proliferation of cells with HIV integrated into cancer genes contributes to persistent infection. Science. 345, 570-573 (2014).
  54. Cohn, L. B., et al. HIV-1 integration landscape during latent and active infection. Cell. 160, 420-432 (2015).
  55. Li, X., Ben-Dov, I. Z., Mauro, M., Williams, Z. Lowering the quantification limit of the QubitTM RNA HS assay using RNA spike-in. BMC Mol. Biol. 16, 9 (2015).
  56. Padmanaban, A., Walker, D. M. Analysis of high molecular weight genomic DNA using the Agilent 2200 TapeStation and genomic DNA ScreenTape. Publication number 5991-1797EN Agilent Technologies. , Agilent Technologies, Inc. Santa Clara, CA. (2013).
  57. Kapa library quantification technical guide version v1.14. , KapaBiosystems. Boston, MA. (2014).
  58. Kent, W. J. BLAT--the BLAST-like alignment tool. Genome Res. 12, 656-664 (2002).
  59. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  60. Gaur, M., Leavitt, A. D. Mutations in the human immunodeficiency virus type 1 integrase D,D(35)E motif do not eliminate provirus formation. J. Virol. 72, 4678-4685 (1998).
  61. Varadarajan, J., McWilliams, M. J., Hughes, S. H. Treatment with suboptimal doses of raltegravir leads to aberrant HIV-1 integrations. Proc. Natl. Acad. Sci. USA. 110, 14747-14752 (2013).
  62. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12, 996-1006 (2002).
  63. Berry, C. C., et al. Estimating abundances of retroviral insertion sites from DNA fragment length data. Bioinformatics. 28, 755-762 (2012).
  64. Firouzi, S., et al. Development and validation of a new high-throughput method to investigate the clonality of HTLV-1-infected cells based on provirus integration sites. Genomic Med. 6, 46 (2014).
  65. Mitchell, R. S., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2, E234 (2004).
  66. Schneider, T. D., Stormo, G. D., Gold, L., Ehrenfeucht, A. Information content of binding sites on nucleotide sequences. J. Mol. Biol. 188, 415-431 (1986).
  67. Langmead, B. Chapter 11, Unit 11. 17, Aligning sort sequencing reads with Bowtie. Curr. Protoc. Bioinformatics. , (2010).
  68. LaFave, M. C., Varshney, G. K., Burgess, S. M. GeIST: a pipeline for mapping integrated DNA elements. Bioinformatics. 31, 3219-3221 (2015).
  69. Hocum, J. D., et al. VISA - Vector Integration Site Analysis server: a web-based server to rapidly identify retroviral integration sites from next-generation sequencing. BMC Bioinformatics. 16, 212 (2015).
  70. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15, 1431-1436 (2009).
  71. TruSeq Library Prep Pooling Guide. Guidelines for pooling TruSeq libraries for Illumina sequencing systems that require balanced index combinations. , Source: https://support.illumina.com/downloads/truseq-library-prep-pooling-guide-15042173.html (2015).

Tags

Virologi retrovirus HIV-1 integration integras integrationsplatser nästa generations sekvensering
Förstärkning, Nästa generations sekvensering, och Genomic DNA Kartläggning av retroviral integration webbplatser
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Serrao, E., Cherepanov, P.,More

Serrao, E., Cherepanov, P., Engelman, A. N. Amplification, Next-generation Sequencing, and Genomic DNA Mapping of Retroviral Integration Sites. J. Vis. Exp. (109), e53840, doi:10.3791/53840 (2016).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter