Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Toveis retroviral integrasjonssted PCR-metodikk og kvantitativ dataanalyse arbeidsflyt

Published: June 14, 2017 doi: 10.3791/55812
* These authors contributed equally

Summary

Dette manuskriptet beskriver eksperimentell prosedyre og programvareanalyse for en toveis integreringsstedanalyse som samtidig kan analysere oppstrøms og nedstrøms vektor-vert-kryss-DNA. Toveis PCR-produkter kan brukes til alle nedstrøms sekvenseringsplattformer. De resulterende dataene er nyttige for en høy gjennomstrømning, kvantitativ sammenligning av integrerte DNA-mål.

Abstract

Integrasjonssted (IS) analyser er en kritisk komponent i studien av retrovirale integrasjonssteder og deres biologiske betydning. I nyere retrovirale genterapi-studier har IS-analyser, i kombinasjon med neste generasjons sekvensering, blitt brukt som et celle-sporingsverktøy for å karakterisere klonale stamcellepopulasjoner som deler samme IS. For nøyaktig sammenligning av repopulerende stamcellekloner i og over forskjellige prøver, er gjenkjenningsfølsomheten, data-reproducerbarheten og høy gjennomstrømningskapasiteten til analysen blant de viktigste analysekvaliteter. Dette arbeidet gir en detaljert protokoll- og dataanalyseprosess for toveis-IS-analyse. Den toveisanalyse kan samtidig sekvensere både oppstrøms og nedstrøms vektor-vert-kryssinger. Sammenlignet med konvensjonelle ensrettede IS-sekvenseringsmetoder, forbedrer bidireksjonell tilnærming signifikant IS-detekteringshastigheter og karakteriseringen av integrasjonshendelser i begge ender av tHan målretter seg mot DNA. Dataanalysepipelinjen som er beskrevet her, identifiserer og oppregner nøyaktig identiske IS-sekvenser gjennom flere trinn for sammenligning som kartet IS-sekvenser på referansegenomet og bestemmer sekvenseringsfeil. Ved hjelp av en optimalisert analyseprosedyre har vi nylig publisert detaljerte repopulasjonsmønstre av tusenvis av hematopoietiske stamceller (HSC) kloner etter transplantasjon i rhesus macaques, som for første gang demonstrerte det presise tidspunktet for HSC-repopulasjon og den funksjonelle heterogeniteten av HSCs i Primatsystem. Følgende protokoll beskriver trinnvis eksperimentell prosedyre og dataanalyseprosess som nøyaktig identifiserer og kvantifiserer identiske IS-sekvenser.

Introduction

Retrovirus setter deres genomiske DNA inn i vertsgenomet på forskjellige steder. Denne unike egenskapen, som kan bidra til utvikling av kreft og andre former for viral patogenese, har den ironiske fordelen ved å gjøre disse virusene svært mottagelige for celleteknikk for genterapi og grunnleggende biologisk forskning. Viral Integration Site (IS) - plasseringen på vertsgenomet der et fremmed DNA (virus) er integrert - har viktige implikasjoner for skjebnen til både de integrerte virusene og vertscellene. IS-analyser har vært brukt i ulike biologiske og kliniske forskningsinnstillinger for å studere retroviral integrasjonsstedseleksjon og patogenese, kreftutvikling, stamcellebiologi og utviklingsbiologi 1 , 2 , 3 , 4 . Lav deteksjonsfølsomhet, dårlig datareproducerbarhet og hyppig krysskontaminering er blantNøkkelfaktorene begrenser bruken av IS-analyser til nåværende og planlagte studier.

Mange IS analyseteknologier er blitt utviklet. Restriksjonsenzymbaserte integrasjonsstedanalyser, inkludert Linker-Mediated (LM) Polymerase Chain Reaction (PCR) 5 , inverse PCR 6 og Linear Amplification-Mediated (LAM) PCR 7 , er de mest brukte. Bruken av stedsspesifikke restriksjonsenzymer genererer imidlertid en bias under gjenvinning av IS, slik at bare en delmengde av integromer (et fremmed DNA integrert i vertsgenomet) i nærheten av restriksjonsstedet som skal gjenvinnes 4 . Analyseteknologier som mer omfattende vurderer vektor IS har også blitt introdusert de siste årene. Disse analysene anvender forskjellige strategier, inkludert Mu transposon-mediert PCR 8 , ikke-restriktiv (nr) -LAM PCR 9 , type II restriksjon enzym-mEdiert fordøyelse 10 , mekanisk skjæring 11 og tilfeldig heksamerbasert PCR (Re-fri PCR) 12 , for å fragmentere genomiske DNAer og amplifisere IS. Nåværende teknologier har varierende nivåer av deteksjonsfølsomhet, genomet dekning, målspesifikitet, høy gjennomstrømningskapasitet, kompleksitet av analyseprosedyrer og forstyrrelser ved å detektere de relative frekvensene av målsteder. Gitt de varierende egenskapene til de eksisterende analysene og de forskjellige formål som de kan brukes til, bør den optimale analysemetoden velges nøye.

Dette arbeidet gir detaljerte eksperimentelle prosedyrer og en beregningsdataanalyseprosess for en toveisanalyse som betydelig forbedrer deteksjonshastigheten og sekvenskvantifiseringsnøyaktigheten ved samtidig å analysere IS oppstrøms og nedstrøms for det integrerte mål-DNA (se figur 1 for en skjematisk oversikt over analyseprosedyrene ). Denne tilnærmingen gir ogsåS måten å karakterisere den retrovirale integrasjonsprosessen (for eksempel påliteligheten til målstedduplisering og variasjoner i de genomiske sekvensene av oppstrøms og nedstrøms innføringer). Andre bidireksjonelle metoder har blitt brukt primært for kloning og sekvensering av begge ender av mål-DNA 11 , 13 , 14 . Denne analysen er i stor grad optimalisert for høy gjennomstrømning og reproduserbar kvantifisering av vektormerkede kloner ved bruk av den veletablerte LM-PCR-metoden og beregningsanalysekartlegging og for kvantifisering av både oppstrøms og nedstrøms kryssinger. Toveisanalyse med TaqaI- enzymet har vist seg nyttig for høyt gjennomstrømmende klonal kvantifisering i stamcellegenterapi prekliniske studier 2 , 15 . Dette papiret beskriver en modifisert metode ved hjelp av en hyppigere kutter (RsaI / CviQI - motiv: GTAC) som dobler tHan sjanser til å oppdage integromer i forhold til en TaqaI- basert analyse . Detaljert eksperimentelle og dataanalyseprosedyrer som bruker GTAC-motiv-enzymer for lentiviral (NL4.3 og dets derivater) og gamma-retroviral (pMX vektorer) vektor IS-analyse, er beskrevet. Oligonukleotidene anvendt i analysen er oppført i tabell 1 . Et internt programmeringsskript for IS-sekvensanalyse er gitt i tilleggsdokumentet.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Genererer Upstream (left) - og Downstream (right) -junction Sequence Libraries

  1. DNA linkerpreparasjon:
    1. Klargjør en 10 μl linker-DNA-løsning ved å tilsette 2 μl 100 μM LINKER_A oligos (slutt: 20 μM), 2 μl 100 μM LINKER_B oligos (slutt: 20 μM), 2 μl 5 M NaCl (slutt: 1 M) og 4 μl nukleasefritt vann i et PCR-rør. Se tabell 1 for linker-sekvensene.
    2. Inkubér linker-DNA-løsningen ved 95 ° C i 5 minutter i et PCR-instrument, stopp programmet og slå av PCR-instrumentet. La linkeroppløsningen i instrumentet stå i 30 minutter for å sakte kjøle ned linker-DNA. Linker-DNA-løsningen kan lagres ved 4 ° C.
  2. LTR-spesifikk biotin-primer forlengelse:
    1. Bruk et UV-Vis-spektrofotometer for å bestemme DNA-konsentrasjonen og 260/280 nm-verdiene av det genomiske DNA fra in vivoEller in vitro eksperimenter. Fortynn 1-2 μg prøve genomisk DNA til et sluttvolum på 170 μl genomisk DNA-løsning ved bruk av nukleasefritt vann.
    2. Forbered en 200 μl PCR-reaksjon ved å blande 2,5 μl hver av 10 μM HIV-1-spesifikke biotinprimere (L-BP og R-BP i tabell 1 : totalt 10 μl for fire lentivirus-spesifikke primere), 20 μl 10X termostabil DNA-polymerasebuffer, 4 μl 10 mM dNTP'er (slutt: 200 μM av hver dNTP), 3 μl 2,5 U / μl termostabil DNA-polymerase og 163 μl genomisk DNA.
      MERK: For gammaretrovirale vektorer (pMX vektorer), bruk 5 μl hver av to 10 μM pMX-spesifikke biotinprimere (L-BP og R-BP: totalt 10 μl) i stedet for de fire HIV-1-spesifikke biotinprimere ovenfor.
    3. Del oppløsningen i fire PCR-rør (hver 50 μl) og utfør en enkelt forlengelsessyklus under følgende tilstand: 94 ° C i 5 minutter, 56 ° C i 3 minutter, 72 ° C i 5Min og 4 ° C for lagring.
    4. Basseng alle fire PCR-reaksjonene i et 2 ml mikrocentrifugerør og følg PCR-rensingsprosedyren i PCR-rensingssettet. Eluer med 50 μl elueringsbuffer (5 ganger vannfortynnet elueringsbuffer gitt i settet). Straks fortsett med trinn 1.3.1 eller lagre det eluerte DNA ved -20 ° C.
  3. RsaI og CviQI fordøyelse
    1. Forbered en 100 μl fordøyelsesreaksjon ved å tilsette 50 μl DNA (fra trinn 1.2.4), 10 μl 10x buffer A og 2 μL (20 U) av RsaI-enzym. Inkuber ved 37 ° C i 1 time i et PCR-instrument.
    2. Tilsett 1 μl (10 U) CviQI-enzym til reaksjonen og inkuber ved 25 ° C i 30 minutter i et PCR-instrument. Straks fortsett med trinn 1.4.1
  4. Blunt ending:
    1. Klargjør en 4,5 μl blanding som inneholder 2,5 μl DNA Polymerase I stort (klenow) fragment og 2 μL 10 mM dNTPs. Overfør 181; L av blandingen til DNA-prøven fra trinn 1.3.2. Det totale volumet vil være 102 μl. Bland godt ved vortexing og inkuber ved 25 ° C i 1 time i et PCR-instrument. Straks fortsett med trinn 1.6.1.
  5. Fremstilling av streptavidinperler:
    1. Vortex streptavidin-perleoppløsningen og overfør 50 μL til et nytt 2 ml mikrocentrifugerør. Fjern supernatanten ved hjelp av magnetisk stativ og vask perlene med 200 μl bindingsløsning.
    2. Resuspender perlene i 100 μl bindingsløsning og plasser røret bort fra magnetstativet. Straks fortsett med trinn 1.6.1.
  6. Streptavidin perle binding:
    1. Overfør 100 μL prøve-DNA (trinn 1.4.1) til 100 μl re-suspendert perleoppløsning (trinn 1.5.2) og bland forsiktig ved pipetting for å unngå skumdannelse av oppløsningen. Inkuber røret ved romtemperatur i 3 timer på et roterende hjul eller en rulle.
    2. Bruk magnetstativet til å fange perlene og kassere supernatanten. Vask perlene to ganger i 400 μl vaskeoppløsning og to ganger i 400 μl 1 x T4 DNA ligase buffer (fortynnet fra 10X oppløsning ved bruk av nukleasefritt vann).
    3. Resuspender perlene i 200 μl 1x T4 DNA ligase buffer (fortynnet fra 10X løsning ved bruk av nukleasefritt vann) og legg det bort fra magnetisk stativ. Straks fortsett med trinn 1.7.1.
  7. Linkerligasjon:
    1. Klargjør en 400 μl ligasjonsreaksjonsløsning i et 2 ml mikrocentrifugerør ved å blande 0,5 μl av DNA-linkeren (trinn 1.1.2), 10 μl 10x T4 DNA ligase buffer, 20 μl 5X T4 DNA ligase buffer (inneholdende 25% polyetylen Glykol), 5 μl T4 DNA ligase, 164,5 μL nukleasefritt vann og 200 μl av de resuspenderte perler (trinn 1.6.3). Plasser reaksjonsrøret på rotasjonshjulet og inkuber ved RT (22 ° C) i 3 timer (eller 16 ° C / N). Vask perlene to ganger med vaskeløsningen og to ganger med 1X termostabil DNA-polymerasebuffer (fortynnet fra 10x oppløsning ved bruk av nukleasefritt vann) ved hjelp av magnetisk stativ.
    2. Resuspender perlene i 50 μl 1x termostabil DNA polymerase PCR buffer og legg den bort fra magnetisk stativ. Straks fortsett med trinn 1.8.1 eller lagre ved 4 ° C i opptil en dag.
  8. Pre-amplifisering av både venstre og høyre kryss-DNA:
    1. Forbered en 200 μl PCR-reaksjon ved å tilsette 10 μl 10 μM 1L-primer, 10 μl 10 μM 1R-primer, 20 μl 10 μM primer Link1 (Tabell 1), 10 μl 10X termostabil DNA-polymerasebuffer, 4 μl 10 mM dNTPs (slutt: 200 μM av hver dNTP), 8 μl (20 U) termostabil DNA-polymerase og 88 μl nukleasefritt vann til de gjenoppslåede perler (50 μl) fra trinn 1.7.3.
    2. Aliquot reaksjonsblandingen i 4 PCR rør (hver 501; L) og utføre PCR med følgende tilstand: 94 ° C inkubering i 2 minutter; 25 sykluser på 94 ° C i 20 s, 56 ° C i 25 s og 72 ° C i 2 minutter; Og en endelig forlengelse ved 72 ° C i 5 minutter.
    3. Basseng alle 4 PCR-reaksjoner i et 2 ml mikrocentrifugerør og følg PCR-rensingsprosedyren i PCR-rensingssettet. Eluer med 50 μl elueringsbuffer.
    4. Bestem DNA-konsentrasjonen og 260/280-nm-verdiene ved å bruke et UV-Vis-spektrofotometer; DNA-en kan lagres ved -20 ° C til klar for neste trinn. Fortsett med trinn 1.9.1 / 1.10.1 (valgfritt) eller direkte med trinn 1.11.1 / 1.12.1.
  9. Fjerner intern DNA-amplikon på venstre side (valgfritt):
    1. Overfør opptil 100 ng PCR DNA-produkt fra trinn 1.8.4 til et 2 ml mikrocentrifugerør og juster volumet til 10 μL ved bruk av nukleasefritt vann.
    2. Forbered en restriksjonsenzymreaksjon som spesifikt målretter mot venstre D-indreNA amplikon.
      MERK: Reaksjonsbetingelsen kan variere avhengig av valget av enzym. Når du fjerner det indre DNA fra venstre fra NL4.3-baserte lentivirale vektorer, tilsettes for eksempel 1 μL pvuII , 2 μl buffer B og 7 μl nukleasefritt vann. Inkuber ved 37 ° C i 1 time i et PCR-instrument. Straks fortsett med trinn 1.11.1 eller lagre ved -20 ° C.
  10. Fjerner høyre DNA-amplikon på høyre side (valgfritt):
    1. Fortsett det samme som i trinn 1.9.1.
    2. Forbered en restriksjonsenzymreaksjon som spesifikt målretter mot høyre DNA-amplikon.
      MERK: Når du fjerner internt DNA på høyre side fra NL4.3-baserte lentivirale vektorer, tilsettes for eksempel 1 μl sfoI , 2 μL buffer B og 7 μL nukleasefritt vann. Inkuber ved 37 ° C i 1 time i et PCR-instrument. Straks fortsett med trinn 1.12.1 eller lagre ved -20 ° C.
  11. Venstre-junksjonsspesifikke amplifikasjon:
    1. Forbered en 50 μl PCR-reaksjon ved å blande 5 μl DNA fra trinn 1.8.4 (eller fra det valgfrie trinn 1.9.2), 5 μl 10 μM 2L-primer (slutt: 1 μM), 5 μl 10 μM primer Link2 (Slutt: 1 μM), 5 μl 10x termostabil DNA-polymerasebuffer, 1 μl 10 mM dNTP'er (slutt: 200 μM av hver dNTP), 2 μl (5 U) termostabil DNA-polymerase og 27 μl nukleasefri vann.
    2. Utfør PCR med følgende tilstand: 94 ° C inkubering i 3 minutter; 8-15 sykluser ved 94 ° C i 20 s, 56 ° C i 25 s og 72 ° C i 2 minutter; Og en endelig forlengelse ved 72 ° C i 5 minutter.
      MERK: Amplifisert DNA kan lagres ved -20 ° C. * Syklusnummeroptimalisering er foreslått.
    3. Følg PCR-rensingsprosedyren i PCR-rensingssettet. Eluer med 50 μl elueringsbuffer. Bestem DNA-konsentrasjonen og 260/280 nm-verdiene.
  12. Alle prosedyrer er identiske med "Venstre-kryss-spesifikk amplifikasjon" (trinn 1.11.1-1.11.3), unntatt bruk av forskjellige primere; Bruk den høyre kryssespesifikke primeren (2R-primer, se tabell 1 ) i dette trinnet.
  • PCR-amplikonlengdevariasjonstest:
    1. Analyser PCR amplikonlengdevariasjonene ved å utføre 2% agaroselelektroforese eller kapillærelektroforese ( Figur 2 ).
      MERK: Dette er et viktig skritt for å bekrefte fullførelsen av analyseprosedyrene og å foreta en grov vurdering av IS-mønstre basert på PCR-båndmønstrene. Den rensede PCR-amplikon fra trinnene 1.11.3 og 1.12.3 kan brukes til forskjellige DNA-sekvenseringsplattformer. Fortsett med de riktige prøvingsprosedyrene for klassisk kjettingavslutning (Sanger) sekvensering eller neste generasjons sekvensering. DNA-en kan lagres ved -20 °; C.
  • 2. Beregning er sekvensanalyse

    1. Forberedelse av datafiler:
      1. Klargjør tre inngangsdatafiler: en fastformat-sekvensdatafil (Test_data.fa i tilleggsdata), en tsv-fil for søkemotivene for vektor- og linkersekvenser (Demultiplexing_Trimming_blunt_GTAC.tsv i tilleggsdata) og en tsv-fil for restriksjonsenzyminformasjon (Enzyme.tsv i tilleggsdata).
        MERK: Disse filene kreves for demultipleksering, trimning av vektor- og linkersekvenser, og fjerning av interne vektorsekvenser ( figur 3A ). Detaljert trinnvise instruksjoner for implementering av beregningsarbeidet leveres i filen README.txt i tilleggsdataene.
    2. Beregningsanalyse:
      1. Kjør demultiplexing og trimming skript.
        MERK: Råsekvensen blir behandlet for demultipleksering og for trimminenG av vektor-, linker- og primer-sekvensene (se STEP-1 i den komplette README.txt-filen).
      2. Kjør kartleggingskommandoen (se STEP-2 i README.txt-filen) for å kartlegge de behandlede sekvensene på referansegenomet ved hjelp av et BLAST-lignende justeringsverktøy (BLAT; www.genome.ucsc.edu).
      3. Kjør det kvantitative IS-analyseskriptet (se STEP-3 i filen README.txt).
        MERK: To utdatafiler (Initial_count_without_homopolymer_correction.txt og Final_count.txt) blir generert. Flere detaljer om kartlegging og sekvensregistreringsstrategier finner du i "README.txt-filen i tilleggsdataene og i tidligere publikasjoner 2 , 15 .

    Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    Den toveisbaserte IS-analysen genererte forskjellige størrelser av PCR-amplikoner for både oppstrøms (venstre) og nedstrøms (høyre) vektor-vertskryssene ( figur 2 ). Størrelsen på en PCR-amplikon er avhengig av plasseringen av det nærmeste GTAC-motivet oppstrøms og nedstrøms fra en integrering. Analysen produserte også interne DNA-PCR-amplikoner: retrovirale sekvenser nær polypurin-området og primerbindingsstedet ble samtidig amplifisert under henholdsvis venstre og høyre kryss-PCR. PCR-amplikonbånd kan visualiseres ved kapillær eller agarose (2%) elektroforese.

    Etter sekvensering ble både venstre- og høyre-kryss-sekvensene analysert ved hjelp av et internt programmeringsskript for forbehandling av raske sekvenser (inkludert demultipleksering og trimning av vektor og linker-DNA), kartlegging av IS-sekvenser på genomet, identifisering og telling av identisk ISSekvenser, og bruke feilkorreksjonsprosedyrer ( figur 3 ). Steder av 5'-enden av spørringssekvensene i referansegenometet betraktes som IS og brukes til innledende telling av hver IS. Kriteriene som bestemmer de to matchende sekvensene - oppstrøms (venstre) og nedstrøms (høyre) krysssekvenser stammer fra samme integrom-er basert på nukleotidsekvensmønstrene av retrovirusspesifisert samordnet integrasjon og er som følger: (i) To krysssekvenser Justere på genomet i motsatte retninger. (Ii) IS av de to krysssekvensene separeres ved en 5-bp overlapping for humane immunbristvirus (HIV) vektorer og en 4-bp overlapping for vektorer av muse-leukemivirus (MLV). De første 5 bp av de to kryssene av HIV og 4 bp av MLV-kryss er revers-komplementære.

    IS sekvens teller er bestemt i tre trinn: (1) kartlegging IS sekvenser på genometBruker BLAT, som genererer kartleggingskvaliteten og skiller individuelle IS-sekvenser i "single-hit", "multi-hit", "no-hit" og "other" -grupper; (2) ved hjelp av det grunnleggende lokaljusteringssøkverktøyet (BLAST) for å sammenligne enkeltsekvenser med andre suboptimalt kartlagte sekvenser, inkludert multi-hits, no-hits og andre; Og (3) identifisere og korrigere sekvenseringsfeil, inkludert homopolymerfeil. Multi-hit-sekvenser er IS-sekvenser som kan justere to eller flere genomiske posisjoner med høy kartleggingst score. Mens det fortsatt er nyttig for å identifisere og kvantifisere klonpopulasjoner, kan multi-hit-sekvensene ikke brukes til å karakterisere genomisk integrasjonssted distribusjonsmønstre (for eksempel forening med gener, gjentakelser eller andre genomiske tegn). I noen sjeldne tilfeller viser de to krysssekvensene forskjellige kartleggingskvaliteter. For eksempel viser man "single-hit", mens matchende sekvens viser "multi-hit". I slike tilfeller, beggeSekvenser blir behandlet som "single-hit" -sekvenser.

    En del av IS-sekvenser med suboptimale mapping-score, som viser høy prosent-genom-matching (identitet) med en unormal spørringsstørrelse (QSIZE), eller omvendt, ble skilt fra "no-hits" og gruppert i "andre" for ytterligere og ofte Manuell revurdering. For eksempel, når du bruker BLAT for genomkartlegging, kan noen IS-sekvenser vise en unormal QSIZE på grunn av mis-matchende nukleotider i de første eller siste 5-10 nukleotidene. Disse sekvensene oppfyller ofte ikke kartleggingskriteriene for "single-hit" eller "multi-hit" -status, til tross for at det har et relativt høyt kvalitetsresultat.

    En prøve rå sekvens datafil (Test_DATA.fa: 33,374 sekvenser) og prøve utdata datafiler er gitt som tilleggsdata. 1 μg genomisk DNA fra humane repopulerende celler, transdusert med utlånt Ivirale vektorer (FG12) i en humanisert benmarv / lever / tymus (BLT) mus 17 ble analysert ved å bruke toveisanalysen. Retroviral IS ble funnet over hele genomet. Typisk er lentivirale vektorer overrepresentert i gener, mens gamma-retrovirale vektorer overrepresenteres i transkripsjonsstartstedene 16 ( Figur 4 ). Fra to humane repopulerende celleprøver ble totalt 1,081 sekvenser-851 fra oppstrøms (venstre) og 230 nedstrøms (høyre) kryss-kvalifisert som IS-sekvenser. Fra disse sekvensene ble 93 unike IS til venstre og 50 unike IS i de høyre veikryssene identifisert. Av disse ble 44 identifisert i både (venstre og høyre) veikryss, som viser totalt 99 unike integromer i testprøvene. IS er betydelig beriket i gener (66%, p <0,0001) sammenlignet med tilfeldige hendelser ( figur 4A ).

    "> Eksempel gamma retrovirusvektor (pMX) integrasjonssekvenser er også inkludert i testdatafilen. Fra en blandet Pmx-konstruert celleprøve, transdusert med pMX uttrykker okt4, cMyc, Klf4 og Sox2, 1,611 IS-sekvenser og 129 unike IS ble identifisert. Av 65 og 76 unike IS identifisert i henholdsvis venstre og høyre kryss, var 12 i begge veikryss.

    Det har tidligere blitt vist at PCR-amplikoner på ≥500 bp er dårlig sekvensert i pyrosequenserplattformen, mens PCR-amplikoner på <500 bp generelt er vel-sekvenserte, uten en merkbar forspenning med hensyn til sekvenslengder 15 . Således ble sekvensdata fra ≥ 500 bp PCR-amplikoner ekskludert for å fjerne lengdeassosiert sekvenseringsforspenning. Bare data fra <500 bp PCR amplikon (betegnet som kvantifiserbar vektor integrom, eller QVI) ble brukt for kvantitativ klonanalyse. De relative deteksjonsfrekvensene av vektorintegromeneBle beregnet ved bruk av bare sekvensverdiene av IS-kryssninger som genererte <500 bp PCR-amplikoner ( Figur 4B -4D , se også tabell 2 ). Omtrent 77% av vektorene kunne kvantitativt analyseres ved hjelp av denne strategien ( figur 4B ). Som et resultat ble de beregnede frekvensene for hver QVI forventet å overskatte de sanne frekvensene i prøven ( Figur 4E ) med 1,25x.

    Figur 1
    Figur 1: En skjematisk visning av toveis integreringsstedanalyse. Dobbeltstrenget retroviralt DNA (svart og rødt) flankert av cellulært DNA (blå) er vist. Pilene representerer oligonukleotidprimere, og piler med en stjerne representerer biotinprimere. Linker-DNA er betegnet med lilla linjer. Kort fortalt, en lineær forlengelse av venstreBiotinprimere (L-BP) og høyre biotinprimere (R-BP) fra viral Long Terminal Repeat (LTR) genererer biotinylert, dobbeltstrenget IS-DNA. Etter fordøyelsen med CviQI og RsaI, blir det biotinylerte dobbeltstrengede DNA anriket ved bruk av streptavidin-biotinspecifik binding og ligeres med linker-DNA. Streptavidin-fanget, linker-ligerte vektor-vert-kryss-DNA-er amplifiseres ved en to-trinns PCR: pre-amplifisering (amplifisering av både venstre og høyre kryss) etterfulgt av to nestede PCR, hver målrettet venstre og høyre kryss. Vennligst klikk her for å se en større versjon av denne figuren.

    Figur 2
    Figur 2: Representativ PCR Amplicon Image. ( A ) Kapillærelektroforeseanalyse viser varierende lengder av PCR-ampLisoner i lentivirale vektor (FG12) integrasjonssteder etter pvuII eller sfoI fordøyelse . Varierende PCR-bånd for oppstrøms (venstre) og nedstrøms (høyre) vektorvertsforbindelser er vist. De mørke pilens hoder indikerer at de interne vektor-DNA-amplikonene gjenstår etter pvuII- eller sfoI- fordøyelsen. DNA-størrelsesmarkøren (0,1 - 2,5 kbp) er på M-banen. De åpne pilhodene angir justeringsmarkører (15 og 5000 bp). DNA-justeringsmarkører brukes til kalibrering av migrasjonstidsvariasjonen over alle kanaler. ( B ) Gamma-retrovirale (pMX) vektorintegrasjonssteder i murine cellekloner transdusert med multiple pMX vektorer. Left- og right-junction DNAs, samt interne vektor-DNA-amplikoner (pilhoder), vises. De mørke og åpne pilhodene angir henholdsvis interne vektor DNA og justeringsmarkører. DNA-størrelsesmarkøren (50-1 500 bp) er på M-banen. Detaljer om kapillær elektroforese finnes i selskapetprotokoll. Vennligst klikk her for å se en større versjon av denne figuren.

    Figur 3
    Figur 3: Integrasjonsstedssekvensanalyse. ( A ) Et flytskjema for beregningsdataanalyse. Tre datafiler, inkludert en fastformat-sekvensfil, en fil med referansesekvensmotiv for demultipleksering og trimning, og en fil med restriktionsenzyminformasjon, er påkrevd. Eksempelfiler, inkludert Test_DATA.fa (sekvensdata), Demultiplexing_Trimming.tsv (søkesekvensmotiv) og Enzyme.tsv (restriksjonssymmenkjennings-sekvens), leveres som tilleggsdatafiler. De behandlede sekvensene (vertsgenomsekvenser) fra del 1 vil bli kartlagt mot referansen ved bruk av BLAT. Steder ved 5'-enden av spørringssekvensenEs i referansegenomet anses å være integrasjonssteder ( tabell 2 ). Sekvens teller for hver IS er bestemt i tre trinn: (1) kartlegging IS sekvenser på genomet ved hjelp av BLAT; (2) sammenligne single-hit IS-sekvenser (tilpasse seg et unikt sted av vertsgenomet) med andre sekvenser som var suboptimalt kartlagt på genomet; Og (3) identifisere og korrigere sekvenseringsfeil. Flere detaljer om kartlegging og sekvensregistreringsstrategier finnes i tidligere studier 2 , 15 . ( BC ) To enkeltstrengede DNA-sekvenser for nedstrøms (B) og oppstrøms (C) vektor-vert-kryssene er vist. Pyrosequencing primere A og B (grønn) brukes til dråpe-PCR og sekvensering. Fargekodene er de samme som i Figur 1 . Prøven nedstrøms krysssekvens (B) inkluderer Primer A (grønn), MID (grønn), Vector U5-ende (rød), vertsgenomet (blå), liNker (lilla) og Primer B (grønn). I en blandet DNA-sekvensering (oppstrøms og nedstrøms) blir Primer A brukt for sekvensering av nedstrømsforbindelsene (B), og Primer B brukes til sekvensering av oppstrømsforbindelsene. Prøven oppstrøms krysssekvens (C) inkluderer Primer B, MID, Vector U3-ende, vertsgenomet, linker og Primer A. Vennligst klikk her for å se en større versjon av denne figuren.

    Figur 4
    Figur 4: Representativt eksempel på toveis integreringsstedanalyse. ( A ) Prosent integrering i gener (refseq), Alu og LINE 1 (L1) gjentakelser av lentivirale vektorer i humaniserte musrepopulerende celler (LV-huMice), sammenlignet med i silikogenererte 10.000 tilfeldige integrasjonshendelser. Integrasjonssteder er kartlagtPå det humane genomet (hg19). LV-huMice-integreringssteder er betydelig overrepresentert i gener ( p <0,0001, chi-kvadratimotasjon) ( B ) I silicoanalyse av 10.000 tilfeldige integrasjonshendelser. Med en ensrettet tilnærming genererte omtrent 52% av tilfeldige integromer PCR-amplikoner på <500 bp, mens en bidireksjonell tilnærming genererte 77% en PCR-amplikon på <500 bp i enten venstre eller høyre kryss. PCR-amplikoner som er lengre enn 500 bp, er ineffektivt sekventert med pyrosequencing platfor 2 , 15 og bør derfor utelukkes fra kvantitative dataanalyser. ( C ) Strategi for klonal kvantifisering. Hver enkelt klone deler samme vektorintegrasjon (eller IS). De relative frekvensene til venstre (x) og høyre (y) kryssene er kombinert for å representere de relative mengder av klonpopulasjonene (kvantifiserbare vektorintegromer eller QVI). integ Rantessider som ikke har et GTAC-motiv innen 450 bp, diskvalifiseres (dQ) og fjernes fra kvantifiseringsanalyse. ( D ) De relative frekvensene (i forhold til alle QVI-sekvenser) av 44 QVI kloner i humaniserte musrepopulerende celler er vist i et fargevalg (hvitt til rødt: 0 til 0,16). ( E ) Forventet overestimering av klonfrekvenser med toveisanalyse. Basert på silico 10.000 random integrasjonsanalyse, forventes en 1,25-fold overestimering ved bruk av GTAC-motiv-enzymer ( RsaI og CviQI ) på grunn av ca. 20% dQ kloner. En 2,56x over-estimering forventes på grunn av ca. 60% dQ kloner ved bruk av TCGA-motivet enzymet ( TaqaI ). Vennligst klikk her for å se en større versjon av denne figuren.

    Oad / 55812 / 55812table1.jpg "/>
    Tabell 1: Oligonukleotider for Lentiviral og Gamma-retroviral Vector Integration Site Analysis. * 5BioTEG: Biotin modifikasjon ved 5'-enden. Vennligst klikk her for å se en større versjon av denne tabellen.

    Tabell 2
    Tabell 2: Representative Insertion Site Sequence Count Data. Vennligst klikk her for å se en større versjon av denne tabellen.
    1 Kart: Integrasjons-sekvenser kan kartlegges på et unikt sted (enkelt-hit) eller multiple loci (multi-hit) av referansegenomet. NA (ikke tilgjengelig): ingen sekvens ble oppdaget.
    2 STRD: Orientering av spørringssekvensen i genomet
    3 QLEN: lengden på spørringssekvensen
    4 GLEN: den forventede lengden på integrasjonsstedssekvensen, beregnet ut fra avstanden fra nærmeste tilgjengelige GTAC-motiv i genomet til innsatsstedet. GLEN <450 bp aksepteres for kvantitative analyser.
    5 Total_Count: totalt antall sekvenser
    6 Integrasjonssteder er vist med et kromosomnummer (CHR) og et sitenummer for høyre veikryss (CHR_SITE1) og et tall for venstre veikryss (CHR_SITE2). CHR_SITE1 og CHR_SITE2 er 5 bp fra hverandre for lentivirale vektorer og 4 bp fra hverandre for MLV (pMX) vektorer
    7 Sekvens teller for høyre kryss (R_A) og venstre kryss av prøve A (L_A); Sekvens teller for høyre veikryss (R_B) og venstre kryss av prøve B (L_B)
    * Diskvalifisert (dQ): GLEN ≥450 i silico bp

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    Den toveisanalyse muliggjør samtidig analyse av både oppstrøms (venstre) og nedstrøms (høyre) vektor-vert-DNA-krysssekvenser og er nyttig i en rekke genterapi-, stamceller- og kreftforskningsapplikasjoner. Bruken av GTAC-motiv-enzymer (RsaI og CviQI) og den toveire PCR-tilnærmingen øker sjansene for å oppdage en integrometall (eller en klonal populasjon) sammenlignet med tidligere TCGA- motivenzym ( TaqaI ) -baserte analyser 2 , 15 og andre Enveis LM-PCR tilnærminger 5 . Den toveisede analysen forbedrer analysen av IS, spesielt i de begrensede DNA-prøvene som ofte oppstår i kliniske studier eller små-dyrmodellstudier.

    Trinn 1.1-1.7 er kritiske trinn og bør gjøres uten unødvendige forsinkelser. Disse trinnene gjøres vanligvis på en dag. Testing av enzymer før disse trinnene anbefales sterkt. SkrittS 1.9 og 1.10 er valgfrie. Disse trinnene vil redusere interne vektor-DNA-sekvenser som samtidig blir amplifisert med IS-sekvenser. Tabell 1 gir primersettene egnet for å analysere IS av wildtype NL4.3 HIV-1, NL4.3-avledede vektorer, inkludert FG12 21 og pMX-baserte gammaretrovirale vektorer 22 . Avhengig av nukleotidvariasjonene i LTR-sekvensene, kan primerdesign og eksperimentell tilnærming trenge en riktig modifikasjon.

    Blat-programvaren som brukes til kartlegging, er bare kompatibel med fastformat og fungerer ikke med fastq-filer. Man kan konvertere fastq-filene til fasta ved hjelp av ulike programvareverktøy, for eksempel FASTX-Toolkit eller BBTools. En bruker med grunnleggende kunnskap om python kan bruke Biopython til å konvertere fastq-filene til fasta for å kartlegge dem med blat.

    Det forventes at en del av IS ikke vil bli oppdaget med toveis IS-analyse og, selv om det oppdages, ikke vil kvalifisere for nedstrøms klonal kvantifisering. Når GTAC-motiv-enzymer ble anvendt, ga omtrent 23% av integromene i sekvensdataene som ble generert av pyrosequensjonsplattformen ikke analysekriteriene for kvantitativ IS-sekvensanalyse ( figur 4 ). Når omfattende IS-dekning er kritisk, for eksempel i sikkerhetsovervåking av genmodifiserte celler i genterapiinnstillinger, er det tilrådelig å velge en analyse med ubegrenset genomadgang til IS 8 , 9 , 10 , 11 , 12 eller for å reanalysere Samme prøve med en annen eller optimal kombinasjon av restriksjoner 4 , 18 .

    ER-analyser med ubegrenset genomadgang, for eksempel ikke-restriktiv LAM PCR og random-shearing apprOaches 19 , 20 , holder spesielt løfte om omfattende IS-analyse. Disse tilnærmingene bruker teknologier som er relativt vanskelige å kontrollere, noe som gjør det vanskelig å forutsi utfallet av genomisk DNA-fragmentering og IS-amplifikasjon. På den annen side har IS-analyser som bruker velkarakteriserte restriksjonsenzymer to store fordeler: (1) Det er relativt enkelt å kalibrere og optimalisere analyser, fordi analyseresultatene er mer forutsigbare på grunn av enzymreaksjonens spesifisitet og tilgjengeligheten av Referansegenom-sekvenser. (2) Sekvensdata er svært reproduserbare når analysevilkårene er optimalisert. Den toveire PCR med optimaliserte forhold har vist seg nyttig for storskala og nøyaktig klonal kvantifisering 2 , 15 . Selv om bare en del av eksisterende klonale populasjoner har blitt analysert på grunn av begrensningsenzymforstyrrelser, mengder individuelle L-kloner ble målt nøyaktig, slik at det ble muliggjort nøyaktig bestemmelse av klonstørrelsesvariasjoner innenfor og over prøver. Et tilstrekkelig antall kloner ble generert for å bestemme stamcelleadferdsmønstre og funksjonell heterogenitet.

    PCR-amplikonene produsert fra denne toveis-PCR-prosedyren er egnet for enhver nedstrøms sekvenseringsplattform. På grunn av den høye følsomheten til analysen, bør det tas ytterste forsiktighet for å hindre krysskontaminering ved å utføre eksperimenter i et forurensningsfritt rom. Inkluderingen av et negativt (no-template) kontrolleksperiment anbefales for alle PCR-trinn. Selv med den mest forsiktige opplæringen er det vanskelig å forhindre krysskontaminering fra prøve til prøve. Når man sammenligner klonale populasjoner fra forskjellige prøver, anbefales det derfor å benytte en kollisjonskontroll, som fjerner potensielle forurensede data 23 , og en cutoff for lavfrekvente, upålitelige kloner> 2 for å minimere støy fra kryssforurenset DNA. Den toveisede tilnærmingen genererer IS-data for begge ender av integrometene, og derved gir en ytterligere mulighet til å redusere potensielle falske positive detekteringsfeil.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Forfatterne har ingenting å avsløre.

    Acknowledgments

    Finansiering ble gitt av National Institutes of Health Grants R00-HL116234, U19 AI117941 og R56 HL126544; National Science Foundation Grant DMS-1516675; Nasjonalt forskningsfond i Korea (NRF-2011-0030049, NRF-2014M3C9A3064552); Og KRIBB-initiativet.

    Materials

    Name Company Catalog Number Comments
    Thermostable DNA polymerase Agilent 600424 PicoMaxx Polymerase
    Thermostable DNA polymerase buffer Agilent 600424 PicoMaxx Polymerase buffer
    Deoxynucleotide (dNTP) solution mix New England Biolabs N0447L dNTP solution mix (10 mM each)
    PCR tubes VWR International 53509-304 PCR Strip Tubes With Individual Attached Caps
    2 mL microcentrifuge tube Molecular Bioproducts 3453 microcentrifuge tubes
    PCR purification kit Qiagen 28106
    RsaI  New England Biolabs R0167L restriction enzyme
    CviQI New England Biolabs R0639L restriction enzyme
    Buffer A New England Biolabs B7204S NEB CutSmart buffer
    DNA Polymerase I large (klenow) fragment  New England Biolabs M0210L Blunting
    streptavidin beads solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Binding Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Washing Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    magnetic stand ThermoFisher 12321D DynaMag™-2 Magnet
    T4 DNA ligase New England Biolabs M0202L T4 DNA ligase
    10X T4 DNA ligase buffer New England Biolabs B0202S T4 DNA ligase reaction buffer
    5X T4 DNA ligase buffer Invitrogen  46300-018 T4 DNA ligase buffer with polyethylene glycol-8000
    UV-Vis spectrophotometer Fisher Scientific S06497 Nanodrop 2000
    pvuII new England Biolabs R0151L restriction enzyme
    sfoI new England Biolabs R0606L restriction enzyme
    Buffer B new England Biolabs B7203S NEB buffer 3.1
    Nuclease free water Integrated DNA Technologies 11-05-01-14
    Capillary electrophoresis Qiagen 9001941 QIAxcel capillary electrophoresis
    Veriti 96-well Fast Thermal Cycler Thermo Fisher Scientific 4375305 PCR Instrument
    Rotating wheel (or Roller) Eppendorf M10534004 Cell Culture Roller Drums
    DNA size marker Qiagen 929559 QX size marker (100 - 2,500 bp)
    DNA size marker Qiagen 929554 QX size marker (50 - 1,500 bp)
    DNA alignment markers Qiagen 929524 QX DNA Alignment Marker
    genomc DNA Not Available Not Available Sample genomc DNA from in vivo or in vitro experiments

    DOWNLOAD MATERIALS LIST

    References

    1. Serrao, E., Engelman, A. N. Sites of Retroviral DNA Integration: From Basic Research to Clinical Applications. Crit. Rev. Biochem. Mol. Bio. 51 (1), 26-42 (2016).
    2. Kim, S., et al. Dynamics of HSPC Repopulation in Nonhuman Primates Revealed by a Decade-Long Clonal-Tracking Study. Cell Stem Cell. 14 (4), 473-485 (2014).
    3. Bushman, F. Retroviral integration and human gene therapy. J. Clin. Invest. 117 (8), 2083-2086 (2007).
    4. Bystrykh, L. V., Verovskaya, E., Zwart, E., Broekhuis, M., de Haan, G. Counting stem cells: methodological constraints. Nat Meth. 9 (6), 567-574 (2012).
    5. Schröder, A., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110 (4), 521-529 (2002).
    6. Silver, J., Keerikatte, V. Novel use of polymerase chain reaction to amplify cellular DNA adjacent to an integrated provirus. J. Virol. 64, 3150 (1990).
    7. Schmidt, M., et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat. Meth. 4 (12), 1051-1057 (2007).
    8. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39 (11), e72 (2011).
    9. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    10. Kim, S., Kim, Y., Liang, T., Sinsheimer, J., Chow, S. A high-throughput method for cloning and sequencing human immunodeficiency virus type 1 integration sites. J. Virol. 80 (22), 11313-11321 (2006).
    11. Maldarelli, F., et al. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345 (6193), 179-183 (2014).
    12. Wu, C., et al. High Efficiency Restriction Enzyme-Free Linear Amplification-Mediated Polymerase Chain Reaction Approach for Tracking Lentiviral Integration Sites Does Not Abrogate Retrieval Bias. Hum. Gene. Ther. 24 (1), 38-47 (2013).
    13. Aker, M., Tubb, J., Miller, D. G., Stamatoyannopoulos, G., Emery, D. W. Integration Bias of Gammaretrovirus Vectors following Transduction and Growth of Primary Mouse Hematopoietic Progenitor Cells with and without Selection. Mol. Ther. 14 (2), 226-235 (2006).
    14. Gabriel, R., Kutschera, I., Bartholomae, C. C., von Kalle, C., Schmidt, M. Linear Amplification Mediated PCR; Localization of Genetic Elements and Characterization of Unknown Flanking DNA. J Vis Exp. (88), e51543 (2014).
    15. Kim, S., et al. High-throughput, sensitive quantification of repopulating hematopoietic stem cell clones. J. Virol. 84 (22), 11771-11780 (2010).
    16. Mitchell, R., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2 (8), e234 (2004).
    17. Melkus, M., et al. Humanized mice mount specific adaptive and innate immune responses to EBV and TSST-1. Nat. Med. 12 (11), 1316-1322 (2006).
    18. Bystrykh, L. V. A combinatorial approach to the restriction of a mouse genome. BMC Res Notes. 6, 284 (2013).
    19. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. -P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol Biol. , 321-344 (2014).
    20. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    21. Qin, X., An, D., Chen, I., Baltimore, D. Inhibiting HIV-1 infection in human T cells by lentiviral-mediated delivery of small interfering RNA against CCR5. Proc Natl Acad Sci U S A. 100 (1), 183-188 (2003).
    22. Kitamura, T., et al. Retrovirus-mediated gene transfer and expression cloning: powerful tools in functional genomics. Exp. Hematol. 31 (11), 1007-1014 (2003).
    23. Cartier, N., et al. Hematopoietic stem cell gene therapy with a lentiviral vector in X-linked adrenoleukodystrophy. Science. 326 (5954), 818-823 (2009).

    Tags

    Genetikk Utgave 124 Retrovirus Integrasjonssteder Neste generasjons sekvensering Retroviral genterapi Stamceller Cancers Cellular barcoding Bioinformatics
    Toveis retroviral integrasjonssted PCR-metodikk og kvantitativ dataanalyse arbeidsflyt
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Suryawanshi, G. W., Xu, S., Xie, Y., More

    Suryawanshi, G. W., Xu, S., Xie, Y., Chou, T., Kim, N., Chen, I. S. Y., Kim, S. Bidirectional Retroviral Integration Site PCR Methodology and Quantitative Data Analysis Workflow. J. Vis. Exp. (124), e55812, doi:10.3791/55812 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter