Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Tovejs Retroviral Integration Site PCR Metode og Quantitative Data Analysis Workflow

Published: June 14, 2017 doi: 10.3791/55812
* These authors contributed equally

Summary

Dette manuskript beskriver den eksperimentelle procedure og softwareanalyse for et tovejs integrationssite-assay, der samtidigt kan analysere opstrøms og nedstrøms vektor-værtsforbindelses-DNA. Tovejsede PCR-produkter kan anvendes til enhver downstream-sekventeringsplatform. De resulterende data er nyttige til en høj-gennemløbs kvantitativ sammenligning af integrerede DNA-mål.

Abstract

Integration Site (IS) analyser er en kritisk komponent i studiet af retrovirale integrationssteder og deres biologiske betydning. I nyere retrovirale genterapiundersøgelser er IS-analyser i kombination med næste generations sekventering blevet anvendt som et celleopsparingsværktøj til karakterisering af klonale stamcellepopulationer, der deler samme IS. For den nøjagtige sammenligning af repopulerende stamcellekloner inden for og på tværs af forskellige prøver er detektionens følsomhed, data reproducerbarhed og høj gennemløbskapacitet af analysen blandt de vigtigste analysekvaliteter. Dette arbejde giver en detaljeret protokol- og dataanalyseproces for tovejs-IS-analyse. Det tovejsede assay kan samtidigt sekvensere både opstrøms og nedstrøms vektor-værtsforbindelser. Sammenlignet med konventionelle ensrettede IS-sekventeringsmetoder forbedrer den tovejstilgang signifikant IS-detektionshastigheder og karakteriseringen af ​​integrationshændelser i begge ender af tHan målretter DNA. Dataanalysepipelinjen beskrevet her identificerer og opregner identiske og identiske identiske sekvenser gennem flere trin af sammenligning, som kort IS sekvenser på referencegenomet og bestemmer sekventeringsfejl. Ved hjælp af en optimeret analyseprocedure har vi for nylig offentliggjort de detaljerede repopulation mønstre af tusinder af hæmatopoietiske stamceller (HSC) kloner efter transplantation i rhesus macaques, der for første gang demonstrerer det præcise tidspunkt for HSC-repopulation og den funktionelle heterogenitet af HSC'er i Primatsystem. Den følgende protokol beskriver trin for trin eksperimentel procedure og dataanalyse-arbejdsgang, der identificerer og kvantificerer identiske IS-sekvenser nøjagtigt.

Introduction

Retrovirus indsætter deres genomiske DNA i værtsgenomet på forskellige steder. Denne unikke egenskab, som kan bidrage til udviklingen af ​​kræftformer og andre former for viral patogenese, har den ironiske fordel at gøre disse vira yderst velegnede til celleteknik til genterapi og grundbiologiforskning. Viral Integration Site (IS) - placeringen på værtsgenomet hvor et fremmed DNA (virus) er integreret - har vigtige implikationer for skæbnen for både de integrerede vira og værtscellerne. IS-analyser er blevet anvendt i forskellige biologiske og kliniske forskningsinstitutioner for at studere retroviral integrationssiteudvælgelse og patogenese, kræftudvikling, stamcellebiologi og udviklingsbiologi 1 , 2 , 3 , 4 . Lav detektionsfølsomhed, dårlig data reproducerbarhed og hyppig krydskontaminering er blandtNøglefaktorerne begrænser anvendelsen af ​​IS-analyser til aktuelle og planlagte undersøgelser.

Mange IS-analyseteknologier er blevet udviklet. Restriktionsenzymbaserede integrationssite-assays, herunder linker-medieret (LM) polymerase-kædereaktion (PCR) 5 , inverse PCR 6 og lineærforstærkningsmedieret (LAM) PCR 7 er de mest anvendte. Anvendelsen af ​​stedsspecifikke restriktionsenzymer genererer imidlertid en bias under hentningen af ​​IS, hvilket tillader kun en delmængde af integromer (et fremmed DNA integreret i værtsgenomet) i nærheden af ​​restriktionsstedet, der skal genvindes 4 . Analyseteknologier, der mere omfattende vurderer vektor IS, er også blevet introduceret i de seneste år. Disse analyser anvender forskellige strategier, herunder Mu transposon-medieret PCR 8 , ikke-restriktive (nr) -LAM PCR 9 , type II restriktionsenzym-mEdieret fordøjelse 10 , mekanisk forskydning 11 og tilfældig hexamerbaseret PCR (Re-fri PCR) 12 til fragmentering af genomiske DNA'er og amplificering af IS. Nuværende teknologier har varierende niveauer af detektionsfølsomhed, genomdækning, målspecificitet, høj kapacitetskapacitet, kompleksitet af analyseprocedurer og forstyrrelser ved detektering af de relative frekvenser af målsteder. I betragtning af de forskellige kvaliteter af de eksisterende analyser og de forskellige formål, som de kan anvendes til, bør den optimale analysemetode udvælges omhyggeligt.

Dette arbejde giver detaljerede eksperimentelle procedurer og en beregningsdataanalyseproces for et tovejsanalyse, der signifikant forbedrer detektionshastigheder og sekvenskvantificeringsnøjagtighed ved samtidigt at analysere IS opstrøms og nedstrøms for det integrerede mål-DNA (se figur 1 for et skematisk billede af analyseprocedurerne ). Denne tilgang giver ogsåS midler til at karakterisere den retrovirale integrationsproces (for eksempel troværdigheden af ​​målstedduplikation og variationer i de genomiske sekvenser af opstrøms og nedstrøms insertioner). Andre bidirektionelle metoder er primært brugt til kloning og sekventering af begge ender af mål-DNA'et 11 , 13 , 14 . Dette assay optimeres i høj grad for den høje gennemstrømning og reproducerbare kvantificering af vektormarkerede kloner ved anvendelse af den veletablerede LM-PCR-metode og beregningsanalyse-kortlægning og til kvantificering af både opstrøms og nedstrøms krydsninger. Tovejsanalyse med TaqaI- enzymet har vist sig nyttigt til højkvalitets klonal kvantificering i stamcelle genterapi prækliniske studier 2 , 15 . Dette papir beskriver en ændret metode ved hjælp af en hyppigere cutter (RsaI / CviQI - motiv: GTAC), der fordobler tHan chancer for at detektere integromer sammenlignet med et TaqaI- baseret assay . Detaljerede forsøgs- og dataanalyseprocedurer, der bruger GTAC-motiv enzymer til lentiviral (NL4.3 og dets derivater) og gamma-retroviral (pMX vektorer) vektor IS-analyse, er beskrevet. Oligonukleotiderne anvendt i assayet er anført i tabel 1 . Et internt programmeringsskript til IS-sekvensanalyse findes i supplerende dokument.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Generering af opstrøms (venstre) - og nedstrøms (højre) -junction sekvens biblioteker

  1. DNA linker præparation:
    1. Forbered en 10 μl linker-DNA-opløsning ved at tilsætte 2 μl 100 μM LINKER_A-oligos (endelige: 20 μM), 2 μl 100 μM LINKER_B-oligos (endelige: 20 μM), 2 μl 5 M NaCl (endelige: 1 M) og 4 μl nukleasefrit vand i et PCR-rør. Se tabel 1 for linkersekvenserne.
    2. Inkubér linker-DNA-opløsningen ved 95 ° C i 5 minutter i et PCR-instrument, stop programprogrammet og sluk for PCR-instrumentet. Efterlad linkeropløsningen i instrumentet i 30 minutter for langsomt at afkøle linker-DNA'et. Linker-DNA-opløsningen kan opbevares ved 4 ° C.
  2. LTR-specifik biotin-primer forlængelse:
    1. Brug et UV-Vis spektrofotometer til at bestemme DNA-koncentrationen og 260/280 nm værdier af det genomiske DNA fra in vivoEller in vitro eksperimenter. Fortynd 1-2 μg prøve genomisk DNA til et slutvolumen på 170 μl genomisk DNA-opløsning under anvendelse af nuklease-frit vand.
    2. Forbered en 200 μl PCR-reaktion ved at blande 2,5 μl hver af 10 μM HIV-1-specifikke biotinprimere (L-BP'er og R-BP'er i tabel 1 : i alt 10 μl for fire lentivirusspecifikke primere), 20 μl 10X termostabil DNA-polymerasebuffer, 4 μl 10 mM dNTP'er (slutning: 200 μM af hver dNTP), 3 μl 2,5 U / μl termostabil DNA-polymerase og 163 μl genomisk DNA.
      BEMÆRK: Brug for 5 μl hver af to 10 μM pMX-specifikke biotinprimere (L-BP og R-BP: totalt 10 μL) i stedet for de fire HIV-1-specifikke biotinprimere ovenfor for gamaretrovirale vektorer (pMX-vektorer).
    3. Opdel opløsningen i fire PCR-rør (hver 50 μl) og udfør en enkelt forlængelsescyklus under følgende tilstand: 94 ° C i 5 minutter, 56 ° C i 3 minutter, 72 ° C i 5Min og 4 ° C til opbevaring.
    4. Pool alle fire PCR-reaktioner i et 2 ml mikrocentrifugerør og følg PCR-oprensningsproceduren i PCR-rensningssætet. Eluer med 50 μl elueringsbuffer (5 gange vandfortyndet elueringsbuffer tilvejebragt i sættet). Fortsæt straks med trin 1.3.1 eller opbevar det eluerede DNA ved -20 ° C.
  3. RsaI og CviQI fordøjelse
    1. Forbered en 100 μl fordøjelsesreaktion ved at tilsætte 50 μl DNA (fra trin 1.2.4), 10 μl 10x buffer A og 2 μL (20 U) af RsaI-enzym. Inkuber ved 37 ° C i 1 time i et PCR instrument.
    2. Tilsæt 1 μL (10 U) CviQI enzym til reaktionen og inkuber ved 25 ° C i 30 minutter i et PCR instrument. Fortsæt straks med trin 1.4.1
  4. Blunt ending:
    1. Forbered en 4,5 μl blanding indeholdende 2,5 μl DNA Polymerase I stort (klenow) fragment og 2 μl 10 mM dNTP'er. Overførsel 181; L af blandingen til DNA-prøven fra trin 1.3.2. Det totale volumen vil være 102 μl. Bland godt ved vortexing og inkuber ved 25 ° C i 1 time i et PCR instrument. Fortsæt straks med trin 1.6.1.
  5. Fremstilling af streptavidinperler:
    1. Vortex kort streptavidin-perleopløsningen og overfør 50 μL til et nyt 2 ml mikrocentrifugerør. Fjern supernatanten ved hjælp af magnetisk stativ og vask perlerne med 200 μl bindingsopløsning.
    2. Resuspender perlerne i 100 μl bindingsopløsning, og rør røret væk fra magnetstativet. Fortsæt straks med trin 1.6.1.
  6. Streptavidin perle bindende:
    1. Overfør 100 μL prøve-DNA (trin 1.4.1) til den 100 μl genopslæmmede perleopløsning (trin 1.5.2) og bland omhyggeligt ved pipettering for at undgå skumdannelse af opløsningen. Inkuber røret ved stuetemperatur i 3 timer på et roterende hjul eller en rulle.
    2. Brug magnetstativet til at fange perlerne og kassere supernatanten. Vask perlerne to gange i 400 μl vaskeopløsning og to gange i 400 μl 1x T4 DNA ligase buffer (fortyndet fra 10X opløsning ved anvendelse af nuklease-frit vand).
    3. Resuspender perlerne i 200 μl 1 x T4 DNA-ligasepuffer (fortyndet fra 10X opløsning ved anvendelse af nukleasefrit vand) og læg det væk fra magnetstativet. Fortsæt straks med trin 1.7.1.
  7. Linker ligation:
    1. Forbered en 400 μl ligeringsreaktionsopløsning i et 2 ml mikrocentrifugerør ved at blande 0,5 μl af DNA linkeren (trin 1.1.2), 10 μl 10x T4 DNA ligase buffer, 20 μl 5X T4 DNA ligase buffer (indeholdende 25% polyethylen Glycol), 5 μl T4 DNA ligase, 164,5 μL nukleasefrit vand og 200 μl af de genopslåede perler (trin 1.6.3). Anbring reaktionsrøret på det roterende hjul og inkuber ved RT (22 ° C) i 3 timer (eller 16 ° C / N). Vask perlerne to gange med vaskeopløsningen og to gange med 1X termostabil DNA-polymerasebuffer (fortyndet fra 10x opløsning ved anvendelse af nukleasefrit vand) under anvendelse af magnetstanden.
    2. Resuspender perlerne i 50 μl 1x termostabil DNA polymerase PCR buffer og læg den væk fra magnetstativet. Fortsæt straks med trin 1.8.1 eller opbevar ved 4 ° C i op til en dag.
  8. Foramplifikation af både venstre og højre kryds-DNA:
    1. Forbered en 200 μl PCR-reaktion ved at tilsætte 10 μl 10 μM 1L-primer, 10 μl 10 μM 1R-primer, 20 μl 10 μM primer Link1 (tabel 1), 10 μl 10X termostabil DNA-polymerase buffer, 4 μl 10 mM dNTP'er (slutprodukt: 200 μM af hver dNTP), 8 μl (20 U) termostabil DNA-polymerase og 88 μl nukleasefrit vand til de genopslåede perler (50 μl) fra trin 1.7.3.
    2. Aliquot reaktionsblandingen i 4 PCR rør (hver 501; L) og udføre PCR med følgende tilstand: 94 ° C inkubation i 2 minutter; 25 cyklusser på 94 ° C i 20 s, 56 ° C i 25 s og 72 ° C i 2 minutter; Og en endelig forlængelse ved 72 ° C i 5 minutter.
    3. Pool alle 4 PCR-reaktioner i et 2 ml mikrocentrifugerør og følg PCR-oprensningsproceduren i PCR-rensningssættet. Eluer med 50 μl elueringsbuffer.
    4. Bestem DNA-koncentrationen og 260/280-nm værdier ved brug af et UV-Vis spektrofotometer; DNA'et kan opbevares ved -20 ° C indtil det er klar til det næste trin. Fortsæt med trin 1.9.1 / 1.10.1 (valgfrit) eller direkte med trin 1.11.1 / 1.12.1.
  9. Fjernelse af intern DNA-amplikon på venstre side (valgfrit):
    1. Overfør op til 100 ng PCR DNA-produkt fra trin 1.8.4 til et 2 ml mikrocentrifugerør og juster volumenet til 10 μL ved anvendelse af nukleasefrit vand.
    2. Forbered en restriktionsenzymreaktion, der specifikt målretter indvendig D på venstre sideNA amplicon.
      BEMÆRK: Reaktionsbetingelsen kan variere afhængigt af valget af enzym. Når du f.eks. Fjerner internt DNA fra venstre fra NL4.3-baserede lentivirale vektorer, tilsættes 1 μL pvuII , 2 μl buffer B og 7 μl nukleasefrit vand. Inkuber ved 37 ° C i 1 time i et PCR instrument. Fortsæt straks med trin 1.11.1 eller opbevar ved -20 ° C.
  10. Fjernelse af den højre DNA-amplikon til højre (valgfrit):
    1. Fortsæt det samme som i trin 1.9.1.
    2. Forbered en restriktionsenzymreaktion, der specifikt målretter højre intern DNA-amplicon.
      BEMÆRK: Når der f.eks. Fjernes højre internt DNA fra NL4.3-baserede lentivirale vektorer, tilsættes 1 μl sfoI , 2 μl buffer B og 7 μl nukleasefrit vand. Inkuber ved 37 ° C i 1 time i et PCR instrument. Fortsæt straks med trin 1.12.1 eller opbevar ved -20 ° C.
  11. Venstre-junction-specifik amplifikation:
    1. Forbered en 50 μl PCR-reaktion ved at blande 5 μl DNA fra trin 1.8.4 (eller fra det valgfrie trin 1.9.2), 5 μl 10 μM 2L-primer (endelig: 1 μM), 5 μl 10 μM primer Link2 (Endelig: 1 μM), 5 μl 10x termostabil DNA-polymerasebuffer, 1 μl 10 mM dNTP'er (sluttelig: 200 μM af hver dNTP), 2 μl (5 U) termostabil DNA-polymerase og 27 μl nukleasefri vand.
    2. Udfør PCR'en med følgende betingelse: 94 ° C inkubation i 3 minutter; 8-15 cyklusser på 94 ° C i 20 s, 56 ° C i 25 s og 72 ° C i 2 minutter; Og en endelig forlængelse ved 72 ° C i 5 minutter.
      BEMÆRK: Amplificeret DNA kan opbevares ved -20 ° C. * Optimering af cyklusnummer foreslås.
    3. Følg PCR-oprensningsproceduren i PCR rensningssætet. Eluer med 50 μl elueringsbuffer. Bestem DNA-koncentrationen og 260/280 nm værdierne.
  12. Alle procedurer er identiske med "Venstre-kryds-specifik amplifikation" (trin 1.11.1-1.11.3), bortset fra brugen af ​​forskellige primere; Brug den højre krydsningsspecifikke primer (2R-primer, se tabel 1 ) i dette trin.
  • PCR-amplikonlængdevariationstest:
    1. Analyser PCR ampliconlængdevariationer ved at udføre 2% agaroselelektroforese eller kapillærelektroforese ( Figur 2 ).
      BEMÆRK: Dette er et vigtigt skridt til at bekræfte færdiggørelsen af ​​analyseprocedurerne og at foretage en grov vurdering af IS-mønstre baseret på PCR-båndmønstre. Den oprensede PCR-amplicon fra trin 1.11.3 og 1.12.3 kan anvendes til forskellige DNA-sekventeringsplatforme. Fortsæt med de relevante prøveudarbejdelsesprocedurer for sekventificering af klassisk kædens terminering (Sanger) eller næste generations sekventering. DNA'et kan opbevares ved -20 °; C.
  • 2. Computational IS Sequence Analysis

    1. Forberedelse af datafiler:
      1. Forbered tre input datafiler: en fasta format sekvens data fil (Test_data.fa i supplerende data), en tsv fil for søgemotiverne for vektor og linker sekvenser (Demultiplexing_Trimming_blunt_GTAC.tsv i supplerende data) og en tsv fil for restriktionsenzym information (Enzyme.tsv i supplerende data).
        BEMÆRK: Disse filer er nødvendige for demultipleksering, trimning af vektor- og linkersekvenser og fjernelse af interne vektorsekvenser ( Figur 3A ). Detaljerede trinvise instruktioner til gennemførelse af beregningsprocessen leveres i filen README.txt i supplerende data.
    2. Beregningsanalyse:
      1. Kør demultiplexing og trimning scripts.
        BEMÆRK: Råsekvensen behandles til demultipleksering og til trimminenG af vektor-, linker- og primer-sekvenserne (se STEP-1 i den supplerende README.txt-fil).
      2. Kør mapping kommandoen (se STEP-2 i filen README.txt) for at kortlægge de behandlede sekvenser på referencegenomet ved hjælp af et BLAST-lignende tilpasningsværktøj (BLAT; www.genome.ucsc.edu).
      3. Kør det kvantitative IS analyse script (se STEP-3 i filen README.txt).
        BEMÆRK: To outputfiler (Initial_count_without_homopolymer_correction.txt og Final_count.txt) bliver genereret. Flere detaljer om kortlægnings- og sekvensregistreringsstrategier findes i filen "README.txt" i supplerende data og i tidligere publikationer 2 , 15 .

    Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    Den tovejsede IS-analyse genererede forskellige størrelser af PCR-amplikoner for både opstrøms (venstre) og nedstrøms (højre) vektorværtsforbindelser ( figur 2 ). Størrelsen af ​​en PCR-amplicon er afhængig af placeringen af ​​det nærmeste GTAC-motiv opstrøms og nedstrøms for en integrering. Assayet producerede også interne DNA-PCR-amplikoner: retrovirale sekvenser nær polypurinkanalen og primerbindingsstedet blev samtidig amplificeret under henholdsvis venstre og højre kryds-PCR. PCR-ampliconbånd kan visualiseres ved kapillær eller agarose (2%) elektroforese.

    Efter sekventering blev både venstre- og højre-junction-sekvenserne analyseret ved hjælp af et internt programmeringsskript til forbehandling af rå sekvenser (herunder demultipleksering og trimning af vektor og linker-DNA), kortlægning af IS-sekvenser på genomet, identifikation og tælling af identiske ISSekvenser og anvende fejlkorrektionsprocedurer ( figur 3 ). Steder af 5'-enden af ​​forespørgselssekvenserne i referencegenomet betragtes som IS og anvendes til indledende tælling af hver IS. Kriterierne, der bestemmer de to matchende sekvenser - opstrøms (venstre) og nedstrøms (højre) krydsekvenser stammer fra samme integrom-er baseret på nukleotidsekvensmønstrene af retrovirusspecifik samordnet integration og er som følger: (i) To krydsekvenser Justere på genomet i modsatte retninger. (Ii) IS'en af ​​de to forbindelsessekvenser adskilles af en 5-bp overlapning for humane immunodeficiencyvirus (HIV) vektorer og en 4-bp overlapning for murine leukæmivirus (MLV) -vektorer. De første 5 bp af de to krydsninger af HIV og 4 bp af MLV kryds er revers-komplementære.

    IS sekvensantal bestemmes i tre trin: (1) kortlægning af IS-sekvenser på genometVed hjælp af BLAT, som genererer kortkvaliteten og adskiller individuelle IS-sekvenser til "single hit", "multi hit", "no-hit" og "other" grupper; (2) ved hjælp af det grundlæggende lokaljusteringssøgningsværktøj (BLAST) for at sammenligne single-hit-sekvenser med andre suboptimalt kortlagte sekvenser, herunder multi-hits, no-hits og andre; Og (3) identifikation og korrigering af sekventeringsfejl, herunder homopolymerfeil. Multi-hit-sekvenser er IS-sekvenser, der kan justere to eller flere genomiske positioner med en høj mapping score. Mens de stadig er nyttige til at identificere og kvantificere klonpopulationer, kan multi-hit-sekvenserne ikke anvendes til karakterisering af genomiske integrationssite-distributionsmønstre (for eksempel tilknytning til gener, gentagelser eller andre genomiske tegn). I nogle sjældne tilfælde viser de to kryds-sekvenser forskellige kortlægningskvaliteter. For eksempel viser man "single-hit", mens matchende sekvens viser "multi-hit". I sådanne tilfælde beggeSekvenser behandles som "single-hit" sekvenser.

    En del af IS-sekvenser med suboptimale kortlægningsresultater, der viser high percent-genomsammenligning (identitet) med en abnorm forespørgselsstørrelse (QSIZE) eller omvendt, blev adskilt fra "no-hits" og grupperet i "andre" for yderligere og ofte Manuel revurdering. For eksempel kan nogle IS-sekvenser, når de bruger BLAT til genom-kortlægning, vise en unormal QSIZE på grund af manglende matchende nukleotider i de første eller sidste 5-10 nukleotider. Disse sekvenser opfylder ofte ikke kortlægningskriterierne for "single-hit" eller "multi-hit" -status, på trods af at der er et relativt kort kvalitetsresultat.

    En prøve rå sekvens datafil (Test_DATA.fa: 33,374 sekvenser) og sample output data filer leveres som supplerende data. 1 μg genomisk DNA fra humane repopulerende celler, transduceret med udlånt Virale vektorer (FG12) i en humaniseret knoglemarv / lever / thymus (BLT) mus 17 blev analyseret under anvendelse af tovejsanalysen. Retroviral IS blev fundet over hele genomet. Typisk er lentivirale vektorer overrepresenteret i gener, mens gamma-retrovirale vektorer overrepresenteres i transkriptionsstartsteder 16 ( Figur 4 ). Fra to humane repopulerende celleprøver blev i alt 1,081 sekvenser-851 fra opstrøms (venstre) og 230 de nedstrøms (højre) krydsninger kvalificeret som IS-sekvenser. Fra disse sekvenser blev 93 unikke IS i venstre og 50 unikke IS i de højre krydsninger identificeret. Af disse blev 44 identificeret i både (venstre og højre) krydsninger, der viste i alt 99 unikke integreringer i testprøverne. IS er signifikant beriget i gener (66%, p <0,0001) i forhold til tilfældige hændelser ( figur 4A ).

    "> Eksempel gamma-retrovirusvektor (pMX) integrationssitesekvenser er også inkluderet i testdatafilen. Fra en blandet Pmx-konstrueret celleprøve transduceret med pMX, der udtrykker Oct4, cMyc, Klf4 og Sox2, 1.611 IS sekvenser og 129 unikke IS blev identificeret. Af 65 og 76 unikke IS identificeret i henholdsvis venstre og højre kryds, var 12 i begge kryds.

    Det har tidligere vist sig, at PCR-amplikoner på ≥500 bp er dårligt sekventeret i pyrosequensionsplatformen, mens PCR-amplikoner på <500 bp generelt er vel-sekventerede uden en bemærkelsesværdig bias med hensyn til sekvenslængder 15 . Således blev sekvensdata fra ≥ 500 bp PCR-amplikoner udelukket for at fjerne længdeassocieret sekventeringsforspænding. Kun data fra <500 bp PCR amplicon (betegnet som kvantificerbar vektor integromet eller QVI) blev anvendt til kvantitativ klonanalyse. De relative detektionsfrekvenser af vektorintegromerBlev beregnet ved kun at bruge sekvensantallene af IS-krydsninger, der genererede <500 bp PCR ampliconer ( Figur 4B -4D ; se også tabel 2 ). Ca. 77% af vektorerne kunne analyseres kvantitativt ved denne strategi ( figur 4B ). Som følge heraf forventedes de beregnede frekvenser for hver QVI at overslagse de sande frekvenser i prøven ( Figur 4E ) med 1,25x.

    figur 1
    Figur 1: En skematisk visning af tovejs integrationssiteanalyse. Dobbeltstrenget retroviralt DNA (sort og rød) flankeret af cellulært DNA (blå) er vist. Pilene repræsenterer oligonukleotidprimere, og pile med en stjerne repræsenterer biotinprimere. Linker-DNA'er betegnes med lilla linjer. Kort sagt, en lineær forlængelse af venstreBiotinprimere (L-BP) og højre biotinprimere (R-BP) fra viral Long Terminal Repeat (LTR) genererer biotinyleret, dobbeltstrenget IS-DNA. Efter fordøjelse med CviQI og RsaI beriges det biotinylerede dobbeltstrengede DNA ved anvendelse af streptavidin-biotinspecifik binding og ligeres med linker-DNA. Streptavidinindfangede, linker-ligerede vektor-værtsforbindelses-DNA'er amplificeres ved hjælp af en to-trins PCR: præamplifikation (amplifikation af både venstre og højre kryds) efterfulgt af to indlejrede PCR'er, hver målrettet venstre og højre kryds. Klik her for at se en større version af denne figur.

    Figur 2
    Figur 2: Repræsentativ PCR Amplicon Image. ( A ) Kapillær elektroforese analyse viser varierende længder af PCR ampLiconer i lentivirale vektor (FG12) integration sites efter pvuII eller sfoI fordøjelse . Forskellige PCR-bånd til opstrøms (venstre) og nedstrøms (højre) vektorværtsforbindelser er vist. De mørke pilhoveder angiver de interne vektor-DNA-amplikoner, der er tilbage efter pvuII- eller sfoI- fordøjelsen. DNA-størrelsesmarkøren (0,1 - 2,5 kbp) er på M-banen. De åbne pilhoveder angiver justeringsmarkører (15 og 5.000 bp). DNA-justeringsmarkører anvendes til kalibrering af migrationstidsvariationen på tværs af alle kanaler. ( B ) Gamma-retrovirale (pMX) vektorintegrationssteder i murine cellekloner transduceret med multiple pMX-vektorer. Venstre- og højre-junction-DNA'er samt interne vektor-DNA-amplikoner (pilhoveder) er vist. De mørke og åbne pilhoveder indikerer henholdsvis interne vektor DNA og alignment markører. DNA-størrelsesmarkøren (50-1.500 bp) er på M-banen. Detaljer om kapillær elektroforese findes i virksomhedenprotokol. Klik her for at se en større version af denne figur.

    Figur 3
    Figur 3: Integrationsstedssekvensanalyse. ( A ) Et rutediagram til beregningsdataanalyse. Tre data filer, herunder en fasta format sekvens fil, en fil med reference sekvens motiver til demultiplexing og trimning, og en fil med restriktionsenzym oplysninger, er påkrævet. Prøvefiler, herunder Test_DATA.fa (sekvensdata), Demultiplexing_Trimming.tsv (søgsekvensmotiver) og Enzyme.tsv (Restriktionsenzymgenkendelsessekvens), leveres som supplerende datafiler. De behandlede sekvenser (værtsgenomsekvenser) fra del 1 vil blive kortlagt mod referencen ved anvendelse af BLAT. Steder i 5'-enden af ​​forespørgselssekvensenEs i referencegenomet betragtes som integrationsstederne ( tabel 2 ). Sekvensantal for hver IS bestemmes i tre trin: (1) kortlægning af IS-sekvenser på genomet ved hjælp af BLAT; (2) sammenligning af single-hit-IS-sekvenser (tilpasning til et unikt sted af værtsgenomet) med andre sekvenser, der blev suboptimalt kortlagt på genomet; Og (3) identifikation og korrigering af sekventeringsfejl. Flere detaljer om kortlægning og sekvensregistreringsstrategier findes i tidligere studier 2 , 15 . ( BC ) To enkeltkernede enkeltstrengede DNA-sekvenser for nedstrøms (B) og opstrøms (C) vektor-værtsforbindelserne er vist. Pyrosequencing primere A og B (grøn) anvendes til dråbe-PCR og sekventering. Farvekoderne stemmer overens med dem i figur 1 . Prøven nedstrøms sammenkoblingssekvens (B) indbefatter Primer A (grøn), MID (grøn), Vector U5 ende (rød), værtsgenomet (blå), liNker (lilla) og primer B (grøn). I en blandet (opstrøms og nedstrøms) DNA-sekventering anvendes Primer A til sekventering af nedstrømsforbindelserne (B), og Primer B anvendes til sekventering af opstrømsforbindelserne. Prøven opstrøms sammenkoblingssekvens (C) indbefatter Primer B, MID, Vector U3 ende, værtsgenom, linker og Primer A. Klik venligst her for at se en større version af denne figur.

    Figur 4
    Figur 4: Repræsentativt eksempel på tovejs integrationssiteanalyse. ( A ) Procent integrering i gener (refseq), Alu og LINE 1 (L1) gentagelser af lentivirale vektorer i humaniserede musrepopulerende celler (LV-huMice) sammenlignet med i siliciumgenererede 10.000 tilfældige integrationshændelser. Integrationssteder kortlæggesPå det humane genom (hg19). LV-huMice-integrationssteder er signifikant overrepræsenteret i gener ( p <0,0001, chi-kvadrat-tilnærmelse) ( B ) I silicoanalyse af 10.000 tilfældige integrationshændelser. Med en ensrettet tilgang dannede ca. 52% tilfældige integromer PCR-amplikoner på <500 bp, hvorimod 77% genererede en PCR-amplicon på <500 bp i begge retninger i venstre eller højre retning. PCR-amplikoner længere end 500 bp er ineffektivt sekventeret med pyrosequencingplatformen 2 , 15 og bør således udelukkes fra kvantitative dataanalyser. ( C ) Strategi for klonal kvantificering. Hver enkelt klon deler samme vektorintegration (eller IS). De relative frekvenser af venstre (x) og højre (y) krydsene kombineres for at repræsentere de relative mængder af klonpopulationer (kvantificerbare vektorintegromer eller QVI). Integ Ration sites, der ikke har et GTAC motiv inden for 450 bp diskvalificeres (dQ) og fjernes fra kvantificeringsanalyse. ( D ) De relative frekvenser (i forhold til alle QVI-sekvenser) af 44 QVI kloner i humaniserede musrepopulerende celler er vist i et farveskema (hvid til rød: 0 til 0,16). ( E ) Forventet overestimering af klonfrekvenser med tovejsanalyse. Baseret på silicico 10.000 random integrationsanalyse forventes en 1,25-fold overestimering, når man bruger GTAC-motiv enzymer ( RsaI og CviQI ) på grund af ca. 20% dQ kloner. En 2,56x over estimation forventes på grund af ca. 60% dQ kloner, når der anvendes TCGA-motiv enzym ( TaqaI ). Klik her for at se en større version af denne figur.

    Oad / 55812 / 55812table1.jpg "/>
    Tabel 1: Oligonukleotider til Lentiviral og Gamma-Retroviral Vector Integration Site Analysis. * 5BioTEG: Biotin modifikation ved 5'-enden. Klik her for at se en større version af denne tabel.

    Tabel 2
    Tabel 2: Repræsentative indsætningsstedssekvenssekvensdata. Klik her for at se en større version af denne tabel.
    1 Kort: Integrationssted sekvenser kan kortlægges på et unikt sted (single-hit) eller multiple loci (multi-hit) af referencegenomet. NA (ikke tilgængelig): ingen sekvens blev detekteret.
    2 STRD: Orientering af forespørgselssekvensen i genomet
    3 QLEN: længden af ​​forespørgselssekvensen
    4 GLEN: den forventede længde af integrationssitesekvensen, beregnet ud fra afstanden fra det nærmeste tilgængelige GTAC-motiv i genomet til insertionsstedet. GLEN <450 bp accepteres til kvantitative analyser.
    5 Total_Count: total sekvensantal
    6 Integrationssteder er vist med et kromosomnummer (CHR) og et stednummer til højre kryds (CHR_SITE1) og et nummer til venstre kryds (CHR_SITE2). CHR_SITE1 og CHR_SITE2 er 5 bp fra hinanden for lentivirale vektorer og 4 bp fra hinanden for MLV (pMX) vektorer
    7 Sekvens tæller for højre kryds (R_A) og venstre kryds af prøve A (L_A); Sekvens tæller for højre kryds (R_B) og venstre kryds af prøve B (L_B)
    * Diskvalificeret (dQ): GLEN ≥450 i silico bp

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    Det tovejsede assay muliggør samtidig analyse af både opstrøms (venstre) og nedstrøms (højre) vektor-vært-DNA-forbindelsessekvenser og er anvendelig i en række genterapi-, stamceller- og cancerforskningsapplikationer. Anvendelsen af ​​GTAC-motiv-enzymer (RsaI og CviQI) og den tovejsede PCR-tilgang forbedrer signifikant chancerne for at detektere en integromet (eller en klonal population) sammenlignet med tidligere TCGA-motiv enzym ( TaqaI ) -baserede assays 2 , 15 og andre Ensrettet LM-PCR-tilgange 5 . Det tovejsede assay forbedrer analysen af ​​IS, især i de begrænsede DNA-prøver, der ofte opstår i kliniske undersøgelser eller små dyrmodeller.

    Trin 1.1-1.7 er et kritisk trin og skal gøres uden unødige forsinkelser. Disse trin udføres normalt på en dag. Test enzymer forud for disse trin anbefales stærkt. TrinS 1.9 og 1.10 er valgfrie. Disse trin vil reducere interne vektor-DNA-sekvenser, som samtidig amplificeres med IS-sekvenser. Tabel 1 tilvejebringer primersæt, der er egnede til at analysere IS af vildtype NL4.3 HIV-1, NL4.3-afledte vektorer, herunder FG12 21 og pMX-baserede gammaretrovirale vektorer 22 . Afhængigt af nukleotidvariationerne i LTR-sekvenserne (Long Terminal Repeat), kan primerdesign og eksperimentel tilgang kræve en ordentlig modifikation.

    Blat-softwaren, der bruges til kortlægning, er kun kompatibel med fastformat og fungerer ikke med fastq-filer. Man kan konvertere fastq-filer til fasta ved hjælp af forskellige softwareværktøjer, såsom FASTX-Toolkit eller BBTools. En bruger med grundlæggende kendskab til python kan bruge Biopython til at konvertere fastq-filerne til fasta til kortlægning af dem med blat.

    Det forventes, at en del af IS'et ikke vil blive detekteret med tovejskoden IS-assay og, selvom detekteres, ikke vil kvalificere sig til nedstrøms klonal kvantificering. Når GTAC-motiv-enzymer blev brugt, passerede ca. 23% af integromerne i sekvensdataene, der var genereret af pyrosequencingplatformen, analysekriterierne for kvantitativ IS-sekvensanalyse ( Figur 4 ). Når en omfattende IS-dækning er kritisk, for eksempel i sikkerhedsovervågningen af ​​genanvendte celler i genterapiindstillinger, er det tilrådeligt at vælge et assay med ubegrænset genomadgang til IS 8 , 9 , 10 , 11 , 12 eller for at omanalysere Samme prøve med en anden eller optimeret kombination af restriktioner 4 , 18 .

    Er analyser med ubegrænset genom adgang, såsom ikke-restriktiv LAM PCR og tilfældig skære apprOaches 19 , 20 , holder særligt løfte om omfattende IS analyse. Disse fremgangsmåder bruger teknologier, som er relativt vanskelige at kontrollere, hvilket gør det svært at forudsige udfaldet af genomisk DNA-fragmentering og IS-amplifikation. På den anden side har IS-analyser, der anvender velkendetegnede restriktionsenzymer, to væsentlige fordele: (1) Det er relativt let at kalibrere og optimere analyser, fordi analyseresultaterne er mere forudsigelige på grund af enzymreaktionens specificitet og tilgængeligheden af Referencegenomsekvenser. (2) Sekvensdata er meget reproducerbare, når assaybetingelserne er blevet optimeret. Den tovejsede PCR med optimerede betingelser har vist sig nyttig til storskala og præcis klonal kvantificering 2 , 15 . Selvom kun en del af eksisterende klonpopulationer er blevet analyseret på grund af restriktionsenzymforspænding, er mængderne af individuel L-kloner blev nøjagtigt målt, hvilket muliggjorde den nøjagtige bestemmelse af klonstørrelsesvariationer inden for og på tværs af prøver. Et tilstrækkeligt antal kloner blev genereret til bestemmelse af stamcelleadfærdsmønstre og funktionel heterogenitet.

    PCR-amplikonerne fremstillet fra denne tovejs-PCR-procedure er egnede til enhver downstream-sekventeringsplatform. På grund af analysens høje følsomhed skal der udvises den største forsigtighed for at forhindre krydskontaminering ved at udføre forsøg i et forureningsfrit rum. Inddragelsen af ​​et negativt (no-template) kontrolforsøg anbefales til alle PCR-trin. Selv med den mest omhyggelige praksis er det ekstremt vanskeligt at forhindre krydskontaminering fra stikprøve til prøve. Når man sammenligner klonale populationer fra forskellige prøver, er det derfor tilrådeligt at anvende en kollisionsstyring, der fjerner potentielle forurenede data 23 og en afskæring for lavfrekvente, upålidelige kloner> 2 for at minimere støj fra krydskontamineret DNA. Den tovejsede tilgang genererer IS-data for begge ender af integromerne og derved tilvejebringer en yderligere mulighed for at reducere potentielle falskpositive detekteringsfejl.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Forfatterne har intet at afsløre.

    Acknowledgments

    Finansiering blev ydet af National Institutes of Health Grants R00-HL116234, U19 AI117941 og R56 HL126544; National Science Foundation Grant DMS-1516675; Koreas Nationale Forskningsfond (NRF-2011-0030049, NRF-2014M3C9A3064552); Og KRIBB initiativprogrammet.

    Materials

    Name Company Catalog Number Comments
    Thermostable DNA polymerase Agilent 600424 PicoMaxx Polymerase
    Thermostable DNA polymerase buffer Agilent 600424 PicoMaxx Polymerase buffer
    Deoxynucleotide (dNTP) solution mix New England Biolabs N0447L dNTP solution mix (10 mM each)
    PCR tubes VWR International 53509-304 PCR Strip Tubes With Individual Attached Caps
    2 mL microcentrifuge tube Molecular Bioproducts 3453 microcentrifuge tubes
    PCR purification kit Qiagen 28106
    RsaI  New England Biolabs R0167L restriction enzyme
    CviQI New England Biolabs R0639L restriction enzyme
    Buffer A New England Biolabs B7204S NEB CutSmart buffer
    DNA Polymerase I large (klenow) fragment  New England Biolabs M0210L Blunting
    streptavidin beads solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Binding Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Washing Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    magnetic stand ThermoFisher 12321D DynaMag™-2 Magnet
    T4 DNA ligase New England Biolabs M0202L T4 DNA ligase
    10X T4 DNA ligase buffer New England Biolabs B0202S T4 DNA ligase reaction buffer
    5X T4 DNA ligase buffer Invitrogen  46300-018 T4 DNA ligase buffer with polyethylene glycol-8000
    UV-Vis spectrophotometer Fisher Scientific S06497 Nanodrop 2000
    pvuII new England Biolabs R0151L restriction enzyme
    sfoI new England Biolabs R0606L restriction enzyme
    Buffer B new England Biolabs B7203S NEB buffer 3.1
    Nuclease free water Integrated DNA Technologies 11-05-01-14
    Capillary electrophoresis Qiagen 9001941 QIAxcel capillary electrophoresis
    Veriti 96-well Fast Thermal Cycler Thermo Fisher Scientific 4375305 PCR Instrument
    Rotating wheel (or Roller) Eppendorf M10534004 Cell Culture Roller Drums
    DNA size marker Qiagen 929559 QX size marker (100 - 2,500 bp)
    DNA size marker Qiagen 929554 QX size marker (50 - 1,500 bp)
    DNA alignment markers Qiagen 929524 QX DNA Alignment Marker
    genomc DNA Not Available Not Available Sample genomc DNA from in vivo or in vitro experiments

    DOWNLOAD MATERIALS LIST

    References

    1. Serrao, E., Engelman, A. N. Sites of Retroviral DNA Integration: From Basic Research to Clinical Applications. Crit. Rev. Biochem. Mol. Bio. 51 (1), 26-42 (2016).
    2. Kim, S., et al. Dynamics of HSPC Repopulation in Nonhuman Primates Revealed by a Decade-Long Clonal-Tracking Study. Cell Stem Cell. 14 (4), 473-485 (2014).
    3. Bushman, F. Retroviral integration and human gene therapy. J. Clin. Invest. 117 (8), 2083-2086 (2007).
    4. Bystrykh, L. V., Verovskaya, E., Zwart, E., Broekhuis, M., de Haan, G. Counting stem cells: methodological constraints. Nat Meth. 9 (6), 567-574 (2012).
    5. Schröder, A., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110 (4), 521-529 (2002).
    6. Silver, J., Keerikatte, V. Novel use of polymerase chain reaction to amplify cellular DNA adjacent to an integrated provirus. J. Virol. 64, 3150 (1990).
    7. Schmidt, M., et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat. Meth. 4 (12), 1051-1057 (2007).
    8. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39 (11), e72 (2011).
    9. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    10. Kim, S., Kim, Y., Liang, T., Sinsheimer, J., Chow, S. A high-throughput method for cloning and sequencing human immunodeficiency virus type 1 integration sites. J. Virol. 80 (22), 11313-11321 (2006).
    11. Maldarelli, F., et al. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345 (6193), 179-183 (2014).
    12. Wu, C., et al. High Efficiency Restriction Enzyme-Free Linear Amplification-Mediated Polymerase Chain Reaction Approach for Tracking Lentiviral Integration Sites Does Not Abrogate Retrieval Bias. Hum. Gene. Ther. 24 (1), 38-47 (2013).
    13. Aker, M., Tubb, J., Miller, D. G., Stamatoyannopoulos, G., Emery, D. W. Integration Bias of Gammaretrovirus Vectors following Transduction and Growth of Primary Mouse Hematopoietic Progenitor Cells with and without Selection. Mol. Ther. 14 (2), 226-235 (2006).
    14. Gabriel, R., Kutschera, I., Bartholomae, C. C., von Kalle, C., Schmidt, M. Linear Amplification Mediated PCR; Localization of Genetic Elements and Characterization of Unknown Flanking DNA. J Vis Exp. (88), e51543 (2014).
    15. Kim, S., et al. High-throughput, sensitive quantification of repopulating hematopoietic stem cell clones. J. Virol. 84 (22), 11771-11780 (2010).
    16. Mitchell, R., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2 (8), e234 (2004).
    17. Melkus, M., et al. Humanized mice mount specific adaptive and innate immune responses to EBV and TSST-1. Nat. Med. 12 (11), 1316-1322 (2006).
    18. Bystrykh, L. V. A combinatorial approach to the restriction of a mouse genome. BMC Res Notes. 6, 284 (2013).
    19. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. -P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol Biol. , 321-344 (2014).
    20. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    21. Qin, X., An, D., Chen, I., Baltimore, D. Inhibiting HIV-1 infection in human T cells by lentiviral-mediated delivery of small interfering RNA against CCR5. Proc Natl Acad Sci U S A. 100 (1), 183-188 (2003).
    22. Kitamura, T., et al. Retrovirus-mediated gene transfer and expression cloning: powerful tools in functional genomics. Exp. Hematol. 31 (11), 1007-1014 (2003).
    23. Cartier, N., et al. Hematopoietic stem cell gene therapy with a lentiviral vector in X-linked adrenoleukodystrophy. Science. 326 (5954), 818-823 (2009).

    Tags

    Genetik Udgave 124 Retrovirus Integrationssteder Næste generations sekventering Retroviral genterapi Stamceller Cancers Cellular barcoding Bioinformatics
    Tovejs Retroviral Integration Site PCR Metode og Quantitative Data Analysis Workflow
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Suryawanshi, G. W., Xu, S., Xie, Y., More

    Suryawanshi, G. W., Xu, S., Xie, Y., Chou, T., Kim, N., Chen, I. S. Y., Kim, S. Bidirectional Retroviral Integration Site PCR Methodology and Quantitative Data Analysis Workflow. J. Vis. Exp. (124), e55812, doi:10.3791/55812 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter