Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Sistema di integrazione bidirezionale retrovirale Metodo PCR e flusso di lavoro analitico dei dati quantitativi

Published: June 14, 2017 doi: 10.3791/55812
* These authors contributed equally

Summary

Questo manoscritto descrive la procedura sperimentale e l'analisi del software per un test di sito di integrazione bidirezionale che può contemporaneamente analizzare il DNA di giunzione vettoriale-host a monte ea valle. I prodotti bidirezionali di PCR possono essere usati per qualsiasi piattaforma di sequencing a valle. I dati risultanti sono utili per un confronto quantitativo e ad alto rendimento dei target integrati del DNA.

Abstract

I test di sito di integrazione (IS) sono una componente fondamentale dello studio dei siti di integrazione retrovirale e del loro significato biologico. Negli ultimi studi di terapia genica retrovirale, i test di IS, in combinazione con sequenziamento di nuova generazione, sono stati utilizzati come strumento di monitoraggio delle cellule per caratterizzare le popolazioni di cellule staminali clonali che condividono la stessa IS. Per il confronto preciso dei cloni di cellule staminali ripopolari all'interno e tra diversi campioni, la sensibilità di rilevazione, la riproducibilità dei dati e la capacità di trasmissione elevata del dosaggio sono tra le qualità di dosaggio più importanti. Questo lavoro fornisce un flusso di lavoro dettagliato per il protocollo e l'analisi dei dati per l'analisi bidirezionale dell'IS. Il saggio bidirezionale può simultaneamente sequenziare giunzioni sia a monte che a valle del vettore-host. Rispetto agli approcci convenzionali sequenziali unidirezionali, l'approccio bidirezionale migliora notevolmente i tassi di rilevazione di IS e la caratterizzazione degli eventi di integrazione a entrambe le estremità di tEgli mira al DNA. L'analisi dei dati descritta qui accuratamente identifica e enumera le sequenze identiche di IS attraverso più fasi di confronto che mappono le sequenze di IS sul genoma di riferimento e determinano gli errori di sequenza. Utilizzando una procedura di dosaggio ottimizzata, abbiamo recentemente pubblicato gli schemi di repopulazione dettagliati di migliaia di cloni di cellule staminali ematopoietiche (HSC) dopo il trapianto in macaques rhesus, dimostrando per la prima volta il momento preciso del ripopolamento HSC e l'eterogeneità funzionale degli HSC nel Sistema primato. Il seguente protocollo descrive la procedura sperimentale dettagliata e il flusso di lavoro di analisi dei dati che identifica con precisione e quantifica le sequenze identiche di IS.

Introduction

Retrovirus inserire il loro DNA genomico nel genoma ospite in vari siti. Questa proprietà unica, che può contribuire allo sviluppo di tumori e altre forme di patogenesi virale, ha il vantaggio ironico di rendere tali virus altamente suscettibili all'ingegneria cellulare per la terapia genica e la ricerca di base della biologia. Il sito di integrazione virale (IS) - l'ubicazione sul genoma ospite in cui è integrato un DNA straniero (virus) - ha importanti implicazioni per il destino sia dei virus integrati che delle cellule ospitanti. I test di IS sono stati utilizzati in varie impostazioni di ricerca biologiche e cliniche per studiare la selezione e la patogenesi dei siti di integrazione retrovirale, lo sviluppo del cancro, la biologia delle cellule staminali e la biologia dello sviluppo 1 , 2 , 3 , 4 . Sono tra le minore sensibilità di rilevazione, la scarsa riproducibilità dei dati e la frequente contaminazione incrociataI fattori chiave che limitano le applicazioni dei test IS a studi attuali e pianificati.

Sono state sviluppate molte tecnologie di analisi IS. I più ampiamente utilizzati sono i test del sito di integrazione a base di enzimi di restrizione, tra cui la reazione a catena polimerasi (PCR) 5 , PCR inversa PCR 6 e LAM (PCR 7 ) mediata da amplificazione lineare (LAM). L'uso di enzimi di restrizione specifici del sito, tuttavia, genera una polarizzazione durante il recupero dell'IS, consentendo solo un sottoinsieme di integromi (un DNA straniero integrato nel genoma ospite) nelle vicinanze del sito di restrizione da recuperare 4 . Sono state introdotte anche tecnologie di analisi che valutano in modo più ampio il vettore IS negli ultimi anni. Questi test impiegano varie strategie, tra cui Mu transposone mediato PCR 8 , non restrittivo (nr) -LAM PCR 9 , tipo II restriction enzymLa digestione 10 , la tranciatura meccanica 11 e il PCR a base di esame casuale (PCR re-free) 12 , per frammentare i DNA genomici e amplificare l'IS. Le tecnologie correnti hanno diversi livelli di sensibilità di rilevazione, copertura del genoma, specificità dell'obiettivo, capacità di trasmissione elevata, complessità delle procedure di analisi e pregiudizi nel rilevare le frequenze relative dei siti target. Dato le varie qualità dei test esistenti e la varietà di scopi per cui possono essere utilizzati, l'approccio ottimale del dosaggio deve essere attentamente selezionato.

Questo lavoro fornisce procedure dettagliate sperimentali e un flusso di lavoro di analisi dei dati computazionali per un test bidirezionale che migliora notevolmente i tassi di rilevazione e la precisione di quantificazione della sequenza analizzando simultaneamente l'IS a monte ea valle del DNA target integrato (si veda la figura 1 per una visione schematica delle procedure di analisi ). Questo approccio fornisce ancheI mezzi per caratterizzare il processo di integrazione retrovirale (ad esempio, la fedeltà della duplicazione del sito di destinazione e delle variazioni nelle sequenze genomiche di inserzioni a monte ea valle). Altri metodi bidirezionali sono stati usati principalmente per la clonazione e il sequenziamento di entrambe le estremità del DNA bersaglio 11 , 13 , 14 . Questo test è ampiamente ottimizzato per la quantificazione ad alta percentuale e riproducibile di cloni marcati da vettori, utilizzando il metodo LM-PCR consolidato e mappatura di analisi computazionale e per la quantificazione delle giunzioni a monte ea valle. L'analisi bidirezionale con l'enzima TaqαI si è dimostrata utile per la quantificazione clonale ad alta percentuale in studi preclinici per la terapia genica delle cellule staminali 2 , 15 . Questo articolo descrive un metodo modificato che utilizza una taglierina più frequente (RsaI / CviQI - motivo: GTAC) che raddoppia tHa probabilità di rilevare gli integri rispetto ad un test basato su TaqαI . Sono descritte procedure dettagliate di analisi sperimentale e di dati che utilizzano enzimi motivi GTAC per lentivirali (NL4.3 e suoi derivati) e vectori gamma-retrovirali (vettori pMX). Gli oligonucleotidi usati nel saggio sono elencati nella tabella 1 . Uno script di programmazione interno per l'analisi sequenza IS è fornito nel documento supplementare.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Generazione di librerie di sequenza di giunzione a monte (a sinistra) e a valle (a destra)

  1. Preparazione del DNA linker:
    1. Preparare una soluzione di DNA a 10 μL di linker aggiungendo 2 μl di Oligos LINKER_A 100 μM (finale: 20 μM), 2 μl di Oligos LINKER_B 100 μM (finale: 20 μM), 2 μL di 5 M NaCl (finale: 1M) e 4 μl di acqua priva di nucleasi in un tubo PCR. Vedere la Tabella 1 per le sequenze di linker.
    2. Incubare la soluzione DNA del linker a 95 ° C per 5 minuti in uno strumento PCR, arrestare il programma di esecuzione e spegnere lo strumento PCR. Lasciare la soluzione del linker nello strumento per 30 minuti per raffreddare lentamente il DNA del linker. La soluzione DNA del linker può essere conservata a 4 ° C.
  2. Estensione biotina-primer specifica di LTR:
    1. Utilizzare uno spettrofotometro UV-Vis per determinare la concentrazione del DNA ei valori di 260/280 nm del DNA genomico da in vivoO esperimenti in vitro . Diluire 1-2 μg di DNA genomico di campione ad un volume finale di 170 μL di soluzione genomica del DNA usando acqua senza nucleasi.
    2. Preparare una reazione di PCR da 200 μl mescolando 2,5 μL di ciascuno dei 10 μM primari di biotina specifici HIV-1 (L-BP e R-BP nella Tabella 1 : complessivamente 10 μL per quattro primer specifici lentivirus), 20 μL di 10X termostabili DNA buffer di polimerasi, 4 μL di 10 mM dNTPs (finale: 200 μM di ciascun dNTP), 3 μL di polimerasi DNA termostabile 2,5 U / μL e 163 μL di DNA genomico.
      NOTA: Per i vettori gammaretrovirali (vettori pMX), utilizzare 5 μl ciascuno di due primer di biotina specifici pMX 10 μM (L-BP e R-BP: complessivamente 10 μL) anziché i quattro primer biotinici specifici HIV-1 sopra.
    3. Dividere la soluzione in quattro tubi PCR (ogni 50 μL) e effettuare un ciclo di estensione singolo nelle seguenti condizioni: 94 ° C per 5 min, 56 ° C per 3 min, 72 ° C per 5Min e 4 ° C per la conservazione.
    4. Stazionare tutte le quattro reazioni PCR in un tubo di microcentrifuga da 2 mL e seguire la procedura di purificazione PCR del kit di purificazione PCR. Eluire con 50 μl di tampone di eluizione (tampone di eluizione diluito a 5 volte nel kit). Procedere immediatamente con il passo 1.3.1 o memorizzare il DNA eluito a -20 ° C.
  3. RsaI e CviQI digestione
    1. Preparare una reazione di digestione da 100 μL aggiungendo 50 μL di DNA (dal punto 1.2.4), 10 μL di 10 volte tampone A e 2 μl (20 U) di enzima RsaI. Incubare a 37 ° C per 1 h in uno strumento PCR.
    2. Aggiungere 1 μl (10 U) di enzima CviQI alla reazione e incubare a 25 ° C per 30 minuti in uno strumento PCR. Procedere immediatamente con il punto 1.4.1
  4. Finale sbattuto:
    1. Preparare una miscela di 4,5 μl contenente 2,5 μL di DNA polimerasi I grande (klenow) e 2 μL di 10 mM dNTPs. Trasferimento 181 L della miscela al campione di DNA dal punto 1.3.2. Il volume totale sarà di 102 μL. Mescolare bene vorticando e incubare a 25 ° C per 1 h in uno strumento PCR. Procedere immediatamente con il passaggio 1.6.1.
  5. Preparazione di perle streptavidina:
    1. Brevemente vortex la soluzione perlato di streptavidina e trasferire 50 μl in un nuovo tubo di microcentrifuga da 2 mL. Rimuovere il surnatante usando lo stand magnetico e lavare le perle con 200 μL di soluzione di legame.
    2. Resuspendere le perle in 100 μL di soluzione di legame e posizionare il tubo dal supporto magnetico. Procedere immediatamente con il passaggio 1.6.1.
  6. Strisce leganti di Streptavidin:
    1. Trasferire 100 μL di DNA campione (punto 1.4.1) alla soluzione di rilievo ricoperto da 100 μL (punto 1.5.2) e mescolare attentamente pipettando per evitare qualsiasi schiuma della soluzione. Incubare il tubo a temperatura ambiente per 3 ore su una ruota o un rullo rotante.
    2. Usate lo stand magnetico per catturare le perle e scartare il surnatante. Lavare le perle due volte in 400 μL di soluzione di lavaggio e due volte in 400 μl di 1x T4 DNA ligase buffer (diluito da soluzione 10X usando acqua priva di nucleasi).
    3. Resuspendere le perle in 200 μl di 1x T4 DNA ligase buffer (diluito da soluzione 10X usando acqua priva di nucleasi) e metterlo lontano dal supporto magnetico. Procedere immediatamente con il punto 1.7.1.
  7. Ligation del linker:
    1. Preparare una soluzione di reazione di ligation di 400 μL in un tubo di microcentrifuga da 2 ml mescolando 0,5 μL del linker del DNA (fase 1.1.2), 10 μl di tampone ligasi 10x T4 DNA, 20 μl di 5X T4 DNA ligase buffer (contenente il 25% di polietilene Glicole), 5 μl di ligasi del DNA di T4, 164,5 μL di acqua priva di nucleasi e 200 μL di brani ri-sospesi (punto 1.6.3). Posizionare il tubo di reazione sulla ruota rotante e incubare a RT (22 ° C) per 3 ore (o 16 ° CO / N). Lavare le perline due volte con la soluzione di lavaggio e due volte con 1X tampone termoplastico DNA polimerasi (diluito da soluzione 10x utilizzando acqua senza nucleasi) utilizzando il supporto magnetico.
    2. Resuspendere le perle in 50 μl di 1x termostabile tampone PCR polimerasi di DNA e metterlo lontano dal supporto magnetico. Procedere immediatamente con il passo 1.8.1 o conservare a 4 ° C per un massimo di un giorno.
  8. Preamplificazione della giunzione sinistro e destra DNA:
    1. Preparare una reazione PCR da 200 μl aggiungendo 10 μL di 10 μM di primer di 1L, 10 μL di 10 μM di primer 1R, di 20 μL di 10 μM di primer Link1 (Tabella 1), di 10 μl di tampone DNA polimerasi termo-stabile 10X, 4 μL di 10 mM dNTPs (finale: 200 μM di ciascun dNTP), 8 μL (20 U) DNA polimerasi termostabile e 88 μL di acqua libera da nucleasi per le perline ricondizionate (50 μL) del punto 1.7.3.
    2. Aliquota la miscela di reazione in 4 tubi PCR (ogni 501; L) e realizzare PCR con la seguente condizione: incubazione a 94 ° C per 2 min; 25 cicli di 94 ° C per 20 s, 56 ° C per 25 s e 72 ° C per 2 min; E una estensione finale a 72 ° C per 5 min.
    3. Raccogliere tutte le 4 reazioni PCR in un tubo di microcentrifuga da 2 mL e seguire la procedura di purificazione PCR del kit di purificazione PCR. Eluire con 50 μl di tampone di eluizione.
    4. Determinare la concentrazione del DNA ei valori di 260/280 nm utilizzando uno spettrofotometro UV-Vis; Il DNA può essere conservato a -20 ° C fino a quando è pronto per il passo successivo. Procedere con i passaggi 1.9.1 / 1.10.1 (facoltativo) o direttamente con i passaggi 1.11.1 / 1.12.1.
  9. Rimozione dell'ampiezza del DNA interno sinistro (opzionale):
    1. Trasferire fino a 100 ng di prodotto DNA del PCR dal punto 1.8.4 in un tubo di microcentrifuga da 2 mL e regolare il volume a 10 μL usando acqua priva di nucleasi.
    2. Preparare una reazione di enzima di restrizione che punta specificamente al D interno interno sinistroAmplicone NA.
      NOTA: La condizione di reazione può variare a seconda della scelta dell'enzima. Ad esempio, quando si rimuove il DNA interno sinistro da vettori lentivirali basati su NL4.3 , aggiungere 1 μl di pvuII , 2 μL di tampone B e 7 μl di acqua priva di nucleasi. Incubare a 37 ° C per 1 h in uno strumento PCR. Procedere immediatamente con il passo 1.11.1 o conservare a -20 ° C.
  10. Rimozione dell'ampiezza del DNA interno destro (opzionale):
    1. Procedere come al punto 1.9.1.
    2. Preparare una reazione di enzima di restrizione che punta specificamente all'amplificone interno destro del DNA.
      NOTA: Ad esempio, quando si rimuove il DNA interno destro da vettori lentivirali basato su NL4.3 , aggiungere 1 μl di sfoI , 2 μL di buffer B e 7 μl di acqua priva di nucleasi. Incubare a 37 ° C per 1 h in uno strumento PCR. Procedere immediatamente con il passo 1.12.1 o conservare a -20 ° C.
  11. Sinistra- amplificazione specifica di giunzione:
    1. Preparare una reazione PCR da 50 μl mescolando 5 μL di DNA dal punto 1.8.4 (o dal punto opzionale 1.9.2), 5 μL di 10 μM primer 2L (finale: 1 μM), 5 μL di primer da 10 μM Link2 (Finale: 1 μM), 5 μl di tampone DNA polimerasi termo-stabile 10x, 1 μL di dNTP 10 mM (finale: 200 μM di ciascun dNTP), 2 μL (5 U) di DNA polimerasi termostabile e 27 μL di nucleasi acqua.
    2. Eseguire il PCR con la seguente condizione: incubazione di 94 ° C per 3 min; 8-15 cicli di 94 ° C per 20 s, 56 ° C per 25 s e 72 ° C per 2 min; E una estensione finale a 72 ° C per 5 min.
      NOTA: il DNA amplificato può essere conservato a -20 ° C. * Si suggerisce l'ottimizzazione del numero di ciclo.
    3. Seguire la procedura di purificazione PCR del kit di purificazione PCR. Eluire con 50 μl di tampone di eluizione. Determinare la concentrazione del DNA ei valori di 260/280 nm.
  12. Tutte le procedure sono identiche a "Amplificazione specifica sinistro-giunzione" (fasi 1.11.1-1.11.3), ad eccezione dell'uso di diversi primer; Utilizzare il primer specifico a destra (primer 2R, vedi tabella 1 ) in questo passaggio.
  • Prova di variazione della lunghezza di amplicon PCR:
    1. Analizzare le variazioni della lunghezza dell'ampiezza del PCR eseguendo l'elettroforesi del gel agarosico del 2% o l'elettroforesi capillare ( Figura 2 ).
      NOTA: Si tratta di un passo essenziale per confermare il completamento delle procedure di analisi e per effettuare una valutazione ruvida dei modelli IS basati sui modelli di banda PCR. L'amplicone PCR purificato dai passaggi 1.11.3 e 1.12.3 può essere utilizzato per varie piattaforme di sequenziamento del DNA. Procedere con le appropriate procedure di preparazione del campione per la sequenza classica di terminazione di catena (Sanger) o sequenziamento di nuova generazione. Il DNA può essere conservato a -20 °; C.
  • 2. Analisi della sequenza di calcolo IS

    1. Preparazione dei file di dati:
      1. Preparare tre file di dati di input: un file di dati di sequenza di formato fasta (Test_data.fa in dati aggiuntivi), un file tsv per i motivi di ricerca per le sequenze di vettori e linker (Demultiplexing_Trimming_blunt_GTAC.tsv nei dati aggiuntivi) e un file tsv per informazioni sull'enzima di restrizione (Enzyme.tsv in dati supplementari).
        NOTA: Questi file sono richiesti per la demultiplexing, la sequenza di vettori e sequenze di link e la rimozione delle sequenze vettoriali interne ( Figura 3A ). Le istruzioni passo per passo dettagliate per l'implementazione del flusso di lavoro computazionale sono fornite nel file README.txt nei dati supplementari.
    2. Analisi computazionale:
      1. Esegui script demultiplexing e trim.
        NOTA: la sequenza cruda verrà elaborata per demultiplexing e per il trimminG del vettore, del linker e delle sequenze di primer (vedere STEP-1 nel file README.txt supplementare).
      2. Eseguire il comando di mappatura (vedere STEP-2 nel file README.txt) per mappare le sequenze elaborate sul genoma di riferimento utilizzando uno strumento di allineamento simile a BLAST (BLAT; www.genome.ucsc.edu).
      3. Eseguire lo script di analisi quantitativa IS (vedere STEP-3 nel file README.txt).
        NOTA: Verranno generati due file di output (Initial_count_without_homopolymer_correction.txt e Final_count.txt). Ulteriori dettagli sulla mappatura e sulle sequenze di sequenza di sequenze possono essere trovati nel file "README.txt" nei dati supplementari e nelle pubblicazioni precedenti 2 , 15 .

    Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    Il test bidirezionale IS ha generato diverse dimensioni di ampliconi PCR per entrambi i giunti dell'host vettore a monte (a sinistra) e a valle (destra) ( Figura 2 ). La dimensione di un amplicon PCR dipende dalla posizione del motivo più prossimo GTAC a monte ea valle di un integro. Il saggio ha inoltre prodotto ampliconi PCR a DNA interni: sequenze retrovirali vicine al tratto polipurinico e al sito di legame di primer sono stati amplificati contemporaneamente durante il PCR sinistro e destro. Le bande di amplicon PCR possono essere visualizzate mediante elettroforesi capillare o agarosa (2%).

    Dopo la sequenza, sia le sequenze di giunzione a sinistra che a destra sono state analizzate da uno script di programmazione interno per la preprocessazione di sequenze grezze (incluso il DNA di demultiplexing e trimming e il DNA di linker), mappando le sequenze di IS sul genoma, identificando e contando identiche ISSequenze e applicare procedure di correzione degli errori ( Figura 3 ). Le posizioni della 5 'delle sequenze di query nel genoma di riferimento sono considerate IS e sono utilizzate per il conteggio iniziale di ogni IS. I criteri che determinano le due sequenze corrispondenti - le sequenze di giunzione a monte (a sinistra) e a valle (a destra) originate dallo stesso integrome - si basano sui modelli di sequenza nucleotidica dell'integrazione concertata specifica del retrovirus e sono i seguenti: (i) due sequenze di giunzione Allinearsi sul genoma in opposti orientamenti. (Ii) L'IS delle due sequenze di giunzione è separato da una sovrapposizione di 5 bp per vettori di virus dell'immunodeficienza umana (HIV) e da una sovrapposizione di 4 bp per i vettori di virus della leucemia murina (MLV). I primi 5 bp delle due giunzioni di HIV e 4 bp di giunzioni MLV sono reverse-complementari.

    Le sequenze di sequenze di IS sono determinate in tre fasi: (1) mappatura delle sequenze di IS sul genomaUtilizzando BLAT, che genera la qualità di mappatura e separa le singole sequenze di IS in gruppi "hit singolo", "multi-colpito", "non colpito" e "altri"; (2) utilizzando lo strumento di ricerca di allineamento locale di base (BLAST) per confrontare le singole sequenze colpite con altre sequenze mappate in modo suboptimally, compresi i multi-hits, i non-hits e altri; E (3) identificare e correggere gli errori di sequenza, compresi gli errori di omopolimero. Le sequenze multi-hit sono sequenze IS che possono allineare due o più posizioni genomiche con un punteggio di mappatura elevato. Sebbene ancora utili per identificare e quantificare le popolazioni clonali, le sequenze multi-hit non possono essere utilizzate per caratterizzare schemi di distribuzione del sito di integrazione genomica (ad esempio associazione con geni, ripetizioni o altri genomici). In alcuni casi rari, le due sequenze di giunzione mostrano diverse qualità di mappatura. Ad esempio, si mostra "singolo colpo", mentre la sequenza di corrispondenza mostra "multi-hit". In questi casi, entrambiLe sequenze vengono trattate come sequenze "single hit".

    Una parte delle sequenze di IS con punteggi di mappatura non ottimali, mostrando una corrispondenza genomica elevata (identità) con una dimensione di query anormale (QSIZE) o viceversa, sono stati separati da "non-hit" e raggruppati in "altri" per ulteriori e spesso Riesame manuale. Ad esempio, quando si utilizza BLAT per la mappatura dei genomi, alcune sequenze di IS possono mostrare un QSIZE anormale a causa di nucleotidi miss-matching nei primi o ultimi 5-10 nucleotidi. Queste sequenze spesso non soddisfano i criteri di mappatura per lo stato "single hit" o "multi-hit", nonostante abbiano un risultato di mappatura relativamente elevato.

    Come dati aggiuntivi vengono forniti un file di dati di sequenza crude di campione (Test_DATA.fa: 33.374 sequenze) e file di dati di output di esempio. 1 μg di DNA genomico da cellule umane ripopolanti, trasduzione con prestiti Varianti virali (FG12) in un midollo osseo / fegato / timo (BLT) umano umanizzato 17 sono stati analizzati utilizzando il saggio bidirezionale. Retrovirale IS è stata trovata in tutto il genoma. Tipicamente, i vettori lentivirali sono sovrapresentati nei geni, mentre i vettori gamma-retrovirale sono sovra-rappresentati nei siti di inizio della trascrizione 16 ( Figura 4 ). Da due campioni di cellule ripopolari umane, sono state qualificate come sequenze di IS un totale di 1.081 sequenze-851 dall'alto (a sinistra) e 230 le giunzioni a valle (destra). Da queste sequenze sono state identificate 93 IS uniche nella sinistra e 50 IS univoche nelle giunzioni giuste. Di questi, 44 sono stati identificati in entrambi i giunzioni (sinistra e destra), mostrando un totale di 99 integri unici nei campioni di prova. IS sono significativamente arricchiti nei geni (66%, p <0,0001) rispetto ad eventi casuali ( Figura 4A ).

    "> Le sequenze di siti di integrazione del vettore gamma-retrovirus (pMX) sono inclusi anche nel file di dati di test. Da un campione di cellule miscelato Pmx, trasduttore con pMX che esprime le sequenze Oct4, cMyc, Klf4 e Sox2, 1.611 IS e 129 singole IS sono stati identificati. Di 65 e 76 IS univoco identificati nelle giunzioni a sinistra e destra, rispettivamente, 12 erano in entrambe le giunzioni.

    È stato dimostrato in precedenza che gli ampliconi PCR di ≥500 bp sono scarsamente sequenziati nella piattaforma di pirosequencing, mentre gli ampliconi PCR di <500 bp sono generalmente ben sequenziati, senza una considerevole bias per quanto riguarda le lunghezze di sequenza 15 . Così, i dati di sequenza da ≥ 500 bp ampliconi PCR sono stati esclusi per rimuovere la bias di sequenza associata a lunghezza. Solo i dati da <500 bp di amplicon PCR (definiti come integritore vettoriale quantificabile, o QVI) sono stati utilizzati per l'analisi clonal quantitativa. Le relative frequenze di rilevamento di integrometi vettorialiSono stati calcolati utilizzando solo i conteggi di sequenza delle giunzioni IS che generano <500 bp ampliconi PCR ( Figura 4B -4D , vedi anche Tabella 2 ). Circa il 77% dei vettori potrebbe essere analizzato quantitativamente da questa strategia ( figura 4B ). Come risultato, le frequenze calcolate per ciascun QVI dovrebbero superare le stime effettive del campione ( Figura 4E ) per 1.25x.

    Figura 1
    Figura 1: Una vista schematica dell'analisi del sito bidirezionale di integrazione. Sono mostrati DNA retrovirale a doppio filamento (nero e rosso) affiancato dal DNA cellulare (blu). Le frecce rappresentano primari oligonucleotidi e le frecce con un asterisco rappresentano primer di biotina. I DNA del Linker sono contrassegnati da linee viola. Brevemente, un'estensione lineare di sinistraI primer di biotina (L-BP) e i primer di biotina giusti (R-BP) del Long Terminal Repeat virale (LTR) genera il DNA doppio strato biotinilato. Dopo la digestione con CviQI e RsaI, il DNA biotinilato a doppio filamento viene arricchito utilizzando stratificazione streptavidina-biotina-specifica e sono legati con il DNA di collegamento. I DNA di giunzione con vettore-host legati a linker-ligated sono amplificati da un PCR a due stadi: la preamplificazione (amplificazione delle giunzioni a sinistra e destra) seguita da due PCR nidificati, ognuno dei quali punta a giunti a sinistra ea destra. Clicca qui per visualizzare una versione più grande di questa figura.

    figura 2
    Figura 2: Rappresentante PCR Amplicon Image. ( A ) L'analisi elettroforesi capillare mostra diverse lunghezze di amplificatore PCRLicone nei siti di integrazione vettoriale lentivirale (FG12) dopo la digestione pvuII o sfoI . Sono mostrate le varie fasce PCR per i giunzioni del vettore a monte (a sinistra) e a valle (a destra). Le testate frecce scure indicano gli ampliconi del DNA interno del vettore rimanenti dopo la digestione pvuII o sfoI. Il marker di dimensione del DNA (0,1 - 2,5 kbp) si trova sulla corsia M. Le testate a freccia aperte indicano marcatori di allineamento (15 e 5.000 bp). I marcatori di allineamento del DNA vengono utilizzati per la calibrazione della variazione del tempo di migrazione su tutti i canali. ( B ) siti di integrazione vettoriale gamma-retrovirale (pMX) in cloni di cellule murine trasdurate con più vettori pMX. Sono mostrati i DNA del sinistro e destro destro, nonché gli ampliconi del DNA vettoriale interno (teste frecce). Le testate frecce scure e aperte indicano rispettivamente il DNA vettoriale interno ei marcatori di allineamento. Il marker di dimensione del DNA (50-1.500 bp) si trova sulla corsia M. I dettagli sull'elettroforesi capillare si trovano in aziendaprotocollo. Clicca qui per visualizzare una versione più grande di questa figura.

    Figura 3
    Figura 3: Analisi della sequenza del sito di integrazione. ( A ) Un diagramma di flusso per l'analisi dei dati computazionali. Sono necessari tre file di dati, tra cui un file di sequenza di formato fasta, un file con motivi di sequenza di riferimento per demultiplexing e trimming e un file con informazioni sull'enzima di restrizione. I file di esempio, inclusi Test_DATA.fa (dati di sequenza), Demultiplexing_Trimming.tsv (motivi di sequenza di ricerca) e Enzyme.tsv (sequenza di riconoscimento degli enzimi di restrizione) vengono forniti come file di dati aggiuntivi. Le sequenze elaborate (sequenze host-genome) della Parte 1 saranno mappate contro il riferimento usando BLAT. Le posizioni all'estremità 5 della sequenza di queryNel genoma di riferimento sono considerati i siti di integrazione ( Tabella 2 ). I conteggi di sequenza per ogni IS sono determinati in tre fasi: (1) mappare le sequenze di IS sul genoma usando BLAT; (2) confrontando sequenze IS singole colonne (allineamento su un sito unico del genoma ospite) con altre sequenze che sono state mappate suboptimalmente sul genoma; E (3) identificare e correggere gli errori di sequenza. Ulteriori dettagli sulla mappatura e sulle sequenze di enumerazione delle sequenze possono essere trovati negli studi precedenti 2 , 15 . ( BC ) Sono state mostrate due sequenze di DNA a singolo filamento per le giunzioni a valle (B) e verso l'alto (C) vettori-host. I primer A e B (verde) vengono utilizzati per la PCR a goccia e per il sequenziamento. I codici di colore sono d'accordo con quelli della Figura 1 . La sequenza di giunzione a valle (B) comprende primer A (verde), MID (verde), fine U5 vettore (rosso), genoma ospite (blu), liNker (viola) e Primer B (verde). In un sequenziamento misto (a monte ea valle) del DNA, Primer A viene utilizzato per sequenziare le giunzioni a valle (B) e Primer B viene utilizzato per sequenziare le giunzioni a monte. La sequenza di giunzione a monte del campione (C) comprende Primer B, MID, Vettore U3, genoma dell'ospite, linker e Primer A. Fare clic qui per visualizzare una versione più grande di questa figura.

    Figura 4
    Figura 4: Esempio rappresentativo di analisi del sito di integrazione bidirezionale. ( A ) Percentuale di integrazione in geni (refseq), Alu e LINE 1 (L1) ripetizioni di vettori lentivirali in cellule umane di repopulazione del mouse (LV-huMice), in confronto con gli eventi di integrazione casuale in silico- generati. I siti di integrazione sono mappatiSul genoma umano (hg19). I siti di integrazione di LV-huMice sono significativamente superiori nei Geni ( p <0.0001, chi-square approximation) ( B ) In analisi silico di 10.000 eventi di integrazione casuale. Con un approccio unidirezionale, circa il 52% degli integri casuali ha generato ampliconi PCR <500 bp, mentre con un approccio bidirezionale, il 77% ha generato un amplicon PCR di <500 bp nelle giunzioni a sinistra oa destra. Gli ampliconi PCR di lunghezza superiore a 500 bp sono sequenziati inefficiente con il piastra di pirocessenza 2 , 15 e dovrebbero pertanto essere esclusi da analisi quantitativa dei dati. ( C ) Strategia di quantificazione clonale. Ogni clone individuale condivide lo stesso integritore vettoriale (o IS). Le frequenze relative delle giunzioni a sinistra (x) e destra (y) sono combinate per rappresentare le relative quantità delle popolazioni clonali (quantificabili vettori integrali o QVI). integ Siti che non dispongono di un motivo GTAC entro 450 bp sono squalificati (dQ) e rimossi dall'analisi di quantificazione. ( D ) Le frequenze relative (relative a tutte le sequenze QVI) di 44 cloni QVI in cellule repopulanti dei topi umani sono mostrati in uno schema di colori (dal bianco al rosso: da 0 a 0,16). ( E ) Sovra-stima prevista delle frequenze clonali con analisi bidirezionale. Basato su un'analisi di integrazione casuale di silico di 10.000, si prevede una sovra-stima di 1,25 volte quando si utilizzano enzimi motivi GTAC ( RsaI e CviQI ) a causa di circa il 20% di cloni di dQ. Una sovra-stima di 2,56x è prevista a causa di circa il 60% di cloni dQ quando si utilizza l'enzima a motivo TCGA ( TaqαI ). Clicca qui per visualizzare una versione più grande di questa figura.

    Oad / 55812 / 55812table1.jpg "/>
    Tabella 1: Oligonucleotidi per l'analisi del sito di integrazione vettoriale lentivirale e gamma-retrovirale. * 5BioTEG: Modifica della biotina alla fine del 5 '. Clicca qui per visualizzare una versione più grande di questa tabella.

    Tavolo 2
    Tabella 2: dati rappresentativi di conteggio sequenza del sito di inserimento. Clicca qui per visualizzare una versione più grande di questa tabella.
    1 Mappa: le sequenze del sito di integrazione possono essere mappate su una posizione univoca (singolo colpo) o più loci (multi-hit) del genoma di riferimento. NA (non disponibile): nessuna sequenza è stata rilevata.
    2 STRD: orientamento della sequenza di query nel genoma
    3 QLEN: la lunghezza della sequenza di query
    4 GLEN: la lunghezza prevista della sequenza del sito di integrazione, calcolata in base alla distanza dal più vicino motivo GTAC disponibile nel genoma al sito di inserimento. GLEN <450 bp sono accettati per analisi quantitativa.
    5 Total_Count: numero totale di sequenze
    6 I siti di integrazione sono indicati da un numero di cromosomi (CHR) e un numero di sito per la giunzione giusta (CHR_SITE1) e un numero per la giunzione sinistro (CHR_SITE2). CHR_SITE1 e CHR_SITE2 sono 5 bp distinti per vettori lentivirali e 4 bp separati per vettori MLV (pMX)
    7 Sequenza conta per la giunzione giusta (R_A) e la giunzione sinistra del campione A (L_A); Le sequenze contano per la giunzione giusta (R_B) e la giunzione sinistra del campione B (L_B)
    * Squalificato (dQ): GLEN ≥450 in silicio bp

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    Il saggio bidirezionale consente l'analisi simultanea sia delle sequenze di giunzione del DNA vettori-host a monte (a sinistra) che a valle (destra) ed è utile in una serie di terapie geniche, cellule staminali e applicazioni di ricerca del cancro. L'uso di enzimi GTAC-motif (RsaI e CviQI) e l'approccio PCR bidirezionale migliorano significativamente le possibilità di individuazione di un integro (o di una popolazione clonale) rispetto ai precedenti dosaggi 2,15 , basati su enzimi a motivo TCGA ( TaqαI ) Approcci LM-PCR unidirezionali 5 . Il dosaggio bidirezionale migliora l'analisi dell'IS, in particolare nei campioni di DNA limitati che si presentano spesso in studi clinici o di piccoli animali.

    I passaggi 1.1-1.7 sono passi cruciali e devono essere eseguiti senza ritardi inutili. Questi passaggi vengono normalmente eseguiti in un solo giorno. Gli enzimi di prova prima di questi passaggi sono fortemente raccomandati. PassoS 1.9 e 1.10 sono facoltativi. Questi passaggi ridurranno sequenze di DNA vettoriali interne che vengono amplificate contemporaneamente con sequenze IS. La tabella 1 fornisce set di primer adatti per analizzare l'IS di wildtype NL4.3 vettori HIV-1, NL4.3, compresi FG12 21 e vettori gammaretrovirali a base di pMX 22 . A seconda delle variazioni dei nucleotidi nelle sequenze di ripetizioni terminali lunghe (LTR), il progetto di primer e l'approccio sperimentale potrebbero essere necessari per una corretta modifica.

    Il software blat usato per la mappatura è compatibile solo con il formato fasta e non funziona con i file fastq. È possibile convertire i file fastq in fasta utilizzando vari strumenti software, come FASTX-Toolkit o BBTools. Un utente con conoscenze di base di Python può utilizzare Biopython per convertire i file fastq in fasta per mapparli con blat.

    Si prevede che una parte dell'IS non verrà rilevata con l'I bidirezionaleS e, anche se rilevato, non potranno beneficiare di quantificazione clonale a valle. Quando gli enzimi GTAC-motivi sono stati utilizzati, circa il 23% degli integri nei dati di sequenza generati dalla piattaforma di pirosequencing non ha superato i criteri di analisi per l'analisi quantitativa di sequenze IS ( Figura 4 ). Quando la copertura IS completa è critica, ad esempio nel monitoraggio della sicurezza delle cellule geneticamente modificate nelle impostazioni di terapia genica, è consigliabile scegliere un dosaggio con accesso genomico illimitato a IS 8 , 9 , 10 , 11 , 12 o per riesaminare Lo stesso campione con una diversa o ottimizzata combinazione di restrizioni 4 , 18 .

    IS con un accesso illimitato al genoma, come ad esempio LAM PCR non restrittivo e approssOaches 19 , 20 , detengono promesse particolari per un'analisi completa dell'IS. Questi approcci utilizzano tecnologie relativamente difficili da controllare, rendendo difficile prevedere l'esito della frammentazione genomica del DNA e dell'ampliamento IS. D'altra parte, i test di IS con enzimi di restrizione ben caratterizzati hanno due vantaggi principali: (1) è relativamente facile calibrare e ottimizzare i dosaggi, in quanto i risultati del dosaggio sono più prevedibili a causa della specificità della reazione enzimatica e della disponibilità di Sequenze genomiche di riferimento. (2) I dati di sequenza sono altamente riproducibili una volta ottimizzate le condizioni del test. Il PCR bidirezionale con condizioni ottimizzate si è dimostrato utile per quantificazione clonale su larga scala e accurata 2 , 15 . Sebbene solo una parte delle popolazioni clonali esistenti sia stata analizzata a causa della bias di restrizione enzimatica, i quantitativi di individui L cloni sono stati misurati con precisione, consentendo così l'accurata determinazione delle variazioni della dimensione del clone all'interno e tra i campioni. Un numero sufficiente di cloni è stato generato per determinare i modelli di comportamento delle cellule staminali e l'eterogeneità funzionale.

    Gli ampliconi PCR prodotti da questa procedura bidirezionale PCR sono adatti a qualsiasi piattaforma di sequenza a valle. A causa dell'alta sensibilità del dosaggio, occorre prestare la massima attenzione per evitare la contaminazione incrociata eseguendo esperimenti in una stanza priva di contaminazioni. L'inclusione di un esperimento di controllo negativo (senza modello) è consigliato per tutti i passaggi PCR. Anche con la pratica più attenta, la prevenzione della contaminazione incrociata da campione a campione è estremamente difficile. Così, quando si confrontano le popolazioni clonali da diversi campioni, è consigliabile impiegare un controllo di collisione che rimuove i dati contaminati potenziali 23 e un taglio per cloni a bassa frequenza e inaffidabili> 2 al fine di ridurre al minimo il rumore proveniente dal DNA contaminato da incroci. L'approccio bidirezionale genera dati IS per entrambe le estremità degli integri, fornendo così un'ulteriore opportunità per ridurre i possibili errori di rilevamento falsi positivi.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Gli autori non hanno niente da rivelare.

    Acknowledgments

    I finanziamenti sono stati forniti dai finanziamenti nazionali dell'Istituto di assistenza sanitaria R00-HL116234, U19 AI117941 e R56 HL126544; La National Science Foundation Grant DMS-1516675; La Fondazione Nazionale di Ricerca della Corea (NRF-2011-0030049, NRF-2014M3C9A3064552); E il programma di iniziativa KRIBB.

    Materials

    Name Company Catalog Number Comments
    Thermostable DNA polymerase Agilent 600424 PicoMaxx Polymerase
    Thermostable DNA polymerase buffer Agilent 600424 PicoMaxx Polymerase buffer
    Deoxynucleotide (dNTP) solution mix New England Biolabs N0447L dNTP solution mix (10 mM each)
    PCR tubes VWR International 53509-304 PCR Strip Tubes With Individual Attached Caps
    2 mL microcentrifuge tube Molecular Bioproducts 3453 microcentrifuge tubes
    PCR purification kit Qiagen 28106
    RsaI  New England Biolabs R0167L restriction enzyme
    CviQI New England Biolabs R0639L restriction enzyme
    Buffer A New England Biolabs B7204S NEB CutSmart buffer
    DNA Polymerase I large (klenow) fragment  New England Biolabs M0210L Blunting
    streptavidin beads solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Binding Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Washing Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    magnetic stand ThermoFisher 12321D DynaMag™-2 Magnet
    T4 DNA ligase New England Biolabs M0202L T4 DNA ligase
    10X T4 DNA ligase buffer New England Biolabs B0202S T4 DNA ligase reaction buffer
    5X T4 DNA ligase buffer Invitrogen  46300-018 T4 DNA ligase buffer with polyethylene glycol-8000
    UV-Vis spectrophotometer Fisher Scientific S06497 Nanodrop 2000
    pvuII new England Biolabs R0151L restriction enzyme
    sfoI new England Biolabs R0606L restriction enzyme
    Buffer B new England Biolabs B7203S NEB buffer 3.1
    Nuclease free water Integrated DNA Technologies 11-05-01-14
    Capillary electrophoresis Qiagen 9001941 QIAxcel capillary electrophoresis
    Veriti 96-well Fast Thermal Cycler Thermo Fisher Scientific 4375305 PCR Instrument
    Rotating wheel (or Roller) Eppendorf M10534004 Cell Culture Roller Drums
    DNA size marker Qiagen 929559 QX size marker (100 - 2,500 bp)
    DNA size marker Qiagen 929554 QX size marker (50 - 1,500 bp)
    DNA alignment markers Qiagen 929524 QX DNA Alignment Marker
    genomc DNA Not Available Not Available Sample genomc DNA from in vivo or in vitro experiments

    DOWNLOAD MATERIALS LIST

    References

    1. Serrao, E., Engelman, A. N. Sites of Retroviral DNA Integration: From Basic Research to Clinical Applications. Crit. Rev. Biochem. Mol. Bio. 51 (1), 26-42 (2016).
    2. Kim, S., et al. Dynamics of HSPC Repopulation in Nonhuman Primates Revealed by a Decade-Long Clonal-Tracking Study. Cell Stem Cell. 14 (4), 473-485 (2014).
    3. Bushman, F. Retroviral integration and human gene therapy. J. Clin. Invest. 117 (8), 2083-2086 (2007).
    4. Bystrykh, L. V., Verovskaya, E., Zwart, E., Broekhuis, M., de Haan, G. Counting stem cells: methodological constraints. Nat Meth. 9 (6), 567-574 (2012).
    5. Schröder, A., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110 (4), 521-529 (2002).
    6. Silver, J., Keerikatte, V. Novel use of polymerase chain reaction to amplify cellular DNA adjacent to an integrated provirus. J. Virol. 64, 3150 (1990).
    7. Schmidt, M., et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat. Meth. 4 (12), 1051-1057 (2007).
    8. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39 (11), e72 (2011).
    9. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    10. Kim, S., Kim, Y., Liang, T., Sinsheimer, J., Chow, S. A high-throughput method for cloning and sequencing human immunodeficiency virus type 1 integration sites. J. Virol. 80 (22), 11313-11321 (2006).
    11. Maldarelli, F., et al. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345 (6193), 179-183 (2014).
    12. Wu, C., et al. High Efficiency Restriction Enzyme-Free Linear Amplification-Mediated Polymerase Chain Reaction Approach for Tracking Lentiviral Integration Sites Does Not Abrogate Retrieval Bias. Hum. Gene. Ther. 24 (1), 38-47 (2013).
    13. Aker, M., Tubb, J., Miller, D. G., Stamatoyannopoulos, G., Emery, D. W. Integration Bias of Gammaretrovirus Vectors following Transduction and Growth of Primary Mouse Hematopoietic Progenitor Cells with and without Selection. Mol. Ther. 14 (2), 226-235 (2006).
    14. Gabriel, R., Kutschera, I., Bartholomae, C. C., von Kalle, C., Schmidt, M. Linear Amplification Mediated PCR; Localization of Genetic Elements and Characterization of Unknown Flanking DNA. J Vis Exp. (88), e51543 (2014).
    15. Kim, S., et al. High-throughput, sensitive quantification of repopulating hematopoietic stem cell clones. J. Virol. 84 (22), 11771-11780 (2010).
    16. Mitchell, R., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2 (8), e234 (2004).
    17. Melkus, M., et al. Humanized mice mount specific adaptive and innate immune responses to EBV and TSST-1. Nat. Med. 12 (11), 1316-1322 (2006).
    18. Bystrykh, L. V. A combinatorial approach to the restriction of a mouse genome. BMC Res Notes. 6, 284 (2013).
    19. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. -P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol Biol. , 321-344 (2014).
    20. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    21. Qin, X., An, D., Chen, I., Baltimore, D. Inhibiting HIV-1 infection in human T cells by lentiviral-mediated delivery of small interfering RNA against CCR5. Proc Natl Acad Sci U S A. 100 (1), 183-188 (2003).
    22. Kitamura, T., et al. Retrovirus-mediated gene transfer and expression cloning: powerful tools in functional genomics. Exp. Hematol. 31 (11), 1007-1014 (2003).
    23. Cartier, N., et al. Hematopoietic stem cell gene therapy with a lentiviral vector in X-linked adrenoleukodystrophy. Science. 326 (5954), 818-823 (2009).

    Tags

    Genetica Numero 124 Retrovirus siti di integrazione sequenziamento di nuova generazione terapia genetica retrovirale cellule staminali tumori codifica cellulare a barre bioinformatica
    Sistema di integrazione bidirezionale retrovirale Metodo PCR e flusso di lavoro analitico dei dati quantitativi
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Suryawanshi, G. W., Xu, S., Xie, Y., More

    Suryawanshi, G. W., Xu, S., Xie, Y., Chou, T., Kim, N., Chen, I. S. Y., Kim, S. Bidirectional Retroviral Integration Site PCR Methodology and Quantitative Data Analysis Workflow. J. Vis. Exp. (124), e55812, doi:10.3791/55812 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter