Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Amplificazione, sequenziamento di prossima generazione, e DNA genomico mappatura dei siti di integrazione retrovirali

Published: March 22, 2016 doi: 10.3791/53840

Abstract

preferenze di integrazione firma retrovirus presentano su entrambi i scala locale e globale. Qui, vi presentiamo un protocollo dettagliato per (1) generazione di diverse librerie di siti di integrazione retrovirali che utilizzano amplificazione PCR legatura-mediata (LM-PCR) e di sequenziamento di prossima generazione (NGS), (2) la mappatura della posizione genomica di ogni virus- ospitare giunzione con BEDTools, e (3) analizzare i dati per rilevanza statistica. Il DNA genomico estratto da cellule infette è frammentata mediante digestione con enzimi di restrizione o mediante ultrasuoni. Dopo adatto DNA finale di riparazione, linker a doppio filamento sono legatura sul conclude il DNA, e semi-nested PCR è condotta utilizzando primer complementari sia per il long terminal repeat (LTR) fine del virus e il DNA linker legatura. I primer PCR portano sequenze necessarie per il clustering DNA durante NGS, negando la necessità di legatura adattatore separato. Il controllo di qualità (QC) è condotto per valutare il DNA di distribuzione dimensione del frammento e adattarsier l'incorporazione del DNA prima di NGS. file di output di sequenza vengono filtrati per LTR contenenti legge, e le sequenze che definiscono il LTR e il linker sono tagliate via. sequenze di cellule ospitanti rasata vengono mappati a un genoma di riferimento utilizzando BLAT e sono filtrati per minimo 97% di identità di un unico punto di riferimento nel genoma. siti di integrazione unici sono esaminati per adiacenti nucleotidi (nt) sequenza e di distribuzione relativi a varie caratteristiche genomiche. Usando questo protocollo, le biblioteche sito di integrazione di elevata complessità possono essere costruiti da DNA genomico in tre giorni. L'intero protocollo che comprende infezione virale esogena di cellule di coltura tissutale suscettibili di analisi sito di integrazione può quindi essere condotta in circa una o due settimane. Recenti applicazioni di questa tecnologia riguardano analisi longitudinale dei siti di integrazione da pazienti affetti da HIV.

Introduction

L'integrazione del DNA virale (vDNA) nel genoma della cellula ospite è un passo essenziale nel ciclo di vita retrovirale. L'integrazione viene eseguita l'integrasi virale (IN), che svolge due processi catalitici distinti che portano alla creazione del provirus stabilmente inserita 1. IN subunità impegnare le estremità della vDNA lineare che viene generato attraverso trascrizione inversa, formando la intasome ordine superiore con vDNA estremità tenuto insieme da un multimero IN 2-4. IN unirà 'estremità del vDNA valle invarianti 5'-CA-3' del 3 sequenze in un processo noto come 3'-processing, lasciando incasso 3 'termina con gruppi ossidrile reattivi ad ogni vDNA capolinea 5-8. Il intasome viene successivamente importato nel nucleo come parte di una grande assemblea di host e proteine ​​virali conosciuti come il complesso preintegrazione (PIC) 9-11. Dopo aver incontrato bersaglio cellulare del DNA (tDNA), IN utilizza il vDNA 3'-idrossile group per fendere l'alto tDNA e fili di fondo in modo sfalsato e, contemporaneamente, si unisce la vDNA di tDNA 5 'gruppi fosfato attraverso il processo di trasferimento strand 12,13.

preferenze del sito di integrazione mostra retrovirus sulle scale locale e globale. Localmente, siti di integrazione consenso consistono debolmente conservati sequenze palindromi tDNA che si estendono da circa 9:55 bp a monte ed a valle dei siti di inserzione vDNA 14,15. A livello globale, i retrovirus bersaglio specifiche annotazioni della cromatina 16. Ci sono sette diversi generi retrovirale - alpha attraverso epsilon, lenti, e spuma. I lentivirus, che comprendono l'HIV-1, favoriscono l'integrazione in seno agli organi di geni attivamente trascritti 17, mentre i gammaretroviruses preferenzialmente si integrano all'interno di siti o di trascrizione di inizio (Tsss) e regioni enhancer attivi 18-20. In netto contrasto, spumavirus è fortemente sbilanciata verso heterochromregioni ATIC, come ad esempio i domini lamina associata gene-poveri 21. Preferenze di base tDNA locali sono in gran parte dettato da specifiche reti di contatti nucleoproteici tra IN e tDNA 13,22,23. Per i lentivirus e gammaretroviruses, l'integrazione relativa alle annotazioni genomiche è in gran parte governato da interazioni tra IN e fattori cellulari affini 24-27. Alterare le specifiche di interazione di rete IN-tDNA 13,22,23,28 e interrompere o re-engineering IN-host interazioni tra fattori 25-27,29-32 hanno dimostrato strategie per retarget l'integrazione a livello locale e globale, rispettivamente.

Il potere delle procedure di sequenziamento del DNA utilizzate per catalogare i siti di integrazione retrovirali è aumentata enormemente negli ultimi decenni. Siti di integrazione sono stati recuperati in un lavoro pionieristico con la purificazione laborioso e tecniche di clonazione manuali per produrre solo una manciata di siti unici al 33,34 studio.La combinazione di LM-PCR amplificazione del DNA giunzioni LTR-ospite con la possibilità di mappare singoli siti di integrazione a genomi progetti topo umani e trasformate campo, con il numero di siti recuperati da infezioni cellule di coltura tissutale esogeno aumentando a diverse centinaia di migliaia 17 , 18. La recente fusione di più di LM-PCR con metodologia NGS ha inviato profondità biblioteca alle stelle. In particolare, pyrosequencing ha dato l'ordine di decine di migliaia di siti di integrazione unici 30,35-38, mentre le librerie in sequenza attraverso l'uso di cluster DNA può produrre milioni di sequenze uniche 19-21,39. Qui si descrive un protocollo ottimizzato LM-PCR per amplificare e sequenziare siti di integrazione retrovirali che utilizzano NGS di clustering DNA. Il metodo incorpora richiesto sequenze di adattamento nei primer PCR e, quindi, direttamente nelle molecole di DNA amplificati, precludendo in tal modo la necessità di un passaggio adattatore legatura aggiuntivo prima Sequencing 40. L'analisi bioinformatica gasdotto, dalla analisi dei dati di sequenziamento prime per LTR-ospite DNA giunzioni alla mappatura dei siti di integrazione uniche osservazione a caratteristiche genomiche, è anche generalmente descritto. In conformità con la priorità stabilita da precedenti protocolli metodologici in questo campo 36,38,41-43, script personalizzati possono essere sviluppati che contribuisca alla realizzazione di interventi specifici in cantiere bioinformatica. L'utilità e la sensibilità del protocollo è illustrato con dati rappresentativi amplificando, sequenziamento, e mappatura HIV-1 siti di integrazione da colture cellulari infettate alla molteplicità approssimativa di infezione (MOI) di 1,0, nonché una serie di titolazione di questo DNA diluita attraverso DNA cellulare non infetta in 5 volte procedura a una diluizione di 1: 15,625 per dare il approssimativa equivalente MOI di 6,4 x 10 -5.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Generare le riserve di virus

Nota: Un diagramma di flusso dell'aspetto panchina bagnata di questo protocollo è illustrato nella Figura 1 I dati di archivio di produzione virale e successiva infezione di cellule di coltura tissutale generalmente applicabile a diverse tipologie di retrovirus.. Per alcuni esperimenti, la cellula bersaglio non può esprimere il recettore virale endogena (s), e in tali casi la costruzione di particelle retrovirali pseudotyped ospitano eterologa glicoproteina virale, ad esempio la glicoproteina G del virus della stomatite vescicolare (VSV-G), sarà necessaria per l'infezione 44,45.

Nota: Precauzione dovrebbe essere presa quando si lavora con HIV-1. Anche se le linee guida specifiche variano da istituto ad istituto, tutti i lavori di virus a base dovrebbe essere condotto in una cappa di sicurezza biologica dedicato dell'operatore limitato (di solito indicato come una cappa coltura tissutale). dispositivi di protezione individuale correttache comprende la faccia, copriscarpe, un doppio strato guanto, e un abito tuta tutto il corpo deve essere indossato in ogni momento. Tutti i rifiuti liquidi derivanti da esperimenti legati ai virus deve essere inattivato con candeggina (concentrazione finale 10%), e tutti i rifiuti solidi tra cui dovrebbe essere autoclavato prima dello smaltimento.

  1. Un giorno prima della trasfezione, piastra di 3,3 x 10 6 cellule HEK293T in 10 ml di Dulbecco Modified Eagle Medium (DMEM) supplementato con 10% (v / v) di siero fetale bovino e 1% (v / v) di penicillina / streptomicina (10.000 U / ml magazzino) in ciascuna delle cinque 100 piatti mm.
    Nota: Integrato-DMEM è indicato come DMEM-FPS da questo punto in poi.
  2. Nel giorno successivo, trasfezione le cellule con 10 microgrammi di plasmide portare full-length cloni molecolari retrovirali o 9 mg di vettori turno unico busta-cancellato con 1 mg di un'espressione costrutto VSV-G utilizzando reagenti di trasfezione disponibili in commercio o fosfato di calcio.
    1. Incubare la cells a 37 ° C in un incubatore umidificato coltura cellulare con 5% di CO 2 (questa condizione di seguito denominato "il tessuto cultura incubatore"). Dopo circa 48 ore, raccogliere il supporto delle cellule virus contenente con una pipetta volumetrica e farla passare attraverso un filtro da 0,45 micron dal flusso di gravità.
    2. Concentrare il virus ultracentrifugazione a 200.000 xg per 1 ora a 4 ° C. Risospendere il pellet virus in 500 microlitri DMEM-FPS contenente 20 U DNasi, e incubare per 1 ora a 37 ° C.
      Nota: Il passo DNasi aiuta a ridurre il recupero di sequenze plasmide indesiderate eliminando il peso di DNA plasmidico che persiste dalla procedura di trasfezione.
  3. Determinare la concentrazione p24 46 utilizzando un antigene p24 kit di cattura da HIV-1 come da istruzioni del produttore.
    Nota: la concentrazione di virus può essere determinato anche da attività di trascrittasi inversa test 47,48. In alternativa, il livello del virus funzionale puòessere determinata misurando MOI. Questo è più facilmente fatto usando cellule fluorescenza-attivato l'ordinamento con i virus che esprimono geni reporter fluorescenti come la proteina fluorescente verde. determinazione MOI può essere particolarmente utile quando si lavora con le cellule primarie che potrebbero non supportare lo stesso livello di infezione da linee cellulari ottimizzate.

2. Le cellule infettano con il virus

  1. Piastra 3.0 x 10 5 cellule HEK293T per pozzetto in una piastra da 6 pozzetti in 2,5 ml DMEM-FPS e incubare una notte in un incubatore di coltura tissutale.
    Nota: Il numero di siti di integrazione unici recuperati con questo protocollo è direttamente proporzionale al numero di cellule e la quantità di virus attivo utilizzati nella infezione.
  2. Infettare le cellule con una concentrazione finale p24 virale di 500 ng / ml in un volume finale di 500 microlitri fresca DMEM-FPS per 2 ore in un tessuto culturale incubatore, quindi aggiungere 2 ml di DMEM-FPS pre-riscaldato a 37 ° C al bene e continuare l'incubazione.
  3. A48 ore dopo l'infezione, rimuovere i media e lavare le cellule con 2 ml di soluzione salina tamponata con fosfato (PBS). Aggiungere 0,5 ml di tripsina-EDTA pre-riscaldato a 37 ° C, dopo un paio di secondi ispezionare visivamente i pozzetti per dislocazione delle cellule.
  4. Aggiungere 2 ml di pre-riscaldato DMEM-FPS e risospendere le cellule di dolce su / giù pipettaggio con una pipetta volumetrica ~ 10 volte. Trasferire la soluzione a 75 cm pallone di coltura tissutale 2 contenente 18 ml di pre-riscaldato DMEM-FPS, e incubare le cellule in un tessuto culturale incubatore.
  5. Dopo minimamente cinque giorni dall'inizio dell'infezione, raccogliere le cellule rimuovendo il materiale, lavare con 5 ml di PBS, aggiungere 2 ml di pre-riscaldato tripsina-EDTA, e risospendere con 5 ml di pre-riscaldato DMEM-FPS pipettando. Centrifugare la soluzione per 5 minuti a temperatura ambiente a 2.500 xg, e scartare il surnatante.
    Nota: Anche se l'integrazione in queste condizioni plateau a circa 48 ore dopo l'infezione 49,50, gli altri 3 giorni di coltura sono tenuti a sufficiently diluire la concentrazione di molecole di DNA non integrati che derivano dalla cella basata ricombinazione DNA o autointegration virale-mediata.
  6. Estrarre il DNA genomico dal pellet cellulare utilizzando un kit disponibile in commercio (ad esempio, vedere 51). Eluire il DNA dalla colonna a scambio ionico fornito con 200 ml di 10 mM Tris-HCl, pH 8,5.
    Nota: Una aliquota di cellule dovrebbe essere ripartita in 48 ore dopo l'infezione (passo 2,3) per una prova di infettività per garantire l'infezione da virus corretta prima di NGS.

3. Frammento DNA genomico mediante ultrasuoni o con enzima di restrizione Digest

Nota: frammenti sonicazione DNA genomico in modo sequenza-indipendente, praticamente ed è quindi preferibile la modalità di frammentazione quando i campioni sequenziamento con un basso tasso di recupero atteso (ad esempio, le cellule paziente infetto o infezioni avviate a relativamente basso MOI). Inoltre, sonicazione permette di distinguere duplicati PCR di partilare sequenza sito di integrazione da integrazioni unici nello stesso sito, che è fondamentale per distinguere l'espansione clonale delle cellule provirus contenenti in pazienti infetti (vedere il punto 11 di seguito) 39,52-54.
Nota: Il DNA deve essere aperto immediatamente a valle dal monte LTR diminuire amplificazione di sequenze virali interni durante LM-PCR. L'enzima di restrizione BglII che giace 43 bp a valle della sequenza U5 monte e che è compatibile per la successiva legatura con DNA MseI generata termina funziona bene con molti ceppi HIV-1 (Figura 1B). Durante la preparazione del DNA per sonicazione, l'enzima di restrizione interna-scissione dovrebbe essere applicata dopo linker legatura (vedere Figura 1C - E e Step 4.3).

  1. Per sonicazione, miscelare 10 mg di DNA genomico in acqua priva di nucleasi ad un volume finale di 120 microlitri. Sonicare utilizzando i parametri per una dimensione media rottura di 500 bp (due gare del seguente parametri: Ciclo di lavoro: 5%; intensità: 3; cicli al raffica: 200; Durata: 80 sec).
  2. Purificare DNA sonicato utilizzando un kit di purificazione PCR. Riparare il DNA si conclude con un DNA kit di fine-riparazione e purificare il DNA utilizzando un kit di purificazione PCR. A-coda il DNA utilizzando Klenow eso - enzima e purificare il DNA A-coda utilizzando un kit di purificazione PCR. Fare riferimento alle 51,52 per ulteriori dettagli di utilizzo del kit.
  3. Per endonucleasi di restrizione digestione, tagliare 10 mg di DNA genomico notte a 37 ° C in un volume di 100 pl con tampone fornite dal costruttore e un cocktail di enzimi (100 U ciascuno) che generano sovrasta 5'-TA, nonché un enzima incompatibili quali BglII che fende valle dal monte LTR virale. Purificare il DNA il giorno successivo utilizzando un kit di purificazione PCR.
    Nota: Nessuna delle enzimi di restrizione dovrebbe tagliare all'interno del terminal ~ 30 bp dell'estremità DNA virale che viene amplificato dal protocollo LM-PCR. Questo protocollo amplifica specificamente la U5fine di HIV-1 DNA.

4. ricottura Linker Oligonucleotidi e legare a Frammentato DNA genomico

Nota: Preparare un linker asimmetrica contenente una sporgenza che è compatibile con i frammenti di DNA di cui sopra (vedi Tabella 1 per le sequenze di oligonucleotidi utilizzati in questo protocollo). Il linker da utilizzare con DNA sonicato deve contenere un 'sbalzo T-3 compatibile, mentre il linker per DNA MseI digerito deve contenere una compatibili sbalzo 5'-TA (Figura 1). La breve strand linker deve inoltre contenere una modificazione chimica non estensibile, come 3'-ammina, per vincolare le successive reazioni di amplificazione verso il DNA di interesse.
Nota: Quando si prepara più librerie sito di integrazione diverse in parallelo e / o quando i campioni unici di multiplexing sulla stessa corsa di sequenziamento, si raccomanda di usare linkers unici per ogni campione di limitare il potenziale per il campione di cross-Contaminzione durante la PCR. Ciò comporta inoltre l'uso di primer linker unici per ciascun campione durante semi-nested PCR (descritto di seguito). Filoni linker unici e primer linker possono essere progettati da rimescolando le sequenze oligonucleotidiche del linker elencati nella tabella 1, pur mantenendo simile contenuto% GC generale e posizioni sbalzo applicabili.

  1. Ricuocere i fili linker corte e lunghe in 35 ml di 10 mM Tris-HCl, pH 8,0-0,1 mM EDTA (concentrazione finale di 10 pM di ogni oligonucleotide) mediante riscaldamento a 90 ° C e raffreddando lentamente a temperatura ambiente a passi di 1 ° C per min.
  2. Preparare almeno quattro reazioni legatura parallele per campione di DNA genomico, che contengono 1,5 micron linker legatura, 1 mg DNA frammentato, e 800 U T4 DNA ligasi a 50 ml. Legare durante la notte a 12 ° C. Purificare il giorno dopo con un kit di purificazione PCR.
  3. Per i campioni preparati da sonicazione, digerire la reazione legatura purificata con 100 U di una restrizioneenzima zione che fende a valle dal monte LTR (ad esempio, BglII per l'HIV-1) sotto il produttore di condizioni raccomandate durante la notte. Purificare il DNA utilizzando un kit di purificazione PCR.

5. Amplify virali LTR-host DNA genomico degli incroci PCR semi-nested

Nota: Per garantire la diversità libreria ottimale, almeno 4-8 PCR parallele, a seconda della concentrazione di DNA della reazione legatura recuperato, deve essere preparato per ciascun campione per entrambi i turni PCR. concentrazione modello del DNA dovrebbe essere quantificata mediante spettrofotometria. In questo protocollo, primo e secondo cicli di PCR impiegano primer LTR-specifici nidificati, ma lo stesso primer specifico-linker viene utilizzato per entrambi i turni (Tabella 1). Il secondo fondo LTR-specifica rotonda e le sequenze di primer adattatore codificare specifiche linker per il clustering del DNA così come i siti di primer legame di sequenziamento. Il primer LTR-specifica nidificato codifica anche una sequenza di indice 6 nt, which può essere variato tra i diversi inneschi per le biblioteche di multiplexing all'interno dello stesso ciclo di sequenziamento.

  1. Preparare primi PCR rotonde che contengono gli ingredienti per tubo come elencato nella tabella 2.
    Nota: Il primer specifico linker ospita 22 nt di complementarità al linker, una temperatura di fusione di 53 ° C, un Contenuto GC del 45%, e la sua estremità 3 'in cui si trova 15-16 bp a monte del 3' capolinea i lunghi filamenti differenti linker (Tabella 1). Il primo turno 27 nt LTR iniettore ha una temperatura di fusione di 59 ° C, un Contenuto GC del 48%, e il suo 'estremità 3 si trova 34 bp a monte della HIV-1 U5 terminus. La regione del secondo turno iniettore 26 nt LTR che è complementare alla HIV-1 LTR ha una temperatura di fusione di 60 ° C, un Contenuto GC del 50%, e il suo 'estremità 3 si trova 18 bp a monte del U5 virale capolinea. Si raccomanda che la temperatura di fusione e oligonucleotide Contenuto GC dovrebbero imitare questi parametri se gli utentiprimer disegno di PCR con sequenze alterate (anche per l'uso con altri retrovirus) 21.
  2. Eseguire primo turno di PCR in presenza delle seguenti parametri Thermocycler: Un ciclo: 94 ° C per 2 min; 30 cicli: 94 ° C per 15 sec, 55 ° C per 30 sec, 68 ° C per 45 sec; un ciclo: 68 ° C per 10 min.
  3. Pool reazioni e purificare utilizzando un kit di purificazione PCR. Preparare la seconda PCR rotonde che contengono gli ingredienti per tubo come da tabella 3. Eseguire il secondo round di PCR utilizzando i parametri Thermocycler descritti al punto 5.2. In comune le reazioni e purificare il DNA utilizzando un kit di purificazione PCR commerciale seguendo le istruzioni del produttore.
    Nota: Una varietà di sequenze indice raccomandati compatibili con NGS di clustering DNA sono disponibili 71.

6. Eseguire QC e NGS (tipicamente completato da un sequenziamento strumento)

  1. (QC test # 1) Conferma Passo 5.3 concentrazione di DNA biblioteca utilizzando un fluorometro 55. Brevemente, preparare standard e campioni sperimentali in un volume finale di 200 acqua priva di nucleasi microlitri. Tubi vortex per 2-3 secondi, incubare a temperatura ambiente per 2 minuti, e poi leggere i campioni nel fluorimetro.
    Nota: I campioni devono contenere una concentrazione minima di 2 nM DNA libreria in un volume minimo di 15 microlitri.
  2. (QC test # 2) Verificare distribuzione delle dimensioni frammento di DNA usando un test basato su nastro 56.
    Nota: una distribuzione ideale è un relativamente ampio picco di DNA centratura circa 500 bp di lunghezza. Se una notevole quantità di materiale è maggiore di 1 kb, allora è consigliabile incorporare una procedura di selezione per taglia per eliminare le specie di DNA più lunghi, che impediranno amplificazione ponte durante clustering. Al contrario, se un picco significativo risulta circa 100 a 200 bp, un dimero di primer può essere formato durante la PCR. In questo caso la procedura deve essere ottimizzata per minimizzare la formazione di dimeri di primer.
  3. (QC test # 3) Confirm corretta incorporazione di adattatori nella libreria di DNA mediante PCR quantitativa 57.
  4. Eseguire NGS seguente letteratura applicazione del produttore. Utilizzare un picco-in del 10% (w / w) ΦX174 DNA, che ottimizzerà metriche di qualità in tempo reale fornendo composizione di base equilibrata per la corsa di sequenziamento.
    Nota: esperimenti sito di integrazione di sequenziamento sono in genere sottoposti a sola fine 150 bp (SE150) o abbinato-end 150 bp sequenziamento (PE150). PE150 è particolarmente utile per catturare il punto di attacco linker su ogni molecola di DNA (ad esempio, in sede di esame siti di integrazione per la prova di cellula ospite espansione clonale).

7. Utilizzare una Python o Perl script su misura per analizzare Sequencing dati per LTR contenenti sequenze, Crop via LTR e il linker sequenze, e mappa di riferimento Genome con BLAT

  1. file FASTA scansione per LTR contenenti sequenza di legge, delle colture LTR e le sequenze del linker via da host genomic sequenza di DNA, eesportare queste sequenze in un nuovo file FASTA. Mappa ritagliata legge sia un genoma di riferimento (ad esempio, le versioni del genoma umano hg19 o GRCh38) e il genoma virale utilizzando BLAT 58, con il sito di integrazione uscita coordinate esportata in un file .txt separato, utilizzando le seguenti impostazioni:
    stepSize = 6, minIdentity = 97, e maxIntron = 0
  2. Analizzare l'output BLAT txt, rimuovere autointegrations (cioè la prova che la fine LTR è integrato in una regione interna del genoma DNA virale) e altre sequenze mappatura per la HIV-1 genoma, e creare un'uscita separata txt file in cui tutti i siti di integrazione duplicati sono stati condensati in singoli, successi coordinate uniche.

8. Creare file .bed contenenti intervalli di 15 Nt circostanti integrazioni, convertire questi per FASTA file, e costruire Sequenza Logos per la visualizzazione delle preferenze Base circostante siti di integrazione

  1. Creare file .bed che elencano un intervallo di basi perogni sito di integrazione. Almeno 15 basi (5 a monte ea valle) 10 sono suggeriti per la generazione di sequenze logo. Generare un file FASTA da questi file .bed utilizzando la funzione fastaFromBed da BEDTools 59 e questo comando:
    -fi / directory fastaFromBed / a / riferimento / genoma / -name -s -bed 15_base_pair_file.bed -fo output_file.fasta
    Nota: Il virale 5'-CA-3 'dinucleotide invariante è unita ad ospitare DNA durante l'integrazione e la verifica dello svincolo della capolinea LTR al DNA cellulare è un importante filtro iniziale per identificare in buona fede siti di integrazione. Abbiamo inoltre compiliamo loghi sequenza da questo host sequenza di DNA della popolazione per verificare i risultati sperimentali. Come retrovirus visualizzare le preferenze di base firma che circondano i loro siti di integrazione 14,15, i loghi sequenza servono a verificare che i siti genomici mappati sono sorti attraverso l'integrazione IN-mediata rispetto ad altri meccanismi di ricombinazione come il DNA non omologaterminare unendo 60,61.
  2. Utilizzare WebLogo 3 (http://weblogo.threeplusone.com/create.cgi) per creare loghi sequenza dal file FASTA. Fare clic su 'Scegli file' caricare il file FASTA, e utilizzare le seguenti impostazioni: Formato di visualizzazione, PDF (vettoriale); dimensione logo, di grandi dimensioni; In primo numero di posizione, -5; Logo gamma, -5 a 5; scala dell'asse Y, 0.1, asse Y spaziatura tic, 0.5, combinazione di colori classica (NA).

9. Creare centrale paia di basi .bed file, Controllare per il campione cross-contaminazione, e mappare la distribuzione di unici siti di integrazione relativa ai tratti pertinenti genomiche

  1. Dal momento che l'integrazione retrovirale si verifica in modo sfalsato tra i fili tDNA, regolare le coordinate precise dei siti di integrazione in modo da riflettere la bp centrale del sito di destinazione di duplicazione per una corretta mappatura della distribuzione genomica relativa alle caratteristiche genomiche.
    1. Pertanto, per 5 bp duplicazione di virus come l'HIV-1, creare un file .bed con il bp centrale offset dal Isito ntegrazione da due basi a valle per le integrazioni mappatura al più filo, e due basi a monte per le integrazioni mappatura al filamento meno.
  2. Per verificare la presenza di campioni la contaminazione incrociata, calcolare il numero di siti di integrazione comuni tra le diverse librerie utilizzando le BEDTools funzione si intersecano ad intersecare bp centrale .bed file per due campioni diversi e seguendo il seguente comando:
    bedtools intersecano -a -b central_basepair_1.bed central_basepair_2.bed -f 1,00 -r -s> overlap1v2.txt
  3. Contare il numero di righe all'interno del file di output overlap1v2.txt al fine di quantificare il numero esatto dei siti comuni tra le due librerie utilizzando il seguente comando:
    wc -l overlap1v2.txt
  4. Scaricare il file .bed RefSeq annotazione per la versione di genoma di riferimento che è stato utilizzato per la mappatura del sito di integrazione dal database UCSC Genome Annotazione (ad es http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database) 62.
    1. Calcolare il numero di siti di integrazione che rientrano geni RefSeq utilizzando le BEDTools funzione si intersecano ad intersecare il file .bed coppia di base centrale che è stato generato per il campione con il RefSeq .bed di file seguendo questo comando:
      bedtools intersecano -a -b central_basepair_1.bed RefSeq_hg38.bed -u> RefSeq_sample1.bed
  5. Contare il numero di righe all'interno del file di output RefSeq_sample1.bed al fine di quantificare il numero esatto dei siti rientranti nei geni RefSeq utilizzando il seguente comando:
    wc -l RefSeq_sample1.bed
  6. Ripetere i punti 9.3 e 9.4 per i siti di integrazione mappatura a qualsiasi altra annotazione di interesse per i quali un intervallo .bed file è disponibile. Scaricare il file .bed più recente CpG isola annotazione per il genoma di interesse di riferimento dal database UCSC Genome annotazione come indicato al punto 9.4.
    1. Calcolare il numero di siti di integrazione rientrano entro un certo diposizione (illustrata in questo esempio è una finestra 5 kb) delle isole CpG utilizzando la funzione finestra BEDTools e seguendo questo comando:
      finestra bedtools -w 2500 central_basepair_1.bed -b CpG_hg38.bed -u> CpG_sample1.bed
  7. Contare il numero di righe all'interno del file di output CpG_sample1.bed al fine di quantificare il numero esatto dei siti che rientrano nel 2,5 kb a monte oa valle di isole CpG utilizzando il seguente comando:
    wc -l CpG_sample1.bed
  8. Ripetere i punti 9.6 e 9.7 per i siti di integrazione mappatura vicina TSSS. Generare una versione alternativa del file RefSeq.bed, dove coordina genomica mappatura per più di un gene sono state aggiustate per riflettere solo un singolo gene presente in quella posizione. Questo impedisce sovrastima della densità genica circostante siti di integrazione. Calcolare la densità gene nella regione 1 Mb circonda ciascun sito di integrazione utilizzando la funzione finestra BEDTools e seguendo questo comando:
  9. Calcolare la densità media gene per tutte le integrazioni nel set di dati seguendo questo comando:
    awk '(somma + = $ 7) END (stampa "= Average", somma / NR)' GeneDensity_sample1.bed

10. Statisticamente Confronto integrazione del sito distribuzioni tra i campioni utilizzando due code test esatto di Fisher e due code Wilcoxon della somma dei ranghi di prova in R

Nota: test esatto di Fisher Usa per confrontare la percentuale di siti di integrazione all'interno dei geni RefSeq o all'interno di una finestra di isole CpG o Tsss, ma utilizzare il test somma dei ranghi di Wilcoxon per comparare la distribuzione di densità genica che circonda i siti di integrazione. Il programma di ricerca è disponibile presso http://www.r-project.org/.
Due code test esatto di Fisher:

  1. Utilizzando i numeri calcolati come indicato ai punti 9.4 e 9.7, crEATE matrici per ogni confronto in R di eventi osservati (integrazioni all'interno di un'annotazione o all'interno di una finestra circostante un'annotazione) contro siti rimanenti seguendo questo comando:
    (Annotation_of_interest <- matrice (c (SampleA # a, SampleA # rimanente, SampleB # a, SampleB # rimanente), nrow = 2, dimnames = lista (c ( 'Centro', 'Resto'), c ( 'SampleA', 'SampleB'))))
  2. Calcolare il valore P per il confronto con due code test esatto di Fisher con il seguente comando:
    fisher.test (annotation_of_interest, alternativa = 'two.sided') $ p.value
    Due code Wilcoxon rank test sum:
  3. Creare un file txt delimitato da tabulazioni in cui ogni colonna contiene il nome del campione nella cella in alto, seguita al di sotto dei valori di densità genica per tutti i siti di integrazione in quella libreria (ottenuto dal file .bed generato al punto 9.9). Importare questo file txt delimitato da tabulazioni in R utilizzando il seguente comando e navigating alla directory file corretto:
    FILENAME <- as.data.frame (read.delim (file.choose (), intestazione = T, check.names = FALSE, riempire = TRUE, Settembre = ' t'))
  4. Calcolare il valore P per il confronto con due code Wilcoxon rank test somma con il seguente comando:
    wilcox.test (FILENAME $ SampleA, FILENAME $ SampleB, = alternative 'two.sided', in coppia = F, esatto = T) $ p.value
    Nota: i valori P possono essere calcolati solo fino a un certo limite (estremamente bassa) in R, dopo di che azzerare saranno restituiti dal programma. Per i campioni in maniera massiccia diverse che producono un P = 0 in R, stimare il valore di P come <2,2 x 10 -308.

11. Esaminate Raw sequenziamento dei dati per la prova di espansione clonale di cellule contenenti integrato Viral DNA

Nota: esiste un potenziale piccolo per più di una integrazione nello stesso preciso nt nel genoma di riferimento. In alternativa, un singolo inevento tegrazione può diventare ridondante presente nei dati di sequenziamento a causa dell'uso di PCR durante la preparazione biblioteca e / o duplicazione cellulare prima della preparazione del DNA. Recenti analisi di DNA genomico da pazienti con infezione da HIV hanno contraddistinto queste possibilità, individuando punti punti ultrasuoni taglio / attacco linker unici (che può derivare solo prima PCR) all'interno di sequenze di DNA che contengono siti di integrazione identici 52-54. Attualmente vi è un dibattito sul fatto provirus albergano all'interno delle cellule espanse clonale contribuiscono al serbatoio virale latente, e quindi è di particolare interesse per caratterizzare il loro livello di espansione quando si studia siti di integrazione nei pazienti umani.

  1. Simile alla procedura di cui al punto 8.1, generare file .bed sfogliare un intervallo di basi che si estendono, in questo caso, 25 nt a valle di ogni sito di integrazione unico (basi a monte non sono necessari qui). Generare un file FASTA da questi file .bed (come indicato nellaPasso 8.1) utilizzando la funzione fastaFromBed da BEDTools e seguendo questo comando:
    -fi / directory fastaFromBed / a / riferimento / genoma / -name -s -bed 25_base_pair_file.bed -fo output_file.fasta
    Nota: Per migliorare la specificità di ogni ricerca si raccomanda di estrarre almeno 25 nt a valle di ciascun sito di integrazione per le analisi espansione clonale.
  2. Preferibilmente utilizzando uno script personalizzato, cercare il file di dati di sequenza FASTA prima per tutte le stringhe che contengono una corrispondenza esatta al 25 nt a valle di ogni sito di integrazione unico e depositare queste sequenze in un nuovo file. Trim LTR e le sequenze del linker dalle corde prime. Unire sequenza PE legge convertendo legge per il complemento inverso, rifilatura LTR e linker sequenze, e quindi l'assegnazione di stringhe READ2 alla loro coppia READ1 se le stringhe condividono almeno 20 sovrapposizione nt.
  3. Scansione i punti di fissaggio linker di ogni blocco sito di integrazione. Classificare ogni integrazione come "clonale ampliato &# 34; se punti di attacco linker sono ≥3 bp a parte.
    Nota: Un protocollo per l'analisi espansione clonale senza fusione sequenza si legge è stata descritta 52.
    Nota: La frammentazione del genoma presso la stessa identica posizione mediante ultrasuoni porta ad una sottostima della misura di espansione clonale, e metodi per correggere la distorsione sperimentale risultante sono state descritte 63,64.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Tabella 4 elenca i risultati di un esperimento rappresentativo per illustrare la sensibilità di NGS per il recupero di siti di integrazione da una coltura di cellule infette. DNA cellulare non infetti è stata utilizzata per diluire serialmente DNA genomico da una infezione, in cui ogni cellula in media conteneva un integrazione 40. Le diluizioni sono stati preparati a passi di cinque a una diluizione massima di 1: 15.625. DNA genomico della serie titolazione è stata poi frammentata tramite sonicazione o mediante digestione con endonucleasi di restrizione MseI e BglII, seguita da LM-PCR. Il numero di siti di integrazione uniche, così come il numero di siti mappatura prossimale per annotazioni genomici selezionati, sono stati calcolati secondo il protocollo sopra. L'analisi dei dati ha rivelato decine di siti di integrazione unici (1-2% dell'importo recuperato dal DNA genomico puro) recuperati dalle biblioteche preparati da cellule in cui, in teoria, solo uno su 15.625 è stato infettato. Quando si analizzano set di dati del sito di integrazione, è fondamentale per confrontare i dati in un unico set di siti genomici casuali, che si chiama un controllo casuale abbinato o MRC. Poiché i risultati rappresentativi tosati DNA genomico da enzima di restrizione digestione o per sonicazione, sono state costruite due diverse serie di dati MRC. MRC enz conteneva 50.000 siti genomici univoco generato in modo casuale selezionando i siti da hg19 in prossimità di siti di MseI e BglII enzimi di restrizione, mentre MRC casuali nutriti 10.000 siti generati senza normalizzazione per la distanza da impostare i marcatori genomici. Solo i siti che possono essere mappati di nuovo in una posizione genomica unica dovrebbero essere usati in set di dati MRC. Come cesoie sonicazione DNA genomico essenzialmente libera da pregiudizi sequenza, MRC casuale può essere visto come più applicabile ai set di dati prodotti dalla frammentazione del DNA mediante ultrasuoni. Uno stile alternativo di integrazione di controllosito set di dati può essere generato in vitro reagendo ricombinante di proteine, intasome nucleoprotein complesso 21, o PIC estratte da cellule con infezione acuta 17 con il DNA genomico deproteinizzato, e poi seguendo la LM-PCR e NGS protocolli 21.

Valori di P per il confronto della distribuzione dei siti di integrazione recuperato mediante sonicazione rispetto restrizione digest (confronto tra i campioni ordinate), nonché per confronto con il MRC enz e MRC casuale, vengono visualizzati in figura 2. La distribuzione dei siti di integrazione recuperato dopo sonicazione era simile a quelli recuperati da enzima di restrizione digerire per tutte le annotazioni in esame, con la più grande varianza evidente in termini di vicinanza alle isole CpG. Come previsto 18,65 entrambi i set di dati differivano significativamente dalle CMR in termini di integrazioni all'interno dei geni RefSeq e gene densità che circonda il sito di integrazione media, mentre entrambi i set di dati erano simili alle CMR in termini di distribuzione relativi a isole CpG e TSSS. Poiché relativamente pochi HIV-1 siti di integrazione mappa entro 2,5 kb di un'isola CpG o TSS, aumentando il numero totale di siti recuperato grado di ridurre la variabilità che può crearsi tra insiemi di dati (Tabella 4 e Figura 2). Loghi sequenza per confermare l'autenticità dei dati del sito di integrazione sono mostrati in figura 3. Il consenso di HIV-1 sito di integrazione 14,22 (-3) TDG (G / V) TWA (C / B) CHA (+7) ( scritto usando Unione Internazionale delle codici base Biochimica, la barra rovesciata indica la posizione del vDNA plus-strand giunzione, e la sottolineatura indica la sequenza 5-bp duplicato seguente HIV-1 integrazione e riparazione del DNA) è apparente per librerie preparati da entrambe le tecniche di frammentazione, anche se il grado di certezza diminuisce all'aumentare della diluizione della cellula infettataDNA. I siti casuali allineati dal set di dati MRC al contrario non è riuscito a generare livelli apprezzabili di preferenze di base.

Figura 1
Figura 1:. Diagramma di flusso Illustrazione di preparativi Integrazione Biblioteca del sito (A) Genera le riserve di virus per trasfezione le cellule HEK293T, la raccolta e il filtraggio surnatante 48 ore più tardi, concentrandosi da ultracentrifugazione, e infettare le cellule bersaglio con un'adeguata concentrazione di virus. Almeno cinque giorni dopo l'infezione, estrarre il DNA genomico. Fare riferimento alle sezioni 1 e 2 del testo principale per i dettagli sperimentali aggiuntivi. (B e C) Frammento purificato DNA genomico mediante digestione con enzimi di restrizione o mediante sonicazione. Il cocktail enzima di restrizione dovrebbe includere un enzima (ad es BglII), che si unirà a valle dal monte LTR virale per contro-selezione per LM-PCR amplificazione di sequenze vDNA interne. Asterisco verde e freccia ramificata in (C) indicano che BglII dovrebbe essere applicata dopo linker legatura. riflessi rossi sequenza virale, mentre riflessi neri ospitano sequenza cellulare. punti implicita rottura del DNA (non in scala) sono contrassegnati da "X" HIV-1 contiene numerosi siti MseI e BglII; solo sono mostrati quelli rilevanti per il protocollo. Le parentesi sopra le mappe indicano le regioni di DNA U5-cellulare preferenzialmente amplificati da LM-PCR. (D) Purificare DNA frammentato (poi fine-riparazione e A-coda in caso di ultrasuoni) e legare alle molecole linker asimmetriche (E) compatibili (di colore blu). Cerchi in Magenta (D) indicano il sito di integrazione che verrà amplificato. Gli asterischi alle estremità 3 'del linker corti filamenti denotano aminoacidi blocco modifiche. (F) Comportamento primo turno di semi-nested PCR con primer prima rotonda LTR (rosso) e linker Primer (blu). in til suo giro di PCR, il primer linker codifica per il clustering DNA e NGS Primer sequenze (raggruppati come un'appendice verde al linker fondo blu) vincolante, mentre il primer LTR manca tali sequenze. (G) Purificare primo prodotto turno PCR e condurre secondo turno di semi-nested PCR. In questo giro di PCR, utilizzare lo stesso fondo linker, come nel primo turno (blu + appendice verde), insieme con il secondo fondo rotondo LTR (rosso) che porta il clustering DNA e NGS di primer sequenze di legame così come un codice a barre per il multiplexing ( raggruppati come un'appendice verde al rosso LTR primer). (H) Purificare secondo prodotto turno PCR come la biblioteca sito di integrazione finale (in scatola in magenta, con il sito di integrazione segnata dal cerchio magenta). Invia aliquota da impianto di sequenziamento per controllo di qualità e NGS. Cliccate qui per vedere una versione più grande di questa figura.

"Figura Figura 2:. I valori P per il confronto dei siti di integrazione Amplified seguito frammentazione del DNA mediante ultrasuoni o con enzimi di restrizione contro CMR rispettivo numero di siti di integrazione all'interno di geni RefSeq e vicine isole CpG e Tsss, così come i profili di densità genica regionali, sono elencati in valori di P Tabella 4 ≥0.05 sono evidenziate in grassetto e corsivo a valori di p calcolati esatti valori di p di Fisher prova B calcolati dal Wilcoxon rank test somma c MRC Enz:.... abbinato controllo casuale; un insieme di 50.000 siti di integrazione unici è stato prodotto selezionando casualmente posizioni in prossimità di siti di restrizione MseI / BglII in hg accumulo 19. d MRC casuale: abbinato controllo casuale contenente 10.000 siti di integrazione unici prodotti da casualmente Selectiposizioni ng in hg19 senza normalizzazione di sito di restrizione di prossimità. Cliccate qui per vedere una versione più grande di questa figura.

Figura 3
Figura 3: Sequenza Logos Raffigurante HIV-1 Preferenze base delle biblioteche esperimento rappresentativo siti di integrazione da librerie preparati da (A) digestione con enzimi di restrizione o (B) sonicazione sono state allineate con il software WebLogo.. Ogni diluizione in serie di titolazione è raffigurato, dal DNA ordinata nella parte superiore della figura alla diluizione di 1: 15.625 in basso. Logo (C) Sequenza per la MRC di 50.000 siti genomici unici. Le barre di errore rappresentano essenzialmente la deviazione standard di incorporazione di base in qualsiasi posizione particolare. Più specificamente, il taltezza otale di ogni barra di errore è equivalente a due volte la piccola correzione campione di 66, che controlla per sottostima di entropia presente in relativamente piccoli insiemi di dati. L'asse x rappresenta genomiche posizioni nt DNA della cellula ospite relativi al sito di integrazione a zero. Si prega di cliccare qui per vedere una versione più grande di questa figura.

Tabella 1
. Tabella 1: rotonde primer LTR oligonucleotidi sequenze per Linker Edilizia e PCR amplificazione Linker-specifici e secondo codificano sequenze di DNA adattatore di clustering, che sono color-coded come segue: nero, basi complementari al linker o per l'HIV-1 LTR; rosso, indice univoco o codice a barre; verde, sequenziamento Primer siti di legame; blu, sequenze di adattamento per il clustering del DNA. Single-end (SE) rea sequenziamentoZIONI utilizzeranno il primer di sequenziamento che annealing al secondo turno LTR fondo READ1 (verde) di sequenza, mentre abbinato-end (PE) reazioni useranno entrambi (READ1 e READ2) primer di sequenziamento. un linker corti filamenti contengono 3 'amino blocco modifica. clicca qui per vedere una versione più grande di questa tabella.

Reagente Per aggiungere per reazione
Prima fondo tondo LTR (15 micron): 2,5 ml
-specific Linker fondo (15 micron): 0,5 ml
10x PCR buffer: 2,5 ml
dNTP (2,5 mm ciascuno) 0,5 ml
DNA polimerasi mix: 0,5 ml
reazione legatura: 100 ng
priva di nucleasi acqua: fino a 25 ml

Tabella 2:. Ricetta per primo turno PCR L'ammontare di ogni reagente specifico da aggiungere è indicato ogni singolo tubo di PCR.

Reagente Per aggiungere per reazione
Secondo fondo tondo LTR (15 micron): 2,5 ml
-specific Linker fondo (15 micron): 0,5 ml
10x PCR buffer: 2,5 ml
dNTP (2,5 mm ciascuno) 0,5 ml
DNA polimerasi mix: 0,5 ml
Primo turno di PCR: 100 ng
priva di nucleasi acqua: fino a 25 ml

Tabella 3:. Secondo turno di PCR Ricetta La quantità di ciascun reagente da aggiungere ad ogni provetta PCR è indicato.

<td> Digest, 1: 125
Biblioteca Siti #Unique % RefSeq un % CpG +/- 2,5 kb b % TSS +/- 2,5 kb c AVG. Gene densità +/- 500 kb d
Sonicazione, pulito 3.169 71.2 5.1 3.7 15.8
Sonicazione, 1: 5 366 75,1 2.7 3 16.3
254 74 7.1 5.1 16,7
Sonicazione, 1: 125 430 69.8 6.9 6 14.6
Sonicazione, 1: 625 314 65,6 5.6 6.7 13.5
Sonicazione, 1: 3.125 116 73,6 3.5 2.5 13.1
Sonicazione, 1: 15.625 72 62.5 0 1.4 14,7
Digest, pulito 7.428 69.8 3.6 2.9 15.2
Digest, 1: 5 1.460 71,4 4.4 3.4 14.9
Digest, 01:25 394 68.8 4.3 3.3 15.8
172 71 0 3 14
Digest, 1: 625 134 73.9 3.7 3.7 14.1
Digest, 1: 3.125 100 83.1 6.4 5.2 19.1
Digest, 1: 15.625 73 74 4.1 1.4 9.7
MRC enz e 50.000 44.7 4.2 4 8.7
MRC f casuale 10.000 41.3 5.3 4.2 8.6

Tabella 4: Distribuzione genomica di siti di integrazione dal rappresentante Titolazione serie La percentuale dei siti di integrazione totale esimo.alla caduta nel giro di geni RefSeq, b entro 2,5 kb di isole CpG, ec entro 2,5 kb di Tsss d la densità genica all'interno di 1 Mb che circondano il sito di integrazione e media MRC Enz:.. abbinati controllo casuale; un insieme di 50.000 siti di integrazione unici è stato prodotto selezionando casualmente posizioni in prossimità di siti di restrizione MseI / BglII in hg19 f MRC casuale:. controllo casuale abbinato contenente 10.000 siti di integrazione uniche prodotte selezionando casualmente posizioni in hg19 senza normalizzazione a posizioni fisse.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Un protocollo per l'analisi dei siti di integrazione retrovirali, dalla fase virus iniziale fino mappatura dei modelli di distribuzione genomici, è descritto. Questo protocollo è applicabile a qualsiasi retrovirus e qualsiasi tipo di cellula infettabili. Inoltre, la conduttura dosaggio è molto sensibile, con la possibilità di recuperare un numero soddisfacente di integrazione siti unici da diluizioni seriali di DNA genomico equivalente a quella di una infezione avviato con una MOI di 6,4 x 10 -5. Questa sensibilità rende il protocollo particolarmente utile quando applicato ai campioni da pazienti infetti che possono contenere una carica virale bassa, in cui solo una piccola frazione di cellule porto i un provirus integrato. Coerentemente con le carte metodologia precedenti in questo campo 36,38,41-43, più passaggi nella parte bioinformatica di questo protocollo potranno beneficiare dello sviluppo di script personalizzati per l'elaborazione di file di grandi dimensioni di dati di sequenza. Mentre BLAT 58 è il mApping utilità descritto in questo protocollo, gli utenti possono trovare Bowtie 67 (http://bowtie-bio.sourceforge.net/index.shtml) per essere una valida alternativa.

Un oleodotto bioinformatica alternativa è stata recentemente riportato per la determinazione di Moloney virus della leucemia murina (MoMLV) siti di integrazione 19. Questo gasdotto è utile in quanto è stato sviluppato in un software standalone che è disponibile al pubblico, ed è abbastanza potente nel senso che è stato originariamente utilizzato per mappare centinaia di migliaia di siti di integrazione MoMLV unici. Tuttavia, il software disponibile è stato originariamente progettato per specificamente ri-analizzare il set di dati MoMLV riportato, e così riprogrammazione sarebbe necessario per personalizzare la pipeline di alternare disegni sperimentali (la funzionalità dello strumento è stata recentemente ampliata per includere virus adeno-associati e Tol2 e Ac / Ds trasposoni vettori 68). Inoltre, tale protocollo descritto la generazione del sito di integrazione preliminare .bedfile, ma non ha lay out misure specifiche necessarie per i siti della mappa osservazione a annotazioni genomiche. I lettori possono trovare il "vettore di integrazione Analisi del sito" server 69, che è stato rilasciato durante la revisione del manoscritto corrente, utile per analizzare le sequenze di NGS generati utilizzando il protocollo descritto qui.

Alcuni punti devono essere sottolineati quando si utilizza qualsiasi protocollo per analizzare insiemi di dati retrovirali sito di integrazione. Quando si prepara più librerie in tandem, esiste un potenziale significativo per il campione contaminazione incrociata. Anche un piccolo livello di diafonia campione può oscurare risultati al livello di rendere una corsa NGS inutilizzabile. Pertanto, tutti i lavori di bagnato-panca dovrebbe essere completato in una, cappa a flusso laminare dedicato sterilizzato o stazione di lavoro PCR. Una serie di pipette e reagenti come l'acqua priva di nucleasi dovrebbe essere dedicato esclusivamente all'amplificazione sito di integrazione. L'uso di linkers unici per ciascun preparato libreria può limitare il potenzialeper il cross-amplificazione e anche permettere l'identificazione di attraversamento si legge all'interno di ciascuna libreria nei file FASTA prime.

E 'importante considerare i pro ei contro di utilizzare ultrasuoni contro restrizione endonucleasi digestione al frammento di DNA genomico. Da un lato, sonicazione fornisce una distribuzione relativamente casuale di punti di taglio, ma i passi di riparazione del DNA e A-tailing successivamente richiesti ridurre costantemente la resa dei prodotti di ligazione linker rispetto al legature eseguite con estremità coesive enzima di restrizione generati. D'altra parte, enzimi di restrizione fornisce una popolazione meno erogato dei punti di taglio, che invariabilmente introdurre alcuni pregiudizi nei dati recuperati. Utilizzando una endonucleasi di restrizione di scartare a monte sequenze LTR sarà in entrambi i casi (figura 1) comportare la perdita di una piccola frazione dei siti di integrazione che si trovano a monte di tale sito del genoma. Qualsiasi pregiudizio dati che possono risultato può essere annunciovestito omettendo la digestione enzimatica dal protocollo durante la preparazione biblioteca e filtrando la moltitudine di risultante monte sequenze LTR dai dati di sequenziamento.

Sebbene il protocollo attuale è molto sensibile e capace di generare milioni di siti di integrazione uniche 21,40, solo circa un terzo di tutte le integrazioni disponibili potrebbe aspettare di essere amplificato in un dato esperimento anche con le migliori dei preparati libreria (rif. 70 e osservazioni non pubblicate). Ciò può causare complicazioni quando si analizzano campioni provenienti da infezioni MOI basse o pazienti che ospitano bassa carica virale. Questa limitazione può essere superata in parte ripetutamente sequenziando la stessa preparazione biblioteca e / o sequenziamento più librerie derivati ​​dallo stesso campione di DNA in parallelo. futuri aumenti di sensibilità del test sarà di conseguenza essere molto utile per le applicazioni traslazionali promozione della retrovirale sito di integrazione sequenziamento.

Subscription Required. Please recommend JoVE to your librarian.

Acknowledgments

Siamo grati ai nostri colleghi Stephen Hughes e Henry Levin per un consiglio che è stato fondamentale per stabilire il protocollo di NGS per retrovirale sito di integrazione sequenziamento in laboratorio Engelman. Questo lavoro è stato sostenuto da Stati Uniti National Institutes of Health concede AI039394 e AI052014 (a ANE) e AI060354 (Harvard University Center for AIDS Research).

Materials

Name Company Catalog Number Comments
DMEM Gibco 11965-084 Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum Thermo Scientific SH 30088.03 Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin Corning 30-002-Cl Antibiotics to be added to DMEM
Phosphate-Buffered saline Mediatech 21-040-CV Used to wash cells
Trypsin EDTA Corning 25-053-CI Used to detach adherent cells from tissue culture plates
PolyJet SignaGen Laboratories SL100688 DNA transfection reagent
0.45 µm Filters Thermo Scientific 09-740-35B Used to filter virus particle-containing cell culture media
Turbo DNase Ambion AM2239 Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay ABL Inc. 5447 Used to quantify yield of virus production
DNeasy Blood & Tissue Kit Qiagen 69506 Used to purify genomic DNA from cells
Sonicator Covaris S2 With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water GeneMate G-3250-125 Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit Qiagen 28106 Used to purify DNA during library construction
End-It DNA End-Repair Kit Epicentre ER81050 Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–) New England Biolabs (NEB) M0212S Used with dATP to A-tail repaired DNA fragments
dATP Thermo Scientific R0141 Deoxyadenosine triphosphate
MseI NEB R0525L Restriction endonuclease for genomic DNA cleavage
BglII NEB R0144L Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase NEB M0202L/6218 Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides Integrated DNA Technologies custom Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs 
Advantage 2 Polymerase Mix Clontech 639202 Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions) Thermo Scientific R0181 Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop Thermo Scientific NanoDrop 2000 Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter Life Technologies Qubit® 3.0 Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System Agilent G2964AA Tape-based assay to confirm integration site library DNA size distribution
MiSeq Illumina SY-410-1003 Used for NGS

DOWNLOAD MATERIALS LIST

References

  1. Craigie, R., Bushman, F. D. HIV DNA integration. Cold Spring Harb. Perspect. Med. 2, a006890 (2012).
  2. Li, M., Mizuuchi, M., Burke, T. R. J., Craigie, R. Retroviral DNA integration: reaction pathway and critical intermediates. EMBO J. 25, 1295-1304 (2006).
  3. Hare, S., Gupta, S. S., Valkov, E., Engelman, A., Cherepanov, P. Retroviral intasome assembly and inhibition of DNA strand transfer. Nature. 464, 232-236 (2010).
  4. Hare, S., Maertens, G. N., Cherepanov, P. 3'-processing and strand transfer catalysed by retroviral integrase in crystallo. EMBO J. 31, 3020-3028 (2012).
  5. Fujiwara, T., Mizuuchi, K. Retroviral DNA integration: structure of an integration intermediate. Cell. 54, 497-504 (1988).
  6. Roth, M. J., Schwartzberg, P. L., Goff, S. P. Structure of the termini of DNA intermediates in the integration of retroviral DNA: dependence on IN function and terminal DNA sequence. Cell. 58, 47-54 (1989).
  7. Brown, P. O., Bowerman, B., Varmus, H. E., Bishop, J. M. Retroviral integration: structure of the initial covalent product and its precursor, and a role for the viral IN protein. Proc. Natl. Acad. Sci. USA. 86, 2525-2529 (1989).
  8. Pauza, C. D. Two bases are deleted from the termini of HIV-1 linear DNA during integrative recombination. Virology. 179, 886-889 (1990).
  9. Bowerman, B., Brown, P. O., Bishop, J. M., Varmus, H. E. A nucleoprotein complex mediates the integration of retroviral DNA. Genes Dev. 3, 469-478 (1989).
  10. Bukrinsky, M. I., et al. Active nuclear import of human immunodeficiency virus type 1 preintegration complexes. Proc. Natl. Acad. Sci. USA. 89, 6580-6584 (1992).
  11. Miller, M. D., Farnet, C. M., Bushman, F. D. Human immunodeficiency virus type 1 preintegration complexes: studies of organization and composition. J. Virol. 71, 5382-5390 (1997).
  12. Engelman, A., Mizuuchi, K., Craigie, R. HIV-1 DNA integration: mechanism of viral DNA cleavage and DNA strand transfer. Cell. 67, 1211-1221 (1991).
  13. Maertens, G. N., Hare, S., Cherepanov, P. The mechanism of retroviral integration from X-ray structures of its key intermediates. Nature. 468, 326-329 (2010).
  14. Holman, A. G., Coffin, J. M. Symmetrical base preferences surrounding HIV-1, avian sarcoma/leukosis virus, and murine leukemia virus integration sites. Proc. Natl. Acad. Sci. USA. 102, 6103-6107 (2005).
  15. Wu, X., Li, Y., Crise, B., Burgess, S. M., Munroe, D. J. Weak palindromic consensus sequences are a common feature found at the integration target sites of many retroviruses. J. Virol. 79, 5211-5214 (2005).
  16. Kvaratskhelia, M., Sharma, A., Larue, R. C., Serrao, E., Engelman, A. Molecular mechanisms of retroviral integration site selection. Nucleic Acids Res. 42, 10209-10225 (2014).
  17. Schroder, A. R., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110, 521-529 (2002).
  18. Wu, X., Li, Y., Crise, B., Burgess, S. M. Transcription start regions in the human genome are favored targets for MLV integration. Science. 300, 1749-1751 (2003).
  19. LaFave, M. C., et al. MLV integration site selection is driven by strong enhancers and active promoters. Nucleic Acids Res. 42, 4257-4269 (2014).
  20. De Ravin, S. S., et al. Enhancers are major targets for murine leukemia virus vector integration. J. Virol. 88, 4504-4513 (2014).
  21. Maskell, D. P., et al. Structural basis for retroviral integration into nucleosomes. Nature. 523, 366-369 (2015).
  22. Serrao, E., et al. Integrase residues that determine nucleotide preferences at sites of HIV-1 integration: implications for the mechanism of target DNA binding. Nucleic Acids Res. 42, 5164-5176 (2014).
  23. Aiyer, S., et al. Structural and sequencing analysis of local target DNA recognition by MLV integrase. Nucleic Acids Res. 43, 5647-5663 (2015).
  24. Ciuffi, A., et al. A role for LEDGF/p75 in targeting HIV DNA integration. Nat. Med. 11, 1287-1289 (2005).
  25. Sharma, A., et al. BET proteins promote efficient murine leukemia virus integration at transcription start sites. Proc. Natl. Acad. Sci. USA. 110, 12036-12041 (2013).
  26. Gupta, S. S., et al. Bromo- and extraterminal domain chromatin regulators serve as cofactors for murine leukemia virus integration. J. Virol. 87, 12721-12736 (2013).
  27. De Rijck, J., et al. The BET family of proteins targets moloney murine leukemia virus integration near transcription start sites. Cell Rep. 5, 886-894 (2013).
  28. Demeulemeester, J., et al. HIV-1 integrase variants retarget viral integration and are associated with disease progression in a chronic infection cohort. Cell Host Microbe. 16, 651-662 (2014).
  29. Meehan, A. M., et al. LEDGF/p75 proteins with alternative chromatin tethers are functional HIV-1 cofactors. PLoS Pathog. 5, e1000522 (2009).
  30. Ferris, A. L., et al. Lens epithelium-derived growth factor fusion proteins redirect HIV-1 DNA integration. Proc. Natl. Acad. Sci. USA. 107, 3135-3140 (2010).
  31. Gijsbers, R., et al. LEDGF hybrids efficiently retarget lentiviral integration into heterochromatin. Mol. Ther. 18, 552-560 (2010).
  32. Aiyer, S., et al. Altering murine leukemia virus integration through disruption of the integrase and BET protein family interaction. Nucleic Acids Res. 42, 5917-5928 (2014).
  33. Jahner, D., Jaenisch, R. Integration of Moloney leukaemia virus into the germ line of mice: correlation between site of integration and virus activation. Nature. 287, 456-458 (1980).
  34. Stevens, S. W., Griffith, J. D. Human immunodeficiency virus type 1 may preferentially integrate into chromatin occupied by L1Hs repetitive elements. Proc. Natl. Acad. Sci. USA. 91, 5557-5561 (1994).
  35. Wang, G. P., Ciuffi, A., Leipzig, J., Berry, C. C., Bushman, F. D. HIV integration site selection: analysis by massively parallel pyrosequencing reveals association with epigenetic modifications. Genome Res. 17, 1186-1194 (2007).
  36. Wang, G. P., et al. DNA bar coding and pyrosequencing to analyze adverse events in therapeutic gene transfer. Nucleic Acids Res. 36, e49 (2008).
  37. Roth, S. L., Malani, N., Bushman, F. D. Gammaretroviral integration into nucleosomal target DNA in vivo. J. Virol. 85, 7393-7401 (2011).
  38. Ciuffi, A., Barr, S. D. Identification of HIV integration sites in infected host genomic DNA. Methods. 53, 39-46 (2011).
  39. Gillet, N. A., et al. The host genomic environment of the provirus determines the abundance of HTLV-1-infected T-cell clones. Blood. 117, 3113-3122 (2011).
  40. Matreyek, K. A., et al. Host and viral determinants for MxB restriction of HIV-1 infection. Retrovirology. 11, 90 (2014).
  41. Ciuffi, A., et al. Methods for integration site distribution analyses in animal cell genomes. Methods. 47, 261-268 (2009).
  42. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39, e72 (2011).
  43. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol. Biol. 1185, 321-344 (2014).
  44. Page, K. A., Landau, N. R., Littman, D. R. Construction and use of a human immunodeficiency virus vector for analysis of virus infectivity. J. Virol. 64, 5270-5276 (1990).
  45. Emi, N., Friedmann, T., Yee, J. K. Pseudotype formation of murine leukemia virus with the G protein of vesicular stomatitis virus. J. Virol. 65, 1202-1207 (1991).
  46. Wehrly, K., Chesebro, B. p24 antigen capture assay for quantification of human immunodeficiency virus using readily available inexpensive reagents. Methods. 12, 288-293 (1997).
  47. Goff, S., Traktman, P., Baltimore, D. Isolation and properties of Moloney murine leukemia virus mutants: use of a rapid assay for release of virion reverse transcriptase. J. Virol. 38, 239-248 (1981).
  48. Willey, R. L., et al. In vitro mutagenesis identifies a region within the envelope gene of the human immunodeficiency virus that is critical for infectivity. J. Virol. 62, 139-147 (1988).
  49. Butler, S. L., Hansen, M. S., Bushman, F. D. A quantitative assay for HIV DNA integration in vivo. Nat. Med. 7, 631-634 (2001).
  50. Brussel, A., Sonigo, P. Analysis of early human immunodeficiency virus type 1 DNA synthesis by use of a new sensitive assay for quantifying integrated provirus. J. Virol. 77, 10119-10124 (2003).
  51. Serrao, E., Ballandras-Colas, A., Cherepanov, P., Maertens, G. N., Engelman, A. N. Key determinants of target DNA recognition by retroviral intasomes. Retrovirology. 12, 39 (2015).
  52. Maldarelli, F., et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345, 179-183 (2014).
  53. Wagner, T. A., et al. HIV latency. Proliferation of cells with HIV integrated into cancer genes contributes to persistent infection. Science. 345, 570-573 (2014).
  54. Cohn, L. B., et al. HIV-1 integration landscape during latent and active infection. Cell. 160, 420-432 (2015).
  55. Li, X., Ben-Dov, I. Z., Mauro, M., Williams, Z. Lowering the quantification limit of the QubitTM RNA HS assay using RNA spike-in. BMC Mol. Biol. 16, 9 (2015).
  56. Padmanaban, A., Walker, D. M. Analysis of high molecular weight genomic DNA using the Agilent 2200 TapeStation and genomic DNA ScreenTape. Publication number 5991-1797EN Agilent Technologies. , Agilent Technologies, Inc. Santa Clara, CA. (2013).
  57. Kapa library quantification technical guide version v1.14. , KapaBiosystems. Boston, MA. (2014).
  58. Kent, W. J. BLAT--the BLAST-like alignment tool. Genome Res. 12, 656-664 (2002).
  59. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  60. Gaur, M., Leavitt, A. D. Mutations in the human immunodeficiency virus type 1 integrase D,D(35)E motif do not eliminate provirus formation. J. Virol. 72, 4678-4685 (1998).
  61. Varadarajan, J., McWilliams, M. J., Hughes, S. H. Treatment with suboptimal doses of raltegravir leads to aberrant HIV-1 integrations. Proc. Natl. Acad. Sci. USA. 110, 14747-14752 (2013).
  62. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12, 996-1006 (2002).
  63. Berry, C. C., et al. Estimating abundances of retroviral insertion sites from DNA fragment length data. Bioinformatics. 28, 755-762 (2012).
  64. Firouzi, S., et al. Development and validation of a new high-throughput method to investigate the clonality of HTLV-1-infected cells based on provirus integration sites. Genomic Med. 6, 46 (2014).
  65. Mitchell, R. S., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2, E234 (2004).
  66. Schneider, T. D., Stormo, G. D., Gold, L., Ehrenfeucht, A. Information content of binding sites on nucleotide sequences. J. Mol. Biol. 188, 415-431 (1986).
  67. Langmead, B. Chapter 11, Unit 11. 17, Aligning sort sequencing reads with Bowtie. Curr. Protoc. Bioinformatics. , (2010).
  68. LaFave, M. C., Varshney, G. K., Burgess, S. M. GeIST: a pipeline for mapping integrated DNA elements. Bioinformatics. 31, 3219-3221 (2015).
  69. Hocum, J. D., et al. VISA - Vector Integration Site Analysis server: a web-based server to rapidly identify retroviral integration sites from next-generation sequencing. BMC Bioinformatics. 16, 212 (2015).
  70. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15, 1431-1436 (2009).
  71. TruSeq Library Prep Pooling Guide. Guidelines for pooling TruSeq libraries for Illumina sequencing systems that require balanced index combinations. , Source: https://support.illumina.com/downloads/truseq-library-prep-pooling-guide-15042173.html (2015).

Tags

Virology Retrovirus HIV-1 l'integrazione l'integrasi siti di integrazione di prossima generazione di sequenziamento
Amplificazione, sequenziamento di prossima generazione, e DNA genomico mappatura dei siti di integrazione retrovirali
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Serrao, E., Cherepanov, P.,More

Serrao, E., Cherepanov, P., Engelman, A. N. Amplification, Next-generation Sequencing, and Genomic DNA Mapping of Retroviral Integration Sites. J. Vis. Exp. (109), e53840, doi:10.3791/53840 (2016).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter