We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.
preferenze di integrazione firma retrovirus presentano su entrambi i scala locale e globale. Qui, vi presentiamo un protocollo dettagliato per (1) generazione di diverse librerie di siti di integrazione retrovirali che utilizzano amplificazione PCR legatura-mediata (LM-PCR) e di sequenziamento di prossima generazione (NGS), (2) la mappatura della posizione genomica di ogni virus- ospitare giunzione con BEDTools, e (3) analizzare i dati per rilevanza statistica. Il DNA genomico estratto da cellule infette è frammentata mediante digestione con enzimi di restrizione o mediante ultrasuoni. Dopo adatto DNA finale di riparazione, linker a doppio filamento sono legatura sul conclude il DNA, e semi-nested PCR è condotta utilizzando primer complementari sia per il long terminal repeat (LTR) fine del virus e il DNA linker legatura. I primer PCR portano sequenze necessarie per il clustering DNA durante NGS, negando la necessità di legatura adattatore separato. Il controllo di qualità (QC) è condotto per valutare il DNA di distribuzione dimensione del frammento e adattarsier l'incorporazione del DNA prima di NGS. file di output di sequenza vengono filtrati per LTR contenenti legge, e le sequenze che definiscono il LTR e il linker sono tagliate via. sequenze di cellule ospitanti rasata vengono mappati a un genoma di riferimento utilizzando BLAT e sono filtrati per minimo 97% di identità di un unico punto di riferimento nel genoma. siti di integrazione unici sono esaminati per adiacenti nucleotidi (nt) sequenza e di distribuzione relativi a varie caratteristiche genomiche. Usando questo protocollo, le biblioteche sito di integrazione di elevata complessità possono essere costruiti da DNA genomico in tre giorni. L'intero protocollo che comprende infezione virale esogena di cellule di coltura tissutale suscettibili di analisi sito di integrazione può quindi essere condotta in circa una o due settimane. Recenti applicazioni di questa tecnologia riguardano analisi longitudinale dei siti di integrazione da pazienti affetti da HIV.
L'integrazione del DNA virale (vDNA) nel genoma della cellula ospite è un passo essenziale nel ciclo di vita retrovirale. L'integrazione viene eseguita l'integrasi virale (IN), che svolge due processi catalitici distinti che portano alla creazione del provirus stabilmente inserita 1. IN subunità impegnare le estremità della vDNA lineare che viene generato attraverso trascrizione inversa, formando la intasome ordine superiore con vDNA estremità tenuto insieme da un multimero IN 2-4. IN unirà 'estremità del vDNA valle invarianti 5'-CA-3' del 3 sequenze in un processo noto come 3'-processing, lasciando incasso 3 'termina con gruppi ossidrile reattivi ad ogni vDNA capolinea 5-8. Il intasome viene successivamente importato nel nucleo come parte di una grande assemblea di host e proteine virali conosciuti come il complesso preintegrazione (PIC) 9-11. Dopo aver incontrato bersaglio cellulare del DNA (tDNA), IN utilizza il vDNA 3'-idrossile group per fendere l'alto tDNA e fili di fondo in modo sfalsato e, contemporaneamente, si unisce la vDNA di tDNA 5 'gruppi fosfato attraverso il processo di trasferimento strand 12,13.
preferenze del sito di integrazione mostra retrovirus sulle scale locale e globale. Localmente, siti di integrazione consenso consistono debolmente conservati sequenze palindromi tDNA che si estendono da circa 9:55 bp a monte ed a valle dei siti di inserzione vDNA 14,15. A livello globale, i retrovirus bersaglio specifiche annotazioni della cromatina 16. Ci sono sette diversi generi retrovirale – alpha attraverso epsilon, lenti, e spuma. I lentivirus, che comprendono l'HIV-1, favoriscono l'integrazione in seno agli organi di geni attivamente trascritti 17, mentre i gammaretroviruses preferenzialmente si integrano all'interno di siti o di trascrizione di inizio (Tsss) e regioni enhancer attivi 18-20. In netto contrasto, spumavirus è fortemente sbilanciata verso heterochromregioni ATIC, come ad esempio i domini lamina associata gene-poveri 21. Preferenze di base tDNA locali sono in gran parte dettato da specifiche reti di contatti nucleoproteici tra IN e tDNA 13,22,23. Per i lentivirus e gammaretroviruses, l'integrazione relativa alle annotazioni genomiche è in gran parte governato da interazioni tra IN e fattori cellulari affini 24-27. Alterare le specifiche di interazione di rete IN-tDNA 13,22,23,28 e interrompere o re-engineering IN-host interazioni tra fattori 25-27,29-32 hanno dimostrato strategie per retarget l'integrazione a livello locale e globale, rispettivamente.
Il potere delle procedure di sequenziamento del DNA utilizzate per catalogare i siti di integrazione retrovirali è aumentata enormemente negli ultimi decenni. Siti di integrazione sono stati recuperati in un lavoro pionieristico con la purificazione laborioso e tecniche di clonazione manuali per produrre solo una manciata di siti unici al 33,34 studio.La combinazione di LM-PCR amplificazione del DNA giunzioni LTR-ospite con la possibilità di mappare singoli siti di integrazione a genomi progetti topo umani e trasformate campo, con il numero di siti recuperati da infezioni cellule di coltura tissutale esogeno aumentando a diverse centinaia di migliaia 17 , 18. La recente fusione di più di LM-PCR con metodologia NGS ha inviato profondità biblioteca alle stelle. In particolare, pyrosequencing ha dato l'ordine di decine di migliaia di siti di integrazione unici 30,35-38, mentre le librerie in sequenza attraverso l'uso di cluster DNA può produrre milioni di sequenze uniche 19-21,39. Qui si descrive un protocollo ottimizzato LM-PCR per amplificare e sequenziare siti di integrazione retrovirali che utilizzano NGS di clustering DNA. Il metodo incorpora richiesto sequenze di adattamento nei primer PCR e, quindi, direttamente nelle molecole di DNA amplificati, precludendo in tal modo la necessità di un passaggio adattatore legatura aggiuntivo prima Sequencing 40. L'analisi bioinformatica gasdotto, dalla analisi dei dati di sequenziamento prime per LTR-ospite DNA giunzioni alla mappatura dei siti di integrazione uniche osservazione a caratteristiche genomiche, è anche generalmente descritto. In conformità con la priorità stabilita da precedenti protocolli metodologici in questo campo 36,38,41-43, script personalizzati possono essere sviluppati che contribuisca alla realizzazione di interventi specifici in cantiere bioinformatica. L'utilità e la sensibilità del protocollo è illustrato con dati rappresentativi amplificando, sequenziamento, e mappatura HIV-1 siti di integrazione da colture cellulari infettate alla molteplicità approssimativa di infezione (MOI) di 1,0, nonché una serie di titolazione di questo DNA diluita attraverso DNA cellulare non infetta in 5 volte procedura a una diluizione di 1: 15,625 per dare il approssimativa equivalente MOI di 6,4 x 10 -5.
Un protocollo per l'analisi dei siti di integrazione retrovirali, dalla fase virus iniziale fino mappatura dei modelli di distribuzione genomici, è descritto. Questo protocollo è applicabile a qualsiasi retrovirus e qualsiasi tipo di cellula infettabili. Inoltre, la conduttura dosaggio è molto sensibile, con la possibilità di recuperare un numero soddisfacente di integrazione siti unici da diluizioni seriali di DNA genomico equivalente a quella di una infezione avviato con una MOI di 6,4 x 10 -5. Ques…
The authors have nothing to disclose.
Siamo grati ai nostri colleghi Stephen Hughes e Henry Levin per un consiglio che è stato fondamentale per stabilire il protocollo di NGS per retrovirale sito di integrazione sequenziamento in laboratorio Engelman. Questo lavoro è stato sostenuto da Stati Uniti National Institutes of Health concede AI039394 e AI052014 (a ANE) e AI060354 (Harvard University Center for AIDS Research).
DMEM | Gibco | 11965-084 | Standard cell culture medium, compatible with HEK293T cells |
Fetal Bovine Serum | Thermo Scientific | SH 30088.03 | Different lots of serum may need to be pre-screened for optimal viral production |
Penicillin/Streptomycin | Corning | 30-002-Cl | Antibiotics to be added to DMEM |
Phosphate-buffered saline | Mediatech | 21-040-CV | Used to wash cells |
Trypsin EDTA | Corning | 25-053-CI | Used to detach adherent cells from tissue culture plates |
PolyJet | SignaGen Laboratories | SL100688 | DNA transfection reagent |
0.45 µm Filters | Thermo Scientific | 09-740-35B | Used to filter virus particle-containing cell culture media |
Turbo DNase | Ambion | AM2239 | Used to degrade carryover plasmid DNA from virus stocks |
HIV-1 p24 Antigen Capture Assay | ABL Inc. | 5447 | Used to quantify yield of virus production |
DNeasy Blood & Tissue Kit | Qiagen | 69506 | Used to purify genomic DNA from cells |
Sonicator | Covaris | S2 | With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec |
Nuclease-Free Water | GeneMate | G-3250-125 | Commercially-available water is recommended to reduce the possibility of sample cross-contamination |
QIAQuick PCR Purification Kit | Qiagen | 28106 | Used to purify DNA during library construction |
End-It DNA End-Repair Kit | Epicentre | ER81050 | Used to repair DNA ends of sonicated DNA samples |
Klenow Fragment (3'-5' exo–) | New England Biolabs (NEB) | M0212S | Used with dATP to A-tail repaired DNA fragments |
dATP | Thermo Scientific | R0141 | Deoxyadenosine triphosphate |
MseI | NEB | R0525L | Restriction endonuclease for genomic DNA cleavage |
BglII | NEB | R0144L | Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence |
T4 DNA Ligase | NEB | M0202L/6218 | Enzyme for covalent joining of compatible DNA ends |
DNA Oligonucleotides | Integrated DNA Technologies | custom | Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs |
Advantage 2 Polymerase Mix | Clontech | 639202 | Commercial mix containing DNA polymerase for PCR |
dNTPs (100 mM solutions) | Thermo Scientific | R0181 | Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP |
NanoDrop | Thermo Scientific | NanoDrop 2000 | Spectrophotometer for determination of DNA concentration |
Qubit Fluorimeter | Life Technologies | Qubit® 3.0 | Fluorometer used to confirm integration site library DNA concentration |
2200 TapeStation System | Agilent | G2964AA | Tape-based assay to confirm integration site library DNA size distribution |
MiSeq | Illumina | SY-410-1003 | Used for NGS |