We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.
Rétrovirus exposition préférences d'intégration de la signature sur les deux échelles locales et globales. Ici, nous présentons un protocole détaillé pour (1) génération de diverses bibliothèques de sites d'intégration rétrovirales par PCR (LM-PCR) de ligature médiée et séquençage de nouvelle génération (NGS), (2) la cartographie de la localisation génomique de chaque virus- accueillir la jonction en utilisant bedtools, et (3) l'analyse des données pour la pertinence statistique. L'ADN génomique extrait de cellules infectées est fragmenté par digestion avec des enzymes de restriction ou par sonication. ADN après la fin de la réparation appropriée, lieurs double brin sont ligaturés sur les extrémités d'ADN et la PCR semi-nichée est réalisée en utilisant des amorces complémentaires à la fois à la longue répétition terminale (LTR) du virus extrémité et l'ADN de liaison ligaturer. Les amorces de PCR portent des séquences requises pour la classification de l'ADN lors de NGS, niant la nécessité d'adapter la ligature séparée. le contrôle de la qualité (CQ) est réalisée afin d'évaluer la distribution de la taille des fragments d'ADN et d'adapterer ADN incorporation avant NGS. les fichiers de sortie de séquence sont filtrés pour LTR contenant lit, et les séquences définissant le LTR et l'éditeur de liens sont rognées loin. des séquences de cellules hôtes rognées sont mises en correspondance à un génome de référence en utilisant BLAT et sont filtrées pour une identité minimale de 97% à un point unique dans le génome de référence. sites d'intégration uniques sont examinés pour nucléotide adjacent (nt) la séquence et la distribution par rapport à diverses caractéristiques génomiques. En utilisant ce protocole, les bibliothèques de site d'intégration d'une grande complexité peuvent être construites à partir d'ADN génomique dans les trois jours. Le protocole complet qui englobe une infection virale sensible exogène de cellules de culture tissulaire à l'analyse des sites d'intégration peut donc être effectuée en environ une à deux semaines. Les applications récentes de cette technologie se rapportent à l'analyse longitudinale des sites d'intégration de patients infectés par le VIH.
L'intégration de l'ADN viral (vDNA) dans le génome de la cellule hôte est une étape essentielle dans le cycle de vie retroviral. L' intégration est réalisée par l'enzyme intégrase virale (IN), qui réalise deux procédés catalytiques distincts qui conduisent à la mise en place du provirus inséré de façon stable 1. EN unités s'engager les extrémités de la vDNA linéaire qui est produite par transcription inverse, la formation de la intasome d'ordre supérieur avec vDNA extrémités maintenues ensemble par un multimère EN 2-4. EN clive 'extrémités de la vDNA en aval de 5'-CA-3 invariants du 3 séquences dans un processus connu sous le nom 3'-traitement, laissant en retrait extrémités 3' avec des groupes hydroxyles réactifs à chaque vDNA terminale 5-8. Le intasome est ensuite importé dans le noyau dans le cadre d'un grand ensemble de l' hôte et des protéines virales connues comme le complexe de pré – intégration (PIC) 9-11. Après avoir rencontré l'ADN cible cellulaire (ADNt), IN utilise le vDNA 3'-hydroxyle groups pour cliver le haut ADNt et des brins inférieurs en quinconce et se joint à la vDNA à des groupes de phosphate ADNt 5 'dans le processus de transfert de brin 12,13 simultanément.
Rétrovirus préférences du site d'intégration d'exposition sur les échelles locales et globales. Localement, les sites d'intégration de consensus sont constitués de séquences palindromiques TDNA faiblement conservés qui enjambent d'environ cinq à dix paires de bases en amont et en aval des sites d'insertion vDNA 14,15. Globalement, les retrovirus ciblent annotations chromatine spécifiques 16. Il y a sept genres différents rétroviral – alpha par epsilon, lenti et spuma. Les lentivirus, qui comprennent le VIH-1, favorisent l' intégration au sein des organes de gènes activement transcrits 17, tandis que les gammaretroviruses intègrent préférentiellement dans les sites de transcription de démarrage (TSSS) et des régions activatrices actives 18-20. À l'opposé, spumavirus est fortement biaisé vers heterochromrégions atiques, tels que les domaines de la lamina associée gènes pauvres 21. Les préférences de base ADNt locales sont en grande partie dictée par des réseaux spécifiques de contacts nucléoprotéine entre IN et ADNt 13,22,23. Pour les lentivirus et gammaretroviruses, l' intégration par rapport aux annotations génomiques est en grande partie régie par des interactions entre IN et facteurs cellulaires parentes 24-27. Modifier les détails du réseau d'interaction IN-ADNt 13,22,23,28 et de perturber ou de re-engineering IN-hôte interactions de facteurs 25-27,29-32 sont des stratégies éprouvées pour recibler l' intégration aux niveaux local et mondial, respectivement.
La puissance des procédures de séquençage d'ADN utilisés au catalogue des sites d'intégration rétrovirale a beaucoup augmenté au cours des dernières décennies. Les sites d'intégration ont été récupérés dans le travail de pionnier en utilisant la purification laborieuse et des techniques manuelles de clonage pour obtenir une poignée de sites uniques par étude 33,34.La combinaison de l' amplification LM-PCR des jonctions d'ADN LTR-hôtes avec la possibilité de cartographier des sites d'intégration individuels aux génomes humains et les projets de souris transformées sur le terrain, avec le nombre de sites récupérés à partir de la culture tissulaire exogène infection de cellules croissant à plusieurs centaines de milliers 17 , 18. La combinaison la plus récente de la LM-PCR avec la méthodologie NGS a envoyé la profondeur de la bibliothèque montée en flèche. Plus précisément, pyroséquençage a donné l'ordre de dizaines de milliers de sites d'intégration uniques 30,35-38, tandis que les bibliothèques séquencés grâce à l'utilisation du regroupement d'ADN peut donner des millions de séquences uniques 19-21,39. Nous décrivons ici un protocole LM-PCR optimisé pour l'amplification et le séquençage des sites d'intégration rétroviraux utilisant NGS de regroupement d'ADN. Le procédé incorpore nécessaire séquences d'adaptation dans les amorces de PCR, et donc directement dans les molécules d'ADN amplifiées, ce qui empêche ainsi la nécessité d'une étape de ligature adaptateur supplémentaire avant séquenCing 40. Le pipeline d'analyse bio-informatique, à partir de l'analyse des données de séquençage pour les premières LTR-hôtes d'ADN des jonctions à la cartographie des sites uniques d'intégration à PERTINENT caractéristiques génomiques, est également décrite de façon générale. Conformément à la préséance établi des protocoles méthodologiques antérieurs dans ce domaine 36,38,41-43, scripts personnalisés peuvent être développés pour faciliter la réalisation des étapes spécifiques dans le pipeline de la bioinformatique. L'utilité et la sensibilité du protocole est illustré par des données représentatives de l'amplification, le séquençage et la cartographie du VIH-1 des sites d'intégration à partir de cellules de culture de tissus infectés à la multiplicité approximative d'infection (MOI) de 1,0, ainsi qu'une série de titrages de cet ADN diluée à travers l' ADN cellulaire non infecté dans 5 fois des mesures pour une dilution maximale de 1: 15,625 pour obtenir le approximative MOI équivalent de 6,4 x 10 -5.
Un protocole pour l'analyse des sites d'intégration de retrovirus, de l'étape d'infection par le virus initial par mappage des profils de distribution génomique, est décrite. Ce protocole est applicable à tout retrovirus et tout type de cellule infectable. En outre, la conduite de dosage est très sensible, avec la possibilité de récupérer un nombre satisfaisant des sites uniques d'intégration à partir de dilutions en série de l' ADN génomique équivalent à celui d'une infection …
The authors have nothing to disclose.
Nous sommes reconnaissants à nos collègues Stephen Hughes et Henry Levin conseil qui était essentiel d'établir le protocole NGS pour rétroviral séquençage du site d'intégration dans le laboratoire Engelman. Ce travail a été soutenu par les Instituts nationaux américains de la santé accorde AI039394 et AI052014 (à ANE) et AI060354 (Centre universitaire de Harvard for AIDS Research).
DMEM | Gibco | 11965-084 | Standard cell culture medium, compatible with HEK293T cells |
Fetal Bovine Serum | Thermo Scientific | SH 30088.03 | Different lots of serum may need to be pre-screened for optimal viral production |
Penicillin/Streptomycin | Corning | 30-002-Cl | Antibiotics to be added to DMEM |
Phosphate-buffered saline | Mediatech | 21-040-CV | Used to wash cells |
Trypsin EDTA | Corning | 25-053-CI | Used to detach adherent cells from tissue culture plates |
PolyJet | SignaGen Laboratories | SL100688 | DNA transfection reagent |
0.45 µm Filters | Thermo Scientific | 09-740-35B | Used to filter virus particle-containing cell culture media |
Turbo DNase | Ambion | AM2239 | Used to degrade carryover plasmid DNA from virus stocks |
HIV-1 p24 Antigen Capture Assay | ABL Inc. | 5447 | Used to quantify yield of virus production |
DNeasy Blood & Tissue Kit | Qiagen | 69506 | Used to purify genomic DNA from cells |
Sonicator | Covaris | S2 | With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec |
Nuclease-Free Water | GeneMate | G-3250-125 | Commercially-available water is recommended to reduce the possibility of sample cross-contamination |
QIAQuick PCR Purification Kit | Qiagen | 28106 | Used to purify DNA during library construction |
End-It DNA End-Repair Kit | Epicentre | ER81050 | Used to repair DNA ends of sonicated DNA samples |
Klenow Fragment (3'-5' exo–) | New England Biolabs (NEB) | M0212S | Used with dATP to A-tail repaired DNA fragments |
dATP | Thermo Scientific | R0141 | Deoxyadenosine triphosphate |
MseI | NEB | R0525L | Restriction endonuclease for genomic DNA cleavage |
BglII | NEB | R0144L | Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence |
T4 DNA Ligase | NEB | M0202L/6218 | Enzyme for covalent joining of compatible DNA ends |
DNA Oligonucleotides | Integrated DNA Technologies | custom | Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs |
Advantage 2 Polymerase Mix | Clontech | 639202 | Commercial mix containing DNA polymerase for PCR |
dNTPs (100 mM solutions) | Thermo Scientific | R0181 | Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP |
NanoDrop | Thermo Scientific | NanoDrop 2000 | Spectrophotometer for determination of DNA concentration |
Qubit Fluorimeter | Life Technologies | Qubit® 3.0 | Fluorometer used to confirm integration site library DNA concentration |
2200 TapeStation System | Agilent | G2964AA | Tape-based assay to confirm integration site library DNA size distribution |
MiSeq | Illumina | SY-410-1003 | Used for NGS |