Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Site d'intégration bidirectionnel Retroviral Méthodologie PCR et analyse de données quantitatives Workflow

Published: June 14, 2017 doi: 10.3791/55812
* These authors contributed equally

Summary

Ce manuscrit décrit la procédure expérimentale et l'analyse de logiciel pour un test de site d'intégration bidirectionnelle qui peut analyser simultanément l'ADN de jonction vecteur-hôte en amont et en aval. Les produits de PCR bidirectionnels peuvent être utilisés pour toute plate-forme de séquençage en aval. Les données résultantes sont utiles pour une comparaison quantitative à haut débit des cibles intégrées d'ADN.

Abstract

Les analyses du site d'intégration (IS) sont une composante essentielle de l'étude des sites d'intégration rétroviraux et leur importance biologique. Dans les récentes études de thérapie génique rétrovirale, les tests IS, en combinaison avec le séquençage de la prochaine génération, ont été utilisés comme outil de suivi des cellules pour caractériser les cellules clonales de cellules souches partageant le même IS. Pour la comparaison précise de la réapprovisionnement de clones de cellules souches à l'intérieur et à travers différents échantillons, la sensibilité de détection, la reproductibilité des données et la capacité à haut débit de l'analyse sont parmi les qualités d'analyse les plus importantes. Ce travail fournit un protocole détaillé et un workflow d'analyse de données pour l'analyse IS bidirectionnelle. Le dosage bidirectionnel peut simultanément séquencer les jonctions vecteur-hôte en amont et en aval. Par rapport aux approches de séquençage IS unidirectionnelles conventionnelles, l'approche bidirectionnelle améliore considérablement les taux de détection IS et la caractérisation des événements d'intégration aux deux extrémités de tIl cible l'ADN. Le pipeline d'analyse de données décrit ici identifie et énumère avec précision des séquences IS identiques à travers plusieurs étapes de comparaison qui mettent en place des séquences IS dans le génome de référence et déterminent les erreurs de séquençage. En utilisant une procédure de dosage optimisée, nous avons récemment publié les modèles de repeuplement détaillés de milliers de clones de cellules souches hématopoïétiques (HSC) après transplantation dans des macaques rhésus, démontrant pour la première fois le point précis du repopulation HSC et l'hétérogénéité fonctionnelle des HSC dans le Système de primates. Le protocole suivant décrit la procédure expérimentale étape par étape et le flux de travail d'analyse de données qui identifie et quantifie précisément les séquences IS identiques.

Introduction

Les rétrovirus insèrent leur ADN génomique dans le génome hôte dans différents sites. Cette propriété unique, qui peut contribuer au développement de cancers et d'autres formes de pathogenèse virale, a l'avantage ironique de rendre ces virus hautement accessibles à l'ingénierie cellulaire pour la thérapie génique et la recherche biologique de base. Le site d'intégration virale (IS) - l'emplacement sur le génome hôte où un ADN étranger (virus) est intégré - a des implications importantes pour le sort des virus intégrés et des cellules hôtes. Les tests IS ont été utilisés dans divers contextes de recherche biologique et clinique pour étudier la sélection et la pathogenèse du site d'intégration rétrovirale, le développement du cancer, la biologie des cellules souches et la biologie du développement 1 , 2 , 3 , 4 . Une faible sensibilité à la détection, une faible reproductibilité des données et une contamination croisée fréquente sont parmiLes facteurs clés limitant les applications des tests IS aux études actuelles et planifiées.

De nombreuses technologies d'analyse IS ont été développées. Les essais sur le site d'intégration à base d'enzyme à restriction, y compris la réaction en chaîne par polymérase (PCR) 5 , la PCR inverse 6 et la PCR 7 à médiation par amplification linéaire (LAM), sont les plus utilisés. L'utilisation d'enzymes de restriction spécifiques au site, cependant, génère un biais lors de la récupération de l'IS, permettant seulement un sous-ensemble d'intégres (un ADN étranger intégré dans le génome de l'hôte) au voisinage du site de restriction à récupérer 4 . Des technologies d'analyse qui permettent d'évaluer plus largement le vecteur IS ont également été introduites ces dernières années. Ces essais utilisent diverses stratégies, y compris la PCR 8 à médiation par transposon de Mu, non restrictive (nr) -LAM PCR 9 , enzyme de restriction de type II-mLa digestion éditée 10 , le cisaillement mécanique 11 et la PCR à l'hexamère aléatoire (Re-free PCR) 12 , pour fragmenter les ADN génomiques et amplifier l'IS. Les technologies actuelles ont différents niveaux de sensibilité à la détection, la couverture du génome, la spécificité cible, la capacité à haut débit, la complexité des procédures d'analyse et les biais dans la détection des fréquences relatives des sites cibles. Étant donné les différentes qualités des analyses existantes et la variété des buts pour lesquels elles peuvent être utilisées, l'approche d'analyse optimale doit être soigneusement sélectionnée.

Ce travail fournit des procédures expérimentales détaillées et un flux de travail d'analyse de données de calcul pour un test bidirectionnel qui améliore de manière significative les taux de détection et la précision de la quantification des séquences en analysant simultanément l'IS en amont et en aval de l'ADN cible intégré (voir la figure 1 pour une vue schématique des procédures de dosage ). Cette approche fournit égalementS le moyen de caractériser le processus d'intégration rétrovirale (par exemple, la fidélité à la duplication du site cible et les variations dans les séquences génomiques des insertions en amont et en aval). D'autres méthodes bidirectionnelles ont été utilisées principalement pour le clonage et le séquençage des deux extrémités de l'ADN cible 11 , 13 , 14 . Ce test est largement optimisé pour la quantification à haut débit et reproductible des clones vectorisés, en utilisant la méthode LM-PCR et la cartographie de l'analyse calculée, ainsi que pour la quantification des jonctions amont et aval. L'analyse bidirectionnelle avec l'enzyme TaqαI s'est révélée utile pour la quantification clonale à haut débit dans les études précliniques de thérapie génique de cellules souches 2 , 15 . Cet article décrit une méthode modifiée utilisant un coupeur plus fréquent (RsaI / CviQI - motif: GTAC) qui doubleIl existe des chances de détecter des globules par rapport à un dosage basé sur TaqαI . Des procédures détaillées d'analyse expérimentale et de données qui utilisent des enzymes de motifs GTAC pour les lentiviraux (NL4.3 et ses dérivés) et les analyses gamma-rétrovirales (vecteurs pMX) IS sont décrites. Les oligonucleotides utilisés dans le dosage sont listés dans le tableau 1 . Un script de programmation interne pour l'analyse de séquence IS est fourni dans le document complémentaire.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Génération des bibliothèques de séquences en amont (à gauche) et en aval (droite)

  1. Préparation ADN linker:
    1. Préparez une solution d'ADN de liaison de 10 μL en ajoutant 2 μL d'oligos LINKER_A 100 μM (finale: 20 μM), 2 μL d'oligos LINKER_B 100 μM (finale: 20 μM), 2 μL de NaCl 5 M (finale: 1 M) et 4 μl d'eau exempte de nuclease dans un tube PCR. Voir le tableau 1 pour les séquences de liaison.
    2. Incuber la solution d'ADN linker à 95 ° C pendant 5 minutes dans un instrument de PCR, arrêter le programme de course et éteindre l'instrument de PCR. Laissez la solution de liaison dans l'instrument pendant 30 minutes pour refroidir lentement l'ADN du lieur. La solution d'ADN de liaison peut être stockée à 4 ° C.
  2. Extension de biotine-amorce spécifique au LTR:
    1. Utiliser un spectrophotomètre UV-Vis pour déterminer la concentration d'ADN et les valeurs 260/280 nm de l'ADN génomique in vivoOu des expériences in vitro . Diluer 1-2 μg d'échantillon d'ADN génomique à un volume final de 170 μL de solution d'ADN génomique en utilisant de l'eau exempte de nuclease.
    2. Préparer une réaction de PCR de 200 μl en mélangeant 2,5 μL chacun des amorces de biotine spécifiques au VIH-1 10 μM (L-BP et R-BP dans le tableau 1 : total de 10 μL pour quatre amorces spécifiques au lentivirus), 20 μL de 10X thermostable Le tampon ADN polymérase, 4 μL de dNTP 10 mM (final: 200 μM de chaque dNTP), 3 μL d'ADN polymerase thermostable 2,5 U / μL et 163 μL d'ADN génomique.
      NOTE: Pour les vecteurs gammarérovirales (vecteurs pMX), utiliser 5 μL chacun des deux amorces de biotine spécifiques à la pMX 10 μM (L-BP et R-BP: total de 10 μL) au lieu des quatre amorces de biotine spécifiques au VIH-1 ci-dessus.
    3. Divisez la solution en quatre tubes de PCR (chaque 50 μL) et effectuez un seul cycle d'extension dans les conditions suivantes: 94 ° C pendant 5 min, 56 ° C pendant 3 min, 72 ° C pour 5Min, et 4 ° C pour le stockage.
    4. Collez les quatre réactions de PCR dans un tube de microcentrifugeuse de 2 mL et suivez la procédure de purification par PCR du kit de purification par PCR. Eluir avec 50 μL de tampon d'élution (tampon d'élution 5 fois dilué à l'eau fourni dans le kit). Commencez immédiatement avec l'étape 1.3.1 ou stockez l'ADN élue à -20 ° C.
  3. RsaI et CviQI digestion
    1. Préparer une réaction de digestion de 100 μl en ajoutant 50 μL d'ADN (à partir de l'étape 1.2.4), 10 μL de 10x tampon A et 2 μl (20 U) d'enzyme RsaI. Incuber à 37 ° C pendant 1 h dans un instrument de PCR.
    2. Ajouter 1 μL (10 U) d'enzyme CviQI à la réaction et incuber à 25 ° C pendant 30 minutes dans un instrument de PCR. Commencez immédiatement avec l'étape 1.4.1
  4. Blunt ending:
    1. Préparez un mélange de 4,5 μL contenant 2,5 μL de fragment d'ADN Polymerase I large (klenow) et 2 μL de dNTP 10 mM. Transfert 181; L du mélange à l'échantillon d'ADN de l'étape 1.3.2. Le volume total sera de 102 μL. Bien mélanger en vortex et incuber à 25 ° C pendant 1 h dans un instrument de PCR. Commencez immédiatement avec l'étape 1.6.1.
  5. Préparation des perles de streptavidine:
    1. En bref, tourbillonner la solution de talle de streptavidine et transférer 50 μL à un nouveau tube de microcentrifugeuse de 2 mL. Retirer le surnageant à l'aide du support magnétique et laver les perles avec 200 μL de solution de liaison.
    2. Remettre en suspension les perles dans 100 μl de solution de liaison et déposer le tube hors du support magnétique. Commencez immédiatement avec l'étape 1.6.1.
  6. Reliure des talons de streptavidine:
    1. Transférer 100 μL d'échantillon d'ADN (étape 1.4.1) à la solution de bourrage ré-suspendue de 100 μl (étape 1.5.2) et mélanger soigneusement par pipettage pour éviter tout moussage de la solution. Incuber le tube à température ambiante pendant 3 h sur une roue rotative ou un rouleau.
    2. Utilisez le support magnétique pour capturer les perles et jeter le surnageant. Laver les billes deux fois dans 400 μl de solution de lavage et deux fois dans 400 μL de 1x T4 ADN ligase tampon (dilué à partir de solution 10X en utilisant de l'eau libre de nuclease).
    3. Remettre en suspension les perles dans 200 μl de tampon T4 ADN ligase (dilué à partir de la solution 10X en utilisant de l'eau exempte de nuclease) et l'éloigner du support magnétique. Commencez immédiatement avec l'étape 1.7.1.
  7. Ligature du lieur:
    1. Préparer une solution de réaction de ligation de 400 μl dans un tube de microcentrifugeuse de 2 mL en mélangeant 0,5 μL du lieur d'ADN (étape 1.1.2), 10 μl de 10x T4 DNA Ligase, 20 μL de 5X T4 ADN ligase tampon (contenant 25% de polyéthylène Glycol), 5 μL d'ADN ligase T4, 164,5 μL d'eau libre de nuclease et 200 μL des billes ré-suspendues (étape 1.6.3). Placer le tube de réaction sur la roue rotative et incuber à la température ambiante (22 ° C) pendant 3 h (ou 16 ° CO / N). Laver les billes deux fois avec la solution de lavage et deux fois avec du tampon ADN polymerase thermostable 1X (dilué à partir de la solution 10x en utilisant de l'eau exempte de nuclease) en utilisant le support magnétique.
    2. Remettre en suspension les perles dans 50 μl de tampon de PCR d'ADN polymérase 1x thermostable et l'éloigner du support magnétique. Commencez immédiatement avec l'étape 1.8.1 ou conservez à 4 ° C pendant un jour.
  8. Préamplification de l'ADN de la jonction gauche et droite:
    1. Préparer une réaction de PCR de 200 μl en ajoutant 10 μL d'amorce 1L 10 μM, 10 μl d'amorce 1R 10 μM, 20 μL de couche 1 d'amorce 10 μM (Tableau 1), 10 μl de tampon ADN polymérase 10X thermostable, 4 μL de DNTP 10 mM (finale: 200 μM de chaque dNTP), 8 μL (20 U) d'ADN polymérase thermostable, et 88 μL d'eau libre de nuclease aux billes ré-suspendues (50 μL) de l'étape 1.7.3.
    2. Aliquotez le mélange réactionnel en 4 tubes PCR (chacun 501; L) et effectuer la PCR avec la condition suivante: 94 ° C d'incubation pendant 2 min; 25 cycles de 94 ° C pendant 20 s, 56 ° C pendant 25 s et 72 ° C pendant 2 min; Et une extension finale à 72 ° C pendant 5 min.
    3. Collez les 4 réactions de PCR dans un tube de microcentrifugeuse de 2 mL et suivez la procédure de purification par PCR du kit de purification par PCR. Appliquer avec 50 μL de tampon d'élution.
    4. Déterminer la concentration d'ADN et les valeurs de 260/280 nm en utilisant un spectrophotomètre UV-Vis; L'ADN peut être stocké à -20 ° C jusqu'à ce qu'il soit prêt pour l'étape suivante. Procédez aux étapes 1.9.1 / 1.10.1 (facultatif) ou directement avec les étapes 1.11.1 / 1.12.1.
  9. Retrait de l'amplicon d'ADN interne côté gauche (facultatif):
    1. Transférer jusqu'à 100 ng de produit d'ADN PCR de l'étape 1.8.4 à un tube de microcentrifugeuse de 2 mL et ajuster le volume à 10 μL en utilisant de l'eau exempte de nuclease.
    2. Préparez une réaction enzymatique de restriction ciblant spécifiquement le D intérieur interne gaucheNA amplicon.
      NOTE: L'état de la réaction peut varier en fonction du choix de l'enzyme. Par exemple, lors de l'élimination de l'ADN interne côté gauche des vecteurs lentiviraux à base de NL4.3, ajouter 1 μl de pvuII , 2 μL de tampon B et 7 μl d'eau exempte de nuclease. Incuber à 37 ° C pendant 1 h dans un instrument de PCR. Commencez immédiatement avec l'étape 1.11.1 ou conservez à -20 ° C.
  10. Retrait de l'amplicon d'ADN interne côté droit (facultatif):
    1. Procédez de la même manière qu'à l'étape 1.9.1.
    2. Préparez une réaction enzymatique de restriction ciblant spécifiquement l'amplicon d'ADN interne côté droit.
      NOTE: Par exemple, lors de l'élimination de l'ADN interne du côté droit des vecteurs lentiviraux basés sur NL4.3, ajouter 1 μL de sfoI , 2 μL de tampon B et 7 μL d'eau exempte de nuclease. Incuber à 37 ° C pendant 1 h dans un instrument de PCR. Commencez immédiatement avec l'étape 1.12.1 ou conservez-la à -20 ° C.
  11. La gaucheAmplification spécifique à la jonction:
    1. Préparer une réaction de PCR de 50 μl en mélangeant 5 μL d'ADN à partir de l'étape 1.8.4 (ou de l'étape facultative 1.9.2), 5 μL d'amorce 2L 10 μM (finale: 1 μM), 5 μL d'amorce μ μm μ2 (Finale: 1 uM), 5 μL de tampon ADN polymérase thermostable 10x, 1 μL de dNTP 10 mM (finale: 200 μM de chaque dNTP), 2 μL (5 U) d'ADN polymérase thermostable et 27 μL de nuclease-libre eau.
    2. Effectuer la PCR avec la condition suivante: 94 ° C d'incubation pendant 3 min; 8-15 cycles de 94 ° C pendant 20 s, 56 ° C pendant 25 s et 72 ° C pendant 2 min; Et une extension finale à 72 ° C pendant 5 min.
      NOTE: L'ADN amplifié peut être conservé à -20 ° C. * L'optimisation du nombre de cycles est suggérée.
    3. Suivre la procédure de purification par PCR du kit de purification par PCR. Appliquer avec 50 μL de tampon d'élution. Déterminer la concentration d'ADN et les valeurs de 260/280 nm.
  12. Toutes les procédures sont identiques à "amplification spécifique à la jonction gauche" (étapes 1.11.1-1.11.3), à l'exception de l'utilisation de différentes amorces; Utiliser l'amorce spécifique à la jonction droite (2R-primer, voir tableau 1 ) dans cette étape.
  • Test de variation de longueur d'amplicon PCR:
    1. Analyser les variations de longueur d'amplicon de PCR en effectuant une électrophorèse sur gel d'agarose à 2% ou une électrophorèse capillaire ( Figure 2 ).
      NOTE: Il s'agit d'une étape essentielle pour confirmer l'achèvement des procédures d'analyse et pour une évaluation approximative des modèles IS en fonction des modèles de bande PCR. L'amplicon de PCR purifié à partir des étapes 1.11.3 et 1.12.3 peut être utilisé pour diverses plates-formes de séquençage d'ADN. Procédez avec les procédures de préparation d'échantillon appropriées pour le séquençage classique de la terminaison de la chaîne (Sanger) ou le séquençage de la prochaine génération. L'ADN peut être stocké à -20 °; C.
  • 2. Analyse de séquence informatique IS

    1. Préparation des fichiers de données:
      1. Préparez trois fichiers de données d'entrée: un fichier de données de séquence de format fasta (Test_data.fa dans des données supplémentaires), un fichier tsv pour les motifs de recherche pour les séquences vectorielles et de liaison (Demultiplexing_Trimming_blunt_GTAC.tsv dans des données supplémentaires) et un fichier tsv pour l'information sur les enzymes de restriction (Enzyme.tsv dans les données supplémentaires).
        REMARQUE: ces fichiers sont nécessaires pour le démultiplexage, la coupe des séquences vectorielles et des liens, et la suppression des séquences vectorielles internes ( Figure 3A ). Des instructions détaillées étape par étape pour la mise en œuvre du flux de travail de calcul sont fournies dans le fichier README.txt dans les données supplémentaires.
    2. Analyse computationnelle:
      1. Exécutez des scripts de démultiplexage et de recadrage.
        REMARQUE: la séquence brute sera traitée pour le démultiplexage et pour la coupeG du vecteur, du lieur et des séquences d'amorces (voir STEP-1 dans le fichier README.txt supplémentaire).
      2. Exécutez la commande de mappage (voir STEP-2 dans le fichier README.txt) pour mapper les séquences traitées sur le génome de référence à l'aide d'un outil d'alignement BLAST-like (BLAT; www.genome.ucsc.edu).
      3. Exécutez le script d'analyse IS quantitatif (voir STEP-3 dans le fichier README.txt).
        REMARQUE: Deux fichiers de sortie (Initial_count_without_homopolymer_correction.txt et Final_count.txt) seront générés. Vous trouverez plus de détails sur la cartographie et les stratégies d'énumération des séquences dans le fichier README.txt dans les données supplémentaires et dans les publications précédentes 2 , 15 .

    Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    L'essai IS bidirectionnel a généré différentes tailles d'amplicons de PCR pour les jonctions d'hôte vecteur amont (gauche) et aval (droite) ( Figure 2 ). La taille d'un amplicon de PCR dépend de l'emplacement du motif GTAC le plus proche en amont et en aval d'un integrome. L'essai a également produit des amplicons internes de PCR d'ADN: des séquences rétrovirales proches du tube de polypurine et le site de liaison de l'amorce ont été amplifiés concomitamment lors de la PCR de jonction gauche et droite, respectivement. Les bandes d'amplicon PCR peuvent être visualisées par électrophorèse capillaire ou agarose (2%).

    Après le séquençage, les séquences de jonction gauche et droite ont été analysées par un script de programmation interne pour le prétraitement des séquences brutes (y compris le démultiplexage et la coupe du vecteur et de l'ADN du lieur), cartographier les séquences IS sur le génome, identifier et compter IS identiqueSéquences et application des procédures de correction d'erreur ( Figure 3 ). Les emplacements de l'extrémité 5 'des séquences de requête dans le génome de référence sont considérés comme IS et sont utilisés pour le comptage initial de chaque IS. Les critères déterminant les deux séquences correspondantes - les séquences de jonction amont (gauche) et aval (droite) originaires du même integrome - sont basés sur les séquences nucléotidiques de l'intégration concertée spécifique au retrovirus et sont les suivants: (i) Deux séquences de jonction Aligner sur le génome dans les orientations opposées. (Ii) L'IS des deux séquences de jonction est séparé par un chevauchement de 5 pb pour les virus du virus de l'immunodéficience humaine (VIH) et un chevauchement de 4 pb pour les virus du virus de la leucémie murine (MLV). Les premiers 5 pb des deux jonctions du VIH et 4 pb des jonctions MLV sont complémentaires.

    Les comptes de séquence IS sont déterminés en trois étapes: (1) cartographie des séquences IS sur le génomeEn utilisant BLAT, qui génère la qualité de la cartographie et sépare les séquences IS individuelles en groupes "single-hit", "multi-hit", "no-hit" et "others"; (2) en utilisant l'outil de recherche d'alignement local de base (BLAST) pour comparer les séquences à un seul coup avec d'autres séquences subitement optimisées, y compris les multi-hits, les no-hits et d'autres; Et (3) identifier et corriger les erreurs de séquençage, y compris les erreurs d'homopolymère. Les séquences multi-hit sont des séquences IS qui peuvent aligner deux positions génomiques ou plus avec un score de cartographie élevé. Bien que utiles pour identifier et quantifier les populations clonales, les séquences multi-hit ne peuvent pas être utilisées pour caractériser les schémas de distribution du site d'intégration génomique (par exemple, association avec des gènes, des répétitions ou d'autres caractères génomiques). Dans de rares cas, les deux séquences de jonction présentent différentes qualités de cartographie. Par exemple, on montre "single-hit", tandis que la séquence correspondante montre "multi-hit". Dans de tels cas, les deuxLes séquences sont traitées comme des séquences "single-hit".

    Une partie des séquences IS avec des scores de cartographie sous-optimale, montrant un pourcentage élevé d'appariement du génome (identité) avec une taille de requête anormale (QSIZE), ou vice versa, ont été séparés de "no-hits" et regroupés en "autres" pour un supplément et souvent Réévaluation manuelle. Par exemple, lors de l'utilisation de BLAT pour la cartographie génomique, certaines séquences IS peuvent présenter une QSIGE anormale due à des nucléotides qui correspondent à une erreur dans le premier ou le dernier 5-10 nucleotides. Ces séquences ne répondent souvent pas aux critères de cartographie pour l'état «unique-coupé» ou «multi-hit», malgré un résultat de cartographie relativement élevé.

    Un exemple de fichier de données de séquence brute (Test_DATA.fa: 33 374 séquences) et des exemples de fichiers de données de sortie sont fournis en tant que données supplémentaires. 1 μg d'ADN génomique à partir de cellules repopulantes humaines, transduit avec un prêt Des vecteurs ivirales (FG12) dans une souris 17 médullaire médullaire / foie / thymus (BLT) ont été analysés à l'aide du dosage bidirectionnel. Retroviral IS a été trouvé dans tout le génome. Typiquement, les vecteurs lentiviraux sont surreprésentés dans les gènes, tandis que les vecteurs gamma-rétroviraux sont surreprésentés dans les sites de départ de la transcription 16 ( Figure 4 ). À partir de deux échantillons cellulaires réapprovisionnés par l'homme, un total de 1 081 séquences - 851 provenant de l'amont (gauche) et 230 des jonctions aval (droite) - étaient qualifiées de séquences IS. A partir de ces séquences, 93 IS unique dans la gauche et 50 IS unique dans les jonctions correctes ont été identifiés. Parmi ceux-ci, 44 ont été identifiés dans les jonctions (gauche et droite), montrant un total de 99 integromes uniques dans les échantillons de test. Les IS sont significativement enrichis en gènes (66%, p <0,0001) par rapport aux événements aléatoires ( figure 4A ).

    "> Les échantillons des séquences du site d'intégration du vecteur gamma-retrovirus (pMX) sont également inclus dans le fichier de données de test. À partir d'un échantillon de cellules mixtes Pmx, transduit avec pMX exprimant Oct4, cMyc, Klf4 et Sox2, 1 611 séquences IS et 129 uniques Les IS ont été identifiés. De 65 et 76 IS identifiés dans les jonctions gauche et droite, respectivement, 12 étaient dans les deux jonctions.

    On a déjà montré que les amplicons de PCR de ≥500 pb sont mal séquencés dans la plate-forme de pyrose-cadence, tandis que les amplicons de PCR de <500 pb sont généralement bien séquencés, sans biais notable en ce qui concerne les longueurs de séquence 15 . Ainsi, les données de séquence provenant d'amplicons de PCR ≥ 500 pb ont été exclues pour éliminer le biais de séquençage associé à la longueur. Seules les données provenant de <500 pb d'amplicon de PCR (appelées vecteur quantifiable d'intégrome ou QVI) ont été utilisées pour une analyse clonale quantitative. Les fréquences de détection relatives des intégrés vectorielsOnt été calculés en utilisant uniquement les comptes de séquence des jonctions IS générant des amplicons de PCR <500 pb ( figure 4B -4D , voir également le tableau 2 ). Environ 77% des vecteurs pourraient être analysés quantitativement par cette stratégie ( figure 4B ). En conséquence, les fréquences calculées pour chaque QVI étaient censées surévaluer les vraies fréquences dans l'échantillon ( Figure 4E ) de 1.25x.

    Figure 1
    Figure 1: Vue schématique de l'analyse du site d'intégration bidirectionnelle. L'ADN retroviral double brin (noir et rouge) flanqué par l'ADN cellulaire (bleu) est montré. Les flèches représentent des amorces oligonucléotidiques, et les flèches avec un astérisque représentent des amorces de biotine. Les ADN de Linker sont désignés par des lignes violettes. En bref, une extension linéaire de gaucheLes amorces de biotine (L-BP) et les amorces de biotine droites (R-BP) à partir du répétitif viral long terme (LTR) génèrent de l'ADN IS à double brin biotinylé. Après la digestion avec CviQI et RsaI, l'ADN double brin biotinylé est enrichi en utilisant une liaison spécifique à la streptavidine-biotine et sont ligaturés avec un ADN de liaison. Les ADN de jonction vectorielle-hôte ligaturés, liés par la streptavidine, sont amplifiés par une PCR en deux étapes: pré-amplification (amplification des jonctions gauche et droite) suivie de deux PCR anées, chacune ciblant les jonctions gauche et droite. Cliquez ici pour voir une version plus grande de ce chiffre.

    Figure 2
    Figure 2: Image d'amplicon PCR représentative. ( A ) L'analyse par électrophorèse capillaire montre des longueurs variables de l'amplificateur PCRDans des sites d'intégration de vecteurs lentiviraux (FG12) après la digestion pvuII ou sfoI . Des bandes de PCR variables pour les jonctions d'hôte vecteur amont (gauche) et aval (droite) sont représentées. Les têtes sombres de la flèche indiquent les amplicons d'ADN du vecteur interne restant après la digestion pvuII ou sfoI. Le marqueur de taille d'ADN (0,1 - 2,5 kbp) se trouve sur la voie M. Les têtes de flèche ouvertes indiquent les marqueurs d'alignement (15 et 5 000 pb). Les marqueurs d'alignement d'ADN sont utilisés pour l'étalonnage de la variation de temps de migration dans tous les canaux. ( B ) Sites d'intégration de vecteurs gamma-rétroviraux (pMX) dans des clones de cellules murines transduites avec de multiples vecteurs pMX. Les ADN de jonction gauche et droite, ainsi que les amplicons internes d'ADN vectoriel (têtes de flèche), sont montrés. Les têtes de flèches sombres et ouvertes indiquent respectivement l'ADN vectoriel interne et les marqueurs d'alignement. Le marqueur de taille d'ADN (50 à 1 500 pb) se trouve sur la voie M. Des détails sur l'électrophorèse capillaire peuvent être trouvés dans l'entrepriseprotocole. Cliquez ici pour voir une version plus grande de ce chiffre.

    figure 3
    Figure 3: Analyse de séquence de site d'intégration. ( A ) Un organigramme pour l'analyse de données de calcul. Trois fichiers de données, y compris un fichier de séquence de format fasta, un fichier avec des motifs de séquence de référence pour le démultiplexage et la coupe, et un fichier contenant des informations sur les enzymes de restriction sont requis. Des exemples de fichiers, y compris Test_DATA.fa (données de séquence), Demultiplexing_Trimming.tsv (motifs de séquence de recherche) et Enzyme.tsv (séquence de reconnaissance d'enzyme de restriction) sont fournis sous forme de fichiers de données supplémentaires. Les séquences traitées (séquences génome-hôte) de la Partie 1 seront mappées par rapport à la référence à l'aide de BLAT. Emplacements à l'extrémité 5 'de la séquence de requêtesEs dans le génome de référence sont considérés comme les sites d'intégration ( tableau 2 ). Les comptes de séquence pour chaque IS sont déterminés en trois étapes: (1) cartographie des séquences IS sur le génome en utilisant BLAT; (2) en comparant les séquences IS d'un seul coup (alignement sur un site unique du génome de l'hôte) avec d'autres séquences qui ont été cartographiées de façon incomplète sur le génome; Et (3) identifier et corriger les erreurs de séquençage. Plus d'informations sur la cartographie et les stratégies d'énumération des séquences peuvent être trouvées dans les études précédentes 2 , 15 . ( BC ) Deux échantillons de séquences d'ADN monocaténaires pour les jonctions vecteur-hôte en aval (B) et amont (C) sont représentées. Les amorces Pyrosequencing A et B (vert) sont utilisées pour la PCR et le séquençage des gouttelettes. Les codes de couleur concordent avec ceux de la figure 1 . La séquence de jonction en aval de l'échantillon (B) inclut Primer A (vert), MID (vert), extrémité vectorielle U5 (rouge), génome hôte (bleu), liNker (violet) et Primer B (vert). Dans un séquençage d'ADN mixte (en amont et en aval), l'amorce A est utilisé pour séquencer les jonctions aval (B), et l'amorce B est utilisé pour séquencer les jonctions amont. L'échantillon de la séquence de jonction en amont (C) inclut Primer B, MID, Vector U3 end, host genome, linker, et Primer A. Cliquez ici pour voir une version plus grande de ce chiffre.

    Figure 4
    Figure 4: Exemple représentatif de l'analyse du site d'intégration bidirectionnelle. ( A ) Pourcentage d'intégration dans les répétitions de Gène (refseq), Alu et LINE 1 (L1) de vecteurs lentiviraux dans des cellules reproductrices de souris humanisées (LV-huMice), par rapport à 10 000 événements d'intégration aléatoire générés par silico . Les sites d'intégration sont mappésSur le génome humain (hg19). Les sites d'intégration de LV-huMice sont nettement plus représentés dans Genes ( p <0.0001, approximation chi-carré) ( B ) Analyse in silico de 10 000 événements d'intégration aléatoire. Avec une approche unidirectionnelle, environ 52% des integromes aléatoires ont généré des amplicons de PCR de <500 pb, alors qu'avec une approche bidirectionnelle, 77% ont généré un amplicon de PCR de <500 pb dans les jonctions gauche ou droite. Les amplicons de PCR de plus de 500 pb sont séquentiellement inefficaces avec le platose de pyrosequencing 2 , 15 et devraient donc être exclus des analyses de données quantitatives. ( C ) Stratégie pour la quantification clonale. Chaque clone individuel partage le même vecteur integrome (ou IS). Les fréquences relatives des jonctions gauche (x) et droite (y) sont combinées pour représenter les quantités relatives des populations clonales (integromes vectoriels quantifiables ou QVI). Integ Les sites de rationnement qui n'ont pas de motif GTAC à moins de 450 pb sont disqualifiés (dQ) et éliminés de l'analyse de quantification. ( D ) Les fréquences relatives (par rapport à toutes les séquences QVI) de 44 clones QVI dans des cellules repopulées de souris humanisées sont représentées dans un schéma de couleurs (du blanc au rouge: 0 à 0,16). ( E ) Surestimation prévue des fréquences clonales avec analyse bidirectionnelle. Sur la base de l'analyse de l'intégration aléatoire in silico 10 000, une surestimation de 1,25 fois est attendue lors de l'utilisation d'enzymes de motifs GTAC ( RsaI et CviQI ) en raison de clones d'approximativement 20% de dQ. Une surestimation de 2,56x est attendue en raison d'environ 60% de clones dQ lors de l' utilisation de l' enzyme motif TCGA ( TaqαI ). Cliquez ici pour voir une version plus grande de ce chiffre.

    Oad / 55812 / 55812table1.jpg "/>
    Tableau 1: Oligonucléotides pour l'analyse du site d'intégration vectorielle Lentiviral et Gamma-retroviral. * 5BioTEG: modification de la biotine à la fin du 5 '. Cliquez ici pour voir une version plus grande de ce tableau.

    Tableau 2
    Tableau 2: Données de compte séquentiel du site d'insertion représentatif. Cliquez ici pour voir une version plus grande de ce tableau.
    1 Carte: les séquences du site d'intégration peuvent être mappées sur un emplacement unique (single-hit) ou plusieurs loci (multi-hit) du génome de référence. NA (non disponible): aucune séquence n'a été détectée.
    2 STRD: orientation de la séquence de requêtes dans le génome
    3 QLEN: la longueur de la séquence de requête
    4 GLEN: la longueur attendue de la séquence du site d'intégration, calculée en fonction de la distance du motif GTAC disponible le plus proche du génome au site d'insertion. GLEN <450 pb sont acceptés pour les analyses quantitatives.
    5 Total_Count: nombre total de séquences
    6 Les sites d'intégration sont affichés par un nombre de chromosome (CHR) et un numéro de site pour la jonction droite (CHR_SITE1) et un nombre pour la jonction gauche (CHR_SITE2). CHR_SITE1 et CHR_SITE2 sont séparés de 5 paires pour les vecteurs lentiviraux et 4 paires de pixels pour les vecteurs MLV (pMX)
    7 La séquence compte pour la jonction droite (R_A) et la jonction gauche de l'échantillon A (L_A); La séquence compte pour la jonction droite (R_B) et la jonction gauche de l'échantillon B (L_B)
    * Disqualifié (dQ): GLEN ≥450 in silico bp

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    L'essai bidirectionnel permet d'analyser simultanément les séquences de jonction d'ADN vecteur-hôte amont (gauche) et aval (droite) et est utile dans plusieurs applications de thérapie génique, de cellules souches et de recherche sur le cancer. L'utilisation d'enzymes de motif GTAC (RsaI et CviQI) et l'approche PCR bidirectionnelle améliore considérablement les chances de détection d'un integrome (ou d'une population clonale) par rapport aux dosages à base d'enzymes motifs TCGA ( TaqαI ) 2 , 15 et autres Approches unidirectionnelles LM-PCR 5 . Le dosage bidirectionnel améliore l'analyse de l'IS, en particulier dans les échantillons d'ADN limités qui apparaissent souvent dans des études cliniques ou à modèles de petits animaux.

    Les étapes 1.1-1.7 sont une étape critique et devraient être effectuées sans délais inutiles. Ces étapes se font généralement en une journée. Le test des enzymes avant ces étapes est fortement recommandé. ÉtapeS 1.9 et 1.10 sont facultatifs. Ces étapes réduiront les séquences internes d'ADN du vecteur qui sont amplifiées concomitamment avec des séquences IS. Le tableau 1 fournit des séries d'amorces adaptées à l'analyse de l'IS des vecteurs dérivés du VIH-1, NL4.3 de type sauvage NL4.3, y compris FG12 21 et vecteurs gammaréviraux à base de pMX 22 . En fonction des variations de nucleotides dans les séquences de répétition terminale longue (LTR), la conception de l'amorce et l'approche expérimentale peuvent nécessiter une modification appropriée.

    Le logiciel blat utilisé pour le mappage n'est compatible qu'avec le format fasta et ne fonctionne pas avec les fichiers Fastq. On peut convertir les fichiers fastq en fasta en utilisant différents outils logiciels, tels que FASTX-Toolkit ou BBTools. Un utilisateur ayant une connaissance basique de python peut utiliser Biopython pour convertir les fichiers fastq en fasta pour les mapper avec blat.

    On s'attend à ce qu'une partie de l'IS ne soit pas détectée avec le bidirectionnel IS et, même si détecté, ne seront pas admissibles à la quantification clonale en aval. Lorsque des enzymes de motif GTAC ont été utilisées, environ 23% des integromes dans les données de séquence générées par la plate-forme pyrosequencing n'ont pas passé les critères d'analyse pour l'analyse quantitative de séquence IS ( Figure 4 ). Lorsque la couverture globale de l'IS est essentielle, par exemple dans la surveillance de la sécurité des cellules génétiquement modifiées dans les paramètres de la thérapie génique, il est conseillé de choisir un essai avec un accès illimité au génome IS 8 , 9 , 10 , 11 , 12 ou de réanalyser le Même échantillon avec une combinaison différente ou optimisée de restrictases 4 , 18 .

    IS avec un accès génome sans restriction, tel que la PCR LAM non restrictive et l'estimation de cisaillement aléatoireOaches 19 , 20 , sont particulièrement prometteurs pour une analyse complète de l'IS. Ces approches utilisent des technologies qui sont relativement difficiles à contrôler, ce qui rend difficile de prédire le résultat de la fragmentation de l'ADN génomique et de l'amplification de l'IS. D'autre part, les essais IS utilisant des enzymes de restriction bien caractérisées présentent deux avantages majeurs: (1) Il est relativement facile de calibrer et d'optimiser les analyses, car les résultats de l'analyse sont plus prévisibles en raison de la spécificité de la réaction enzymatique et de la disponibilité de Séquences de génome de référence. (2) Les données de séquence sont hautement reproductibles une fois que les conditions d'analyse ont été optimisées. La PCR bidirectionnelle avec des conditions optimisées s'est révélée utile pour la quantification clonale à grande échelle et précise 2 , 15 . Bien que seulement une partie des populations clonales existantes aient été analysées en raison du biais de restriction enzymatique, les quantités d'individus L ont été mesurés avec précision, permettant ainsi la détermination précise des variations de taille de clone dans et à travers des échantillons. Un nombre suffisant de clones a été généré pour déterminer les comportements des cellules souches et l'hétérogénéité fonctionnelle.

    Les amplicons de PCR produits à partir de cette procédure de PCR bidirectionnelle conviennent à toute plate-forme de séquençage en aval. En raison de la grande sensibilité du dosage, il faut faire très attention pour prévenir la contamination croisée en effectuant des expériences dans une pièce sans contamination. L'inclusion d'une expérience de contrôle négative (sans modèle) est conseillée pour toutes les étapes de la PCR. Même avec la pratique la plus prudente, la prévention de la contamination croisée entre échantillons et échantillons est extrêmement difficile. Ainsi, lors de la comparaison des populations clonales de différents échantillons, il est conseillé d'utiliser un contrôle de collision, qui supprime les données potentiellement contaminées 23 et un seuil de clones peu fiables à basse fréquence> 2 pour minimiser le bruit provenant de l'ADN contaminé par la contamination. L'approche bidirectionnelle génère des données IS pour les deux extrémités des integromes, offrant ainsi une possibilité supplémentaire de réduire les fausses erreurs de détection potentielles faussaires.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Les auteurs n'ont rien à dévoiler.

    Acknowledgments

    Le financement a été fourni par les Instituts nationaux de subventions de santé R00-HL116234, U19 AI117941 et R56 HL126544; La Fondation nationale pour la science Grant DMS-1516675; La National Research Foundation of Korea (NRF-2011-0030049, NRF-2014M3C9A3064552); Et le programme d'initiative KRIBB.

    Materials

    Name Company Catalog Number Comments
    Thermostable DNA polymerase Agilent 600424 PicoMaxx Polymerase
    Thermostable DNA polymerase buffer Agilent 600424 PicoMaxx Polymerase buffer
    Deoxynucleotide (dNTP) solution mix New England Biolabs N0447L dNTP solution mix (10 mM each)
    PCR tubes VWR International 53509-304 PCR Strip Tubes With Individual Attached Caps
    2 mL microcentrifuge tube Molecular Bioproducts 3453 microcentrifuge tubes
    PCR purification kit Qiagen 28106
    RsaI  New England Biolabs R0167L restriction enzyme
    CviQI New England Biolabs R0639L restriction enzyme
    Buffer A New England Biolabs B7204S NEB CutSmart buffer
    DNA Polymerase I large (klenow) fragment  New England Biolabs M0210L Blunting
    streptavidin beads solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Binding Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Washing Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    magnetic stand ThermoFisher 12321D DynaMag™-2 Magnet
    T4 DNA ligase New England Biolabs M0202L T4 DNA ligase
    10X T4 DNA ligase buffer New England Biolabs B0202S T4 DNA ligase reaction buffer
    5X T4 DNA ligase buffer Invitrogen  46300-018 T4 DNA ligase buffer with polyethylene glycol-8000
    UV-Vis spectrophotometer Fisher Scientific S06497 Nanodrop 2000
    pvuII new England Biolabs R0151L restriction enzyme
    sfoI new England Biolabs R0606L restriction enzyme
    Buffer B new England Biolabs B7203S NEB buffer 3.1
    Nuclease free water Integrated DNA Technologies 11-05-01-14
    Capillary electrophoresis Qiagen 9001941 QIAxcel capillary electrophoresis
    Veriti 96-well Fast Thermal Cycler Thermo Fisher Scientific 4375305 PCR Instrument
    Rotating wheel (or Roller) Eppendorf M10534004 Cell Culture Roller Drums
    DNA size marker Qiagen 929559 QX size marker (100 - 2,500 bp)
    DNA size marker Qiagen 929554 QX size marker (50 - 1,500 bp)
    DNA alignment markers Qiagen 929524 QX DNA Alignment Marker
    genomc DNA Not Available Not Available Sample genomc DNA from in vivo or in vitro experiments

    DOWNLOAD MATERIALS LIST

    References

    1. Serrao, E., Engelman, A. N. Sites of Retroviral DNA Integration: From Basic Research to Clinical Applications. Crit. Rev. Biochem. Mol. Bio. 51 (1), 26-42 (2016).
    2. Kim, S., et al. Dynamics of HSPC Repopulation in Nonhuman Primates Revealed by a Decade-Long Clonal-Tracking Study. Cell Stem Cell. 14 (4), 473-485 (2014).
    3. Bushman, F. Retroviral integration and human gene therapy. J. Clin. Invest. 117 (8), 2083-2086 (2007).
    4. Bystrykh, L. V., Verovskaya, E., Zwart, E., Broekhuis, M., de Haan, G. Counting stem cells: methodological constraints. Nat Meth. 9 (6), 567-574 (2012).
    5. Schröder, A., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110 (4), 521-529 (2002).
    6. Silver, J., Keerikatte, V. Novel use of polymerase chain reaction to amplify cellular DNA adjacent to an integrated provirus. J. Virol. 64, 3150 (1990).
    7. Schmidt, M., et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat. Meth. 4 (12), 1051-1057 (2007).
    8. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39 (11), e72 (2011).
    9. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    10. Kim, S., Kim, Y., Liang, T., Sinsheimer, J., Chow, S. A high-throughput method for cloning and sequencing human immunodeficiency virus type 1 integration sites. J. Virol. 80 (22), 11313-11321 (2006).
    11. Maldarelli, F., et al. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345 (6193), 179-183 (2014).
    12. Wu, C., et al. High Efficiency Restriction Enzyme-Free Linear Amplification-Mediated Polymerase Chain Reaction Approach for Tracking Lentiviral Integration Sites Does Not Abrogate Retrieval Bias. Hum. Gene. Ther. 24 (1), 38-47 (2013).
    13. Aker, M., Tubb, J., Miller, D. G., Stamatoyannopoulos, G., Emery, D. W. Integration Bias of Gammaretrovirus Vectors following Transduction and Growth of Primary Mouse Hematopoietic Progenitor Cells with and without Selection. Mol. Ther. 14 (2), 226-235 (2006).
    14. Gabriel, R., Kutschera, I., Bartholomae, C. C., von Kalle, C., Schmidt, M. Linear Amplification Mediated PCR; Localization of Genetic Elements and Characterization of Unknown Flanking DNA. J Vis Exp. (88), e51543 (2014).
    15. Kim, S., et al. High-throughput, sensitive quantification of repopulating hematopoietic stem cell clones. J. Virol. 84 (22), 11771-11780 (2010).
    16. Mitchell, R., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2 (8), e234 (2004).
    17. Melkus, M., et al. Humanized mice mount specific adaptive and innate immune responses to EBV and TSST-1. Nat. Med. 12 (11), 1316-1322 (2006).
    18. Bystrykh, L. V. A combinatorial approach to the restriction of a mouse genome. BMC Res Notes. 6, 284 (2013).
    19. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. -P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol Biol. , 321-344 (2014).
    20. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    21. Qin, X., An, D., Chen, I., Baltimore, D. Inhibiting HIV-1 infection in human T cells by lentiviral-mediated delivery of small interfering RNA against CCR5. Proc Natl Acad Sci U S A. 100 (1), 183-188 (2003).
    22. Kitamura, T., et al. Retrovirus-mediated gene transfer and expression cloning: powerful tools in functional genomics. Exp. Hematol. 31 (11), 1007-1014 (2003).
    23. Cartier, N., et al. Hematopoietic stem cell gene therapy with a lentiviral vector in X-linked adrenoleukodystrophy. Science. 326 (5954), 818-823 (2009).

    Tags

    Genetics Numéro 124 Retrovirus sites d'intégration séquençage de la prochaine génération thérapie génique rétrovirale cellules souches cancers code-barres cellulaires bioinformatique
    Site d&#39;intégration bidirectionnel Retroviral Méthodologie PCR et analyse de données quantitatives Workflow
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Suryawanshi, G. W., Xu, S., Xie, Y., More

    Suryawanshi, G. W., Xu, S., Xie, Y., Chou, T., Kim, N., Chen, I. S. Y., Kim, S. Bidirectional Retroviral Integration Site PCR Methodology and Quantitative Data Analysis Workflow. J. Vis. Exp. (124), e55812, doi:10.3791/55812 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter