Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Sitio de Integración Retroviral Bidireccional Metodología de PCR y Flujo de Trabajo de Análisis de Datos Cuantitativos

Published: June 14, 2017 doi: 10.3791/55812
* These authors contributed equally

Summary

Este manuscrito describe el procedimiento experimental y el análisis de software para un ensayo de sitio de integración bidireccional que puede analizar simultáneamente el ADN de unión vector-huésped aguas arriba y aguas abajo. Los productos de PCR bidireccionales pueden utilizarse para cualquier plataforma de secuenciación aguas abajo. Los datos resultantes son útiles para una comparación cuantitativa de alto rendimiento de dianas de ADN integradas.

Abstract

Los ensayos del sitio de integración (IS) son un componente crítico del estudio de los sitios de integración retroviral y su importancia biológica. En estudios recientes de terapia génica retroviral, los ensayos de IS, en combinación con secuenciación de próxima generación, se han utilizado como una herramienta de seguimiento celular para caracterizar poblaciones de células madre clonales que comparten la misma IS. Para la comparación precisa de repoblar clones de células madre dentro y entre diferentes muestras, la sensibilidad de detección, la reproducibilidad de los datos y la capacidad de alto rendimiento del ensayo están entre las cualidades de ensayo más importantes. Este trabajo proporciona un protocolo detallado y flujo de trabajo de análisis de datos para el análisis bidireccional IS. El ensayo bidireccional puede secuenciar simultáneamente las uniones vector-huésped aguas arriba y aguas abajo. Comparado con los enfoques de secuenciación SI unidireccionales convencionales, el enfoque bidireccional mejora significativamente las tasas de detección de IS y la caracterización de eventos de integración en ambos extremos de tÉl se dirigió al ADN. La tubería de análisis de datos que aquí se describe con precisión identifica y enumera secuencias IS idénticas a través de múltiples pasos de comparación que mapean las secuencias de IS al genoma de referencia y determinan los errores de secuenciación. Utilizando un procedimiento de ensayo optimizado, hemos publicado recientemente los patrones detallados de repoblación de miles de clones de células madre hematopoyéticas (HSC) después del trasplante en macacos rhesus, demostrando por primera vez el momento preciso de la repoblación de HSC y la heterogeneidad funcional de HSCs en el Sistema de primates. El siguiente protocolo describe el procedimiento experimental paso a paso y el flujo de trabajo de análisis de datos que identifica y cuantifica con exactitud las secuencias IS idénticas.

Introduction

Los retrovirus insertan su ADN genómico en el genoma del huésped en varios sitios. Esta propiedad única, que puede contribuir al desarrollo de cánceres y otras formas de patogenia viral, tiene el beneficio irónico de hacer estos virus altamente susceptibles a la ingeniería celular para la terapia génica y la investigación básica de la biología. El Sitio de Integración viral (IS) - la ubicación en el genoma del host donde está integrado un ADN (virus) extraño - tiene implicaciones importantes para el destino tanto de los virus integrados como de las células huésped. Los ensayos de IS se han utilizado en diversos contextos de investigación biológica y clínica para estudiar la selección y la patogénesis del sitio de integración retroviral, el desarrollo del cáncer, la biología de células madre y la biología del desarrollo 1 , 2 , 3 , 4 . La baja sensibilidad de detección, la baja reproducibilidad de los datos y la frecuente contaminación cruzadaLos factores clave que limitan las aplicaciones de los ensayos de IS a los estudios actuales y previstos.

Se han desarrollado muchas tecnologías de análisis de IS. Los ensayos de sitios de integración basados ​​en enzimas de restricción, que incluyen la Reacción en Cadena de Polimerasa (PCR) 5 , la PCR inversa 6 y la PCR 7 de Medición de Amplificación Lineal (LAM), son las más ampliamente utilizadas. El uso de enzimas de restricción específicas de sitio, sin embargo, genera un sesgo durante la recuperación de la IS, permitiendo sólo un subconjunto de integromes (un ADN extraño integrado en el genoma del huésped) en la vecindad del sitio de restricción a ser recuperado [ 4] . En los últimos años también se han introducido tecnologías de ensayo que evalúan de forma más exhaustiva el vector IS. Estos ensayos emplean diversas estrategias, incluyendo la PCR 8 mediada por transposón Mu, la PCR 9 no restrictiva (nr) -LAM, la enzima de restricción tipo IILa digestión edificada 10 , el cizallamiento mecánico 11 y la PCR aleatoria basada en hexámero (Re-PCR libre) 12 , para fragmentar ADN genómicos y amplificar IS. Las tecnologías actuales tienen diferentes niveles de sensibilidad de detección, cobertura del genoma, especificidad del objetivo, capacidad de alto rendimiento, complejidad de los procedimientos de ensayo y sesgos en la detección de las frecuencias relativas de los sitios objetivo. Dadas las diferentes cualidades de los ensayos existentes y la variedad de propósitos para los cuales pueden ser usados, el enfoque de ensayo óptimo debe ser cuidadosamente seleccionado.

Este trabajo proporciona procedimientos experimentales detallados y un flujo de trabajo de análisis de datos computacionales para un ensayo bidireccional que mejora significativamente las tasas de detección y precisión de cuantificación de secuencias analizando simultáneamente el IS aguas arriba y aguas abajo del ADN diana integrado (ver la Figura 1 para una vista esquemática de los procedimientos de ensayo ). Este enfoque tambiénS los medios para caracterizar el proceso de integración retroviral (por ejemplo, la fidelidad de la duplicación del sitio objetivo y las variaciones en las secuencias genómicas de inserciones aguas arriba y aguas abajo). Se han utilizado otros métodos bidireccionales principalmente para clonar y secuenciar ambos extremos del ADN diana 11 , 13 , 14 . Este ensayo se optimiza ampliamente para la cuantificación de alto rendimiento y reproducible de clones marcados con vectores, utilizando el método LM-PCR bien establecido y la cartografía de análisis computacional, y para cuantificar las uniones tanto aguas arriba como aguas abajo. El análisis bidireccional con la enzima TaqαI ha demostrado ser útil para la cuantificación clonal de alto rendimiento en estudios preclínicos de terapia génica de células madre 2 , 15 . Este artículo describe un método modificado que utiliza un cortador más frecuente (RsaI / CviQI - motivo: GTAC) que dobla tLas posibilidades de detectar integromes en comparación con un ensayo basado en TaqαI . Se describen procedimientos experimentales detallados y procedimientos de análisis de datos que utilizan enzimas con motivo GTAC para el análisis IS vectorial lentiviral (NL4.3 y sus derivados) y gamma-retroviral (vectores pMX). Los oligonucleótidos usados ​​en el ensayo se enumeran en la Tabla 1 . En el documento complementario se proporciona un script de programación interno para el análisis de secuencias de IS.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Generación de las bibliotecas de secuencia de derivación (izquierda) y descendente (derecha)

  1. Preparación del enlazador de ADN:
    1. Preparar una solución de ADN de ligador de 10 μL añadiendo 2 μL de oligos LINKER_A 100 μM (final: 20 μM), 2 μL de oligos LINKER_B 100 μM (final: 20 μM), 2 μL de NaCl 5 M (final: 1M) y 4 μL de agua libre de nucleasa en un tubo de PCR. Véase la Tabla 1 para las secuencias enlazadoras.
    2. Incubar la solución de ADN del enlazador a 95 ° C durante 5 min en un instrumento de PCR, detener el programa de ejecución y apagar el instrumento de PCR. Dejar la solución de enlazador en el instrumento durante 30 minutos para enfriar lentamente el ADN del engarce. La solución de ADN enlazador se puede almacenar a 4ºC.
  2. Extensión de cebador de biotina específica de LTR:
    1. Utilizar un espectrofotómetro UV-Vis para determinar la concentración de ADN y los valores de 260/280 nm del ADN genómico de in vivoO experimentos in vitro . Diluir 1-2 μg de ADN genómico de muestra hasta un volumen final de 170 μl de solución de ADN genómico utilizando agua libre de nucleasa.
    2. Preparar una reacción de PCR de 200 μL mezclando 2,5 μl de cada uno de 10 μM de cebadores de biotina específicos para HIV-1 (L-BP y R-BP en la Tabla 1 : total de 10 μl para cuatro cebadores específicos de lentivirus), 20 μl de 10X termoestable ADN polimerasa, 4 μL de dNTP 10 mM (final: 200 μM de cada dNTP), 3 μL de 2,5 U / μl de ADN polimerasa termoestable y 163 μL de ADN genómico.
      NOTA: Para los vectores gammaretrovirales (vectores pMX), utilice 5 μl de cada uno de dos cebadores de biotina específicos de pMX 10 μM (L-BP y R-BP: total de 10 μl) en lugar de los cuatro cebadores de biotina específicos de HIV-1 anteriores.
    3. Se divide la solución en cuatro tubos de PCR (cada 50 μl) y se lleva a cabo un único ciclo de extensión bajo las siguientes condiciones: 94 ° C durante 5 min, 56 ° C durante 3 min, 72 ° C durante 5Min, y 4 ° C para el almacenamiento.
    4. Reúna las cuatro reacciones de PCR en un tubo de microcentrífuga de 2 ml y siga el procedimiento de purificación por PCR del kit de purificación de PCR. Eluir con 50 μl de tampón de elución (5 veces el tampón de elución diluido en agua proporcionado en el kit). Proceder inmediatamente con el paso 1.3.1 o almacenar el ADN eluido a -20ºC.
  3. RsaI y CviQI digestión
    1. Preparar una reacción de digestión de 100 μL añadiendo 50 μl de ADN (de la etapa 1.2.4), 10 μl de 10 μg de tampón A y 2 μl (20 μl) de enzima RsaI. Incubar a 37 ° C durante 1 h en un instrumento de PCR.
    2. Añadir 1 μl (10 U) de enzima CviQI a la reacción e incubar a 25 ° C durante 30 min en un instrumento de PCR. Proceda inmediatamente con el paso 1.4.1
  4. Extremo romo:
    1. Preparar una mezcla de 4,5 μL que contiene 2,5 μL de fragmento grande de ADN Polimerasa I (klenow) y 2 μL de dNTP 10 mM. Transferencia 181; L de la mezcla a la muestra de ADN de la etapa 1.3.2. El volumen total será de 102 μl. Mezclar bien por vórtex e incubar a 25 ° C durante 1 h en un instrumento de PCR. Proceda inmediatamente con el paso 1.6.1.
  5. Preparación de perlas de estreptavidina:
    1. Vórtice brevemente la solución de perlas de estreptavidina y transfiera 50 μl a un nuevo tubo de microcentrífuga de 2 ml. Eliminar el sobrenadante usando el soporte magnético y lavar las perlas con 200 μl de solución de unión.
    2. Resuspender las perlas en 100 μl de solución de unión y colocar el tubo lejos del soporte magnético. Proceda inmediatamente con el paso 1.6.1.
  6. Estreptavidina:
    1. Transferir 100 μl del ADN de la muestra (paso 1.4.1) a la solución de 100 μL de resuspensión suspendida (paso 1.5.2) y mezclar cuidadosamente pipeteando para evitar cualquier formación de espuma de la solución. Incubar el tubo a temperatura ambiente durante 3 h en una rueda giratoria o en un rodillo.
    2. Utilice el soporte magnético para capturar las perlas y deseche el sobrenadante. Lavar las perlas dos veces en 400 μl de solución de lavado y dos veces en 400 μl de tampón de DNA-ligasa 1x T4 (diluido de solución 10X usando agua libre de nucleasa).
    3. Resuspender las perlas en 200 μl de tampón de ADN ligasa 1x4 T4 (diluido de solución 10X con agua libre de nucleasa) y colocarlo lejos del soporte magnético. Proceda inmediatamente con el paso 1.7.1.
  7. Enlace ligador:
    1. Preparar una solución de reacción de ligadura de 400 μl en un tubo de microcentrífuga de 2 ml mezclando 0,5 μl del adaptador de ADN (paso 1.1.2), 10 μl de tampón de ADN ligasa 10 x T4, 20 μl de tampón 5X de ADN ligasa T4 (que contiene 25% de polietileno Glicol), 5 μl de ADN ligasa T4, 164,5 μl de agua libre de nucleasa y 200 μl de perlas re-suspendidas (etapa 1.6.3). Colocar el tubo de reacción en la rueda giratoria e incubar a RT (22 ° C) durante 3 h (o 16 ° CO / N). Lavar las perlas dos veces con la solución de lavado y dos veces con tampón de ADN polimerasa 1X termoestable (diluido a partir de solución 10x usando agua libre de nucleasa) usando el soporte magnético.
    2. Resuspender las perlas en 50 μ l de 1x buffer de PCR polimerasa de ADN termoestable y colocarlo lejos del soporte magnético. Proceda inmediatamente con el paso 1.8.1 o guarde a 4 ° C durante un máximo de un día.
  8. Pre-amplificación del ADN de la unión izquierda y derecha:
    1. Preparar una reacción de PCR de 200 μL añadiendo 10 μl de cebador 1L 10 μM, 10 μL de cebador 1R 10 μM, 20 μL de cebador Primer 10 μM (Tabla 1), 10 μL de tampón 10X de ADN polimerasa termoestable, 4 μL de DNTP 10 mM (final: 200 μM de cada dNTP), 8 μl (20 U) de ADN polimerasa termoestable y 88 μl de agua libre de nucleasa a las perlas re-suspendidas (50 μl) de la etapa 1.7.3.
    2. Alícuota de la mezcla de reacción en 4 tubos de PCR (cada 501; L) y llevar a cabo la PCR con la siguiente condición: 94 ° C de incubación durante 2 min; 25 ciclos de 94ºC durante 20 s, 56ºC durante 25 s, y 72ºC durante 2 min; Y una extensión final a 72 ° C durante 5 min.
    3. Reúna las 4 reacciones de PCR en un tubo de microcentrífuga de 2 mL y siga el procedimiento de purificación por PCR del kit de purificación de PCR. Eluir con 50 μl de tampón de elución.
    4. Determinar la concentración de ADN y los valores de 260/280-nm utilizando un espectrofotómetro UV-Vis; El ADN se puede almacenar a -20 ° C hasta que esté listo para el siguiente paso. Proceda con los pasos 1.9.1 / 1.10.1 (opcional) o directamente con los pasos 1.11.1 / 1.12.1.
  9. Eliminación del amplicón de ADN interno del lado izquierdo (opcional):
    1. Transferir hasta 100 ng de producto de ADN de PCR del paso 1.8.4 a un tubo de microcentrífuga de 2 ml y ajustar el volumen a 10 μl usando agua libre de nucleasa.
    2. Preparar una reacción de enzima de restricción dirigida específicamente a la D interna del lado izquierdoNA amplicón.
      NOTA: La condición de reacción puede diferir dependiendo de la elección de la enzima. Por ejemplo, cuando se elimina el ADN interno del lado izquierdo de vectores lentivirales basados ​​en NL4.3, se añade 1 μl de pvuII , 2 μl de tampón B y 7 μl de agua libre de nucleasa. Incubar a 37 ° C durante 1 h en un instrumento de PCR. Proceda inmediatamente con el paso 1.11.1 o guarde a -20 ° C.
  10. Eliminación del amplicón de ADN interno del lado derecho (opcional):
    1. Proceda de la misma manera que en el paso 1.9.1.
    2. Prepare una reacción de enzima de restricción dirigida específicamente al amplicón de ADN interno del lado derecho.
      NOTA: Por ejemplo, al eliminar el ADN interno del lado derecho de vectores lentivirales basados ​​en NL4.3, añada 1 μl de sfoI , 2 μl de tampón B y 7 μl de agua libre de nucleasa. Incubar a 37 ° C durante 1 h en un instrumento de PCR. Proceda inmediatamente con el paso 1.12.1 o guarde a -20 ° C.
  11. Izquierda- amplificación específica de la función:
    1. Preparar una reacción de PCR de 50 μL mezclando 5 μl de ADN del paso 1.8.4 (o del paso opcional 1.9.2), 5 μl de cebador 2L de 10 μM (final: 1 μM), 5 μl de cebador de cebador 10 μM Link2 (Final: 1 μM), 5 μl de tampón de polimerasa de ADN termoestable 10x, 1 μl de dNTP 10 mM (final: 200 μM de cada dNTP), 2 μl (5 μl) de ADN polimerasa termoestable y 27 μl de nucleasa libre de nucleasa agua.
    2. Realizar la PCR con la siguiente condición: 94 ° C de incubación durante 3 min; 8-15 ciclos de 94 ° C durante 20 s, 56 ° C durante 25 s, y 72 ° C durante 2 min; Y una extensión final a 72 ° C durante 5 min.
      NOTA: El ADN amplificado puede almacenarse a -20 ° C. * Se sugiere la optimización del número de ciclos.
    3. Siga el procedimiento de purificación por PCR del kit de purificación de PCR. Eluir con 50 μl de tampón de elución. Determine la concentración de ADN y los valores de 260/280 nm.
  12. Todos los procedimientos son idénticos a "amplificación específica de unión a la izquierda" (pasos 1.11.1-1.11.3), excepto por el uso de diferentes cebadores; Utilice el cebador específico de unión a la derecha (cebador 2R, ver Tabla 1 ) en este paso.
  • Prueba de variación de longitud del amplicón de PCR:
    1. Analizar las variaciones de la longitud del amplicón de PCR mediante la realización de electroforesis en gel de agarosa al 2% o electroforesis capilar ( Figura 2 ).
      NOTA: Este es un paso esencial para confirmar la finalización de los procedimientos de ensayo y para hacer una evaluación aproximada de los patrones de IS basados ​​en los patrones de banda de PCR. El amplicón de PCR purificado de las etapas 1.11.3 y 1.12.3 puede usarse para diversas plataformas de secuenciación de ADN. Proceda con los procedimientos de preparación de muestras apropiados para la secuenciación clásica de cadena (Sanger) o secuenciación de próxima generación. El ADN se puede almacenar a -20 °;DO.
  • 2. Análisis de Secuencia IS Computacional

    1. Preparación de archivos de datos:
      1. Prepare tres archivos de datos de entrada: un archivo de datos de secuencia de formato fasta (Test_data.fa en datos suplementarios), un archivo tsv para los motivos de búsqueda para secuencias de vector y enlazador (Demultiplexing_Trimming_blunt_GTAC.tsv en datos suplementarios) y un archivo tsv para información de enzimas de restricción (Enzyme.tsv en datos suplementarios).
        NOTA: Estos archivos son necesarios para demultiplexar, recortar secuencias de vector y enlazador, y eliminar secuencias de vector interno ( Figura 3A ). En el archivo README.txt de los datos suplementarios se proporcionan instrucciones detalladas paso a paso para implementar el flujo de trabajo computacional.
    2. Análisis computacional:
      1. Ejecutar demultiplexing y recortar scripts.
        NOTA: La secuencia en bruto se procesará para demultiplexación y para la trimminG de las secuencias de vector, enlazador y cebador (vea STEP-1 en el archivo README.txt complementario).
      2. Ejecute el comando mapping (vea STEP-2 en el archivo README.txt) para asignar las secuencias procesadas al genoma de referencia usando una herramienta de alineación similar a BLAST (BLAT; www.genome.ucsc.edu).
      3. Ejecute el script de análisis cuantitativo IS (consulte STEP-3 en el archivo README.txt).
        NOTA: Se generarán dos archivos de salida (Initial_count_without_homopolymer_correction.txt y Final_count.txt). Más detalles sobre la cartografía y las estrategias de enumeración de secuencias se pueden encontrar en el "archivo README.txt en los datos complementarios y en publicaciones anteriores 2 , 15 .

    Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    El bidireccional IS ensayo generado diferentes tamaños de PCR amplicones tanto para el upstream (izquierda) y aguas abajo (derecha) de acogida de acogida junturas ( Figura 2 ]. El tamaño de un amplicón de PCR depende de la localización del motivo GTAC más cercano aguas arriba y aguas abajo de un integro. El ensayo también produjo amplicones de PCR de ADN interno: las secuencias retrovirales cerca del tracto polipurino y el sitio de unión del cebador se amplificaron concomitantemente durante la PCR de unión izquierda y derecha, respectivamente. Las bandas de amplicones de PCR se pueden visualizar mediante electroforesis capilar o de agarosa (2%).

    Después de la secuenciación, las secuencias de unión izquierda y derecha se analizaron mediante un script de programación interno para preprocesar secuencias sin procesar (incluyendo demultiplexar y recortar vector y ADN de enlazador), cartografiar secuencias de IS en el genoma, identificar y contar ISSecuencias y aplicar procedimientos de corrección de errores ( Figura 3 ). Las ubicaciones del extremo 5 'de las secuencias de consulta en el genoma de referencia se consideran IS y se usan para el recuento inicial de cada IS. Los criterios que determinan las dos secuencias coincidentes -las secuencias de unión aguas arriba (izquierda) y aguas abajo (derecha) originadas del mismo integromo- se basan en los patrones de secuencias de nucleótidos de la integración concertada específica de retrovirus y son los siguientes: (i) Dos secuencias de unión Se alinean en el genoma en las orientaciones opuestas. (Ii) El IS de las dos secuencias de unión se separan por un solapamiento de 5 pb para los vectores del virus de la inmunodeficiencia humana (VIH) y una superposición de 4 pb para los vectores del virus de la leucemia murina (MLV). Los primeros 5 pb de las dos uniones del VIH y 4 pb de las uniones MLV son inversamente complementarios.

    Los conteos de secuencias de IS se determinan en tres etapas: (1) cartografía de secuencias de IS sobre el genomaUtilizando BLAT, que genera la calidad de mapeado y separa las secuencias individuales de SI en grupos de "golpe único", "golpe múltiple", "sin impacto" y "otros"; (2) utilizando la Herramienta de Búsqueda de Alineación Local Básica (BLAST) para comparar secuencias de un solo golpe con otras secuencias mapeadas subóptimamente, incluyendo múltiples hits, no-hits y otras; Y (3) identificar y corregir errores de secuenciación, incluyendo errores homopolímeros. Las secuencias multi-hit son secuencias de IS que pueden alinear dos o más posiciones genómicas con una alta puntuación de mapeo. Aunque todavía son útiles para identificar y cuantificar poblaciones clonales, las secuencias de múltiples impactos no pueden usarse para caracterizar patrones de distribución de sitios de integración genómica (por ejemplo, asociación con genes, repeticiones u otros caracteres genómicos). En algunos casos raros, las dos secuencias de unión muestran diferentes cualidades de mapeo. Por ejemplo, uno muestra "single-hit", mientras que la secuencia de coincidencia muestra "multi-hit". En tales casos, tantoSecuencias se tratan como "single hit" secuencias.

    Una porción de las secuencias de IS con puntuaciones de mapeo subóptimo, mostrando alto porcentaje de identidad del genoma (identidad) con un tamaño de consulta anormal (QSIZE), o viceversa, fueron separados de "no-hits" y agrupados en "otros" Re-evaluación manual. Por ejemplo, cuando se utiliza BLAT para el mapeo del genoma, algunas secuencias de IS pueden mostrar un QSIZE anormal debido a nucleótidos de falta de coincidencia en el primer o último 5-10 nucleótidos. Estas secuencias a menudo no cumplen los criterios de mapeo para el estado de "golpe único" o "golpe múltiple", a pesar de tener un resultado de mapeado de calidad relativamente alta.

    Se proporciona un archivo de datos de secuencia sin procesar (Test_DATA.fa: 33.374 secuencias) y archivos de datos de salida de ejemplo como datos complementarios. 1 μg de ADN genómico de células repoblativas humanas, transducidas con Vectores ivirales (FG12) en un ratón 17 humanizado de médula ósea / hígado / timo (BLT), se analizaron usando el ensayo bidireccional. Retroviral IS se encuentran en todo el genoma. Típicamente, los vectores lentivirales están sobrerrepresentados en genes, mientras que los vectores gamma-retrovirales están sobrerrepresentados en los sitios de inicio de la transcripción 16 ( Figura 4 ). A partir de dos muestras de células de repoblación humana, un total de 1.081 secuencias-851 de la corriente ascendente (izquierda) y 230 la corriente abajo (derecha) de las uniones se calificaron como secuencias de IS. A partir de estas secuencias, se identificaron 93 IS únicos en la izquierda y 50 IS únicos en las uniones correctas. De éstos, 44 fueron identificados en ambos (izquierda y derecha) las uniones, mostrando un total de 99 integromes único en las muestras de prueba. IS están significativamente enriquecidos en genes (66%, p <0,0001) en comparación con los eventos aleatorios ( Figura 4A ].

    A partir de una muestra mixta de células modificadas con Pmx, transducida con pMX que expresa Oct4, cMyc, Klf4 y Sox2, 1.611 secuencias de IS y 129 únicas Se identificaron de 65 y 76 IS únicas identificadas en las uniones izquierda y derecha, respectivamente, 12 en ambas uniones.

    Se ha demostrado previamente que los amplificados de PCR de ≥ 500 pb están mal secuenciados en la plataforma de pirosequencia, mientras que los amplicones de PCR de <500 pb están generalmente bien secuenciados, sin un sesgo notable con respecto a las longitudes de secuencia 15 . Así, la secuencia de datos de ≥ 500 pb amplicones PCR se excluyeron para eliminar la longitud asociada a la secuencia de sesgo. Sólo los datos de <500 pb PCR amplicón (denominado como vector integrome cuantificable, o QVI) se utilizaron para el análisis cuantitativo clonal. Las frecuencias relativas de detección de integromos vectorialesSe calcularon usando sólo los recuentos de secuencia de las uniones de SI que generan amplicones de PCR de <500 pb ( Figura 4B- 4D ). Aproximadamente el 77% de los vectores podrían ser analizados cuantitativamente por esta estrategia ( Figura 4B ). Como resultado, se esperaba que las frecuencias calculadas para cada QVI sobreestimaran las frecuencias verdaderas en la muestra ( Figura 4E ) en 1,25x.

    Figura 1
    Figura 1: Una vista esquemática del análisis bidireccional del sitio de integración. Se muestra el ADN retroviral de doble cadena (negro y rojo) flanqueado por ADN celular (azul). Las flechas representan cebadores de oligonucleótidos y las flechas con un asterisco representan cebadores de biotina. Los ADN de los enlazadores se indican mediante líneas púrpuras. Brevemente, una extensión lineal de la izquierdaLos cebadores de biotina (L-BP) y los cebadores de biotina derecha (R-BP) de la Repetición Terminal Largo viral (LTR) generan ADN biotinilado de doble hebra. Después de la digestión con CviQI y RsaI, el ADN de doble cadena biotinilado se enriquece usando unión especıfica a la estreptavidina-biotina y se ligan con ADN enlazador. Streptavidina-capturado, linker-ligated vector-host de ADN de la unión se amplifican mediante una PCR de dos pasos: pre-amplificación (amplificación de la izquierda y derecha de las uniones) seguido de dos anidados PCR, cada uno de los objetivos de la izquierda y la derecha. Haga clic aquí para ver una versión más grande de esta figura.

    Figura 2
    Figura 2: Imagen representativa del amplicón de la PCR. ( A ) El análisis de electroforesis capilar muestra longitudes variables de amplificador de PCRLicons en lentiviral vector (FG12) sitios de integración después de pvuII o sfoI digestión . Se muestran bandas de PCR variables para las uniones de anfitrión de vector aguas arriba (izquierda) y aguas abajo (derecha). Las cabezas de flechas oscuras indican los amplicones de DNA vectoriales internos que quedan después de la digestión pvuII o sfoI. El marcador de tamaño de ADN (0,1 - 2,5 kbp) está en el carril M. Las flechas abiertas indican los marcadores de alineación (15 y 5.000 pb). Los marcadores de alineación de ADN se utilizan para la calibración de la variación del tiempo de migración en todos los canales. ( B ) Sitios de integración del vector gamma-retroviral (pMX) en clones de células murinas transducidos con múltiples vectores pMX. Se muestran los ADN de la unión izquierda y derecha, así como los amplicones del ADN del vector interno (cabezas de las flechas). Las cabezas de las flechas oscuras y abiertas indican el ADN vectorial interno y los marcadores de alineación, respectivamente. El marcador de tamaño de ADN (50-1.500 pb) está en el carril M. Los detalles sobre la electroforesis capilar se pueden encontrar en la empresaprotocolo. Haga clic aquí para ver una versión más grande de esta figura.

    figura 3
    Figura 3: Análisis de secuencias de sitios de integración. ( A ) Un diagrama de flujo para el análisis de datos computacionales. Se requieren tres archivos de datos, incluyendo un archivo de secuencia de formato fasta, un archivo con motivos de secuencia de referencia para demultiplexar y recortar, y un archivo con información de enzima de restricción. Se proporcionan archivos de ejemplo, como Test_DATA.fa (datos de secuencia), Demultiplexing_Trimming.tsv (motivos de secuencia de búsqueda) y Enzyme.tsv (secuencia de reconocimiento de enzimas de restricción), como archivos de datos suplementarios. Las secuencias procesadas (secuencias de genoma del huésped) de la Parte 1 se correlacionarán con la referencia utilizando BLAT. Ubicaciones en el extremo 5 'de la consulta sequencEs en el genoma de referencia se consideran los sitios de integración ( Tabla 2 ]. Los conteos de secuencias para cada IS se determinan en tres pasos: (1) cartografiar secuencias de IS en el genoma usando BLAT; (2) comparar las secuencias de IS de un solo golpe (alineándose en un sitio único del genoma del huésped) con otras secuencias que se correlacionaron subóptimamente en el genoma; Y (3) identificar y corregir errores de secuenciación. Más detalles sobre la cartografía y secuencia de enumeración estrategias se pueden encontrar en estudios anteriores [ 2 , 15] . ( BC ) Se muestran dos muestras de secuencias de ADN de cadena sencilla para las uniones de vector-huésped aguas abajo (B) y aguas arriba (C). Los cebadores de pirosequencia A y B (verde) se usan para PCR de gotas y secuenciación. Los códigos de color coinciden con los de la figura 1 . La secuencia de unión de la muestra corriente abajo (B) incluye Primer A (verde), MID (verde), Vector U5 (rojo), genoma del huésped (azul), liNker (púrpura) y Primer B (verde). En una secuenciación de ADN mixta (aguas arriba y aguas abajo), se utiliza el cebador A para secuenciar las uniones aguas abajo (B) y el cebador B para secuenciar las uniones aguas arriba. La secuencia de unión de la corriente ascendente de la muestra (C) incluye Primer B, MID, Vector U3 end, genoma del huésped, enlazador y Primer A. Haga clic aquí para ver una versión más grande de esta figura.

    Figura 4
    Figura 4: Ejemplo representativo de análisis bidireccional del sitio de integración. ( A ) Porcentaje de integración en genes (refseq), Alu y LINE 1 (L1) repeticiones de vectores lentivirales en células repoblativas de ratón humanizadas (LV-huMice), en comparación con 10.000 eventos de integración aleatoria generados con silico . Los sitios de integración se asignanSobre el genoma humano (hg19). Los sitios de integración de LV-huMice están significativamente más representados en los genes ( p <0,0001, aproximación chi-cuadrada) ( B ) Análisis in silico de 10.000 eventos de integración aleatoria. Con un enfoque unidireccional, aproximadamente el 52% de los integromos aleatorios generó amplicones de PCR de <500 pb, mientras que con un enfoque bidireccional, el 77% generó un amplicón de PCR de <500 pb en las uniones izquierda o derecha. Los amplicones de PCR de más de 500 pb se secuencian ineficientemente con la platós pirosecienciación 2 , 15 y deben ser excluidos de los análisis de datos cuantitativos. ( C ) Estrategia para la cuantificación clonal. Cada clon individual comparte el mismo vector integrome (o IS). Las frecuencias relativas de las uniones izquierda (x) y derecha (y) se combinan para representar las cantidades relativas de las poblaciones clonales (integromos vectoriales cuantificables, o QVI). Integ Los sitios de racionamiento que no tienen un motivo GTAC dentro de 450 pb son descalificados (dQ) y eliminados del análisis de cuantificación. ( D ) Las frecuencias relativas (relativas a todas las secuencias QVI) de 44 clones QVI en ratones humanizados que repopulan células se muestran en un esquema de color (blanco a rojo: 0 a 0,16). ( E ) Excesiva sobreestimación de frecuencias clonales con análisis bidireccional. Basado en el análisis de integración aleatoria in silico 1000, se espera una sobreestimación de 1,25 veces cuando se usan enzimas con motivo GTAC ( RsaI y CviQI ) debido a aproximadamente 20% de clones dQ. Se espera una sobreestimación de 2,56x debido a aproximadamente 60% de clones dQ cuando se usa la enzima con motivo TCGA ( TaqαI ). Haga clic aquí para ver una versión más grande de esta figura.

    Oad / 55812 / 55812table1.jpg "/>
    Tabla 1: Oligonucleótidos para Lentiviral y Gamma-retroviral Vector Integración de análisis de sitio. * 5BioTEG: Modificación de biotina en el extremo 5 '. Haga clic aquí para ver una versión más grande de esta tabla.

    Tabla 2
    Tabla 2: Datos de recuento de secuencias de sitios de inserción representativos. Haga clic aquí para ver una versión más grande de esta tabla.
    1 Mapa: las secuencias del sitio de integración pueden ser asignadas a una localización única (single-hit) o ​​múltiples loci (multi-hit) del genoma de referencia. NA (no disponible): no se detectó secuencia.
    2 STRD: orientación de la secuencia de consulta en el genoma
    3 QLEN: la longitud de la secuencia de consulta
    4 GLEN: longitud esperada de la secuencia del sitio de integración, calculada basándose en la distancia desde el motivo GTAC disponible más próximo en el genoma al sitio de inserción. GLEN <450 pb se aceptan para análisis cuantitativos.
    5 Total_Count: conteo total de secuencias
    6 Los sitios de integración se muestran mediante un número de cromosoma (CHR) y un número de sitio para la unión derecha (CHR_SITE1) y un número para la unión izquierda (CHR_SITE2). CHR_SITE1 y CHR_SITE2 son 5 pb aparte para vectores lentivirales y 4 pb aparte para vectores MLV (pMX)
    7 Sequence cuenta para la unión derecha (R_A) y la unión izquierda de la muestra A (L_A); La cuenta de secuencia para la unión derecha (R_B) y la unión izquierda de la muestra B (L_B)
    * Descalificado (dQ): GLEN ≥450 en silico pb

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    El ensayo bidireccional permite el análisis simultáneo de ambas secuencias de unión de ADN vector-huésped aguas arriba (izquierda) y aguas abajo (derecha) y es útil en una serie de aplicaciones de terapia génica, células madre y cáncer. El uso de enzimas GTAC-motivo (RsaI y CviQI) y el enfoque de PCR bidireccional mejora significativamente las posibilidades de detectar un integromo (o una población clonal) cuando se compara con anteriores enzimas de motivo TCGA- TaqαI 2 , 15 y otros Unidireccional LM-PCR enfoques 5 . El ensayo bidireccional mejora el análisis de IS, particularmente en las muestras limitadas de ADN que a menudo surgen en estudios clínicos o en modelos de animales pequeños.

    Los pasos 1.1-1.7 son un paso crítico y deben hacerse sin retrasos innecesarios. Estos pasos se realizan generalmente en un día. Se recomienda altamente probar enzimas antes de estos pasos. PasoS 1.9 y 1.10 son opcionales. Estos pasos reducirán las secuencias de ADN vectoriales internas que se amplifican concomitantemente con secuencias de IS. La Tabla 1 proporciona conjuntos de cebadores adecuados para analizar la IS de vectores NL4.3 derivados de HIV4, derivados de NL4.3 de tipo salvaje, incluyendo FG1221 y vectores gammaretrovatorios basados ​​en pMX 22 . Dependiendo de las variaciones de nucleótidos en las secuencias de repetición terminal larga (LTR), el diseño del cebador y el enfoque experimental pueden necesitar una modificación apropiada.

    El software blat utilizado para la asignación es sólo compatible con el formato fasta y no funciona con archivos fastq. Uno puede convertir los archivos fastq a fasta utilizando diversas herramientas de software, como FASTX-Toolkit o BBTools. Un usuario con conocimientos básicos de python puede utilizar Biopython para convertir los archivos fastq a fasta para asignarlos con blat.

    Se espera que una parte de la IS no se detectará con el I bidireccionalS y, aunque se detecte, no calificará para la cuantificación clonal de aguas abajo. Cuando se usaron enzimas con motivo GTAC, aproximadamente el 23% de los integromos en los datos de secuencia generados por la plataforma de pirosequencia no pasaron los criterios de análisis para el análisis cuantitativo de la secuencia IS ( Figura 4 ). Cuando la cobertura integral de la IS es crítica, por ejemplo en el monitoreo de seguridad de las células genéticamente modificadas en los entornos de terapia génica, es aconsejable escoger un ensayo con acceso irrestricto al gen IS 8 , 9 , 10 , 11 , 12 o volver a analizar Misma muestra con una combinación diferente o optimizada de restricciones 4 , 18 .

    IS con acceso irrestricto al genoma, tales como la PCR no restrictiva de LAM y el cisOaches 19 , 20 , tienen una promesa particular para el análisis integral de la IS. Estos enfoques utilizan tecnologías que son relativamente difíciles de controlar, lo que hace difícil predecir el resultado de la fragmentación del ADN genómico y la amplificación de la IS. Por otra parte, los ensayos de IS que utilizan enzimas de restricción bien caracterizadas tienen dos beneficios principales: (1) es relativamente fácil calibrar y optimizar los ensayos, porque los resultados del ensayo son más predecibles debido a la especificidad de la reacción enzimática ya la disponibilidad de Secuencias de genoma de referencia. (2) Los datos de secuencia son altamente reproducibles una vez que se han optimizado las condiciones del ensayo. La PCR bidireccional con condiciones optimizadas ha demostrado ser útil para la cuantificación clonal a gran escala y exacta 2 , 15 . Aunque solo se ha analizado una parte de las poblaciones clonales existentes debido al sesgo de la enzima de restricción, las cantidades de individuos L se midieron con precisión, permitiendo de este modo la determinación exacta de las variaciones del tamaño del clon dentro y entre muestras. Se generó un número suficiente de clones para determinar patrones de comportamiento de células madre y heterogeneidad funcional.

    Los amplicones de PCR producidos a partir de este procedimiento de PCR bidireccional son adecuados para cualquier plataforma de secuenciación aguas abajo. Debido a la alta sensibilidad del ensayo, se debe tomar el máximo cuidado para evitar la contaminación cruzada mediante la realización de experimentos en una habitación libre de contaminación. Se recomienda la inclusión de un experimento de control negativo (sin plantilla) para todos los pasos de PCR. Incluso con la práctica más cuidadosa, prevenir la contaminación cruzada entre muestra y muestra es extremadamente difícil. Por lo tanto, cuando se comparan poblaciones clonales de diferentes muestras, es aconsejable emplear un control de colisión, que elimina los datos potencialmente contaminados 23 , y un corte para los clones de baja frecuencia, no confiables> 2 con el fin de minimizar el ruido de ADN contaminado cruzadamente. El enfoque bidireccional genera datos IS para ambos extremos de los integromes, proporcionando así una oportunidad adicional para reducir los errores potenciales de detección de falsos positivos.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Los autores no tienen nada que revelar.

    Acknowledgments

    El financiamiento fue proporcionado por los Institutos Nacionales de Salud Subvenciones R00-HL116234, U19 AI117941, y R56 HL126544; La Fundación Nacional de Ciencias Grant DMS-1516675; La Fundación Nacional de Investigación de Corea (NRF-2011-0030049, NRF-2014M3C9A3064552); Y el programa de la iniciativa KRIBB.

    Materials

    Name Company Catalog Number Comments
    Thermostable DNA polymerase Agilent 600424 PicoMaxx Polymerase
    Thermostable DNA polymerase buffer Agilent 600424 PicoMaxx Polymerase buffer
    Deoxynucleotide (dNTP) solution mix New England Biolabs N0447L dNTP solution mix (10 mM each)
    PCR tubes VWR International 53509-304 PCR Strip Tubes With Individual Attached Caps
    2 mL microcentrifuge tube Molecular Bioproducts 3453 microcentrifuge tubes
    PCR purification kit Qiagen 28106
    RsaI  New England Biolabs R0167L restriction enzyme
    CviQI New England Biolabs R0639L restriction enzyme
    Buffer A New England Biolabs B7204S NEB CutSmart buffer
    DNA Polymerase I large (klenow) fragment  New England Biolabs M0210L Blunting
    streptavidin beads solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Binding Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Washing Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    magnetic stand ThermoFisher 12321D DynaMag™-2 Magnet
    T4 DNA ligase New England Biolabs M0202L T4 DNA ligase
    10X T4 DNA ligase buffer New England Biolabs B0202S T4 DNA ligase reaction buffer
    5X T4 DNA ligase buffer Invitrogen  46300-018 T4 DNA ligase buffer with polyethylene glycol-8000
    UV-Vis spectrophotometer Fisher Scientific S06497 Nanodrop 2000
    pvuII new England Biolabs R0151L restriction enzyme
    sfoI new England Biolabs R0606L restriction enzyme
    Buffer B new England Biolabs B7203S NEB buffer 3.1
    Nuclease free water Integrated DNA Technologies 11-05-01-14
    Capillary electrophoresis Qiagen 9001941 QIAxcel capillary electrophoresis
    Veriti 96-well Fast Thermal Cycler Thermo Fisher Scientific 4375305 PCR Instrument
    Rotating wheel (or Roller) Eppendorf M10534004 Cell Culture Roller Drums
    DNA size marker Qiagen 929559 QX size marker (100 - 2,500 bp)
    DNA size marker Qiagen 929554 QX size marker (50 - 1,500 bp)
    DNA alignment markers Qiagen 929524 QX DNA Alignment Marker
    genomc DNA Not Available Not Available Sample genomc DNA from in vivo or in vitro experiments

    DOWNLOAD MATERIALS LIST

    References

    1. Serrao, E., Engelman, A. N. Sites of Retroviral DNA Integration: From Basic Research to Clinical Applications. Crit. Rev. Biochem. Mol. Bio. 51 (1), 26-42 (2016).
    2. Kim, S., et al. Dynamics of HSPC Repopulation in Nonhuman Primates Revealed by a Decade-Long Clonal-Tracking Study. Cell Stem Cell. 14 (4), 473-485 (2014).
    3. Bushman, F. Retroviral integration and human gene therapy. J. Clin. Invest. 117 (8), 2083-2086 (2007).
    4. Bystrykh, L. V., Verovskaya, E., Zwart, E., Broekhuis, M., de Haan, G. Counting stem cells: methodological constraints. Nat Meth. 9 (6), 567-574 (2012).
    5. Schröder, A., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110 (4), 521-529 (2002).
    6. Silver, J., Keerikatte, V. Novel use of polymerase chain reaction to amplify cellular DNA adjacent to an integrated provirus. J. Virol. 64, 3150 (1990).
    7. Schmidt, M., et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat. Meth. 4 (12), 1051-1057 (2007).
    8. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39 (11), e72 (2011).
    9. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    10. Kim, S., Kim, Y., Liang, T., Sinsheimer, J., Chow, S. A high-throughput method for cloning and sequencing human immunodeficiency virus type 1 integration sites. J. Virol. 80 (22), 11313-11321 (2006).
    11. Maldarelli, F., et al. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345 (6193), 179-183 (2014).
    12. Wu, C., et al. High Efficiency Restriction Enzyme-Free Linear Amplification-Mediated Polymerase Chain Reaction Approach for Tracking Lentiviral Integration Sites Does Not Abrogate Retrieval Bias. Hum. Gene. Ther. 24 (1), 38-47 (2013).
    13. Aker, M., Tubb, J., Miller, D. G., Stamatoyannopoulos, G., Emery, D. W. Integration Bias of Gammaretrovirus Vectors following Transduction and Growth of Primary Mouse Hematopoietic Progenitor Cells with and without Selection. Mol. Ther. 14 (2), 226-235 (2006).
    14. Gabriel, R., Kutschera, I., Bartholomae, C. C., von Kalle, C., Schmidt, M. Linear Amplification Mediated PCR; Localization of Genetic Elements and Characterization of Unknown Flanking DNA. J Vis Exp. (88), e51543 (2014).
    15. Kim, S., et al. High-throughput, sensitive quantification of repopulating hematopoietic stem cell clones. J. Virol. 84 (22), 11771-11780 (2010).
    16. Mitchell, R., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2 (8), e234 (2004).
    17. Melkus, M., et al. Humanized mice mount specific adaptive and innate immune responses to EBV and TSST-1. Nat. Med. 12 (11), 1316-1322 (2006).
    18. Bystrykh, L. V. A combinatorial approach to the restriction of a mouse genome. BMC Res Notes. 6, 284 (2013).
    19. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. -P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol Biol. , 321-344 (2014).
    20. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    21. Qin, X., An, D., Chen, I., Baltimore, D. Inhibiting HIV-1 infection in human T cells by lentiviral-mediated delivery of small interfering RNA against CCR5. Proc Natl Acad Sci U S A. 100 (1), 183-188 (2003).
    22. Kitamura, T., et al. Retrovirus-mediated gene transfer and expression cloning: powerful tools in functional genomics. Exp. Hematol. 31 (11), 1007-1014 (2003).
    23. Cartier, N., et al. Hematopoietic stem cell gene therapy with a lentiviral vector in X-linked adrenoleukodystrophy. Science. 326 (5954), 818-823 (2009).

    Tags

    Genética Número 124 Retrovirus Sitios de integración Secuenciación de próxima generación Terapia génica retroviral Células madre Cáncer Barcoding celular Bioinformática
    Sitio de Integración Retroviral Bidireccional Metodología de PCR y Flujo de Trabajo de Análisis de Datos Cuantitativos
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Suryawanshi, G. W., Xu, S., Xie, Y., More

    Suryawanshi, G. W., Xu, S., Xie, Y., Chou, T., Kim, N., Chen, I. S. Y., Kim, S. Bidirectional Retroviral Integration Site PCR Methodology and Quantitative Data Analysis Workflow. J. Vis. Exp. (124), e55812, doi:10.3791/55812 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter