Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

La detección de alteraciones genéticas somáticas en muestras de tumores por Exon de captura y secuenciación masivamente paralelo

Published: October 18, 2013 doi: 10.3791/50710

Summary

Se describe la preparación de bibliotecas de ADN con códigos de barras y la posterior basada en la hibridación exón captura para la detección de mutaciones clave asociados con el cáncer en las muestras tumorales clínicos de secuenciación masiva en paralelo de "próxima generación". Targeted secuenciación exón ofrece los beneficios de alto rendimiento, bajo coste, y la cobertura de secuencia profunda, produciendo de este modo una alta sensibilidad para la detección de mutaciones de baja frecuencia.

Abstract

Los esfuerzos para detectar e investigar las mutaciones oncogénicas clave han demostrado su utilidad para facilitar el tratamiento adecuado para los pacientes con cáncer. El establecimiento de alto rendimiento, la secuenciación masiva en paralelo "de nueva generación" ha ayudado al descubrimiento de muchas de estas mutaciones. Para aumentar la utilidad clínica y traslacional de esta tecnología, las plataformas deben ser de alto rendimiento, rentable y compatible con parafina fijado en formol e incrustados (FFPE) muestras de tejido que pueden producir pequeñas cantidades de ADN degradado o dañado. Aquí se describe la preparación de bibliotecas de ADN con códigos de barras y multiplexados seguido de captura basados ​​en la hibridación de los exones específicos para la detección de mutaciones asociadas con el cáncer en los tumores congelados y frescos por FFPE secuenciación masiva en paralelo. Este método permite la identificación de mutaciones en la secuencia, copia alteraciones numéricas y seleccionar reajustes estructurales que involucran todos los genes específicos. Targeted secuenciación del exón ofrece tse beneficia de un alto rendimiento, bajo costo, y la cobertura de secuencia de profundidad, lo que confiere una alta sensibilidad para la detección de mutaciones de baja frecuencia.

Introduction

La identificación de "conductor" eventos genéticos tumorales en oncogenes clave y genes supresores de tumores juega un papel esencial en el diagnóstico y el tratamiento de muchos tipos de cáncer 1. Los esfuerzos de investigación a gran escala que utilizan la secuenciación masiva en paralelo "de nueva generación" han permitido la identificación de muchos de estos genes asociados con el cáncer en los últimos años 2. Sin embargo, estas plataformas de secuenciación típicamente requieren grandes cantidades de ADN aisladas a partir de tejidos congelados frescos, lo que plantea una limitación importante en la caracterización y análisis de mutaciones de ADN de tejidos conservados, tales como parafina fijado con formalina incrustado (FFPE) muestras de tumor. La mejora de los esfuerzos para caracterizar de manera eficiente y confiable de la información genómica "recurribles" de muestras de tumores FFPE permitirán el análisis retrospectivo de muestras previamente caballones y seguir fomentando enfoques individualizados para el manejo del cáncer.

Tradicionalmente, d molecularlaboratorios iagnostic se han basado en metodologías de bajo rendimiento que requieren mucho tiempo, como la secuenciación de Sanger y PCR en tiempo real para el perfil de mutación del ADN. Más recientemente, los métodos de mayor rendimiento que utilizan PCR multiplexada o determinación del genotipo de espectrometría de masas se han desarrollado para investigar mutaciones somáticas recurrentes en los genes del cáncer clave 3-5. Estos enfoques, sin embargo, están limitados en que sólo las mutaciones predesignadas "punto caliente" se ensayan, que los hace inadecuados para la detección de mutaciones inactivadoras en los genes supresores de tumores. Secuenciación masiva en paralelo ofrece varias ventajas con respecto a estas estrategias que incluyen la posibilidad de interrogar a los exones enteros para las mutaciones tanto comunes como poco frecuentes, la capacidad de revelar las clases adicionales de alteraciones genómicas tales como las ganancias y pérdidas de número de copias, y una mayor sensibilidad de detección en muestras heterogéneas 6, 7 . La secuenciación del genoma entero representa el enfoque más completo para el descubrimiento de la mutación, aunque es relativamente costoso y incurre grandes demandas computacionales para el análisis y el almacenamiento de datos.

Para aplicaciones clínicas, en los que sólo una pequeña fracción del genoma puede ser de interés clínico, dos innovaciones particulares en la tecnología de secuenciación han sido transformadora. En primer lugar, a través de la hibridación con sede en el exón captura, se puede aislar el ADN correspondiente a los genes clave asociados con el cáncer de apuntado perfiles mutación 8,. En segundo lugar, a través de la ligadura de los códigos de barras moleculares (es decir, secuencias de ADN de 6-8 nucleótidos de longitud), se puede agrupar cientos de muestras por corrida secuenciación y aprovechar al máximo la capacidad cada vez mayor de instrumentos de secuenciación masivamente paralelo 10. Cuando se combinan, estas innovaciones permiten que los tumores ser perfilado para un menor coste y con mayor rendimiento, con requisitos de cómputo más pequeños 11. Además, mediante la redistribución de la cobertura de secuencia de sólo los genes más importantes para la aplicación particular, uno puede ACHIEve más a fondo la secuenciación para una mayor sensibilidad de detección para eventos de baja frecuencia de los alelos.

Aquí describimos nuestro ensayo IMPACT (Integrated Mutación de perfiles de objetivos de cáncer Actionable), que utiliza la captura de códigos de barras en el exón piscinas biblioteca secuencia mediante hibridación utilizando oligonucleótidos personalizados para capturar todos los exones codificadores de proteínas y seleccione intrones de 279 genes claves asociados con el cáncer (Tabla 1 ). Esta estrategia permite la identificación de mutaciones, indeles, alteraciones del número de copias y seleccione reajustes estructurales que implican estos 279 genes. Nuestro método es compatible con el ADN aislado de tanto tejido congelado y FFPE fresca, así como aspirados con aguja fina y otras muestras de citología.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. ADN y Preparación de los reactivos

Nota: Este protocolo describe el procesamiento y el análisis simultáneo de 24 muestras (por ejemplo, 12 pares normales / tumorales), pero puede ser adaptado para lotes más pequeños y más grandes. Las muestras de ADN pueden derivar de FFPE o tejido fresco congelado, especímenes citológicos, o sangre. Típicamente, tanto del tumor y el tejido normal del mismo paciente se perfilan juntos con el fin de distinguir las mutaciones somáticas de los polimorfismos heredados. El protocolo comienza inmediatamente después de la extracción de ADN.

  1. Alícuota de 50-250 ng (250 ng recomendado) de ADN extraído por muestra, diluida en 1X Tris-EDTA (pH 8,0) tampón a un volumen final de 50 l, en tubos de fondo redondo Covaris separadas.
  2. Cortar el ADN en el instrumento Covaris E220 con los siguientes ajustes de corte: 360 segundos a 10 factor de trabajo, 175 de PIP y 200 ciclos por ráfaga.
  3. Descongele Beads XP AMPure (Tabla 2) a temperatura ambiente. Descongele todos bufertas y enzimas en hielo antes de la etapa apropiada.

2. Módulo Reparación End - Preparación Biblioteca

  1. Prepare la mezcla maestra reparación fin en un tubo de microcentrífuga estéril utilizando los siguientes volúmenes por muestra: 10 l de 10x NEBNext End Reaction Buffer Reparación (Tabla 2), 5 l NEBNext End Repair Enzyme Mix (Tabla 2), 35 l de nucleasa estéril libre de H 2 O.
  2. Alícuota de los 50 l de cada ADN cortado en pocillos separados de una placa de 96 pocillos. Añadir 50 l de la mezcla maestra de reparación final preparado para cada reacción. Incubar en un termociclador durante 30 min a 20 ° C.

3. Mensaje End Repair Limpieza

  1. Añadir un volumen de 2x (200 l) de los granos XP AMPure (Tabla 2) a cada muestra y pipetear suavemente todo el volumen arriba y abajo 10 veces usando una pipeta multicanal. Incubar a TA durante 15 min.
  2. Coloque en el soporte magnético (Tabla 2
  3. Retire con cuidado y deseche toma sobrenadante claro cuidado de no molestar a los granos. Un poco de líquido puede permanecer en los pozos.
  4. Con tubos en el soporte, agregar suavemente 200 l de etanol recién preparada 80% a cada muestra y se incuba la placa a temperatura ambiente durante 30 seg. Con cuidado, separar el etanol mediante una pipeta.
  5. Repita el paso 5, para un total de 2 lavados con etanol. Asegúrese de que todo el etanol se ha eliminado. Retirar del soporte magnético y dejar secar a temperatura ambiente durante 5 min.
  6. Resuspender perlas secas con 44,5 l H 2 O. estéril Suavemente, toda pipeta de volumen hacia arriba y hacia abajo 10 veces mezclando bien. Asegurarse de perlas se ya no adheridas al lado del pozo.
  7. Incubar perlas se resuspendieron a TA durante 2 min. Coloque el soporte magnético durante 5 minutos hasta que la muestra parece clara.
  8. Transferir suavemente 42 l de sobrenadante claro que contiene la muestra a un nuevo pozo.
    El procedimiento puede hacerse sin riesgo en este ptep y muestras almacenadas a -20 ° C durante un máximo de 7 días. Para reiniciar, descongelar las muestras congeladas en hielo antes de proceder.

4. Preparación Biblioteca - Módulo dA-tizón

  1. Preparar la mezcla maestra dA-tizón en un tubo de microcentrífuga estéril utilizando los siguientes volúmenes por muestra: 5 l de 10x NEBNext Reacción dA-tizón Buffer (Tabla 2), 3 l (3'-5 'exo-) Klenow Fragment (Tabla 2 ).
  2. Añadir 8 l de la mezcla maestra dA-tizón preparada a cada pocillo que contiene 42 l de ADN reparado en sus extremos. Incubar en un termociclador durante 30 min a 37 ° C.
  3. Lleve a cabo un post-dA Tailing limpieza: Repita los pasos 3.1 a 3.8 usando volumen 2x (100 l) de cuentas, pero se vuelve a suspender en H2O estéril hasta un volumen final de 33.75 l.
    El procedimiento se puede detener de forma segura en este paso y las muestras almacenadas a -20 ° C durante hasta 7 días. Para reiniciar, descongelar las muestras congeladas en hielo antes de continuar. </ Li>

5. Preparación Biblioteca - Módulo adaptador de ligadura

  1. Preparar la mezcla maestra ligadura en un tubo de microcentrífuga estéril utilizando los siguientes volúmenes por muestra: 10 l de 5x NEBNext Ligadura Quick Reaction Buffer (New England Biolabs, Tabla 2), 5 l Quick T4 ADN ligasa (Tabla 2).
  2. Añadir 15 l de la mezcla maestra ligadura a cada pocillo que contiene el ADN Colas dA.
  3. Añadir 1,25 l de la 25 adaptador de código de barras M NEXTflex apropiada (Tabla 2) a cada pocillo. Cada muestra debe recibir un adaptador con código de barras separado. Incubar en un termociclador durante 15 min a 20 ° C.
  4. Realice una ligadura de adaptador de post limpieza: Repita los pasos 3.1 hasta 3.8 utilizando 1 x volumen (50 l) de cuentas, pero se vuelve a suspender en H2O estéril hasta un volumen final de 50 l.
  5. Repita los pasos 3.1 a 3.8 para un segundo volumen 1x (50 l) de limpieza, pero se vuelve a suspender en H2O estéril a unavolumen final de 23 l.
    El procedimiento se puede detener de forma segura en este paso y las muestras almacenadas a -20 ° C durante hasta 7 días. Para reiniciar, descongelar las muestras congeladas en hielo antes de proceder.

6. Amplificación Biblioteca

  1. Preparar la mezcla maestra KAPA de alta fidelidad en un tubo de microcentrífuga estéril usando los siguientes volúmenes por muestra: 25 l 2x KAPA alta fidelidad SA RM (Tabla 2), 1 l cada uno de 100 M Cebador 1 y Cebador 2 (Tabla 3).
  2. Añadir 27 l de la mezcla maestra a cada pocillo que contiene el producto de ligación. Establecer pipeta para 50 l y suavemente con la pipeta el volumen arriba y abajo 10 veces.
  3. Colocar en el termociclador para los siguientes ciclos de PCR: desnaturalización inicial de 45 segundos a 98 ° C, 10 ciclos de 15 segundos a 98 ° C, 30 seg a 60 ° C, 30 seg a 72 ° C, y extensión final de 1 min a 72 ° C.
  4. Lleve a cabo una amplificación posterior limpieza: Repita los pasos 3.1 a 3.8 usando1 x volumen (50 l) de los granos AMPure XP, y resuspender en agua estéril a un volumen final de 30 l.
  5. Cuantificar la concentración de cada biblioteca utilizando Qubit Ensayo de Rango amplio (Life Technologies, Tabla 2) de acuerdo con las instrucciones del fabricante.

7. Roche Nimblegen SeqCap EZ Biblioteca hibridación, lavado, y amplificación

  1. Descongele los bloqueadores de oligonucleótidos universales e índice (Tabla 3), SeqCap EZ Biblioteca y componentes de captura NimbleGen (ADN COT, del tampón de hibridación 2x, y el componente de hibridación A, Tabla 2) en el hielo. Todos los bloqueadores de oligonucleótidos se almacenan en acciones de trabajo de 1 mM. Nuestro SeqCap EZ Library es una piscina de diseño personalizado de sondas de captura que abarcan todos los exones codificantes de proteínas de 279 genes asociados con el cáncer, aunque otros diseños personalizados y catálogos pueden ser utilizados.
  2. Prepare una piscina de 1 mM de los bloqueadores de oligonucleótidos índice correspondientes a la publicidad con código de barras específicosecuencias Aptor utilizados en la preparación de la biblioteca. Combine 1 l de cada bloqueador, y agitar.
  3. En un nuevo tubo estéril de 1.5 ml, añadir 5 l de ADN COT 1mg/ml, 2 l de 1 mM bloqueador universal y 2 l de la piscina 1 mM de los bloqueadores de oligonucleótidos índice.
  4. Piscina 24 bibliotecas con código de barras en una sola reacción. Añade un total de 1-3 g de agrupado, biblioteca de secuencias de código de barras (preparado anteriormente) a la mezcla de la captura. Para 24 muestras, se recomienda 100 ng por muestra. Cuando se combinaron los tumores y las muestras normales emparejados, se recomienda la adición de más biblioteca de tumor (por ejemplo 100 ng por tumor y 50 ng por normal) para que se secuencian a una mayor profundidad de la cobertura.
  5. Cerrar la tapa del tubo y hacer 15-20 agujeros en la parte superior de la tapa con un 18-20 G o aguja más pequeña. Speed ​​Vac las muestras biblioteca / COT ADN / oligos amplificados en un concentrador de vacío de ADN a temperatura alta (60 ° C).
  6. Una vez secado completamente abajo, rehidratar con 7,5 l de 2x hibridaciónamortiguar zación y 3 l de hibridación componente A. El tubo ahora debe contener lo siguiente: 5 g de ADN COT, g variable de biblioteca muestra amplificada, 1000 pmol de Universal y Índice Oligos, tampón 7,5 l 2x hibridación, 3 componente l hibridación A en un volumen total de 10,5 l.
  7. Cubra los orificios de la tapa con un pequeño trozo de cinta de laboratorio. Vortex la muestra durante 10 segundos y se centrifuga a la velocidad máxima durante 10 s.
  8. Incubar la muestra a 95 ° C durante 10 minutos para desnaturalizar el ADN, seguido por centrifugación a velocidad máxima durante 10 segundos a TA.
  9. En un nuevo tubo de tiras PCR 0,2 ml, prepare 2,25 l alícuota de SeqCap EZ sondas de captura Biblioteca y 2,25 l de estéril libre de nucleasa H 2 O y añadir los contenidos de la etapa 7.7. Pipetear suavemente todo el volumen arriba y abajo 10 veces.
  10. Incubar en un termociclador a 47 ° C durante 48-96 horas. Establecer y mantener la temperatura de la tapa del termociclador a 57 ° C.
  11. Folbajos pasos del Capítulo 6 de la Guía v3.0 del SR del usuario NimbleGen SeqCap EX Library (Tabla 2) para el lavado y la recuperación del ADN capturado.
  12. Sigue los pasos en el capítulo 7 del protocolo Roche NimbleGen para la amplificación del ADN capturado con las siguientes modificaciones:
    • Utilice 2x KAPA de alta fidelidad de la polimerasa (Tabla 2) en lugar de Phusion de alta fidelidad PCR Master Mix
    • Utilice 100 M Primer 1 y 2 Primer listado en la Tabla 3.
    • Ejecute las siguientes condiciones de PCR: desnaturalización inicial a 98 ° C durante 30 segundos, 11 ciclos de 98 ° C durante 10 s, 60 ° C durante 30 segundos, 72 ° C durante 30 segundos, y de extensión final a 72 ° C durante 5 min . Mantener a 4 ° C.
  13. Cuantificar la concentración del ADN capturado amplificado utilizando alta sensibilidad de ensayo Qubit (Tabla 2) de acuerdo con las instrucciones del fabricante.
  14. Analizar la calidad del ADN capturado utilizando Agilent Biochip de analizador de ADN HS (Tabla 2) de acuerdo con las instrucciones del fabricante.
    • El rendimiento de PCR debe ser de al menos 100 ng (rango de 100-1.000 ng).
    • La longitud media de fragmento debe ser de entre 150-400 pares de bases.

8. Illumina Hola-Seq Secuenciación

  1. Diluir el ADN capturado amplificada a 14:00, y la carga de la muestra en un solo carril de una celda de flujo Illumina HiSeq 2000. Secuencia de extremo emparejado 75 pares de bases lee de acuerdo con las instrucciones del fabricante. En nuestra experiencia, un carril es suficiente para producir 500-700x única cobertura de secuencia por muestra a través de 279 genes para una piscina de 24 muestras.
  2. Software Illumina (análisis en tiempo real) convertirá las imágenes de alta resolución para las intensidades de racimo basar las llamadas y sus niveles de calidad. Utilice Casava para demultiplexar datos de acuerdo con la identidad del código de barras y generar archivos de FASTQ individuales para cada muestra.

9. Datos Anallisis

  1. Secuencias adaptadoras del ajuste del extremo 3 'de la secuencia se lee en los archivos FASTQ utilizando Cutadapt ( http://code.google.com/p/cutadapt/ ). La longitud de solape mínima (-O) es 3 con una tasa de error (-E) de 1%. La longitud mínima de la base para la retención de emparejado lee después del corte es de 25.
  2. Alinear secuencia lee a los de referencia hg19 genoma humano utilizando la herramienta de Burrows-Wheeler alineador (BWA) 12. Realice los pasos de post-procesamiento, incluyendo el marcado duplicado, múltiples locales secuencia de realineamiento y recalibración puntuación de calidad de base utilizando el kit de herramientas de Análisis Genómico (GATK) de acuerdo con las mejores prácticas estándar ( http://www.broadinstitute.org/gatk/guide/topic? name = mejores prácticas ) 13. Al perfilar varias muestras del mismo paciente (por ejemplo, tumor emparejado y normales), múltiples locales secuencia reajuste debe ser rendimientoMED conjuntamente. La salida de estos pasos de procesamiento posterior es un archivo de BAM diferente para cada muestra, que contiene toda la secuencia, la calidad, y la información de alineación y se puede cargar directamente en la Genómica Integrativa Viewer (IGV) para la visualización de lecturas y variantes de secuencia 14.
  3. Calcular los parámetros de rendimiento de la secuencia utilizando herramientas Picard ( http://picard.sourceforge.net/ ). Métricas informativas incluyen tasa de alineación, distribución de tamaño de fragmento, GC-contenido asociado sesgo de cobertura, la especificidad de captura en el blanco, PCR duplica la tasa, la complejidad de la biblioteca, y la media de cobertura objetivo. Los valores representativos se muestran en la Figura 1. Las frecuencias alélicas en sitios de polimorfismo comunes calculados utilizando DepthOfCoverage de GATK se utilizan para controlar la contaminación de ADN ajeno y para garantizar que los diferentes muestras provenían de los mismos pacientes.
    Los siguientes análisis computacional dependen de la presencia de emparejadomuestras tumorales y normales para la detección de alteraciones genéticas somáticas. Tumores sin igual también se pueden analizar usando una muestra separada de control normal, pero las mutaciones somáticas no pueden más fácilmente ser distinguidos de variantes de la secuencia heredados.
  4. Llame a variantes de nucleótido único somáticas (SNVS) para cada par de tumor normal usando una persona que llama mutación somática, tal como muTect 15, SomaticSniper 16, o Strelka 17. Utilizamos muTect con criterios de filtrado modificados, lo que permite variantes con bajo (distinto de cero) los recuentos de los alelos en la muestra normal, siempre y cuando la frecuencia del alelo es por lo menos 5 veces mayor en el tumor. Variantes recurrentemente llamados en un panel de ADN normales se eliminan como artefactos sistemáticas probables de la secuenciación o la alineación. Cada SNV pasando filtros es luego revisado cuidadosamente con IGV.
  5. Llame indeles somáticas para cada par de tumor normal usando algoritmos tales como SomaticIndelDetector 13, Dindel 18, o 19 SOAPindel
  6. Extrapolar copia estado número en la secuencia de la cobertura en los exones objetivo. Para cada muestra individual, realizar una normalización loess de la cobertura media de secuencia para todos los exones objetivo, la regresión sobre porcentaje GC. Ajuste los valores de cobertura unnormalized restando el ajuste Loess y la adición de la cobertura promedio en toda la muestra. Calcular la relación de cobertura de secuencia normalizada en todos los exones objetivo para pares de tumor normal. En ausencia de una muestra normal correspondiente y / o para disminuir el ruido, otra diploide género coincide conlos controles normales que carecen de variantes de número de copias de la línea germinal se pueden utilizar. Determinar las ganancias y pérdidas de número de copias somáticas sobre la base de los aumentos o disminuciones en la tasa de cobertura.
  7. Llame a reordenamientos somáticos relacionados con los genes del cáncer en la que al menos un punto de interrupción genómico cae dentro o cerca de un intervalo específico del genoma. Algoritmos sugeridos incluyen GASV 20, Breakdancer 21, CREST 22 y Dranger 23. Inversiones intracromosomal, deleciones y duplicaciones en tándem se pueden distinguir sobre la base de la posición relativa y la orientación de apoyo lee en pares discordantes. Todos los reordenamientos candidatos deben ser revisados ​​manualmente con IGV. Recomendamos validación experimental por PCR y secuenciación de Sanger a través de los puntos de interrupción de reordenamiento putativos.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Una piscina de 24 bibliotecas de secuencias de código de barras (12 pares-tumorales normales) fue capturado utilizando sondas correspondientes a todos los exones codificantes de proteínas de 279 genes del cáncer y se secuenció como 2 x 75 pb lee en un solo carril de una celda de flujo HiSeq 2000. El tumor y bibliotecas normales se agruparon en una proporción de 2:1. Métricas de rendimiento de la muestra para un grupo de muestras de ADN de tumores congelados se muestran en la Figura 1, incluyendo la tasa de alineación, distribución de tamaño de fragmento, la especificidad de captura en el blanco, y la media de cobertura objetivo. Mutaciones somáticas ejemplo, inserciones, deleciones, y alteraciones de número de copias se muestran en las Figuras 2-4.

Figura 1
Figura 1. Figuras representativas de las métricas de rendimiento de secuencia. a) la densidad de clúster y tasa de alineación, b) significa la meta de cobertura, > C) insertar distribución de tamaño, y d) capturar la especificidad. Haz clic aquí para ver la imagen más grande .

Figura 2
Figura 2. Genómica Integrativa Viewer (IGV) imagen que muestra la especificidad de secuencia de la cobertura en los exones de EGFR en cáncer de pulmón (arriba) y el tejido normal correspondiente (abajo). Las barras grises representan secuencia única lee. A la derecha, una mutación T> G heterocigotos está presente en el 24% de lecturas en el tumor y el 0% de lecturas en la normal, lo que indica que se trata de una sustitución de aminoácidos L858R somática. Haga clic aquí para ver la imagen más grande .

3 "fo: content-width =" "src =" 6 pulgadas / files/ftp_upload/50710/50710fig3.jpg "width =" 600px "/>
Figura 3. Ejemplos de indeles en un par de tumor normal de cáncer colorrectal:.. A) de inserción del marco de lectura somática en APC b) eliminación de marco somática de 7 pares de bases de TP53 Haga clic aquí para ver la imagen más grande .

Figura 4
Figura 4. Alteraciones en el número de copia en un par de tumores normales. Cada punto de datos representa un solo exón de 279 genes diana. Copiar ganancias y pérdidas numéricas se infieren de los aumentos y disminuciones en la cobertura de secuencia tumor. Haga clic aquí para ver la imagen más grande .

Tabla 1: Características de diseño de la sonda de captura seleccionada.

Exones totales 4535
Intrones totales 14
SNPs * 1042
Territorio totales del objetivo 879.966 pares de bases
Territorio total de la sonda 1.400.415 pares de bases

Tabla 2. Reactivos y Kits.

Nombre deReactivo / Material de Empresa Número de catálogo
Módulo Reparación NEBNext End New England Biolabs E6050L
NEBNext Módulo dA-tizón New England Biolabs E6053L
NEBNext Módulo Ligadura Rápida New England Biolabs E6056L
Agencourt AMPure XP Beckman Coulter Genómica
NEXTflex PCR-Free Códigos de barras - 24 Bioo Científico 514103
Kit HiFi Biblioteca Amplificación KAPA Biosystems KK2612
El ADN humano COT, Fluorometric Grado Roche Diagnostics 05 480 647 001
NimbleGen SeqCap EZ Hibridación y kit de lavado Roche NimbleGen 05 634 261 001
Cebos SeqCap EZ Biblioteca Roche NimbleGen
Kit de Purificación de PCR QIAquick Qiagen 28104
Qubit dsDNA Amplia Gama (BR) Kit de ensayo Life Technologies Q32850
Qubit dsDNA de alta sensibilidad (HS) Kit de ensayo Life Technologies Q32851
Kit Agilent DNA SA Agilent Technologies 5067-4626, 4627
Agilent 2100 Bioanalyzer Agilent Technologies
Covaris E220 Covaris
Magnética Stand-96 Ambion AM10027
Illumina Hi-Sec 2000 Illumina

Tabla 3. Índice Oligo Bloqueo y Primers secuencias.

TS-INV-HE Índice 2 Bloqueador
TS-HE universal Bloqueador AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
TS-INV-HE Índice 1 Bloqueador CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
CAAGCAGAAGACGGCATACGAGATACATCGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 3 Bloqueador CAAGCAGAAGACGGCATACGAGATGCCTAAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 4 Bloqueador CAAGCAGAAGACGGCATACGAGATTGGTCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 5 Bloqueador CAAGCAGAAGACGGCATACGAGATCACTGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 6 Bloqueador CAAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 7 Bloqueador CAAGCAGAAGACGGCATACGAGATGATCTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Index 8 Bloqueador CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 9 Bloqueador CAAGCAGAAGACGGCATACGAGATCTGATCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 10 Bloqueador CAAGCAGAAGACGGCATACGAGATAAGCTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 11 Bloqueador CAAGCAGAAGACGGCATACGAGATGTAGCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 12 Bloqueador CAAGCAGAAGACGGCATACGAGATTACAAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 13 Bloqueador CAAGCAGAAGACGGCATACGAGATTTGACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 14 Bloqueador CAAGCAGAAGACGGCATACGAGATGGAACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 15 Bloqueador CAAGCAGAAGACGGCATACGAGATTGACATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 16 Bloqueador CAAGCAGAAGACGGCATACGAGATGGACGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 18 Bloqueador CAAGCAGAAGACGGCATACGAGATGCGGACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 19 Bloqueador CAAGCAGAAGACGGCATACGAGATTTTCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 20 Bloqueador CAAGCAGAAGACGGCATACGAGATGGCCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 21 Bloqueador CAAGCAGAAGACGGCATACGAGATCGAAACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 22 Bloqueador CAAGCAGAAGACGGCATACGAGATCGTACGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE Índice 23 Bloqueador CAAGCAGAAGACGGCATACGAGATCCACTCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE 25 Index Bloqueador CAAGCAGAAGACGGCATACGAGATATCAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
TS-INV-HE índice 27 Bloqueador CAAGCAGAAGACGGCATACGAGATAGGAATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
Primer 1 5'-AATGATACGGCGACCACCGAGATCT-3 '
El cebador 2 5'-CAAGCAGAAGACGGCATACGAGAT-3 '

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Nuestro ensayo IMPACT produce una alta tasa de alineación, la alta tasa en el blanco, la meta de cobertura alta, y alta sensibilidad para detectar mutaciones, indeles y copiar alteraciones numéricas. Hemos demostrado la capacidad de nuestro ensayo IMPACT secuencia de ADN de ambos helado en fresco y archivado muestras de FFPE de entrada de baja ADN. Mediante la realización de secuenciación dirigida exón de los genes clave asociados con el cáncer, se puede lograr una cobertura de secuencia muy profundo para los exones de estos genes más críticos maximizando así la capacidad de detectar mutaciones de baja frecuencia. El uso de códigos de barras y multiplexación permite un mayor rendimiento, menor costo por muestra, y las cantidades de entrada más bajos de ADN.

Una ventaja del enfoque dirigido es que es factible para optimizar sondas de captura de tal manera que todos los exones están cubiertas de manera uniforme y suficientemente para la detección de mutaciones. Como se muestra en la Tabla 1, nuestro diseño abarca 4.535 exones en 279 genes. A raíz de las mejoras iterativas paranuestro diseño, un experimento típico de secuenciación produce no más de 2% de los exones a menos de 20% de la mediana para la cobertura de toda la muestra. Por lo tanto, para un tumor secuenciado a 500x cobertura de secuencia (una estimación conservadora como se muestra en la Figura 1),> 98% de los exones será cubierto por> 100x profundidad, garantizando una alta sensibilidad para la identificación de mutaciones de baja frecuencia. Esta uniformidad de la cobertura puede ser atribuido en gran medida a la flexibilidad del sistema Nimblegen SeqCap, donde las sondas se pueden sintetizar a diferentes longitudes en regiones de diferente composición de nucleótidos. También hemos utilizado con éxito biotina oligonucleótidos sintetizados individualmente de Integrated DNA Technologies (IDT) para añadir nuevos contenidos a nuestro panel y para aumentar la cobertura de las regiones que son difíciles de capturar y / o secuencia. Por también capturar seleccione intrones de los genes reordenados de manera recurrente, somos capaces de identificar reordenamientos estructurales que producen los genes de fusión, incluso cuando sólo una fusion socio es capturado.

Este enfoque de secuenciación específica sí posee dos limitaciones principales en la capacidad de detectar alteraciones genéticas "controlador" en los tumores. En primer lugar, sólo una fracción del genoma es interrogado. Secuenciación dirigida es, por naturaleza, limitada. A medida que nuevos genes del cáncer surgen de los esfuerzos sistemáticos de genómica, que se pueden añadir rápidamente a un panel de captura, pero las mutaciones funcionalmente importantes pueden pasarse por alto que se detecta por todo el genoma o la secuenciación del exoma. En segundo lugar, se limita a alteraciones basadas en el ADN. La detección de los transcritos expresados ​​aberrantemente, nuevas isoformas de empalme, y las fusiones de genes requiere RNA-Seq o técnicas similares 24. Alteraciones epigenéticas tales como modificaciones de la cromatina y la metilación del ADN también pueden desempeñar un papel clave en la tumorigénesis y la progresión tumoral. Como las tecnologías de secuenciación siguen mejorando, se pueden vislumbrar estrategias integradas empleando la secuenciación de todo el genoma, ARN-Seq y distintos criterios complementariosches para caracterizar exhaustivamente la genética y epigenética del maquillaje de los tumores individuales de forma rutinaria 25. Como estrategias integradas completas Actualmente costo-and-computacionalmente prohibitiva, secuenciación dirigida presenta una alternativa práctica para capturar las características genómicas más destacadas para aplicaciones clínicas y de la traducción.

Nuestro protocolo supone que los tumores se secuenciaron junto con el tejido normal correspondiente tomado del mismo paciente. El propósito de este control normal es para determinar si las variantes de secuencia detectadas en el tumor se heredan o somáticamente adquiridas. En ausencia de un normal correspondiente, se puede inferir que las variantes que ocurren en los hotspots mutacionales (es decir, los sitios de mutaciones somáticas recurrentes en otros tipos de cáncer) es probable que sean somática. Además, el análisis de las ganancias y pérdidas de número de copia se puede realizar con una muestra normal diploide emparejado no genéticamente. Para el resto de las alteraciones genéticas nuevas, la simultáneaanálisis ous de tejido normal correspondiente simplifica en gran medida la interpretación de los datos resultantes de mutación y es muy recomendable.

El protocolo IMPACTO descrito aquí demuestra consistencia y rendimiento de alta calidad para las muestras congeladas. Hemos observado variabilidad ocasional cuando se trabaja con muestras FFPE, sin embargo. Dependiendo de la edad y la calidad de la muestra FFPE, el ADN puede ser seriamente degradada o modificada químicamente, y como resultado puede hacer que la secuenciación y el análisis difícil 26. Dicho esto, hemos encontrado estas condiciones experimentales para ser fiable para la gran mayoría de las muestras FFPE. También hemos aplicado con éxito este protocolo para caracterizar otros especímenes clínicos relevantes, tales como biopsias, aspirados con aguja fina, así como muestras citológicas. Es por esta razón-la flexibilidad para adaptarse a diferentes tipos de especímenes de calidad variable, la cantidad, y la heterogeneidad-que este método se encuentra a un impacto en el diagnósticotratamiento d de pacientes con cáncer en el ámbito clínico.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Dr. Berger ha recibido honorarios de consultoría y fondos de investigación de Medicina de la Fundación, una compañía de diagnóstico de cáncer.

Acknowledgments

Damos las gracias a la Dra. Agnes Viale y el Laboratorio de Genómica MSKCC para la asistencia técnica. Este protocolo ha sido desarrollado con el apoyo del Centro de Investigación del Cáncer Geoffrey Beene y la Fundación Agricultores familia.

Materials

Name Company Catalog Number Comments
NEBNext End Repair Module New England Biolabs E6050L  
NEBNext dA-Tailing Module New England Biolabs E6053L  
NEBNext Quick Ligation Module New England Biolabs E6056L  
Agencourt AMPure XP Beckman Coulter Genomics  
NEXTflex PCR-Free Barcodes – 24 Bioo Scientific 514103  
HiFi Library Amplification Kit KAPA Biosystems KK2612  
COT Human DNA, Fluorometric Grade Roche Diagnostics 05 480 647 001  
NimbleGen SeqCap EZ Hybridization and Wash kit Roche NimbleGen 05 634 261 001  
SeqCap EZ Library Baits Roche NimbleGen  
QIAquick PCR Purification Kit Qiagen 28104  
Qubit dsDNA Broad Range (BR) Assay Kit Life Technologies Q32850  
Qubit dsDNA High Sensitivity (HS) Assay Kit Life Technologies Q32851  
Agilent DNA HS Kit Agilent Technologies 5067-4626, 4627  
Agilent 2100 Bioanalyzer Agilent Technologies  
Covaris E220 Covaris  
Magnetic Stand-96 Ambion AM10027  
Illumina Hi-Seq 2000 Illumina  

DOWNLOAD MATERIALS LIST

References

  1. Stratton, M. R., Campbell, P. J., Futreal, P. A. The cancer genome. Nature. 458 (7239), 719-724 (2009).
  2. Meyerson, M., Gabriel, S., Getz, G. Advances in understanding cancer genomes through second-generation sequencing. Nat. Rev. Genet. 11 (10), 685-696 (2010).
  3. Thomas, R. K., Baker, A. C., Debiasi, R. M., et al. High-throughput oncogene mutation profiling in human cancer. Nat. Genet. 39 (3), 347-351 (2007).
  4. Macconaill, L. E., Campbell, C. D., Kehoe, S. M., et al. Profiling critical cancer gene mutations in clinical tumor samples. PLoS One. 4 (11), e7887 (2009).
  5. Dias-Santagata, D., Akhavanfard, S., David, S. S., et al. Rapid targeted mutational analysis of human tumours: a clinical platform to guide personalized cancer medicine. EMBO Mol. Med. 2 (5), 146-158 (2010).
  6. Macconaill, L. E., Van Hummelen, P., Meyerson, M., Hahn, W. C. Clinical implementation of comprehensive strategies to characterize cancer genomes: opportunities and challenges. Cancer Discov. 1 (4), 297-311 (2011).
  7. Taylor, B. S., Ladanyi, M. Clinical cancer genomics: how soon is now. J. Pathol. 223 (2), 318-326 (2011).
  8. Gnirke, A., Melnikov, A., Maguire, J., et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nat. Biotechnol. 27 (2), 182-189 (2009).
  9. Mamanova, L., Coffey, A. J., Scott, C. E., et al. Target-enrichment strategies for next-generation sequencing. Nat. Methods. 7 (2), 111-118 (2010).
  10. Craig, D. W., Pearson, J. V., Szelinger, S., et al. Identification of genetic variants using bar-coded multiplexed sequencing. Nat. Methods. 5 (10), 887-893 (2008).
  11. Wagle, N., Berger, M. F., Davis, M. J., et al. High-throughput detection of actionable genomic alterations in clinical tumor samples by targeted, massively parallel sequencing. Cancer Discov. 2 (1), 82-93 (2012).
  12. Li, H., Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 25 (14), 1754-1760 (2009).
  13. Depristo, M. A., Banks, E., Poplin, R., et al. A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat. Genet. 43 (5), 491-498 (2011).
  14. Robinson, J. T., Thorvaldsdottir, H., Winckler, W., et al. Integrative genomics viewer. Nat. Biotechnol. 29 (1), 24-26 (2011).
  15. Cibulskis, K., Lawrence, M. S., Carter, S. L., et al. Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples. Nat. Biotechnol. 31 (3), 213-219 (2013).
  16. Larson, D. E., Harris, C. C., Chen, K., et al. SomaticSniper: identification of somatic point mutations in whole genome sequencing data. Bioinformatics. 28 (3), 311-317 (2012).
  17. Saunders, C. T., Wong, W. S., Swamy, S., Becq, J., Murray, L. J., Cheetham, R. K. Strelka: Accurate somatic small-variant calling from sequenced tumor-normal sample pairs. Bioinformatics. 28 (14), 1811-1817 (2012).
  18. Albers, C. A., Lunter, G., Macarthur, D. G., Mcvean, G., Ouwehand, W. H., Din del Durbin, R. Accurate indel calls from short-read data. Genome Res. 21 (6), 961-973 (2011).
  19. Li, S., Li, R., Li, H., et al. Efficient identification of indels from short paired reads. Genome Res. 23 (1), 195-200 (2013).
  20. Sindi, S., Helman, E., Bashir, A., Raphael, B. J. A geometric approach for classification and comparison of structural variants. Bioinformatics. 25 (12), 222-230 (2009).
  21. Chen, K., Wallis, J. W., Mclellan, M. D., et al. BreakDancer: an algorithm for high-resolution mapping of genomic structural variation. Nat. Methods. 6 (9), 677-681 (2009).
  22. Wang, J., Mullighan, C. G., Easton, J., et al. CREST maps somatic structural variation in cancer genomes with base-pair resolution. Nat. Methods. 8 (8), 652-654 (2011).
  23. Drier, Y., Lawrence, M. S., Carter, S. L., et al. Somatic rearrangements across cancer reveal classes of samples with distinct patterns of DNA breakage and rearrangement-induced hypermutability. Genome Res. 23 (2), 228-235 (2012).
  24. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet. 10 (1), 57-63 (2009).
  25. Roychowdhury, S., Iyer, M. K., Robinson, D. R., et al. Personalized oncology through integrative high-throughput sequencing: a pilot study. Sci. Transl. Med. 3 (111), 111ra121 (2011).
  26. Kerick, M., Isau, M., Timmermann, B., et al. Targeted high throughput sequencing in clinical cancer settings: formaldehyde fixed-paraffin embedded (FFPE) tumor tissues, input amount and tumor heterogeneity. BMC Med. Genomics. 4, 68 (2011).

Tags

Biología Molecular Número 80 Técnicas de Diagnóstico Molecular de alto rendimiento de secuenciación de nucleótidos Genética Neoplasias diagnóstico secuenciación masiva en paralelo dirigido secuenciación exón captura por hibridación cáncer FFPE las mutaciones del ADN
La detección de alteraciones genéticas somáticas en muestras de tumores por Exon de captura y secuenciación masivamente paralelo
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Won, H. H., Scott, S. N., Brannon,More

Won, H. H., Scott, S. N., Brannon, A. R., Shah, R. H., Berger, M. F. Detecting Somatic Genetic Alterations in Tumor Specimens by Exon Capture and Massively Parallel Sequencing. J. Vis. Exp. (80), e50710, doi:10.3791/50710 (2013).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter