Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

G2-seq: Una alto rendimiento basado en la secuencia técnica para identificar replicación tardía de regiones del genoma

Published: March 22, 2018 doi: 10.3791/56286

Summary

Describimos una técnica para combinar la citometría de flujo y la secuenciación de alto rendimiento para identificar regiones finales replicación del genoma.

Abstract

Numerosas técnicas se han desarrollado para seguir el progreso de la replicación del ADN a través de la fase S del ciclo celular. La mayoría de estas técnicas se han dirigido hacia la aclaración de la ubicación y el momento de inicio de la duplicación del genoma en lugar de su realización. Sin embargo, es fundamental que entendemos regiones del genoma que son última completar la replicación, porque estas regiones sufren niveles elevados de rotura cromosómica y mutación, y han sido asociados con la enfermedad y el envejecimiento. Aquí describimos cómo hemos ampliado una técnica que se ha utilizado para vigilar la iniciación de la replicación en cambio identificar las regiones del genoma última replicación completa. Este enfoque se basa en una combinación de citometría de flujo y la secuenciación de alto rendimiento. Aunque este informe se centra en la aplicación de esta técnica a la levadura, el enfoque puede utilizarse con cualquier célula que se puede ordenar en un citómetro de flujo según el contenido de ADN.

Introduction

Replicación del genoma eucariota se inicia en múltiples sitios discretos, llamados origen de replicación, de que la replicación horquillas proceden en ambas direcciones (revisados en Fragkos et al., 20151). Orígenes varían en su tiempo y eficiencia de la cocción, y se han desarrollado varias técnicas para supervisar la actividad de origen de replicación y aclarar las causas de esta variación. De niveles de single-stranded DNA2, que se forma alrededor de origen activo, puede inferirse la actividad de orígenes individuales o mediante el uso de electroforesis en 2D para supervisar la replicación específica intermedios3, que pueden ser detectadas con sondas radiactivas. Ambas de estas técnicas se aplican más fácilmente en S. cerevisiae que en células de mamífero, porque orígenes se limitan a secuencias específicas conocidas en la antigua. Con el advenimiento de los microarrays, llegó a ser posible evaluar origen disparando a nivel mundial. Esto fue hecho primero por etiquetado ADN con isótopos pesados, liberación de las células de un bloque de G1 en medio que contiene isótopos ligeros y monitoreo luego de la formación de pesados ligeros híbridos ADN en el genoma4. La introducción de secuenciación de alto rendimiento permitido genoma similares monitoreo de la actividad de origen sin el requisito de etiquetado isotópico caro. Las células fueron clasificadas en un citómetro de flujo según el contenido de ADN y su ADN sometido a secuenciación profunda. Porque la cobertura de secuencia procede de 1 x a 2 x en el transcurso de la fase S, sincronización de replicación relativa puede evaluarse comparando profundidades lecturas de células en fase S que en G1 o G25,6. Estas técnicas, aplicadas particularmente a levadura, condujeron a una comprensión más profunda de cómo proteínas de replicación de ADN, secuencia de la DNA y estructura de la cromatina regulan eficiencia y tiempo de origen.

La transmisión fiel de la información genética durante la proliferación celular requiere no sólo exitosa iniciación de la replicación del ADN, que ocurre en el origen, pero también superación de replicación, que ocurre el encuentro de las horquillas de replicación. Como iniciación de la replicación, el momento de la terminación de la replicación varía a lo largo del genoma con ciertas regiones restantes sin replicar hasta tarde en el ciclo celular. Tales regiones pueden ser particularmente distantes de orígenes de replicación activa o pueden contener secuencias o estructuras de cromatina que impiden polimerasas de la DNA. Tarde replicar las regiones puede manifestarse como sitios frágiles, que se asocian a fractura cromosómica y mayores tasas de mutación y se han implicado en cáncer y envejecimiento7,8,9. Sin embargo, a pesar de la importancia de la correcta terminación de la replicación del ADN en el mantenimiento de la estabilidad del genoma, nuestra comprensión de dónde y cómo esto ocurre ha retrasado lejos detrás de la iniciación de la replicación. Y mientras que los genes individuales cuya replicación tardía se ha asociado con la enfermedad han sido estudiados con, por ejemplo, qPCR10, globales estudios dirigidos a dilucidar las localizaciones y causas de la última replicación han faltado subyacentes. Aquí describimos una técnica que nos referimos a como "G2 seq" en el que combinamos la citometría de flujo con secuenciación de alto rendimiento para arrojar luz sobre la terminación de la replicación del genoma de la levadura11. Con pequeñas modificaciones, este protocolo puede ser adaptado a cualquier célula que puede ser flujo y ordenada según el contenido de ADN.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. preparación de células de flujo Cytometry clasificación

  1. Inocular tubos de ensayo de 15 mL que contiene 8 mL de caldo YEPD tal que los cultivos alcanzan una densidad de 5 x 106 a 1.5 x 107 células por mL después de crecimiento durante la noche (véase la discusión Nota 1).
  2. Desactivación de las células de levadura (1.400 x g, a temperatura ambiente o 4 ° C) en un tubo de centrífuga de 15 mL tapón durante 5 min, resuspender las células en etanol al de 70% 1.5 mL y transfiéralo a un tubo de microcentrífuga 1.6 mL, dejando este sit 1 h a temperatura ambiente o por lo menos 3 h de hielo ( se puede almacenar indefinidamente a 4 ° C) (véase punto de discusión (2)).
  3. Desactivación de las células de levadura en la microcentrífuga (14.000 x g, 4 ° C) durante 1 minuto, resuspender en 1 mL citrato de sodio 50 mM, pH 7.2, giro (14.000 x g, 4 ° C) durante 1 minuto, aspirar el sobrenadante, resuspender en 1 mL citrato de sodio 50 mM, pH 7.2 , que contiene 0.25 mg/mL solución de Rnasa por 1 h a 50 ° C o durante la noche a 37 ° C en baño de agua o bloque de calor.
  4. Añadir 50 μl proteinasa K solución (20 mg/mL resuspendió en 10 mM Tris, pH 7,5, 2 mM CaCl2, peso de 50% de glicerol de volumen) e incubar 1 h a 50 ° C.
  5. Desactivación de las células (14.000 x g, 4 º C), resuspender las células en 1 mL citrato de sodio 50 mM, pH 7.2, desactivación (14.000 x g, 4 º C), aspirar el sobrenadante con vacío, resuspender en 1 mL 1 μm ácido nucleico verde tensión resuspendió en citrato de sodio 50 mM , pH 7.2 e incubar en la oscuridad durante 1 h a temperatura ambiente, someter a ultrasonidos 2 x 2 s cada (2 vatios de potencia de salida).

2. celda de clasificación

  1. Utilizando un clasificador de celda, ordenar las células según el contenido de ADN en las fases G1, S, "primera G2" y "G2 tardía", que recoge al menos 1,6 millones células haploides de cada fase del ciclo celular como en la figura 1 (véase punto de discusión (3)).
  2. Células de transferencia a tubos de microcentrífuga y desactivación de las células durante 20 min a 14.000 xg a 4 ° C en la microcentrífuga y aspirar sobrenadante con vacío (la pelotilla puede guardarse congelada a-20 ° C por tiempo indefinido; véase el punto (4)).

3. DNA extracción y la preparación de la secuenciación de las bibliotecas

Nota: Los pasos siguientes se basan en "Protocolo" en la extracción de ADN genómico de levadura Kit (véase Tabla de materiales).

  1. Añadir 120 μl de "Tampón de digestión", un tampón patentado que permite enzimas líticas levadura y digerir la pared celular y 5 μl de enzima lítica de la levadura, agite con un vórtex, incubar a 37 ° C durante 40-60 min.
  2. Añadir 120 μl de tampón de lisis del"," un propiedad tampón que contiene detergente y vórtice dura de 10-20 s.
  3. Añadir cloroformo μl 250 - mezclar bien durante 1 minuto.
  4. Girar a la velocidad máxima en una microcentrífuga durante 2 minutos.
  5. Cargar el sobrenadante a la columna de unión de ADN y centrifugar a máxima velocidad en una microcentrífuga durante 1 minuto.
  6. Añadir 300 μL de "ADN lavado Tampón", un tampón patentado que contiene etanol y centrifugue durante 1 min a velocidad máxima en una microcentrífuga. Deseche el flujo a través, añadir 300 μL de tampón de lavado de ADN y repita el proceso de lavado.
  7. Transferir la columna spin a un tubo de microcentrífuga fresco, añadir 60 μL de agua (no TE) - esperar 1-3 minutos y luego centrifugar durante 10 s a fin de eluir el ADN.
  8. Medir la concentración al añadir 5 μl de ADN a 195 μl del reactivo de alta sensibilidad de dsDNA que ha sido diluido 1: 200 en buffer de alta sensibilidad de dsDNA y luego medir la fluorescencia en un fluorómetro, con 10 μl de estándares suministrados para la calibración; esperar entre 10 y 50 ng de rendimiento total de ADN.
  9. Someter a ultrasonidos (pico incidente energía 450, Factor de servicio 30%, ciclos por estallar 200, tratamiento tiempo 60 s, 6 de nivel de agua) para romper el ADN en fragmentos de 250-350 bp.
  10. Preparar una biblioteca utilizando el kit de preparación de muestras de ADN y secuenciarlo (lecturas del solo-fin de bp 50 por lo menos 10 millones) en el instrumento de la secuencia de DNA en modo rápido (ver nota de discusión (5)).

4. Análisis de la secuencia de datos y generación de replicación de perfiles

  1. Alinear secuencias de genoma de sacCer3 de Saccharomyces cerevisiae con Gsnap12 (ver nota de discusión (6)).
  2. Determinar por la base par Lee profundidades utilizando "genomeCoverageBed" software13 de Bedtools.
  3. Quitar puntas artefactuales en profundidades de lectura, si está presente (ver nota de discusión (7)).
  4. Lisa Lee profundidades por cromosoma usando medias en una kb 20 corredera ventana mediante la función "runMean" en R paquete "caTools" (ver nota de discusión (8)).
  5. Parcela Lee profundidades en fase S, G2 temprana y tardío G2 como un porcentaje de profundidad leer completamente replicado (ver nota de discusión (9)).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Hemos utilizado el procedimiento descrito anteriormente para identificar sitios de replicación tardíos en levadura de florecimiento. Prueba este planteamiento con una región de replicación finales conocida en un cromosoma artificial demostró la técnica exacta y fiable. Nuestros resultados también han demostrado la importancia biológica de la oportuna terminación de la replicación, mostrando que una región replicación tardía en el cromosoma 7, que identificamos como replicación de fines sobre la base de nuestros resultados de G2-seq, se perdió aproximadamente tres veces más con frecuencia que un similar control de región11.

Un ejemplo concreto de resultados con G2-seq se muestra en la figura 2. Nos habíamos presumido que hay regiones del genoma que se replica particularmente tarde en células carentes una deacetilasa proteína llamado Sir2. Figura 2A muestra la progresión del análisis de datos de tipo salvaje (azul) y sir2 (rojo). Los datos en bruto (filas superiores) contienen grandes espinas, la mayoría de los cuales es debida a la presencia de elementos de Ty. Estos puntos son quitados por capsular leerlas profundidades en 2.5 x la mediana leer la profundidad de cada muestra (filas centrales). Los datos despiked luego se suavizan con una ventana corredera de 20 kb (fila inferior). Finalmente, los datos son normalizados y trazados como relaciones a nivel de G1. Un típico de la región replicación tardía que aparece en el mutante del gen sir2 se destaca en la figura 2.

Figure 1
Figura 1. Flow cytometry perfil indicar fracciones de ciclo celular utilizados; límites exteriores de las puertas marcan. Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2. (A-B) Progresión de datos procesamiento de datos (filas superiores), despiked datos (filas centrales) y alisado datos (filas de la parte inferior) de tipo salvaje (A) y sir2 (B). (C) proporciones de S fase, temprana G2 y G2 tardía-G1 leer profundidades. Tipo salvaje en azul y sir2 en rojo. La región resaltada en la parte superior derecha muestra una región de replicación tardía específica a sir2 mutante. Escala indica la fracción de la replicación completa (2N); una célula completamente sin replicar aparecería en 0,5, una célula completamente replicada en 1. Haga clic aquí para ver una versión más grande de esta figura.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Mientras que esta técnica es robusta y relativamente directo, una atención especial debería destinarse a los siguientes:

(1) recomendamos que las culturas crecen durante al menos 12 h antes de llegar a la fase de registro, ya que las diferencias se manifiestan en ciclo celular distribuciones si las culturas son cosechadas después de haber alcanzado la densidad deseada a 4 h después de la inoculación. Nuestra hipótesis es que una distribución de ciclo celular que ha alcanzado un equilibrio relativamente estable mejor representa una distribución de la fase de registro "real" de una distribución que aún está en flujo cuando una cultura saturada se ha trasladado recientemente a medio fresco.

(2) en vez de girar hacia abajo de las células antes de fijar, las células pueden fijarse también añadiendo directamente etanol 100% a la cultura de la levadura para que la concentración final de etanol es del 70%. Las células pueden cultivarse en medio (YEPD) ya sea sintético o ricos.

(3) ciclo celular fases son visualizadas para la clasificación por numero de celular trazado en función del área de emisión de 530 nm. Hemos encontrado que los puntos de inflexión entre G1 y S y S y G2 sirven como puntos de referencia sólidas para delinear la fase S, y utilizamos el máximo de la G2 como límite para separar G2 temprana y tardía. Utilizamos los términos "primera G2" y "G2 tardía" de claridad y brevedad, tal vez a expensas de la precisión en el sentido de que las células son técnico en fase de S hasta que hayan completado la replicación del ADN. Aunque el objetivo de G2-seq es identificar sitios de replicación muy tarde, que se esperan que se reveló en la última fracción de G2, recogemos fase S y células de G2 tempranas para seguir la replicación a través de todas las fases del ciclo celular.

(4) es muy importante que las células centrifugar abajo inmediatamente después de su clasificación. No permita que las células sentarse durante la noche antes de girar hacia abajo. Hemos tenido problemas de recuperación de las células por centrifugación si se han guardado a 4 ° C, sugiriendo que se vuelven frágiles sobre clasificación y lyse con tiempo.

(5) como pocos como Lee 5 millones es suficiente, pero las parcelas se convierten menos liso con un menor número de lecturas. Conjuntos de datos con menos lecturas puede ser acomodado por alisar con ventanas más grandes que 20 kb, pero no hemos probado esto.

(6) cualquier software de alineación utilizada (p. ej., Bowtie14, Novalign (http://www.novocraft.com), BWA15o Gsnap12) funcionará.

(7) alto rendimiento secuencia datos de levadura muestran picos ocasionales en profundidades de lectura, que a menudo reflejan elementos de Ty. Eliminamos estos sustituyendo 2.5 x mediana muestra leer profundidades para leerlas profundidades fuera de regiones que contienen estiramientos repetitivos (p. ej., el ADNr) que son mayores que la mediana de x 2,5. El rDNA y los extremos de los cromosomas quedan excluidos porque se sabe que contienen elementos repetitivos. Un ejemplo de este "despiking" utilizando el lenguaje R es el siguiente:

# crear una estructura de datos llamada "Lee" que contiene los datos:
Chr <-rep ('mente', 10)
pos <-seq (1, 10)
Rd <-c (3, 4, 6, 5, 88, 2, 9, 10, 900, 1)

Lee <-data.frame ('cromosoma' = chr,
'position' = pos,
'read_depth' = rd)

# "despike" las profundidades de lectura:
lecturas [, 'despiked'] <-ifelse (Lee [, 3] > (2.5 * median(reads[,3])),
(2.5 * median(reads[,3])),
Reads[,3])

"Tapado" o "despiking" se puede también alcanzar por excepto Lee que asigna a más de un lugar, pero esto elimina lecturas que, por ejemplo, sólo dos lugares. Instancias de lecturas que se asignan a más de un lugar, pero todavía proporcionan información valiosa, no son infrecuentes cuando se trabaja con S. cerevisiae, cuyo genoma resultó de una duplicación ancestral16.

(8) hemos obtenido resultados comparables con la función "rollmedian" en el paquete de R "zoo" (https://cran.r-project.org/web/packages/zoo/index.html) y la función de "runmean" en el paquete de R "caTools" (https://cran.r-project.org/web/packages/caTools/index.html).

(9) hemos experimentado con numerosos métodos para normalizar leerlas profundidades, todo lo cual dio resultados comparables. Nuestro enfoque favorecido se basa en el supuesto de que al menos algunas regiones del genoma son completamente replicados en nuestra muestra de fase S. Se determinó la profundidad leer que representa la replicación completa como la mediana profundidad en nuestro conjunto de datos en los sitios correspondientes a los 12 primeros disparo alta confianza (puntuación de "confianza" > = 7) orígenes en un conjunto de datos disponible públicamente. (http://cerevisiae.oridb.org/data_output.php?main=sc_ori_studies & tabla = Raghu2001_ori & ext_format = & formato = ficha). Para la mayoría de las aplicaciones, el enfoque adoptado para la normalización no es crítico y hay muchas opciones razonables, normalizando más simplemente para leer todos los resultados de la cuenta. Sin embargo, cabe señalar que si hay grandes diferencias en los números de secuencias repetitivas muestras, normalización leer cuenta totales puede ser engañoso. Por ejemplo, al comparar dos cepas cuyas matrices de rDNA difieren en varias veces, la normalización total leer cuentas puede hacer cierta regiones del genoma de la cepa con la mayor gama de rDNA artefactually parecen replicar más adelante que la cepa con el más pequeño matriz.

En Resumen, G2-seq representa una extensión lógica de las técnicas existentes para perfiles de replicación. Como otras técnicas de secuenciación y microarray basado en G2-seq tiene ventajas sobre 2D gel análisis de cobertura amplia de genoma y la falta de requisito de conocimiento de la localización de orígenes de replicación. Este último es particularmente relevante en células de mamífero, a diferencia de en levadura de florecimiento, orígenes de replicación no se limitan a secuencias específicas. Por otro lado, geles 2D proporcionan un nivel de resolución de moleculares intermedios en la replicación del ADN completamente inalcanzable por G2-siguientes ampliación G2-seq a otros organismos cuyas células se pueden clasificar según el contenido de ADN debería ser relativamente sencillo, sin embargo, la naturaleza altamente repetitiva de los genomas de eucariotas superiores hace alineación de secuencias cortas de lectura mucho más difícil. Nuevas tecnologías de secuenciación que aportan significativamente más leer longitud puede resultar útil en este sentido, especialmente puesto que G2-seq debe ser relativamente robusto a las mayores tasas de error que pueden asociarse con más lecturas17. En nuestra experiencia, el problema técnico que es más probable que cause problemas es dejar que las células a sentarse después de que han sido clasificados y antes de aislamiento de la DNA. Estas células aparecen ser particularmente frágiles y Lyse con el tiempo y ADN debe ser aislado dentro de a más de una hora o dos de la clasificación. Direcciones futuras prometedoras para esta técnica incluyen dividir las fases S y G2 en un número creciente de fracciones para obtener mayor resolución de la dinámica de la replicación del genoma, de iniciación temprana a la terminación final.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

Este trabajo fue financiado por beca NIH GM117446 a A.B.

Materials

Name Company Catalog Number Comments
YeaStar Genomic DNA kit Genesee Scientific 11-323
1 µM SYTOX Green ThermoFisher 57020 resuspend in 50 mM sodium citrate, pH 7.2
50 mM sodium citrate, pH 7.2
RNase solution (0.25 mg / mL) Sigma R6513 0.25 mg / mL RNaseA resuspended in 50 mM sodium citrate, pH 7.2, boil RNase solution for 10 minutes before the first use only, and from then on store at -20°
proteinase K solution (20 mg / mL) ThermoFisher / Invitrogen 25530-015 resuspend in 10 mM Tris, pH 7.5, 2 mM CaCl2, 50% glycerol, store at -20°C
Model 50 Sonic Dismembrator Fisher Scientific FB50A220
BD Biosciences FACSAria II BD Biosciences 644832
Zymo-spin III columns Zymo Research C1005
Qubit dsDNA HS Assay Kit ThermoFisher Q32851
Qubit 3.0 Fluorometer ThermoFisher Q33216
Covaris Model LE220 Focused-Ultrasonicator Covaris 500219
Illumina TruSeq DNA LT Sample Prep Kit Illumina 15026486
Illumina HiSeq 2500 instrument Illumina SY–401–2501
gsnap alignment software open source software / Genentech http://research-pub.gene.com/gmap

DOWNLOAD MATERIALS LIST

References

  1. Fragkos, M., Ganier, O., Coulombe, P., Mechali, M. DNA replication origin activation in space and time. Nat Rev Mol Cell Biol. 16, 360-374 (2015).
  2. Santocanale, C., Diffley, J. F. A Mec1- and Rad53-dependent checkpoint controls late-firing origins of DNA replication. Nature. 395, 615-618 (1998).
  3. Brewer, B. J., Fangman, W. L. A replication fork barrier at the 3' end of yeast ribosomal RNA genes. Cell. 55, 637-643 (1988).
  4. Raghuraman, M. K., et al. Replication dynamics of the yeast genome. Science. 294, 115-121 (2001).
  5. Muller, C. A., Nieduszynski, C. A. Conservation of replication timing reveals global and local regulation of replication origin activity. Genome Res. 22, 1953-1962 (2012).
  6. Koren, A., Soifer, I., Barkai, N. MRC1-dependent scaling of the budding yeast DNA replication timing program. Genome Res. 20, 781-790 (2010).
  7. Lang, G. I., Murray, A. W. Mutation rates across budding yeast chromosome VI are correlated with replication timing. Genome Biol Evol. 3, 799-811 (2011).
  8. Durkin, S. G., Glover, T. W. Chromosome fragile sites. Annu Rev Genet. 41, 169-192 (2007).
  9. Dillon, L. W., Burrow, A. A., Wang, Y. H. DNA instability at chromosomal fragile sites in cancer. Curr Genomics. 11, 326-337 (2010).
  10. Widrow, R. J., Hansen, R. S., Kawame, H., Gartler, S. M., Laird, C. D. Very late DNA replication in the human cell cycle. Proc Natl Acad Sci U S A. 95, 11246-11250 (1998).
  11. Foss, E. J., et al. SIR2 suppresses replication gaps and genome instability by balancing replication between repetitive and unique sequences. Proc Natl Acad Sci U S A. 114, 552-557 (2017).
  12. Wu, T. D., Reeder, J., Lawrence, M., Becker, G., Brauer, M. J. GMAP and GSNAP for Genomic Sequence Alignment: Enhancements to Speed, Accuracy, and Functionality. Methods Mol Biol. 1418, 283-334 (2016).
  13. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  14. Langmead, B. Aligning short sequencing reads with Bowtie. Curr Protoc Bioinformatics. , Chapter 11, Unit 11 17 (2010).
  15. Li, H., Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 25, 1754-1760 (2009).
  16. Kellis, M., Birren, B. W., Lander, E. S. Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae. Nature. 428, 617-624 (2004).
  17. Goodwin, S., McPherson, J. D., McCombie, W. R. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 17, 333-351 (2016).

Tags

Genética número 133 replicación tardía sitios frágiles citometría de flujo levadura Saccharomyces cerevisiae la secuencia de alto rendimiento
G2-seq: Una alto rendimiento basado en la secuencia técnica para identificar replicación tardía de regiones del genoma
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Foss, E. J., Lao, U., Bedalov, A.More

Foss, E. J., Lao, U., Bedalov, A. G2-seq: A High Throughput Sequencing-based Technique for Identifying Late Replicating Regions of the Genome. J. Vis. Exp. (133), e56286, doi:10.3791/56286 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter