Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

G2-seq: Uma alta taxa de transferência baseada no sequenciamento técnica para identificar a tarde replicando regiões do genoma

Published: March 22, 2018 doi: 10.3791/56286

Summary

Nós descrevemos uma técnica de combinação de citometria de fluxo e sequenciamento de alto throughput para identificar regiões de replicação finais do genoma.

Abstract

Inúmeras técnicas têm sido desenvolvidas para acompanhar o progresso da replicação do DNA através da fase S do ciclo celular. A maioria destas técnicas tem sido direcionada para elucidação do local e hora de início da duplicação do genoma, ao invés de sua conclusão. No entanto, é fundamental que nós entendemos de regiões do genoma que são última para concluir a replicação, porque essas regiões sofrem níveis elevados de quebra cromossômica e mutação, e eles têm sido associados com doenças e envelhecimento. Aqui descrevemos como nós estendemos uma técnica que tem sido usada para monitorar a iniciação de replicação para em vez disso, identificar as regiões do genoma última a replicação completa. Esta abordagem é baseada em uma combinação de citometria de fluxo e sequenciamento de alto rendimento. Embora este relatório centra-se sobre a aplicação desta técnica a levedura, a abordagem pode ser usada com qualquer uma das células que pode ser classificada em um citômetro de fluxo de acordo com o conteúdo de DNA.

Introduction

Replicação do genoma eucariótico é iniciada em vários locais discretos, chamados origens de replicação, de que a replicação garfos procedem em ambas as direções (revistas em Fragkos et al, 20151). Origens variam em seu tempo e a eficiência de queima, e várias técnicas foram desenvolvidas para monitorar a atividade de origem de replicação e elucidar as causas desta variação. A atividade de origens individuais pode ser inferida níveis de single-stranded DNA2, que se forma em torno de origens ativas, ou por meio de eletroforese em gel 2D para monitorar a replicação específico intermediários3, ambos os quais podem ser detectados com sondas radioactivas. Ambas estas técnicas são mais facilmente aplicadas em S. cerevisiae do que em células de mamíferos, porque origens limitam-se a sequências específicas de conhecido na antiga. Com o advento dos microarrays, tornou-se possível avaliar globalmente a disparar de origem. Isto foi feito primeiro pela rotulagem DNA com isótopos pesados, liberando as células de um bloco de G1 no médios contendo isótopos leves e monitoramento em seguida a formação de pesados-luz híbrido DNA através do genoma4. A introdução de sequenciamento de alto throughput permitiu semelhante genoma-monitoração de atividade de origem, sem a exigência de marcação isotópica caro. As células foram classificadas em um citômetro de fluxo de acordo com o conteúdo de DNA e seu DNA submetido ao sequenciamento profundo. Porque a cobertura de sequência procede de 1x a 2x ao longo da fase S, sincronismo de replicação relativo pode ser avaliado comparando leitura profundidades de células em fase S àqueles em G1 ou G25,6. Estas técnicas, particularmente aplicadas à levedura, levaram a uma compreensão mais profunda de como sequência de DNA, estrutura da cromatina e DNA replicação proteínas regulam eficiência e sincronismo de origem.

Transmissão fiel da informação genética durante a proliferação celular requer não só sucesso iniciação da replicação do DNA, que se realiza às origens, mas também a conclusão bem sucedida da replicação, que ocorre onde encontram forquilhas de replicação. Como iniciação da replicação, o momento da conclusão da replicação varia consoante o genoma com certas regiões restantes replicadas no mesmo final do ciclo celular. Tais regiões podem ser particularmente distantes origens de replicação ativa ou podem conter sequências ou estruturas de cromatina que impedem as polimerases de DNA. Tarde, replicar as regiões pode se manifestar como sítios frágeis, que são associados com quebras cromossômicas e maiores taxas de mutação e têm sido implicados no cancro e o envelhecimento7,8,9. No entanto, apesar da importância da adequada conclusão da replicação do DNA na manutenção da estabilidade do genoma, nossa compreensão de onde e como isso ocorre tem lag muito atrás da iniciação da replicação. E enquanto os genes individuais cuja replicação final tem sido associada com doença têm sido estudados com, por exemplo, qPCR10, globais estudos dirigidos a elucidar as localizações e ultimamente tem faltado replicação de causas subjacentes. Aqui nós descrevemos uma técnica que chamamos como "G2 seq", no qual combinamos citometria de fluxo com sequenciamento de alto throughput para lançar luz sobre a conclusão da replicação do genoma em fermento11. Com pequenas alterações, este protocolo pode ser adaptado a qualquer uma das células que pode ser de fluxo-classificados de acordo com o conteúdo de DNA.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. preparação de células para Flow Cytometry classificação

  1. Inocular tubos de ensaio de 15 mL contendo 8 mL de caldo YEPD tal que as culturas atingem uma densidade de 5 x 106 a 1,5 x 107 células / mL após crescimento durante a noite (ver discussão Nota 1).
  2. Spin para baixo de células de levedura (1.400 x g, à temperatura ambiente ou 4 ° C) em um tubo de centrifugação de tampa de rosca 15 mL por 5 min, Ressuspender as células em 1,5 mL de etanol a 70% e transferir para um tubo de microcentrífuga de 1,6 mL, deixando este sentar-se por 1h à temperatura ambiente ou pelo menos 3 h no gelo ( podem ser armazenados indefinidamente a 4 ° C) (ver ponto de discussão (2)).
  3. Spin para baixo de células de levedura na microcentrífuga (14.000 x g, 4 ° C) por 1 min, resuspenda em citrato de sódio 1 mL 50 mM, pH 7,2, spin-down (14.000 x g, 4 ° C) por 1 min, aspirar o sobrenadante, resuspenda em citrato de sódio 1 mL 50 mM, pH 7,2 , contendo 0,25 mg/mL solução de RNAse h 1 a 50 ° C, ou durante a noite a 37 ° C em banho de água ou bloco térmico.
  4. Adicionar 50 µ l solução de proteinase K (20 mg/mL resuspended em pH de Tris 10 mM 7,5, 2 mM CaCl2, peso de 50% de glicerol de volume) e incubar durante 1 h a 50 ° C.
  5. Spin para baixo de células (14.000 x g, 4 ° C), Ressuspender as células em 1 mL citrato de sódio 50 mM, pH 7,2, spin para baixo (14.000 x g, 4 ° C), aspirar o sobrenadante com vácuo, resuspenda em 1 mL 1 µM verde ácido nucleico estirpe resuspended em citrato de sódio 50 mM , pH 7,2 e incubar no escuro por 1h à temperatura ambiente, proceda à sonicação 2x para 2 s cada (2 watts de potência de saída).

2. célula de triagem

  1. Usando um classificador de célula, tipo de células de acordo com o conteúdo de DNA em fases G1, S, "G2 precoce" e "tarde G2", recolha de pelo menos 1,6 milhões células haploides de cada fase do ciclo celular como na Figura 1 (ver ponto de discussão (3)).
  2. Células de transferência para tubos de microcentrífuga e spin para baixo de células por 20 min a 14.000 x g a 4 ° C, na microcentrífuga e aspire o sobrenadante com vácuo (a pelota pode ser armazenada congelado a-20 ° C indefinidamente; ver discussão ponto (4)).

3. DNA extração e preparação de sequenciamento de bibliotecas

Nota: As etapas a seguir são baseadas em "protocolo" na extração de DNA genômico de levedura Kit (veja a Tabela de materiais).

  1. Adicione 120 µ l de "Buffer de digestão," um buffer patenteado que permite que a enzima lítica de levedura digerir a parede celular e 5 µ l da enzima lítica de levedura, resuspenda vortexing e incubar a 37 ° C por 40-60 min.
  2. Adicione 120 µ l de "Lise," uma reserva proprietária que contém detergente e difícil para 10-20 s de vórtice.
  3. Adicionar 250 clorofórmio µ l - homogeneizar por 1 min.
  4. Girar na velocidade máxima em uma microcentrífuga por 2 min.
  5. Carrega o sobrenadante para a coluna de ligação de DNA e centrifugar a velocidade máxima em uma microcentrífuga por 1 min.
  6. Adicione 300 µ l de "DNA lavagem Buffer," uma reserva proprietária que contém etanol e centrifugar por 1 min na velocidade máxima em uma microcentrífuga. Descartar o fluxo através de, adicionar 300 µ l de tampão de lavagem do DNA e repita o processo de lavagem.
  7. Transferir a coluna de rotação para um tubo de microcentrífuga fresco, Adicionar 60 µ l de água (não TE) - Espere 3 min - 1 e em seguida centrifugar durante 10 s para Eluir o DNA.
  8. Medir a concentração pela adição de 5 µ l de DNA para 195 µ l de reagente de alta sensibilidade de dsDNA que foi diluído 1: 200 em dsDNA buffer de alta sensibilidade e, em seguida, a medida de fluorescência em um dados, usando 10 µ l de fornecidos padrões para calibração; Espero que entre 10 e 50 ng do rendimento total do ADN.
  9. Proceda à sonicação (pico incidente poder 450, Factor de serviço de 30%, ciclos por 200 Burst, tratamento tempo 60 s, nível de água 6) para separar o DNA em fragmentos de bp 250-350.
  10. Preparar uma biblioteca usando o kit de preparação de amostra de DNA e sequência-(leituras de pelo menos 10 milhões 50 bp único-extremidade) do instrumento de sequenciamento de DNA no modo rápido (ver nota de discussão (5)).

4. análise de dados e geração de replicação de sequenciamento perfis

  1. Alinhar sequências de Saccharomyces cerevisiae sacCer3 genoma usando Gsnap12 (ver nota de discussão (6)).
  2. Determine por-base par ler profundidades usando "genomeCoverageBed" software13 dos Bedtools.
  3. Remover artefactual picos nas profundezas de leitura, se presente (ver nota de discussão (7)).
  4. Liso ler profundezas por cromossoma usando medianas em um 20KB deslizante janela usando a função "runMean" em R pacote "caTools" (ver nota de discussão (8)).
  5. Trama ler profundezas em S fase precoce G2 e G2 atrasado como uma porcentagem de profundidades de leitura completamente replicadas (ver nota de discussão (9)).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Temos utilizado o procedimento descrito acima para identificar sites replicação finais no fermento de brotamento. Esta abordagem usando uma região de replicação final conhecida em um cromossomo artificial de teste provou a técnica para ser precisa e confiável. Nossos resultados também demonstraram a importância biológica da conclusão atempada da replicação, mostrando que uma tarde região replicam no cromossomo 7, que identificamos como replicação final com base nos nossos resultados de G2-seq, foi perdida aproximadamente triplo, mais frequentemente do que uma comparável controle região11.

Um exemplo específico de resultados com G2-seq é mostrado na Figura 2. Nós tinha a hipótese de que lá estaria regiões do genoma que particularmente tarde replicados nas células falta uma proteína deacetilase chamado Sir2. Figura 2A mostra o progresso da análise de dados para o tipo selvagem (azul) e sir2 (vermelho). Os dados brutos (linhas superiores) contêm grandes picos, a maioria dos quais são devida à presença de elementos de Ty. Estes picos são removidos por tampando Leia profundidades em 2.5 x a mediana leitura profundidade para cada amostra (linhas médios). Então, os dados despiked são suavizados com uma janela de 20KB deslizante (linha inferior). Finalmente, dados são normalizados e plotados como rácios para os níveis no G1. Uma região típica tarde replicam que aparece no mutante sir2 é destacada na Figura 2.

Figure 1
Figura 1. Fluxo cytometry perfil indicando fracções de ciclo celular usadas; Marcado como limites externos de todas as portas. Clique aqui para ver uma versão maior desta figura.

Figure 2
Figura 2. (A-B) Progressão de processamento de dados de dados brutos (linhas superiores), despiked de dados (linhas de médios) e alisou dados (linhas de fundo) para o tipo selvagem (A) e sir2 (B). (C) rácios de S fase - início G2- e tarde G2-G1 ler profundezas. Tipo selvagem em azul e sir2 em vermelho. A região realçada no canto superior direito mostra uma região de replicação final específico para sir2 mutante. Escala indica a fração de replicação completa (2N); uma célula completamente replicada apareceria em 0,5, uma célula completamente replicada no 1. Clique aqui para ver uma versão maior desta figura.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Enquanto esta técnica é robusta e relativamente direta, deve ser prestada especial atenção ao seguinte:

(1) recomendamos que culturas crescem pelo menos 12 h antes que eles atinjam a fase de registo, desde que diferenças se manifestar no ciclo celular distribuições se culturas são colhidas após ter alcançado a densidade desejada apenas 4 h após a inoculação. Nossa suposição é que uma distribuição de ciclo celular que atingiu um equilíbrio relativamente estável melhor representa uma distribuição de fase log "real" do que uma distribuição que está ainda em movimento, quando uma cultura saturada foi mais recentemente transferida para meio fresco.

(2) em vez de girar para baixo as células antes da fixação, as células também podem ser corrigidas adicionando diretamente etanol 100% para a cultura de levedura para que a concentração final de etanol é de 70%. As células podem ser cultivadas em sintético ou rico médio (YEPD).

(3) fases do ciclo de celular são visualizadas para ordenar por número de célula plotagem em função da área de emissão 530 nm. Descobrimos que os pontos de inflexão entre G1 e S e S e G2 servem como Marcos robustos para delinear a fase S, e nós usamos o máximo de G2 de fronteira para separar G2 cedo e tarde. Usamos os termos "G2 precoce" e "G2 final" para a clareza e concisão, talvez em detrimento da precisão no sentido de que as células são tecnicamente em fase S até que tenham concluído a replicação do DNA. Embora o objetivo do G2-seq é identificar sites muito tarde-replicação, que são esperados para ser revelado na fração G2 atrasada, nós coletamos fase S e cedo G2 células a seguir replicação através de todas as fases do ciclo celular.

(4) é criticamente importante que células ser girado para baixo imediatamente após a classificação. Não deixe pilhas sentar-se durante a noite antes girando-os para baixo. Temos tido problemas de recuperação de células por centrifugação se eles foram armazenados a 4 ° C, sugerindo que eles tornam-se frágeis após triagem e lyse com tempo.

(5) como poucos como leituras 5 milhões é suficientes, mas parcelas tornam-se menos suave, com menor número de leituras. Conjuntos de dados com leituras menos ainda pode ser capazes de ser acomodados pela suavização com janelas maiores que 20 kb, mas nós não tentamos isso.

(6) qualquer software de alinhamento utilizado (por exemplo, Bowtie14, Novalign (http://www.novocraft.com), BWA15ou Gsnap12) irá funcionar.

(7) dados de sequenciamento alto throughput do fermento mostram picos ocasionais em profundidades de leitura, que muitas vezes refletem elementos de Ty. Podemos eliminar estas substituindo 2.5 x mediana amostra ler profundezas para leitura profundidades fora regiões conhecidas por conter trechos repetitivos (por exemplo, o rDNA) maiores do que a mediana de x 2,5. O rDNA e as extremidades dos cromossomos são excluídas porque eles são conhecidos por conter elementos repetitivos. Um exemplo deste "despiking" usando a linguagem R é o seguinte:

# criar um quadro de dados chamado "leituras", contendo os dados:
Chr <-rep ('chrI', 10)
pos <-seq (1, 10)
área de trabalho remota <-c (3, 4, 6, 5, 88, 2, 9, 10, 900, 1)

lê <-data.frame ('cromossomo' = chr,
'posição' = pos,
'read_depth' = rd)

# "despike" as profundezas de leitura:
leituras [, 'despiked'] <-ifelse (leituras [, 3] > (2,5 * median(reads[,3])),
(2,5 * median(reads[,3])),
reads[,3])

"Tampando" ou "despiking" pode também ser conseguida excluindo leituras que mapeiam para mais de um local, mas isto irá eliminar leituras que mapeiam para, por exemplo, apenas dois locais. Instâncias de leituras que mapeiam para mais de um local, mas ainda fornecem informações valiosas, não são incomuns quando se trabalha com S. cerevisiae, cujo genoma resultou de um ancestral duplicação16.

(8) obtivemos resultados comparáveis com a função de "rollmedian" no pacote R "zoo" (https://cran.r-project.org/web/packages/zoo/index.html) e a função "runmean" no pacote R "caTools" (https://cran.r-project.org/web/packages/caTools/index.html).

(9) nós já experimentou inúmeros métodos para normalizar a profundidades de leitura, que deu resultados comparáveis. Nossa abordagem favorecida baseia-se no pressuposto de que pelo menos algumas regiões do genoma são totalmente replicados em nossa amostra de fase S. Determinamos a profundidade de leitura que representava a replicação completa como a mediana lê profundidade em nosso conjunto de dados em locais correspondentes aos 12 primeiros disparando alta confiança (Pontuação de "confiança" > = 7) origens em um conjunto de dados publicamente disponível. (http://cerevisiae.oridb.org/data_output.php?main=sc_ori_studies & tabela = Raghu2001_ori & ext_format = & formato = guia). A maioria dos aplicativos, a abordagem adoptada para normalização não é crítica, e há muitas opções razoáveis, normalizando-se mais simplesmente apenas para ler os totais de contagem. No entanto, vale notar que, se existem grandes diferenças nos números de sequências repetitivas entre as amostras, normalização para ler contagem totais pode ser enganosa. Por exemplo, ao comparar duas linhagens cujas matrizes de rDNA diferem por várias vezes, normalizando a total de contagens de ler pode fazer certa regiões do genoma da estirpe com a maior matriz de rDNA artefactually parecem replicar a tensão com o menor, o mais tardar matriz.

Em resumo, G2-seq representa uma extensão lógica das técnicas existentes para perfil de replicação. Como outras técnicas de sequenciamento e microarray-baseada, G2-seq tem vantagens sobre 2D gel análise da ampla cobertura do genoma e a falta de exigência de conhecimento da localização das origens de replicação. O último é particularmente relevante em células de mamíferos onde, ao contrário no fermento de brotamento, origens de replicação não estão limitadas a sequências específicas. Por outro lado, géis 2D fornecem um nível de resolução de intermediários moleculares na replicação do DNA completamente inatingível por G2-Seq estendendo G2-seq para outros organismos cujas células podem ser classificadas de acordo com o conteúdo de DNA deve ser relativamente direta, no entanto, a natureza altamente repetitiva dos genomas de eucariotos superiores faz alinhamento de Sequências curtas de leitura muito mais desafiador. Tecnologias de sequenciamento que fornecem significativamente mais emergentes ler comprimento pode ser úteis a este respeito, especialmente desde que G2-seq deve ser relativamente robusto para as maiores taxas de erro que podem ser associadas com mais leituras17. Em nossa experiência, o problema técnico que é mais provável de causar problemas é deixar células sentar depois que eles foram classificados e antes do isolamento do DNA. Estas células aparecem para ser particularmente frágil e lyse com o tempo, e DNA deve ser isolado dentro de no máximo uma ou duas horas de classificação. Direções de futuras promissoras para esta técnica incluem dividindo as fases S e G2 tanto em aumento do número de fracções para obter maior resolução da dinâmica da replicação do genoma, de início precoce, a conclusão final.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm nada para divulgar.

Acknowledgments

Este trabalho foi apoiado por grant GM117446 NIH de A.B.

Materials

Name Company Catalog Number Comments
YeaStar Genomic DNA kit Genesee Scientific 11-323
1 µM SYTOX Green ThermoFisher 57020 resuspend in 50 mM sodium citrate, pH 7.2
50 mM sodium citrate, pH 7.2
RNase solution (0.25 mg / mL) Sigma R6513 0.25 mg / mL RNaseA resuspended in 50 mM sodium citrate, pH 7.2, boil RNase solution for 10 minutes before the first use only, and from then on store at -20°
proteinase K solution (20 mg / mL) ThermoFisher / Invitrogen 25530-015 resuspend in 10 mM Tris, pH 7.5, 2 mM CaCl2, 50% glycerol, store at -20°C
Model 50 Sonic Dismembrator Fisher Scientific FB50A220
BD Biosciences FACSAria II BD Biosciences 644832
Zymo-spin III columns Zymo Research C1005
Qubit dsDNA HS Assay Kit ThermoFisher Q32851
Qubit 3.0 Fluorometer ThermoFisher Q33216
Covaris Model LE220 Focused-Ultrasonicator Covaris 500219
Illumina TruSeq DNA LT Sample Prep Kit Illumina 15026486
Illumina HiSeq 2500 instrument Illumina SY–401–2501
gsnap alignment software open source software / Genentech http://research-pub.gene.com/gmap

DOWNLOAD MATERIALS LIST

References

  1. Fragkos, M., Ganier, O., Coulombe, P., Mechali, M. DNA replication origin activation in space and time. Nat Rev Mol Cell Biol. 16, 360-374 (2015).
  2. Santocanale, C., Diffley, J. F. A Mec1- and Rad53-dependent checkpoint controls late-firing origins of DNA replication. Nature. 395, 615-618 (1998).
  3. Brewer, B. J., Fangman, W. L. A replication fork barrier at the 3' end of yeast ribosomal RNA genes. Cell. 55, 637-643 (1988).
  4. Raghuraman, M. K., et al. Replication dynamics of the yeast genome. Science. 294, 115-121 (2001).
  5. Muller, C. A., Nieduszynski, C. A. Conservation of replication timing reveals global and local regulation of replication origin activity. Genome Res. 22, 1953-1962 (2012).
  6. Koren, A., Soifer, I., Barkai, N. MRC1-dependent scaling of the budding yeast DNA replication timing program. Genome Res. 20, 781-790 (2010).
  7. Lang, G. I., Murray, A. W. Mutation rates across budding yeast chromosome VI are correlated with replication timing. Genome Biol Evol. 3, 799-811 (2011).
  8. Durkin, S. G., Glover, T. W. Chromosome fragile sites. Annu Rev Genet. 41, 169-192 (2007).
  9. Dillon, L. W., Burrow, A. A., Wang, Y. H. DNA instability at chromosomal fragile sites in cancer. Curr Genomics. 11, 326-337 (2010).
  10. Widrow, R. J., Hansen, R. S., Kawame, H., Gartler, S. M., Laird, C. D. Very late DNA replication in the human cell cycle. Proc Natl Acad Sci U S A. 95, 11246-11250 (1998).
  11. Foss, E. J., et al. SIR2 suppresses replication gaps and genome instability by balancing replication between repetitive and unique sequences. Proc Natl Acad Sci U S A. 114, 552-557 (2017).
  12. Wu, T. D., Reeder, J., Lawrence, M., Becker, G., Brauer, M. J. GMAP and GSNAP for Genomic Sequence Alignment: Enhancements to Speed, Accuracy, and Functionality. Methods Mol Biol. 1418, 283-334 (2016).
  13. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  14. Langmead, B. Aligning short sequencing reads with Bowtie. Curr Protoc Bioinformatics. , Chapter 11, Unit 11 17 (2010).
  15. Li, H., Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 25, 1754-1760 (2009).
  16. Kellis, M., Birren, B. W., Lander, E. S. Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae. Nature. 428, 617-624 (2004).
  17. Goodwin, S., McPherson, J. D., McCombie, W. R. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 17, 333-351 (2016).

Tags

Genética edição 133 replicação final locais frágeis citometria de fluxo levedura de sequenciamento Saccharomyces cerevisiae alta taxa de transferência
G2-seq: Uma alta taxa de transferência baseada no sequenciamento técnica para identificar a tarde replicando regiões do genoma
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Foss, E. J., Lao, U., Bedalov, A.More

Foss, E. J., Lao, U., Bedalov, A. G2-seq: A High Throughput Sequencing-based Technique for Identifying Late Replicating Regions of the Genome. J. Vis. Exp. (133), e56286, doi:10.3791/56286 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter