Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

G2-seq: En High Throughput sekventering-baseret teknik til identifikation af sent replikerende regioner i genomet

Published: March 22, 2018 doi: 10.3791/56286

Summary

Vi beskriver en teknik til at kombinere flowcytometri og høj overførselshastighed sekvensering til at identificere sent replicerer regioner i genomet.

Abstract

Mange teknikker har udviklet til at følge udviklingen i DNA-replikation gennem S fase af cellecyklus. De fleste af disse teknikker har været rettet mod udredning af placeringen og tidspunktet for indledningen af genome dobbeltarbejde snarere end dens afslutning. Det er imidlertid afgørende, at vi forstår regioner i genomet, der sidst at fuldføre replikering, fordi disse regioner lider forhøjede niveauer af kromosomale brud og mutation, og de har været forbundet med både sygdom og ældning. Her beskriver vi, hvordan vi har udvidet en teknik, der er blevet brugt til at overvåge replikering indledning i stedet identificerer områder af genomet sidst på komplet replikering. Denne tilgang er baseret på en kombination af flowcytometri og høj overførselshastighed sekventering. Selv om denne betænkning fokuserer på anvendelse af denne teknik på gær, kan tilgangen bruges med alle celler, der kan sorteres i en flow forskellige efter DNA indhold.

Introduction

Eukaryote genom replikering er indledt på flere diskrete websteder, kaldet oprindelsen af replikering, fra hvilke replikering gafler gå i begge retninger (gennemgik i Fragkos et al., 20151). Oprindelse varierer i både deres timing og effektivitet af fyring, og flere teknikker er blevet udviklet for at overvåge replikering oprindelse aktivitet og belyse årsagerne til denne variation. Aktiviteten af enkelte oprindelse kan udledes af niveauer af enkeltstrenget DNA2, der udgør omkring aktive oprindelse, eller ved hjælp af 2D gelelektroforese for at overvåge specifikke replikering mellemprodukter3, som begge kan opdages med radioaktive sonder. Begge af disse teknikker anvendes lettere i S. cerevisiae end i pattedyrceller, fordi oprindelse er begrænset til specifikke kendte sekvenser i den tidligere. Med fremkomsten af microarrays blev det muligt at vurdere oprindelse fyring globalt. Dette blev først gjort ved mærkning DNA med tunge isotoper, frigiver celler fra en G1 blok i medium indeholdende lys isotoper og derefter overvåge dannelsen af tunge-lette hybrid DNA på tværs af genom4. Indførelsen af høj overførselshastighed sekventering tilladelse lignende genome-wide overvågning af oprindelse aktivitet uden behov for dyre isotopiske mærkning. Celler blev sorteret i en flow forskellige efter DNA indhold og deres DNA underkastes dyb sekvensering. Fordi sekvens dækning provenuet fra 1 x til 2 x i løbet af S fase, kan relative replikering timing vurderes ved at sammenligne Læs dybder af celler i S fase til dem i G1 eller G25,6. Disse teknikker, især anvendt på gær, førte til en dybere forståelse af hvordan DNA-sekvens, kromatin struktur og DNA replikation proteiner regulere oprindelse timing og effektivitet.

Trofaste overførsel af genetiske oplysninger under cellulære spredning kræver ikke kun succesfuld indledning af DNA-replikation, som finder sted på oprindelse, men også fuldførelse af replikering, som opstår, hvor replikering gafler mødes. Som indledning af replikering varierer tidsplanen for færdiggørelsen af replikering på tværs af genomet med visse regioner, der fortsat unreplicated selv sent i cellecyklus. Sådanne regioner kan være særligt fjernt fra aktiv replikering oprindelse eller kan indeholde sekvenser eller kromatin strukturer, der hæmmer DNA polymeraser. Sent replikerende regioner kan manifestere sig som skrøbelige websteder, der er forbundet med kromosomale brud og højere mutation priser, og har været impliceret i kræft og aldring7,8,9. Trods vigtigheden af korrekt færdiggørelse af DNA-replikation i vedligeholdelse af genom stabilitet, har vores forståelse af hvor og hvordan dette foregår haltet langt bagefter replikering indledning. Og mens de enkelte gener hvis afdøde replikering har været forbundet med sygdom er blevet undersøgt med, for eksempel, qPCR10, globale undersøgelser rettet mod belyse steder og bagvedliggende årsager for sent replikering har manglet. Her beskriver vi en teknik, vi refererer til som "G2 seq", hvor vi kombinerer flowcytometri med high throughput sekvensering til at kaste lys på færdiggørelsen af genom replikering i gær11. Med mindre ændringer, kan denne protokol tilpasses til eventuelle celler, der kan være flow-sorteret efter DNA indhold.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. forberedelse af celler for Flow flowcytometri sortering

  1. Podes 15 mL reagensglas indeholdende 8 mL YEPD bouillon, således at kulturerne nå en massefylde på 5 x 106 til 1.5 x 107 celler pr. mL efter natten vækst (Se diskussion note 1).
  2. Spin ned gærceller (1.400 x g, ved stuetemperatur eller 4 ° C) i en 15 mL skruelåg centrifugeglasset i 5 min, resuspend celler i 1,5 mL 70% ethanol, og overførsel til en 1,6 mL mikrofuge tube, at lade denne sidde for 1 time ved stuetemperatur eller mindst 3 h på is ( kan opbevares på ubestemt tid ved 4 ° C) (Se diskussionspunkt (2)).
  3. Spin ned gærceller i mikrofuge (14.000 x g, 4 ° C) for 1 min, resuspend i 1 mL 50 mM natriumcitrat, pH 7,2, spin-ned (14.000 x g, 4 ° C) for 1 min, Aspirér supernatanten, resuspend i 1 mL 50 mM natriumcitrat, pH 7,2 , der indeholder 0,25 mg/mL RNAse løsning for 1 h ved 50 ° C eller natten over ved 37 ° C i varme blok eller vand bad.
  4. Tilsæt 50 µL proteinase K løsning (20 mg/mL genopslemmes i 10 mM Tris pH 7,5, 2 mM CaCl2, 50% vægt til volumen glycerol) og Inkuber i 1 time ved 50 ° C.
  5. Spin ned celler (14.000 x g, 4 ° C), resuspend celler i 1 mL 50 mM natriumcitrat, pH 7,2, spin ned (14.000. x g, 4 ° C), Aspirér supernatanten med vakuum, resuspend i 1 mL 1 µM grønne nukleinsyre stamme genopslemmes i 50 mM natriumcitrat , pH 7,2 og Inkuber i mørke i 1 time ved stuetemperatur, der sonikeres et 2 x til 2 s hver (udgangseffekt 2 watt).

2. celle sortering

  1. Bruger en celle sorteringsanlæg, sortere cellerne efter DNA indhold i faser G1, S, "tidlig G2" og "sent G2", indsamle mindst 1,6 millioner haploide celler fra hver celle cyklus fase Figur 1 (Se diskussionspunkt (3)).
  2. Overfør celler til mikrofuge rør og spin-ned celler i 20 min. på 14.000 x g ved 4 ° C i mikrofuge og Opsug supernatanten med vakuum (pellet kan opbevares frosset ved-20 ° C på ubestemt tid, se diskussion punkt (4)).

3. DNA-ekstraktion og forberedelse af sekventering biblioteker

Bemærk: Følgende trin er baseret på "protokol jeg" i gær genomisk DNA-ekstraktion Kit (Se Tabel af materialer).

  1. Tilføje 120 µL "Fordøjelsen buffer," en proprietær buffer, der giver mulighed for gær lytisk enzym til at fordøje cellevæggen og 5 µL af gær lytisk enzym, resuspend af vortexing, og der inkuberes ved 37 ° C i 40-60 min.
  2. Tilføje 120 µL af "Lysisbuffer," en proprietær buffer, som indeholder vaskemiddel og vortex svært for 10-20 s.
  3. Tilsæt 250 µL chloroform - blandes grundigt i 1 minut.
  4. Spin ved maksimal hastighed i en mikrofuge for 2 min.
  5. Indlæse supernatanten på DNA bindende kolonnen og centrifugeres ved maksimal hastighed i en mikrofuge i 1 min.
  6. Tilsæt 300 µL "DNA vask buffer," en proprietær buffer, der indeholder ethanol, og der centrifugeres i 1 minut ved maksimal hastighed i en mikrofuge. Kassér flow gennem, tilsæt 300 µL DNA Wash buffer, og Gentag vask proces.
  7. Overfør kolonnen spin til en frisk mikrofuge tube, tilsættes 60 µL vand (ikke TE) - vente 1-3 min og derefter centrifugeres i 10 s at eluere DNA.
  8. Måle koncentrationen ved at tilføje 5 µL DNA til 195 µL dsDNA høj følsomhed reagens, der er blevet fortyndet 1:200 i dsDNA høj følsomhed buffer og derefter foranstaltning fluorescens i en fluorometer, ved hjælp af 10 µL af angivne standarder for kalibrering; Forvent, at mellem 10 og 50 ng af DNA samlede udbytte.
  9. Læg instrumenterne i ultralydsbad (Peak hændelse magt 450, Duty faktor 30%, cykler pr. brast 200, behandling tid 60 s, vandstanden 6) til at bryde op DNA i 250-350 bp fragmenter.
  10. Forberede et bibliotek med DNA prøve forberedelse kit og sekvens det (mindst 10 millioner 50 bp single-ende læser) på DNA-sekventering instrument i hurtigt tilstand (Se diskussion note (5)).

4. analyse af Sequencing Data og Generation af replikering profiler

  1. Juster sekvenser til Saccharomyces cerevisiae sacCer3 genom ved hjælp af Gsnap12 (Se diskussion note (6)).
  2. Bestemme pr. basepar læse dybder ved hjælp af Bedtools' "genomeCoverageBed" software13.
  3. Fjerne artefactual pigge i Læs dybder, hvis nuværende (Se diskussion note (7)).
  4. Glat læse dybder af kromosom ved hjælp af medianerne i en 20 kb glidende vindue ved hjælp af "runMean" funktion i R pakke "caTools" (Se diskussion note (8)).
  5. Plot læse dybder i S fase, tidlig G2 og sene G2 som en procentdel af fuldstændigt replikeret Læs dybder (Se diskussion note (9)).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Vi har anvendt proceduren beskrevet ovenfor for at identificere sent replicerer websteder i spirende gær. Test denne fremgangsmåde ved hjælp af en kendt sent replicerer region på en kunstig kromosom bevist teknik til at være nøjagtige og pålidelige. Vores resultater har også vist den biologiske betydning for rettidig afslutning af replikering af viser, at en sen replicerer region på kromosom 7, som vi identificeret som sent replikerende på grundlag af vores G2-seq resultater, var tabt ca tre oftere end en sammenlignelig styre region11.

Et konkret eksempel på resultater med G2-seq er vist i figur 2. Vi havde en hypotese, der ville være regioner i genomet, replikeres især sent i celler mangler en protein deacetylase kaldet Sir2. Figur 2A viser progressionen af dataanalyse for vildtype (blå) og sir2 (rød). De rå data (øverste rækker) indeholder store pigge, hvoraf de fleste er på grund af tilstedeværelsen af Ty elementer. Disse pigge er fjernet af udjævningen Læs dybder på 2,5 x medianen læse dybde for hver prøve (midterste rækker). De despiked data er derefter glattes med en 20 kb skydevinduet (nederste række). Endelig, dataene er normaliserede og afbildet som nøgletal til niveauer i G1. En typisk sene-replikering af regionen, der vises i sir2 mutant er fremhævet i figur 2 c.

Figure 1
Figur 1. Flow flowcytometri profil med angivelse af cellecyklus brøker anvendes; ydre grænser for alle portene mærket. Venligst klik her for at se en større version af dette tal.

Figure 2
Figur 2. (A-B) Progression af databehandling fra rådata (øverste rækker), despiked data (midterste rækker) og glattede data (nederste rækker) til vildtype (A) og sir2 (B). (C) nøgletal S fase-, tidlig G2-og sene G2-til G1 læse dybder. Vildtype i blå og sir2 med rødt. Det fremhævede område i øverste højre hjørne viser en sen replicerer regionen specifikke til sir2 mutant. Skalaen angiver brøkdel af komplet (2N) replikering; en helt unreplicated celle ville vises på 0,5, et fuldstændigt replikeret celle på 1. Venligst klik her for at se en større version af dette tal.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Mens denne teknik er robust og relativt ligetil, bør være genstand for særlig opmærksomhed følgende:

(1) vi anbefaler, at kulturer vokse i mindst 12 timer, før de når log fase, da forskellene åbenbart i cellecyklus distributioner hvis kulturer er hoestet efter at have nået den ønskede tæthed bare 4 h efter podning. Vores antagelse er, at en celle cyklus distribution, der har nået en relativt stabil ligevægt bedre repræsenterer en "rigtig" log fase distribution end en fordeling, der er stadig i flux, når en mættet kultur er blevet overført mere for nylig at friske medium.

(2) i stedet for spinning ned celler før fastsættelse, kan celler fastsættes også ved at tilføje direkte gær kultur 100% ethanol, således at den endelige koncentration af ethanol er 70%. Celler kan dyrkes i enten syntetisk eller rige (YEPD) medium.

(3) cellecyklus faser er visualiseret til sortering af plotting celle nummer som en funktion af 530 nm emission område. Vi har fundet at bøjning points mellem G1 og S og S og G2 tjene som robust vartegn for skildrer S fase, og vi bruger G2 maksimalt som grænsen til at adskille begyndelsen og slutningen G2. Vi bruger udtrykkene "tidlig G2" og "sent G2" for klarhed og korthed, måske på bekostning af nøjagtighed i den forstand, at cellerne er teknisk i S fase indtil de har afsluttet DNA-replikation. Selv om målet med G2-seq er at identificere meget sent replikerende websteder, som forventes at blive afsløret i den sene G2 fraktion, indsamler vi S fase og tidlige G2 celler at følge replikering gennem alle faser af cellecyklus.

(4) det er af afgørende betydning, at celler være spundet ned straks efter sortering. Lad ikke celler sidde natten over før spinding dem ned. Vi har haft problemer med at inddrive celler ved centrifugering, hvis de har været opbevares ved 4 ° C, hvilket tyder på at de bliver skrøbelige efter sortering og lyse med tiden.

(5) så få som 5 millioner lyder er tilstrækkelig, men grunde blevet mindre glat med et lavere antal læsninger. Datasæt med endnu færre læser muligvis rummes ved at udglatte med windows større end 20 kb, men vi har ikke prøvet dette.

(6) enhver udbredte justering software (fx, butterfly14, Novalign (http://www.novocraft.com), BWA15eller Gsnap12) vil arbejde.

(7) high throughput sequencing data fra gær Vis lejlighedsvise pigge i Læs dybder, som afspejler ofte Ty elementer. Vi fjerne disse ved at erstatte 2.5 x median prøven læse dybder for Læs dybder uden for de regioner, der er kendt for at indeholde gentagne strækninger (f.eks., at rDNA), der er større end 2,5 x median. RDNA og enderne af kromosomerne er udelukket, fordi de er kendt for at indeholde gentagne elementer. Et eksempel på denne "despiking" ved hjælp af R sprog er følgende:

# Opret en data ramme kaldet "læser" indeholdende data:
Chr <-rep ('chrI', 10)
pos <-seq (1, 10)
RD <-c (3, 4, 6, 5, 88, 2, 9, 10, 900, 1)

læser <-data.frame ('kromosom' = chr,
'position' = pos,
'read_depth' = rd)

# "despike" Læs dybet:
læser [, 'despiked'] <-ifelse (læser [, 3] > (2,5 * median(reads[,3])),
(2,5 * median(reads[,3])),
Reads[,3])

"Loft" eller "despiking" kan også opnås ved undtagelse af læser, der er knyttet til mere end én placering, men dette vil eliminere læsninger, der er knyttet til, for eksempel, bare to steder. Forekomster af læser, der tilknyttes mere end én placering, men stadig give værdifulde oplysninger, er ikke ualmindelige, når du arbejder med S. cerevisiae, hvis genom resulterede fra en forfædres dobbeltarbejde16.

(8) vi har opnåede sammenlignelige resultater med både funktionen "rollmedian" i pakken R "zoo" (https://cran.r-project.org/web/packages/zoo/index.html) og "runmean" funktion i R pakke "caTools" (https://cran.r-project.org/web/packages/caTools/index.html).

(9) vi har eksperimenteret med talrige metoder til at normalisere Læs dybder, som alle gav sammenlignelige resultater. Vores foretrukne strategi er baseret på den antagelse, at i det mindste nogle regioner i genomet replikeres fuldt ud i vores S fase prøve. Vi bestemt Læs dybden, der repræsenterede fuld replikering som median læse dybde i vores datasæt på lokaliteter svarende til 12 tidligste fyring høj tillid ("tillid" score > = 7) oprindelse i et offentligt tilgængelige data sæt. (http://cerevisiae.oridb.org/data_output.php?main=sc_ori_studies & tabel = Raghu2001_ori & ext_format = & format = tab). For de fleste applikationer, tilgang til normalisering er ikke kritisk og der er mange fornuftige muligheder, mest simpelthen bare normalisere Læs count totaler. Det er imidlertid værd at bemærke, at hvis der er store forskelle i antallet af repetitive sekvenser mellem prøver, normalisering at læse count totaler kan være vildledende. For eksempel, når man sammenligner to stammer hvis rDNA arrays afvige med flere fold, kan normalisere at læse tæller i alt gøre visse regioner i genomet af stamme med større rDNA array artefactually synes at replikere senere end stamme med de mindre matrix.

I Resumé repræsenterer G2-seq en logisk forlængelse af eksisterende teknikker til replikering profilering. Ligesom andre sekventering - og microarray-baserede teknikker har G2-seq fordele i forhold til 2D gel analyse af genom bred dækning og manglen på krav om kendskab til placeringen af replikering oprindelse. Sidstnævnte er særligt relevant i pattedyrceller hvor, i modsætning til i spirende gær, replikering oprindelse ikke er begrænset til specifikke sekvenser. På den anden side giver 2D gel et niveau af opløsning af molekylære mellemprodukter i DNA-replikation helt uopnåelig af G2-FF. udvidelse G2-seq til andre organismer, hvis celler kan sorteres efter DNA indhold bør være relativt ligetil, men den hyppigt gentagne karakter af genomer af højere eukaryoter gør justering af korte sekvenser, Læs meget mere udfordrende. Sekventering teknologier for at giver betydeligt længere læse længde kan være nyttige i denne henseende, især da G2-seq bør være relativt robust over for de højere fejlprocenter, der kan være forbundet med længere læser17. Vores erfaring, er det tekniske problem, der er mest tilbøjelige til at forårsage problemer at lade celler sidder efter de er blevet sorteret og forud for isolering af DNA. Disse celler synes at være særligt skrøbelige og lyse med tiden, og DNA bør isoleres inden for højst en time eller to for sortering. Lovende fremtidige retninger for denne teknik omfatter opdele både S og G2 faser i stigende antal af fraktioner til at opnå højere opløsning af dynamikken i genom replikering, fra tidlig indledning til sen færdiggørelse.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ikke noget at oplyse.

Acknowledgments

Dette arbejde blev støttet af tilskud NIH GM117446 til A.B.

Materials

Name Company Catalog Number Comments
YeaStar Genomic DNA kit Genesee Scientific 11-323
1 µM SYTOX Green ThermoFisher 57020 resuspend in 50 mM sodium citrate, pH 7.2
50 mM sodium citrate, pH 7.2
RNase solution (0.25 mg / mL) Sigma R6513 0.25 mg / mL RNaseA resuspended in 50 mM sodium citrate, pH 7.2, boil RNase solution for 10 minutes before the first use only, and from then on store at -20°
proteinase K solution (20 mg / mL) ThermoFisher / Invitrogen 25530-015 resuspend in 10 mM Tris, pH 7.5, 2 mM CaCl2, 50% glycerol, store at -20°C
Model 50 Sonic Dismembrator Fisher Scientific FB50A220
BD Biosciences FACSAria II BD Biosciences 644832
Zymo-spin III columns Zymo Research C1005
Qubit dsDNA HS Assay Kit ThermoFisher Q32851
Qubit 3.0 Fluorometer ThermoFisher Q33216
Covaris Model LE220 Focused-Ultrasonicator Covaris 500219
Illumina TruSeq DNA LT Sample Prep Kit Illumina 15026486
Illumina HiSeq 2500 instrument Illumina SY–401–2501
gsnap alignment software open source software / Genentech http://research-pub.gene.com/gmap

DOWNLOAD MATERIALS LIST

References

  1. Fragkos, M., Ganier, O., Coulombe, P., Mechali, M. DNA replication origin activation in space and time. Nat Rev Mol Cell Biol. 16, 360-374 (2015).
  2. Santocanale, C., Diffley, J. F. A Mec1- and Rad53-dependent checkpoint controls late-firing origins of DNA replication. Nature. 395, 615-618 (1998).
  3. Brewer, B. J., Fangman, W. L. A replication fork barrier at the 3' end of yeast ribosomal RNA genes. Cell. 55, 637-643 (1988).
  4. Raghuraman, M. K., et al. Replication dynamics of the yeast genome. Science. 294, 115-121 (2001).
  5. Muller, C. A., Nieduszynski, C. A. Conservation of replication timing reveals global and local regulation of replication origin activity. Genome Res. 22, 1953-1962 (2012).
  6. Koren, A., Soifer, I., Barkai, N. MRC1-dependent scaling of the budding yeast DNA replication timing program. Genome Res. 20, 781-790 (2010).
  7. Lang, G. I., Murray, A. W. Mutation rates across budding yeast chromosome VI are correlated with replication timing. Genome Biol Evol. 3, 799-811 (2011).
  8. Durkin, S. G., Glover, T. W. Chromosome fragile sites. Annu Rev Genet. 41, 169-192 (2007).
  9. Dillon, L. W., Burrow, A. A., Wang, Y. H. DNA instability at chromosomal fragile sites in cancer. Curr Genomics. 11, 326-337 (2010).
  10. Widrow, R. J., Hansen, R. S., Kawame, H., Gartler, S. M., Laird, C. D. Very late DNA replication in the human cell cycle. Proc Natl Acad Sci U S A. 95, 11246-11250 (1998).
  11. Foss, E. J., et al. SIR2 suppresses replication gaps and genome instability by balancing replication between repetitive and unique sequences. Proc Natl Acad Sci U S A. 114, 552-557 (2017).
  12. Wu, T. D., Reeder, J., Lawrence, M., Becker, G., Brauer, M. J. GMAP and GSNAP for Genomic Sequence Alignment: Enhancements to Speed, Accuracy, and Functionality. Methods Mol Biol. 1418, 283-334 (2016).
  13. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  14. Langmead, B. Aligning short sequencing reads with Bowtie. Curr Protoc Bioinformatics. , Chapter 11, Unit 11 17 (2010).
  15. Li, H., Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 25, 1754-1760 (2009).
  16. Kellis, M., Birren, B. W., Lander, E. S. Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae. Nature. 428, 617-624 (2004).
  17. Goodwin, S., McPherson, J. D., McCombie, W. R. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 17, 333-351 (2016).

Tags

Genetik sag 133 sent replikering skrøbelige websteder flowcytometri høje overførselshastighed sekventering Saccharomyces cerevisiae gær
G2-seq: En High Throughput sekventering-baseret teknik til identifikation af sent replikerende regioner i genomet
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Foss, E. J., Lao, U., Bedalov, A.More

Foss, E. J., Lao, U., Bedalov, A. G2-seq: A High Throughput Sequencing-based Technique for Identifying Late Replicating Regions of the Genome. J. Vis. Exp. (133), e56286, doi:10.3791/56286 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter