Abstract
DNA-methylering mønster kortlægning er stærkt undersøgt i normale og sygdomsramte væv. En række fremgangsmåder er blevet etableret for at forespørge cytosin mønstre for methylering i celler. Reduceret repræsentation af hele genomet bisulfit sekventering blev udviklet for at detektere kvantitative basepar opløsning cytosin mønstre for methylering ved GC-rig genomisk loci. Dette opnås ved at kombinere brugen af et restriktionsenzym, efterfulgt af omdannelse med bisulfit. Forbedret Reduceret Repræsentation bisulfit sekventering (ERRBS) øger biologisk relevante genomiske loci dækket og har været anvendt til at profilere cytosin-methylering i DNA fra menneske, mus og andre organismer. ERRBS indleder med restriktionsenzymfordøjelse af DNA til generering lavmolekylære fragmenter til brug i biblioteket forberedelse. Disse fragmenter underkastes standard bibliotek konstruktion for næste generation sekventering. Bisulfit konvertering af ikke-methylerede cytosiner før den endelige amplificatipå trin giver mulighed for kvantitativ basis løsning af cytosin methylering niveauer i overdækket genomiske loci. Protokollen kan være afsluttet inden for fire dage. Trods lav kompleksitet i de første tre baser sekventerede, ERRBS biblioteker giver høj kvalitet af data ved brug af en udpeget sekventering kontrol lane. Kortlægning og bioinformatik analyse udføres derefter og giver data, der let kan integreres med en række af genom-dækkende platforme. ERRBS kan udnytte små input materiale mængder gør det muligt at behandle kliniske prøver og gældende menneskelige i en række forskningsansøgninger. Videoen er produceret demonstrerer kritiske trin i ERRBS protokollen.
Introduction
DNA-methylering ved cytosin (5-methylcytosin) er en epigenetisk varemærke kritisk i pattedyrceller for en række biologiske processer, herunder, men ikke begrænset til prægning, X-kromosom inaktivering, udvikling og regulering af genekspression 1-8. Studiet af DNA methyleringsmønstre i maligne og andre lidelser har bestemt sygdomsspecifikke mønstre og bidraget til forståelsen af sygdommen patogenese og potentielle biomarkør opdagelser 9-17. Der er mange protokoller, forespørge epigenome for methylering af DNA status. Disse kan opdeles i affinitet-baseret, restriktionsenzym-baseret, og omdannelse med bisulfit-assays, der udnytter microarray eller sekventering platforme nedstrøms. Desuden er der et par protokoller broen disse generelle kategorier, herunder, men ikke begrænset til, Kombineret Bisulfite Restriction Analysis 18 og nedsat Repræsentation bisulfit sekventering (RRBS 19).
RRBS blev oprindeligt beskrevet af Meissner et al. 19,20. Protokollen indførte et skridt til at berige GC-rige genomiske regioner efterfulgt af bisulfit sekventering, hvilket resulterede i kvantitativ basepar opløsning data som er omkostningseffektiv 21,22. GC-rige regioner er målrettet af enzymet MspI (C ^ CGG) begrænsning, og cytosin-methylering er løst ved omdannelse med bisulfit af cytosiner (deaminering af umodificerede cytosiner til uracil) efterfulgt af polymerasekædereaktion (PCR) amplifikation. RRBS dækkede størstedelen af genpromotorer og CpG-øer i en brøkdel af sekventering nødvendige for en hele genomet; dog RRBS havde begrænset dækning af CpG kyster og andre intergeniske regioner i biologisk relevans. Flere grupper har offentliggjort opdaterede RRBS protokoller siden den oprindelige rapport, forbedrer metoden og deraf følgende dækning af disse genomiske regioner 23-25. Forbedret Reduceret Repræsentation Bisulfite Sequder lever (ERRBS) indeholder bibliotek forberedelse ændringer og en suppleant tilpasning data tilgang 26 sammenlignet med RRBS. ERRBS resulterede i et højere antal CpG'er repræsenteret i de data, der genereres og øget dækning af alle genomiske regioner forhørt 26. Denne fremgangsmåde er blevet anvendt til at løse DNA methyleringsmønstre i human patient og andre animalske prøver 26-30.Den ERRBS beskrevne protokol tilbyder detaljeret information om alle nødvendige skridt til færdiggørelse og data blev genereret ved hjælp af repræsentative humant DNA (prøver blev opnået fra tidligere rapporteret, de identificerede patientprøver 31, og et CD34 + knoglemarv prøve fra en normal human donor). Protokollen omfatter en automatiseret størrelse udvælgelsesprocessen, hvilket reducerer behandlingstiden pr prøven og giver mulighed for øget nøjagtighed i biblioteket udvælgelse størrelse. Protokollen kombinerer en række etablerede molekylærbiologiske teknikker. DNA med høj molekylvægt fordøjes wed en methylering-ufølsom restriktionsenzym (MspI) efterfulgt af ende-reparation, A-hale, og ligering af methylerede adaptere. Størrelse udvalg af GC-rige fragmenter efterfølges af bisulfit konvertering og PCR-amplifikation før sekventering. Bisulfit konvertering har været beskrevet tidligere 32 og detaljeret gennemgang af dataanalyse og applikationer er uden for rammerne af dette papir, men anbefalinger og referencer er inkluderet for læsernes brug. Protokollen kan udføres i løbet af fire dage og er modtagelig for lille input (50 ng eller mindre) materielle beløb. Protokollen som beskrevet giver data med høj dækning pr CpG websted tilstrækkelig ikke kun for differentierede bestemmelser methylering stedet og region, men også for epigenetisk polymorfisme detektion som beskrevet af Landan, et al. 33.
Protocol
Alle procedurer udført godkendes af Indiana University School of Medicine Institutional Animal Care og brug Udvalg og følg National Institute of retningslinjer Sundhed.
1. Kirurgisk teknik
- Oprethold aseptisk teknik under denne procedure ved hjælp af sterile handsker, instrumenter og et sterilt kirurgisk felt ifølge NIH retningslinjer 25. Steriliseres værktøjer, før du begynder kirurgi ved autoklavering dem (se tabel af specifikke reagenser / udstyr for komplet liste). Brug en glaskugle sterilisator at sterilisere redskaber under operationen.
2. Anæstesi og Forberedelse
- Bedøver musen i en anæstesi boks med en blanding af 0,9 L / min oxygen og 2,5% isofluran ved hjælp af en veterinær isofluran vaporizer system. Sørg for, at musen ikke reagerer på ændringer i kropsstilling, før du fjerner den fra kassen.
- Anvend oftalmologiske salve til mouSE øjne for at beskytte dem mod udtørring.
- Skift gasstrømmen fra boksen til næse kegle. Placer musen holdent på sin venstre side på en opvarmet pude dækket med en kirurgisk pad og absorberende bænk papir med sin næse og mund inde i keglen. Løbende overvåge musens vejrtrækning rytme og hastighed og justere isofluran niveauer efter behov (mellem 2,5-3% isofluran) for at opretholde et passende niveau for anæstesi, og bruge tå knivspids refleks at bekræfte total sedation.
3. Kirurgisk Approach
- Juster og fokusere stereoskop med det kirurgiske område. Juster næsekeglen og tape det ned, så det er placeret langs kanten af synsfeltet.
- Med musen liggende på sin venstre side, tape kanten af højre øre til næsekeglen, udsætter området bag øret, hvor snittet skal foretages. Sørg for, at den bageste ørevenen bevæger vandret over øret. Bemærk, at den korrekte placering af than dyr og tape af øret er afgørende for hurtigt at finde det facial nerve.
- Fugt pelsen på og bag øret med 70% ethanol og barbere det kirurgiske sted ved hjælp af et barberblad eller skalpelblad. Pre-befugtning pelsen gør barbering nemmere i denne anatomiske placering.
- Rens huden med en iodopløsning, såsom Betadine kirurgiske krat (7,5% povidon-iod), efterfulgt af 70% ethanol. Gentag denne rengøring to gange mere til grundigt desinficere området.
- For at bestemme, hvor at gøre snittet, spore den bageste ørevenen fra øret kaudalt til området bageste til øret forhøjning. Brug af foråret saks, lave en 4 mm snit 2-3 mm posteriort for fremspringet.
- Skær gennem det subkutane fedt og fascia ved stump dissektion. Undgå direkte skæring med saksen, fordi blodkar eller muskelvæv kan let beskadiget.
- Hvis der opstår blødning, lægge pres på det kirurgiske sted med en steril vatpindfor mindst 30 sek. Hvis betydeligt tab væske sker, injicere mus intraperitonealt med op til 0,5 ml steril 0,9% saltopløsning under anvendelse af en 25 eller 27 G nål.
- Brug flere vigtige vartegn, spinal tilbehør nerve, øregangen, og forreste digastric muskel (beskrevet nedenfor), for at lokalisere den facial nerve. Dissekere omkring disse vartegn, indtil grenene af facial nerve visualiseres. Nerven vises som en betydelig solid hvid struktur, når det er afsløret, og et lag af fascia klæber det til de underliggende strukturer.
- Find spinal tilbehør nerve, som bevæger sig fra den kaudale del af kraniet til innerverer trapezius musklen, når det subkutane fedt og fascia er blevet dissekeret. Det facial nerve er dybt til spinal tilbehør nerve.
- Find bruskagtig øregangen, der ser perlemorsfarvet og kan ses rostralt for facial nerve.
- Find muskelbugen af den forreste digastric muskel, der ligger oven på og Caudal til ansigtet nerve.
- Når de vigtigste grene af facial nerve visualiseres, spore dem dorsalt at finde deres oprindelse fra stylomastoid foramen. Brug fine tippet Dumont pincet # 5/45 for at holde det kirurgiske sted åbent, fremrykke foråret Scissor tips efter nerve vej, derefter flytte tangen dorsalt for at holde den nyligt avancerede område åben.
- Visualiser stammen af facial nerve med zygomatic, bukkal, og marginale mandibulære grene på dette punkt.
BEMÆRK: Den tidsmæssige gren vil blive fundet tættere på foramen. Den marginale mandibulære nerve filialer i sine øvre og nedre del tættere på kæben, og dermed de nerve filialer vil ikke være synlige på dette niveau.- Hvis der udføres en nerve transection stabilisere nerve forsigtigt med de fine spids pincet og skær nerven med foråret saks. Undgå at bruge for meget trækkraft til nerven med pincet for at forhindre avulsing nerven fra hjernestammen. Skubtræstubbe væk fra hinanden, eller klippe og fjerne en del af den distale nerve at sikre, at ingen gentilkobling kan forekomme.
- Hvis der udføres en crush skade, brug Dumont # 5/45 pincet til at komprimere nerve i 30 sek hjælp konstant pres for at afskære alle axoner, derefter gentage denne crush på en anden vinkel vinkelret på den første crush site. Undgå at anvende variable mængder af tryk under 30 sek knuse, ellers skaden vil være inkonsekvent mellem dyr.
4. Lukning og Recovery
- Flyt fedt og muskler i løbet af de underliggende strukturer.
- Omtrentlig kanterne af indsnit og lukke såret ved hjælp af en 7,5 mm sår klip. Suturer eller lim er også acceptable for sårlukning. Postsurgical analgetika kan leveres på dette tidspunkt.
- Fjern tapen fra musens øre. Sluk isofluran flow og tillade musen til at indånde ren oxygen i 30 sekunder til 1 min. Place musen i et tomt bur med ingen strøelse til at komme sig anæstesi.
- Når musen er genvundet, undersøge sin adfærd for genfremsatte tegn på ansigtslammelse. De whiskers bliver lammet og vinkles tilbage mod kinden, vil næsen fraviges, og øjet vil ikke blinke som reaktion på en pust af luft.
- Husdyr fællesskab efter operationen, hvis de er kvinder. Undgå boliger hanmus fællesskab, fordi de er mere aggressive og har tendens til at tvinge fjerne deres cagemate sår klip, hvilket fører til infektion. Giv postkirurgiske analgetika på dette tidspunkt, om nødvendigt.
- Overvåg musene én gang dagligt i flere dage efter operationen for at sikre, at ingen infektion eller andre komplikationer opstår postoperativt. Fjern sårklemmer 7-10 dage efter operationen, hvis de ikke er faldet ud på egen hånd.
- Anvend smøre øjet salve på det angrebne øje dagligt for at forhindre hornhinden komplikationer, enten indtil øjet blinkerefleksen er rebelagt eller indtil aflivning.
Representative Results
Figur 1 giver et overblik over ERRBS, fremhæve de vigtigste trin, som er forklaret hele protokollen beskrevet. ERRBS biblioteker blev fremstillet ved anvendelse af 50 ng input DNA.
Evaluere kvaliteten af de biblioteker fremstillet. Bibliotek produktion rutinemæssigt giver fraktion størrelser af 150-250 bp og 250-400 bp (figur 3A-C). Forventes små forskelle i bibliotekets størrelsesfordelinger mellem prøverne. Bemærk, at i både lavere og højere bibliotek fraktioner der er meget intense DNA størrelser, indikerer berigelse af en bestemt sekvens. MspI fordøjelse resulterer i berigelse af en familie af repetitive DNA-sekvenser til stede i det humane genom på 190 bp, 250 bp og 310 bp i ERRBS biblioteker. Disse tre gentagelser udgør en karakteristisk signatur af en ERRBS bibliotek 20 (se figur 3A-C og 3G). Repræsentative biblioteker blev sekventeret på en næste-generations-sekvensr anvendes enkelt-ende læser. Når du lægger i den anbefalede bibliotek koncentration om en Illumina HiSeq 2500 sequencer, er cluster tætheder på 500,000-700,000 per mm2 forventet. På dette clustering tæthed, 81,6% ± 3,14% (n = 81) af klyngerne pass filter (figur 4A). På grund af den lave kompleksitet ende af bibliotekets indsatser (MspI anerkendelse websted: C ^ CGG), intensitet værdier og kvalitet scores registreret under sekventering er meget varierende i de første tre baser (figur 4B-C), men hvis en uafhængig kontrol lane er inkluderet (se diskussion), vil 85% af baser har kvalitet score på 30 eller højere (Q30-værdier; figur 4D).
Data, tilpasning og cytosin methylering beslutsomhed, som beskrevet i data protokolindstillingerne udbytter basepar opløsning (tabel 7). For det menneskelige genom, en 51-cyklus single-læst sekventering løbet for en ERRBS bibliotek i en bane af en HiSeq 2500 i high output-tilstand regelmæssigly genererer 153194882 ± 12918302 total læser, at efter kvalitet filtrering og adapter trimning udbytter 152231183 ± 13189678 læser for input til analysen rørledningen. Gennemsnitlig kortlægning effektivitet for en ERRBS biblioteket er typisk 62,95% ± 5,92% med repræsentation af 3.183.594 ± 713.547 CpG'er med et minimum dækning pr CpG på 10x og en gennemsnitlig dækning pr CpG af 84,94 ± 16.29 (n = 100).
Den ERRBS protokollen er modtagelig for multiplexing (se Supplemental fil 1: Protokol tilpasning til multiplex-sekventering). Data fra repræsentative sekventering kører er opsummeret i figur 5 data fra multiplex sekventering kørsler (51-cycle single-læst sekventering run;. N = 128 for to biblioteker pr bane, n = 11 for tre biblioteker pr bane, n = 11 for fire biblioteker per bane) blev sammenlignet med en fuld bane sekventering af en ERRBS bibliotek (51-cyklus single-read sekventering kører, n = 100) samt nedsampling en enkelt vognbane til simulatie 50%, 33% og 25% af læser per bane (2, 3 og 4 prøve multiplexing per bane henholdsvis; n = 3). Da antallet af læser per prøve falder med multiplexing faktor, antallet af CpG'er omfattet mindst dækning af 10x og dækning pr CpG falder samt (figur 5 og tabel 8). Mean omregningskurserne for ikke-CpG sites forventede er 99,85% ± 0,04% (n = 400). Omregningskurser lavere end 99% kan indikere mindre end optimal bisulfit konvertering, der kan resultere i høje falske methylering niveauer.
Data fra en ERRBS bibliotek fremstillet ud fra en repræsentativ humant genomisk DNA blev analyseret i R 2.15.2 45 ved hjælp af methylKit pakke 26 (se Supplemental kode fil 1 for kommando- detaljer). Dataene kan visualiseres i almindeligt anvendte genom browsere (figur 6A). Den cytosin methylering data er ligeligt stammer fra begge strenge (figur 6B) og spænder helespektrum af potentielle cytosin methylering niveauer (figur 6C). Analyse af tekniske replikater fra en repræsentativ menneskelig dna-prøve udbytter høj overensstemmelse mellem data resultater (figur 6D) og dækker CpG'er i et bredt spektrum af genomisk loci (figur 6E og F og som tidligere beskrevet 26). Mens tekniske replikaer vil give høj F 2 værdier (større end 97%), vil biologisk replikaer give R 2 værdier i området 0,92-0,96 26, og sammenligne forskellige humane celletyper vil give R 2 værdier lavere end 0,86 (data ikke vist).
Figur 1: Flowdiagram af ERRBS protokol. Chart repræsenterer trin, der kan være afsluttet i en traditionel arbejdsdag. * Angiver mulig pause punkt (umiddelbart efter ing ligering rydde op og før størrelse udvælgelse, protokol trin 5), hvor prøverne kan fryses ved -20 ° C, før du fortsætter med varigheden af protokollen.
Figur 2: Størrelse selektionsprotokol. (A) Skærmbillede af indstillinger, der bruges i ERRBS Pippin Prep-protokollen (se protokol afsnit 5.1.2 - 5.1.6): (1) Vælg kassette type. (2) Vælg standard der skal anvendes. (3) Vælg indsamlingen tilstand for hver bane. (4) Indtast indsamlingen bp intervaller. (5) Gem protokollen (B) Stadier af den manuelle gel udvinding anvendes i protokol afsnit 5.2:. (1) visualiseret gel stiger. (2) markerede Størrelser til størrelse udvælgelse ved hjælp af et barberblad. (3) Billede af udskårne prøver (lavere fraktion: 150-250 bp og højere fraktion: 250-400 bp)."> Klik her for at se en større udgave af dette tal.
Figur 3: Kvalitet resultater for repræsentative ERRBS biblioteker fremstillet fra humane DNA-prøver ved hjælp af en Bioanalyzer maskinstyring. (A) Gel-lignende billede viser en standard stige (1), lavere bibliotek fraktion (135-240 bp fraktionen fra Pippin Prep); 2) og højere biblioteket fraktion (240-410 bp fraktionen fra Pippin Prep); . 3) (B) Bioanalyzer elektroferogram af den forventede lavere biblioteket fraktion (C) Bioanalyzer elektroferogram af det forventede højere biblioteket fraktion D -.. F) Repræsentative data fra en dårlig kvalitet bibliotek prep. Gel-lignende billede (D) af standard stige (1), lavere bibliotek fraktion (2) og højere biblioteket fraktion (3). Bandet ved 150 bp markeret med en arrow indikerer store mængder af adapter. Elektroferogram af den nedre (E) og højere bibliotekets fraktioner (F) med overskydende adapter toppe ved 150 bp (markeret med pile). (G) Bioanalyzer elektroferogram af en poolet ERRBS bibliotek til sekventering. Rød spor repræsenterer en høj kvalitet samlet bibliotek med lige repræsentation af højere og lavere fraktioner. Blå spor repræsenterer en samlet bibliotek ikke tilstrækkelige til sekventering på grund af mangel på lige repræsentation af de højere og lavere fraktioner. Klik her for at se en større udgave af dette tal.
Figur 4 sekvensering diagrammer for en repræsentativ ERRBS 51-cycle single-læst sekventering køre på en HiSeq 2500 sequencer i high outputtilstand. (A) Cluster tætheder (K / mm2 = 1000 klynger pr millimeter kvadreret, blå). Og klynge tætheder passerer filter (grøn) i to baner med ERRBS biblioteker (B) Typiske intensiteter set i de første 30 cyklusser i en vognbane med en ERRBS biblioteket. Bemærk CGG underskrift fra MspI fordøjelse i intensiteterne af de første tre cyklusser. (C) Procentdel af baser med en kvalitet score på 30 eller højere (%> Q30) for hver cyklus i en ERRBS lane. (D) Quality score fordeling for alle cykler i én ERRBS lane. Blå = mindre end Q30, Grøn = større end eller lig med Q30. I denne bane, 84,7% af baser havde kvalitet score på 30 eller højere.
Figur 5 sekvensering output resultater. Box plots af eksperimentelle data fra multiplex og enkelt prøve per bane sekventering ru ns (vist som grønne kasser) og data, som simuleret nedsampling fra sekventering kørsler af tre ERRBS biblioteker (vises som blå kasser; stikprøven fem gange for hver sekventering løb) fra 51-cycle single-læst sekventering kører multiplexing faktor svarer til. antallet af ERRBS biblioteker sekventeret per lane. 1 = hel bane eller 100% af læser og repræsenterer data fra et enkelt ERRBS bibliotek per bane; 2 = 50% af bane og repræsenterer data fra to ERRBS biblioteker per bane; 3 = 33% af en lane og repræsenterer data fra tre ERRBS biblioteker pr bane; og, 4 = 25% af en lane og repræsenterer data fra fire ERRBS biblioteker pr bane. (A) De læste tæller, eller antallet af sekvenser analyseret, pr multiplexing faktor. (B) Antallet af CpG er omfattet af sekventering data pr multiplexing faktor. (C) Den gennemsnitlige dækning pr CpG per multiplexing faktor._blank "> Klik her for at se en større udgave af dette tal.
Figur 6: Repræsentative data fra en ERRBS bibliotek fremstillet fra humant genomisk DNA (A) University of California, Santa Cruz (UCSC) genom browser 43 billede af repræsentative data fra en ERRBS sekventering lane.. Y-aksen Målestokken repræsenterer 0-100% methylering ved hver cytosin dækket med et minimum på 10x. Den øverste brugerdefinerede spor repræsenterer fremad streng og den nederste brugerdefinerede spor repræsenterer den omvendte streng. Vist er chr12:.. 6,489,523-6,802,422 (hg19) inklusive refseq gener og CpG-øer i denne genomisk region (B) Distribution histogrammer af CpG dækning langs frem og bak tråde i en repræsentativ human CD34 + knoglemarv prøve (C) Distribution histogramaf CpG methylering niveauer langs begge strenge i en repræsentativ human CD34 + knoglemarv prøve. (D) korrelationskurve af CpG methylering niveauer fra et repræsentativt teknisk kopi af en menneskelig dna-prøve. (E) Pie illustrerer andelen af CpG'er dækket i ERRBS som kommenteret til CpG øer (lys grøn), CpG kyster (grå) og andre regioner (hvid) i en repræsentativ stikprøve fremstillet ud fra humant genomisk DNA. (F) Pie illustrerer andelen af CpG'er dækket i ERRBS der annoteret til genpromotorer (rød ), exons (grøn), introner (blå) og intergeniske regioner (lilla). Klik her for at se en større udgave af dette tal.
Reagens | Volumen | Kommentar |
10 pi | ||
Deoxynukleotidtriphosphat (dNTP) Løsning Mix | 4 pi | blanding af 10 mM af hvert nukleotid |
T4 DNA-polymerase | 5 pi | 3.000 enheder / ml |
DNA Polymerase I Large (Klenow) Fragment | 1 pi | 5.000 enheder / ml |
T4-polynukleotidkinase | 5 pi | 10.000 enheder / ml |
DNase-frit vand | 45 pi |
Tabel 1:. End reparation reaktionsreagenser Reagent navne og mængder anvendt i slutningen reparation reaktion (protokol trin 2.1).
Reagens | Volumen | Kommentar |
10x reaktionsbuffer | 5 pi | for eksempel, NEBuffer 2 |
1 mM 2'-deoxyadenosin-5'-triphosphat (dATP) | 10 pi | |
Klenow-fragment (3 '→ 5' exo-) | 3 pi | 5.000 enheder / ml |
Tabel 2:. A-tailing reaktionsreagenser Reagent navne og mængder, der anvendes i A-tailing reaktion (protokol trin 3.1).
Reagens | Volumen | Kommentar |
15 pm afhærdede adaptere i DNase-frit vand | 3 pi | PE adapter 1.0 og PE adapter 2.0; se tabel 4 for sekvenser og henvisning |
10x T4 DNA ligase Reaction Buffer | 581 l | |
T4 DNA-ligase | 1 pi | 2.000.000 enheder / ml |
DNase-frit vand | 31 pi |
Tabel 3: Adapter ligeringsreaktion reagenser reagensnavne og mængder, der anvendes i adapteren ligeringsreaktion (protokol trin 4.2)..
Tabel 4:. Oligoer anvendes i ERRBS protokollen Liste over oligoer anvendes i hele ERRBS protokol i ligeringsreaktionen (protokol trin 4) og PCR-amplifikation trin (protokol trin 7).
Reagens | Volumen | Kommentar |
10x FastStart High Fidelity Reaction Buffer with 18 mM magnesiumchlorid | 20 pi | |
10 mM dNTP-opløsning Mix | 5 pi | |
25 uM PCR PE primer 1.0 | 4 pi | Se tabel 4 |
25 uM PCR PE primer 2.0 | 4 pi | Se tabel 4 |
FastStart High Fidelity Enzyme | 2 pi | 5 enheder / pl FastStart Taq DNA polymerase |
DNase-frit vand | 125 pi |
Tabel 5: PCR-reaktionsbetingelser reagenser reagens navne og mængder, der anvendes i PCR-amplifikationsreaktionen (protokol trin 7.1)..
Protokol trin | Reagens / protokol detalje | Input DNA beløb | ||
5-10 ng | 25 ng | 50 ng | ||
1 | MspI enzym | 1 pi | 2 pi | 2 pi |
Mspl digest reaktionsvolumen | 50 | 100 | 100 | |
4 | Adaptere i ligeringsreaktion | 1 pi | 2 pi | 3 pi |
Ligeringsreaktionen volumen | 20 pi | 25 pi | 50 pi | |
5 | Størrelse selektionsprotokol | Kun Manual gel | Pippin Prep eller manuel gel | Pippin Prep eller manuel gel |
7 | PCR primerkoncentration | 25 um | 25 um | 10 uM til 14 cyklusser; 25 um til 18 cykler | Antal PCR cyklusser | 18 | 18 | 14-18 |
Tabel 6:. Protokol trin modifikationer for tilført materiale mængder spænder 5-50 ng Flere trin hele protokollen kræver ændring af reagensmængder anvendt til at generere høj kvalitet biblioteker fra forskellige mængder af råvarer. Ændringer centrale reagensmængder medtages her. Juster buffer og vandmængder i reaktioner i overensstemmelse hermed.
Chr | Base | Strand | Dækning | freqC | freqT |
CHR1 | 10564 | R | 366 | 85,52 | 14,48 |
CHR1 | 10.571 | F | 423 | 91,25 | 8,75 |
CHR1 | 10542 | F | 432 | 91,2 | 8.8 |
CHR1 | 10563 | F | 429 | 94,64 | 5.36 |
CHR1 | 10572 | R | 366 | 96.99 | 3.01 |
CHR1 | 10590 | R | 370 | 88,11 | 11,89 |
CHR1 | 10.526 | R | 350 | 92 | 8 |
CHR1 | 10.543 | R | 368 | 92,93 | 7,07 |
CHR1 | 10.525 | F | 433 | 91.92 | 8.08 |
CHR1 | 10.497 | F | 435 | 88,74 | 11.26 |
Antal ERRBS biblioteker per bane | Gennemsnitlig antal entydigt rettet læser | Gennemsnitlig antal CpG'er dækket | Gennemsnitlig dækning pr CpG |
1 | 152231184 ± 13189678 | 3183594 ± 713.547 | 85 ± 16 |
2 | 77680837 ± 7657058 | 2674823± 153.494 | 49 ± 9 |
3 | 49938156 ± 2436865 | 2552186 ± - 76624 | 39 ± 2 |
4 | 34457208 ± 4441686 | 1814461 ± 144.339 | 28 ± 4 |
Tabel 8:. Repræsentative parametre fra sekventering enkelt og multiplex ERRBS biblioteker Vist er data per bane fra 51-cyklus single-read sekventering kørsler: middelværdi og standardafvigelser af entydigt rettet lyder antal CpG'er dækket og dækning pr CpG websted opnået fra sekventering single ERRBS biblioteker pr bane (n = 100), to ERRBS biblioteker pr bane (n = 128), tre ERRBS biblioteker pr bane (n = 11), og fire ERRBS biblioteker pr bane (n = 11).
Discussion
Data Protokollen præsenterede udbytter basepar opløsning på cytosin methylering på biologisk relevante genomiske regioner. Protokollen som skrevet er optimeret til 50 ng af udgangsmateriale, men det kan tilpasses til at håndtere en række input materiale (5 ng eller mere) 26. Dette vil kræve justeringer af nogle af protokoltrin som det ses i tabel 6. De ERRBS biblioteker er egnede til parret ende sekventering og yderligere genomisk dækning kan også opnås ved sekventering læser længere end 51 cyklusser. Multipleksede sekventering vil tilbyde en lavere pris protokol per prøve, men dette vil resultere i en reduceret dækning pr CpG websted repræsenteret i data (figur 5 og tabel 8), og vil ikke give tilstrækkelig dybde af dækningen til at udføre analyser, der kræver høj dækning pr CpG sted (fx som beskrevet af Landan et al. 33). Endelig er denne protokol (eller enhver bisulfit-baserede protocol) kan ikke skelne mellem methyl-cytosin og hydroxymethyl-cytosin 46,47. Men de genererede data kan integreres med andre protokol resultater 48,49 at afgrænse de forskellige ændringer, og andre cytosin ændringer nylig rapporteret 50, bør de være af interesse.
Høj kvalitet biblioteker vises som vist i figur 3A-C, og når samlet til sekventering giver et spor som vist i figur 3G (rød spor), der repræsenterer lige molære bidrag fra både bibliotekets fraktioner. Bibliotek fiasko forberedelse kan skyldes ethvert skridt under proceduren. Hvis nedbrudt DNA behandles det vil resultere i biblioteker, der ikke er beriget med MspI fragmenter og dermed lav CpG dækning ved hjælp af sekventering parametre er beskrevet i denne protokol. Hvis et enzym er ikke-funktionelt eller uforvarende udelukket fra en af reaktionerne, vil protokollen ikke gav den forventede biblioteket. Hvis ligering reaktion er ineffektiv, adaptere ved en højere koncentration end forventet, og / eller primerne anvendte koncentration er en begrænsende reagens til de endelige amplifikationstrinnene kan svigt bibliotek forekomme. Overskydende adaptere (ses som en toppe ved ~ 150 bp i Bioanalyzer resultater; Figur 3D-F) i biblioteket vil også forstyrre sekventering på grund af den vilkårlige gruppering af både biblioteket og overskydende adaptere. Mens et sådant bibliotek kan sekventere tilsyneladende normalt, en betydelig del af den læser vil blot være adaptorsekvenser. Hvis overskydende adaptere observeres i et bibliotek, er det bedst at gentage biblioteket præparat, hvis materialet er tilgængelige ved hjælp af optimal råmateriale til adapter mængde nøgletal. Endelig, for at sikre en effektiv PCR-amplifikation af bibliotekerne, er lavere og højere bibliotekets fraktioner opretholdes som separate prøver hele omdannelse med bisulfit og PCR berigelse trin. I modsat fald giver forskellen effektivitet forstærkning under PCR omsætning af højere og lavere fraktioner (som set i figur 3G blå spor) og potentialet for ulige repræsentation af den respektive genomiske loci, der er omfattet i hvert bibliotek fraktion under sekventering. Brugeren kan vælge at omfatte en kvantitativ PCR skridt umiddelbart efter bisulfit konvertering for yderligere titrering af optimale PCR-cyklusser er nødvendige for at forstærke bibliotekerne, der genereres.
ERRBS forberedelse bibliotek protokol har flere vigtige skridt i hvilke specifikke reagenser anbefales. Ved udgangen reparation trin, anvendelse af en fire-nukleotid dNTP mix tillader udgangen reparation af produkter, der ikke indeholder CG overhænget, såsom dem, der skyldes MspI enzymatisk stjerne aktivitet og klippede DNA-fragmenter til stede i den oprindelige DNA-prøve. Dette resulterer i forbedret CpG repræsentation i resultaterne. Ved ligering trin er det vigtigt at anvende en høj koncentration ligase (2.000.000 enheder / ml) og denatureret adaptere at sikre, at ligering Reactier effektiv, og at bisulfit konvertering ikke påvirke adapter sekvenser afgørende for præcis justering af data. Ved PCR trin er nødvendigt for høj specificitet under anvendelse af en polymerase er i stand til at amplificere bisulfit-behandlede GC-rige DNA-fragmenter. Endelig, for at sikre fjernelse af overskydende adaptorer og primere SPRI perle-oprensning (for eksempel: Agencourt AMPure XP) anbefales i stedet kolonne baserede assays til ligering og PCR-produktet isoleringer.
For at generere data af høj kvalitet, er det vigtigt at sikre en effektiv omdannelse med bisulfit. Styringen præsenteres giver brugeren mulighed for at bestemme omdannelseseffektivitet før sekventering. Som et alternativ, kan et ikke-humant DNA, såsom lambda-DNA anvendes som en intern kontrol (spike-in). På grund af forskelle i arten, kan denne type af kontrol direkte inkluderet i nedstrøms sekventering (fx som anvendt af Yu et al., 34). Men hvis spike-in is udnyttet, kan det ikke anvendes til at bestemme virkningsgraden før biblioteket sekventering medmindre entydigt amplificeret og uafhængigt sekventeret før biblioteket sekventering. De satser bestemmes konvertering er baseret på status for methylering til ikke-CpG sites. Det kan ikke være egnet til brug i forbindelse med høje cytosin methylering i ikke-CpG kontekst (f.eks embryonale stamceller) og parallelle prøver eller andre midler til at vurdere for virkningsgraden kan anvendes til dette formål.
Der er et par protester til adressen, der er unikke for sekventering af ERRBS biblioteker. De første tre baser af bibliotekets fraktioner sekventerede er næsten ensartet ikke-tilfældige på grund af MspI anerkendelse kløvningspunkt (C ^ CGG, se figur 4B, C). Dette resulterer i potentialet for betydelige tab af data på grund af lav kvalitet læser som følge af dårlig klynge lokalisering på trods af det store klynge tæthed under sekventering. For at overvinde denne barriere,omfatte en høj kompleksitet bibliotek i en uafhængig Lane (PhiX eller anden bibliotek type) som en dedikeret kontrol lane. Høj kompleksitet biblioteker har ender, der indeholder en ligelig repræsentation af A, C, T og G i de første fire baser sekventeret. Egnede kontrolbaner omfatter biblioteker, såsom RNA-seq, chip-seq, hele genomsekventering, eller en kontrol, der tilbydes af sekventering maskinfabrikanten (f.eks PhiX Kontrol v3). Når der er udpeget som en kontrol vognbane for den pågældende sekventering sigt kan danne grundlag for den matrix generation, som er udnyttet i de første fire baser af sekventering til at opdage klynge positioner. Den højere kvalitet læser fanget vil hæve den gennemsnitlige dækning pr CpG websted med 5,2 (n = 4). Alternativt kan denne tekniske vanskelighed også overvindes ved hjælp af en mørk sekventering fremgangsmåde som tidligere beskrevet 23. Andre sekventering kriterier følger standardprocedurer pr producentens protokoller. Endelig dækning pr CpG cHosen til dataanalyse vil blive styret af brugeren, og delvist af de biologiske spørgsmål af interesse. 10x dækning tærskel giver en høj dækning analyse tilgang dog denne tærskel kan sænkes, bør det være af interesse.
En mere detaljeret gennemgang af ERRBS dataanalyse er uden for rammerne af denne artikel, dog differentielt methylerede cytosiner og regioner kan bestemmes ved hjælp af open source-værktøjer 31,51-53. Yderligere analyse overvejelser og tilgange er blevet godt beskrevet 54,55, og læseren opfordres til at søge i litteraturen for værktøjer mest hensigtsmæssige for analysen planlagt.
Sammenlignet med andre offentliggjorte metoder, ERRBS tilbyder en fire-dages protokol, som når de udføres som beskrevet udbytter høje reproducerbarhed. Det er blevet valideret i forhold til guldstandarden MassARRAY EpiTYPER 26, er omkostningseffektiv for høje data dækning, og kan tilpasses til forskellige input-materialemængder (gunstige for klinisk prøve forarbejdning og andre celletyper af lavfrekvens) og sekventering metoder. Det tilbyder basepar opløsning på biologisk relevant loci og kan bruges i integrativ analyser med andre teknikker profilering genom-dækkende transkriptionsfaktorbindende, kromatin remodeling, epigenetiske mærker og andre cytosin modifikationer af interesse. ERRBS data anvendelse i sådanne undersøgelser kan bidrage til en omfattende molekylær tilgang og mulighed for høj dimensionel analyser i studiet af biologiske modeller og sygdom hos mennesker.
Disclosures
Forfatterne har ingen interessekonflikter at afsløre.
Materials
Name | Company | Catalog Number | Comments |
MspI | New England Biolabs | R0106M | 100,000 units/ml |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml |
NaOAc | Sigma-Aldrich | S7899 | 3 M, pH 5.2 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1 M, pH 8.5 solution |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1x buffer solution per manufacturer's recommendations |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10x concentration |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | |
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use. |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml |
50 bp DNA Ladder | NEB | N3236S | |
100 bp DNA Ladder | NEB | N3231S | |
Gel Loading Dye, Orange (6x) | NEB | B7022S | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control |
FastStart High Fidelity PCR System | Roche | 03553426001 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 |
DynaMag-2 Magnet | Life Technologies | 12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | |
2100 Bioanalyzer | Agilent Technologies | ||
PhiX Control v3 | Illumina | FC-110-3001 | |
HiSeq 2500 | Illumina | ||
Pippin Prep | Sage Science | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol. |
Microcentrifuge | |||
Vortex Mixer | |||
Dry Block Heater | |||
Thermal Cycler | |||
Water Bath | |||
Gel electrophoresis system | |||
Electrophoresis power supply | |||
Gel doc | |||
UV or blue light transilluminator |
References
- Jones, P. A. Functions of DNA methylation: islands, start sites, gene bodies and beyond. Nat Rev Genet. 13 (7), 484-492 (2012).
- Barlow, D. P. Genomic imprinting: a mammalian epigenetic discovery model. Annual Review Of Genetics. 45, 379-403 (2011).
- Thiagarajan, R. D., Morey, R., Laurent, L. C. The epigenome in pluripotency and differentiation. Epigenomics. 6 (1), 121-137 (2014).
- Reik, W. Stability and flexibility of epigenetic gene regulation in mammalian development. Nature. 447 (7143), 425-432 (2007).
- Hartnett, L., Egan, L. J. Inflammation, DNA methylation and colitis-associated cancer. Carcinogenesis. 33 (4), 723-731 (2012).
- Smith, Z. D., Meissner, A. DNA methylation: roles in mammalian development. Nat Rev Genet. 14 (3), 204-220 (2013).
- Li, E., Bestor, T. H., Jaenisch, R. Targeted mutation of the DNA methyltransferase gene results in embryonic lethality. Cell. 69 (6), 915-926 (1992).
- Okano, M., Bell, D. W., Haber, D. A., Li, E. DNA methyltransferases Dnmt3a and Dnmt3b are essential for de novo methylation and mammalian development. Cell. 99 (3), 247-257 (1999).
- Feinberg, A. P. Phenotypic plasticity and the epigenetics of human disease. Nature. 447 (7143), 433-440 (2007).
- Bock, C. Epigenetic biomarker development. Epigenomics. 1 (1), 99-110 (2009).
- Laird, P. W. The power and the promise of DNA methylation markers. Nat Rev Cancer. 3 (4), 253-266 (2003).
- How Kit, A., Nielsen, H. M., Tost, J. DNA methylation based biomarkers: practical considerations and applications. Biochimie. 94 (11), 2314-2337 (2012).
- Mikeska, T., Bock, C., Do, H., Dobrovic, A. DNA methylation biomarkers in cancer: progress towards clinical implementation. Expert Review Of Molecular Diagnostics. 12 (5), 473-487 (2012).
- Gyparaki, M. T., Basdra, E. K., Papavassiliou, A. G. DNA methylation biomarkers as diagnostic and prognostic tools in colorectal cancer. Journal of Molecular Medicine. 91 (11), 1249-1256 (2013).
- Figueroa, M. E., et al. DNA methylation signatures identify biologically distinct subtypes in acute myeloid leukemia. Cancer Cell. 17 (1), 13-27 (2010).
- Heyn, H., Mendez-Gonzalez, J., Esteller, M. Epigenetic profiling joins personalized cancer medicine. Expert review of Molecular Diagnostics. 13 (5), 473-479 (2013).
- Kulis, M., Esteller, M. DNA methylation and cancer. Advances in Genetics. 70, 27-56 (2010).
- Xiong, Z., Laird, P. W. COBRA: a sensitive and quantitative DNA methylation assay. Nucleic Acids Res. 25 (12), 2532-2534 (1997).
- Meissner, A., et al. Reduced representation bisulfite sequencing for comparative high-resolution DNA methylation analysis. Nucleic Acids Res. 33 (18), 5868-5877 (2005).
- Gu, H., et al. Preparation of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling. Nat Protoc. 6 (4), 468-481 (2011).
- Bock, C., et al. Quantitative comparison of genome-wide DNA methylation mapping technologies. Nat Biotechnol. 28 (10), 1106-1114 (2010).
- Harris, R. A., et al. Comparison of sequencing-based methods to profile DNA methylation and identification of monoallelic epigenetic modifications. Nat Biotechnol. 28 (10), 1097-1105 (2010).
- Boyle, P., et al. Gel-free multiplexed reduced representation bisulfite sequencing for large-scale DNA methylation profiling. Genome Biol. 13 (10), R92 (2012).
- Chatterjee, A., Rodger, E. J., Stockwell, P. A., Weeks, R. J., Morison, I. M. Technical considerations for reduced representation bisulfite sequencing with multiplexed libraries. Journal of Biomedicine & Biotechnology. 2012, 741542 (2012).
- Lee, Y. K., et al. Improved reduced representation bisulfite sequencing for epigenomic profiling of clinical samples. Biological Procedures Online. 16 (1), 1 (2014).
- Akalin, A., et al. Base-pair resolution DNA methylation sequencing reveals profoundly divergent epigenetic landscapes in acute myeloid leukemia. PLoS Genet. 8 (6), e1002781 (2012).
- Hatzi, K., et al. A Hybrid Mechanism of Action for BCL6 in B Cells Defined by Formation of Functionally Distinct Complexes at Enhancers and Promoters. Cell Reports. 4 (3), 578-588 (2013).
- Will, B., et al. Satb1 regulates the self-renewal of hematopoietic stem cells by promoting quiescence and repressing differentiation commitment. Nature Immunology. 14 (5), 437-445 (2013).
- Lu, C., et al. Induction of sarcomas by mutant IDH2. Genes Dev. 27 (18), 1986-1998 (2013).
- Kumar, R., et al. AID stabilizes stem-cell phenotype by removing epigenetic memory of pluripotency genes. Nature. 500 (7460), 89-92 (2013).
- Li, S., et al. An optimized algorithm for detecting and annotating regional differential methylation. BMC Bioinformatics. 14, Suppl 5. S10 (2013).
- Patterson, K., Molloy, L., Qu, W., Clark, S. DNA methylation: bisulphite modification and analysis. Journal of Visualized Experiments. (56), 3170 (2011).
- Landan, G., et al. Epigenetic polymorphism and the stochastic formation of differentially methylated regions in normal and cancerous tissues. Nat Genet. 44 (11), 1207-1214 (2012).
- Yu, M., et al. Tet-assisted bisulfite sequencing of 5-hydroxymethylcytosine. Nat Protoc. 7 (12), 2159-2170 (2012).
- Goecks, J., Nekrutenko, A., Taylor, J., Galaxy, T. Galaxy: a comprehensive approach for supporting accessible, reproducible, and transparent computational research in the life sciences. Genome Biol. 11 (8), R86 (2010).
- Dorff, K. C., et al. GobyWeb: simplified management and analysis of gene expression and DNA methylation sequencing data. PLoS One. 8 (7), e69666 (2013).
- Roehr, J. T., Dodt, M., Ahmed, R., Dieterich, C. Flexbar − flexible barcode and adapter processing for next-generation sequencing platforms. MDPI Biology. 1 (3), 895-905 (2012).
- Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal, North America. 17 (1), 10-12 (2011).
- Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
- Needleman, S. B., Wunsch, C. D. A general method applicable to the search for similarities in the amino acid sequence of two proteins. J Mol Biol. 48 (3), 443-453 (1970).
- Krueger, F., Andrews, S. R. Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics. 27 (11), 1571-1572 (2011).
- Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
- Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12 (6), 996-1006 (2002).
- Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
- Team, R. C. R. A language and environment for statistical computing. R Foundation for Statistical Computing. Vienna, Austria. ISBN 3-900051-07-0, http://www.R-project.org (2012).
- Nestor, C., Ruzov, A., Meehan, R., Dunican, D. Enzymatic approaches and bisulfite sequencing cannot distinguish between 5-methylcytosine and 5-hydroxymethylcytosine in DNA. BioTechniques. 48 (4), 317-319 (2010).
- Huang, Y., et al. The behaviour of 5-hydroxymethylcytosine in bisulfite sequencing. PLoS One. 5 (1), e8888 (2010).
- Yu, M., et al. Base-resolution analysis of 5-hydroxymethylcytosine in the mammalian genome. Cell. 149 (6), 1368-1380 (2012).
- Song, C. X., et al. Genome-wide profiling of 5-formylcytosine reveals its roles in epigenetic priming. Cell. 153 (3), 678-691 (2013).
- Ito, S., et al. Tet proteins can convert 5-methylcytosine to 5-formylcytosine and 5-carboxylcytosine. Science. 333 (6047), 1300-1303 (2011).
- Akalin, A., et al. methylKit: a comprehensive R package for the analysis of genome-wide DNA methylation profiles. Genome Biol. 13 (10), R87-1186 (2012).
- Stockwell, P. A., Chatterjee, A., Rodger, E. J., Morison, I. M. DMAP: Differential Methylation Analysis Package for RRBS and WGBS data. Bioinformatics. 30 (13), 1814-1822 (2014).
- Sun, D., et al. MOABS: model based analysis of bisulfite sequencing data. Genome Biol. 15 (2), R38 (2014).
- Bock, C. Analysing and interpreting DNA methylation data. Nat Rev Genet. 13 (10), 705-719 (2012).
- Rivera, C. M., Ren, B. Mapping human epigenomes. Cell. 155 (1), 39-55 (2013).