Enhanced Reduced Representation Bisulfite Sequencing is a method for the preparation of sequencing libraries for DNA methylation analysis based on restriction enzyme digestion combined with cytosine bisulfite conversion. This protocol requires 50 ng of starting material and yields base pair resolution data at GC-rich genomic regions.
Metylering mönster DNA-kartläggning är starkt studeras i normala och sjuka vävnader. En mängd metoder har etablerats för att förhöra cytosin metyleringsmönster i celler. Minskad representation av hela genomet bisulfite sekvense utvecklades för att upptäcka kvantitativa baspar upplösning cytosin metyleringsmönster vid GC-rika iska loci. Detta åstadkommes genom att kombinera användningen av ett restriktionsenzym, följt av bisulfit-omvandling. Enhanced Reducerad Representation bisulfit Sequencing (ERRBS) ökar biologiskt relevant genomisk lokus täckt och har använts för att profilera cytosin metylering i DNA från människa, mus och andra organismer. ERRBS inleder med restriktionsenzymspjälkning av DNA för att generera lågmolekylära fragment för användning i biblioteks preparatet. Dessa fragment utsätts för standardbibliotek konstruktion för nästa generations sekvensering. Bisulfite konvertering av ometylerade cytosiner före den slutliga amplificatipå steg möjliggör kvantitativ bas lösa cytosin metylering nivåer i täckt iska loci. Protokollet kan slutföras inom fyra dagar. Trots låg komplexitet i de tre första baserna sekvense, ERRBS biblioteken ger högkvalitativa data när du använder en utsedd sekvensekontroll körfält. Kartläggning och bioinformatik analys utförs därefter och ger data som enkelt kan integreras med en mängd olika genomet hela plattformar. ERRBS kan använda små mängd insatsmaterial som gör det möjligt att bearbeta kliniska prover och tillämpas i en rad olika forskningsansökningar. Videon produceras visar kritiska stegen i ERRBS protokollet.
DNA-metylering vid cytosin (5-metylcytosin) är en epigenetisk märke kritisk i däggdjursceller för en rad olika biologiska processer, inklusive men inte begränsat till prägling, X-kromosom inaktive, utveckling och reglering av genuttryck 1-8. Studien av DNA metyleringsmönster i maligna och andra störningar har fastställt sjukdomsspecifika mönster och bidrog till förståelsen av sjukdomen patogenes och potentiella biomarkörer upptäckter 9-17. Det finns många protokoll som förhöra epigenomet för DNA-metylering status. Dessa kan delas in i affinitetsbaserad, restriktionsenzymbaserad, och bisulfit omvandlingsbaserade analyser som utnyttjar microarray eller sekvenseplattformar nedströms. Vidare finns det några protokoll som överbryggar dessa allmänna kategorier inklusive men inte begränsat till, Kombinerad bisulfit restriktionsanalys 18 och Reducerad Representation bisulfit Sequencing (RRBS 19). </p>
RRBS ursprungligen beskrivits av Meissner et al. 19,20. Protokollet introducerade ett steg att berika GC-rika genomregioner följt av bisulfit sekvensering, vilket resulterade i kvantitativ basparsupplösning uppgifter som är kostnadseffektiv 21,22. GC-rika regioner är målet för den Mspl (C ^ CGG) restriktionsenzym, och cytosin metylering är löst genom bisulfit omvandling av cytosiner (deaminering av omodifierade cytosiner till uracil), följt av polymerase chain reaction (PCR). RRBS omfattade huvuddelen av genpromotorer och CpG-öar i en bråkdel av den sekvense krävs för en hela genomet; dock RRBS hade begränsad täckning av CpG stränder och andra intergena regioner från biologisk relevans. Flera grupper har publicerat uppdaterade RRBS protokoll sedan den ursprungliga rapporten som förbättrar den metod och resulte täckning av dessa genomiska regioner 23-25. Enhanced Minskad Representation bisulfit SEQUkonferenser (ERRBS) omfattar biblioteksberednings ändringar och en suppleant uppgifter inriktningsinflygnings 26 jämfört med RRBS. ERRBS resulterade i ett ökat antal CpG representerade i de data som genereras och ökad täckning av alla iska regioner förhörts 26. Denna metod har använts för att lösa DNA metyleringsmönster i mänsklig patient och andra djurprover 26-30.
Den ERRBS protokoll som beskrivs erbjudanden detaljer om alla steg som behövs för färdigställande och data genererades med hjälp av representativa mänskligt DNA (prover erhölls från tidigare rapporterade, avidentifierade patientprover 31, och en CD34 + benmärgsprov från en normal människa donator). Protokollet innehåller en automatiserad storlek process val, vilket minskar handläggningstiden per prov och möjliggör ökad noggrannhet i biblioteksurvalsstorleken. Protokollet kombinerar en serie av etablerade molekylärbiologiska tekniker. Högmolekylärt DNA spjälkas wed en metylering okänslig restriktionsenzym (Mspl) följt av slut reparation, A-tailing, och ligering av metylerade adaptrar. Storleks val av GC-rika fragment följs av bisulfit konvertering och PCR-amplifiering före sekvensering. Bisulfite omvandling har varit tidigare beskrivits 32 och detaljerad genomgång av dataanalys och tillämpningar är utanför ramen för denna uppsats, men rekommendationer och referenser ingår för läsarnas användning. Protokollet kan utföras över fyra dagar och är mottaglig för liten ingång (50 ng eller mindre) materialmängder. Protokollet som beskrivs ger data med hög täckning per CpG plats räcker inte bara för differential metylering site och regionbestäm men också för epigenetiska polymorfism upptäckt som beskrivs av Landan, et al. 33.
Skördarna baspar upplösning uppgifter protokoll presenteras av cytosin metylering vid biologiskt relevanta iska regioner. Protokollet som skrivet är optimerad för 50 ng av utgångsmaterial, men det kan anpassas för att hantera en rad insatsmaterial (5 ng eller mer) 26. Detta kommer att kräva anpassningar av vissa av protokollsteg såsom framgår av tabell 6. Biblioteken ERRBS är mottagliga för parade slutsekvensering och ytterligare genomiska täckningen kan också åstadkommas genom sekvensavläsningar längre än 51 cykler. Multiplexed sekvense kommer att erbjuda en lägre kostnad protokoll per prov, men detta kommer att leda till minskad täckning per CpG plats representerade i data (Figur 5 och Tabell 8), och kommer inte att ge tillräckligt djup täckning för att utföra analyser som kräver hög täckning per CpG plats (t.ex. som beskrivs av et al. Landan 33). Slutligen detta protokoll (eller någon bisulfite baserad protocol) kan inte skilja mellan metyl-cytosin och hydroximetyl-cytosin 46,47. Men de data som genereras kan integreras med andra protokoll resultat 48,49 för att avgränsa de olika modifikationer, och andra cytosin modifieringar nyligen rapporterat 50, bör de vara av intresse.
Biblioteken Högkvalitativa visas som visas i figur 3A-C, och en gång samman för sekvense ger ett spår som visas i figur 3G (röd kurva) representerar lika molära bidrag från både biblioteksfraktioner. Bibliotek förberedelse misslyckande kan resultera från något steg under proceduren. Om nedbrutet DNA bearbetas det kommer att resultera i bibliotek som inte anrikas i Mspl fragment och därmed i svagt CpG täckningen med hjälp av sekvense parametrar som beskrivs i detta protokoll. Om ett enzym är icke funktionell eller oavsiktligt uteslutna från en av reaktionerna kommer protokollet att inte ge den förväntade biblioteket. Om ligering reaInsatser är ineffektivt, adaptrar är på en högre koncentration än väntat, och / eller primers koncentrationen som används är en begränsande reagens för de slutliga amplifieringsstegen, kan biblioteks fel uppstå. Överskott adaptrar (ses som en toppar vid ~ 150 bp i Bioanalyzer resultat, figur 3D-F) i biblioteket kommer också störa sekvense grund av urskillningslösa klustring av både biblioteket och överskott adaptrar. Medan ett sådant bibliotek kan sekvensera tydligen normalt, läser en betydande del av den kommer att vara enbart adaptersekvenser. Om överskott adaptrar observeras i ett bibliotek, är det bäst att upprepa biblioteket förberedelse om materialet är tillgängligt med hjälp optimal ingångsmaterial till adaptern kvantitetsförhållanden. Slutligen, för att säkerställa en effektiv PCR-amplifiering av biblioteken är de lägre och högre biblioteks fraktioner bibehållas som separata prover hela bisulfite konvertering och PCR anrikningssteg. Underlåtenhet att göra detta ger differentiell effektivitet förstärkning under PCR reaktion av högre och lägre fraktioner (som ses i figur 3G blå spår) och potentialen för ojämlik representation av respektive iska loci täckas i varje bibliotek fraktion under sekvensering. Användaren kan välja att inkludera en kvantitativ PCR steg omedelbart efter bisulfite omvandling för ytterligare titrering av optimala PCR-cykler som behövs för att förstärka biblioteken genereras.
ERRBS förberedelse biblioteksprotokoll har flera viktiga steg i vilka specifika reagens rekommenderas. I slutet-reparationssteg, användningen av en fyra-nukleotid dNTP mix möjliggör för end-reparation av några produkter som inte innehåller CG överhäng, såsom de som följer av Mspl enzymatisk stjärnan aktivitet och kluvna DNA-fragment som finns i den ursprungliga DNA-prov. Detta resulterar i förbättrade CpG representation i resultaten. Vid ligering steget är det viktigt att använda en hög koncentration ligas (2000000 enheter / ml) och metylerade adaptrar för att säkerställa att ligering Reactipå är effektiv och att den bisulfite konverteringen inte påverkar de adaptersekvenser väsentliga för exakt dataanpassning. Vid PCR-steget, med användning av ett polymeras med förmåga att amplifiera bisulfit-behandlad GC-rika DNA-fragment som är nödvändigt för hög specificitet. Slutligen, för att säkerställa eliminering av överskott av adaptrar och primrar, SPRI vulst rening (till exempel: Agencourt AMPure XP) rekommenderas hellre än kolonnbaserade analyser för ligering och PCR-produkt isoleringar.
För att generera data av hög kvalitet, är det viktigt att säkerställa en effektiv bisulfite konvertering. Kontrollen presenterade erbjuder användaren möjlighet att bestämma verkningsgraden före sekvensering. Som ett alternativ, kan en icke-human DNA, såsom lambda-DNA kan användas som en intern kontroll (spike-in). På grund av skillnaderna i art, kan denna typ av en kontroll omfattas direkt i nedströmssekvensering (t.ex. som användes av Yu, et al., 34). Om emellertid spike-i is utnyttjas, kan den inte användas för att bestämma verkningsgraden före bibliotekssekvense såvida unikt förstärks och självständigt sekvens före bibliotekssekvensering. De omräkningskurser som fastställts är baserade på metylering status vid icke-CpG platser. Detta kanske inte är lämplig för användning i samband med höga cytosin metylering i icke-CpG sammanhang (t.ex. embryonala stamceller) och parallella prover eller andra medel för att bedöma om verkningsgrad kan utnyttjas för detta ändamål.
Det finns några varningar till adress som är unika för sekvensering av ERRBS bibliotek. De tre första baserna i biblioteket fraktionerna sekvense är nästan likformigt icke-slumpmässigt på grund av den Mspl igenkännings cut ställe (C ^ CGG; se figur 4B, C). Detta resulterar i att potentialen för betydande förlust av data på grund av låg kvalitet läser följd av dålig kluster lokalisering trots till synes stora kluster täthet under sekvensering. För att övervinna detta hinder,inkludera en hög komplexitet bibliotek i en oberoende körfält (PhiX kontroll eller annan biblioteks typ) som en dedikerad kontroll körfält. Höga bibliotek komplexitet har ändar som innehåller en balanserad representation av A, C, T och G i de första fyra baserna sekvense. Lämpliga kontrollköer inkluderar bibliotek, såsom RNA-seq, Chip-punkter, hela genom sekvense, eller en kontroll som erbjuds av sekvense maskintillverkaren (t.ex. PhiX kontroll v3). När betecknas som en kontroll körfält för respektive sekvense sikt kan ligga till grund för matrisen generation som utnyttjas under de första fyra baserna av sekvense att upptäcka klusterpositioner. Ju högre kvalitet läser fångas kommer att höja den genomsnittliga täckning per CpG plats med 5,2 (n = 4). Alternativt kan denna tekniska svårigheter också övervinnas med hjälp av en mörk sekvense tillvägagångssätt som tidigare beskrivits 23. Andra sekvense kriterier följer standardrutiner per tillverkarens protokoll. Slutligen täckningen per CpG cHosen för dataanalys kommer att styras av användaren och delvis av de biologiska frågor av intresse. Tröskeln 10x täckning ger en hög täckningsgrad analys tillvägagångssätt, men denna tröskel kan sänkas bör det vara av intresse.
En fullständig diskussion av ERRBS dataanalys är utanför ramen för denna artikel, dock differentiellt metylerade cytosiner och regioner kan bestämmas med hjälp av open source-verktyg 31,51-53. Ytterligare överväganden och tillvägagångssätt analys har väl beskrivna 54,55, och läsaren uppmanas att söka litteraturen för verktyg som är lämpligast för analysen planerat.
Jämfört med andra publicerade metoder, erbjuder ERRBS en fyra-dagars protokoll som när den utförs såsom beskrivits utbyten höga hastigheter av reproducerbarhet. Det har validerats i förhållande till guldmyntfoten Massarray EpiTYPER 26, är kostnadseffektivt för data höga täcknings, och är anpassningsbar för olika insatsmaterialbelopp (gynnsamma för klinisk provhantering och andra celltyper med låg frekvens) och sekvense metoder. Det erbjuder baspar upplösning på biologiskt relevant geografisk och kan användas i integrativ analyser med andra tekniker profilering genomet hela transkriptionsfaktor bindande, Kromatinremodellering, epigenetiska märken och andra cytosin modifieringar av intresse. ERRBS uppgifter användning i sådana studier kan bidra till en övergripande molekylär strategi och möjliggöra hög dimensionell analyser i studien av biologiska modeller och mänsklig sjukdom.
The authors have nothing to disclose.
We thank all the authors of the original ERRBS report. We thank Mame Fall for technical assistance. We acknowledge the Weill Cornell Medical College Epigenomics Core for technical services and assistance. The work was supported by a Sass Foundation Judah Folkman Fellowship, an NCI K08CA169055 and ASH-AMFDP12005 to FGB, NIH R01HG006798 and R01NS076465, funding from the Irma T. Hirschl and Monique Weill-Caulier Charitable Trusts and STARR Consortium (I7-A765) to CEM, and an LLS SCORE grant (7006-13) to AMM.
Name of Reagent/ Equipment | Company | Catalog Number | Comments/Description | URL |
MspI | New England Biolabs | R0106M | 100,000 units/ml | https://www.neb.com/products/r0106-mspi |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 | https://www.neb.com/products/b7002-nebuffer-2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 | http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 | http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/g1767 |
NaOAc | Sigma-Aldrich | S7899 | 3M pH 5.2 | http://www.sigmaaldrich.com/catalog/product/sigma/s7899 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology | http://www.sigmaaldrich.com/catalog/product/sial/e7023 |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 | http://www.qiagen.com/products/catalog/lab-essentials-and-accessories/buffer-eb |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1M pH 8.5 solution | http://www.sigmaaldrich.com/catalog/product/sigma/t1503 |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1X buffer solution per manufacturer's recommendations | http://www.sigmaaldrich.com/catalog/product/sigma/t9285 |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10X concentration | https://www.neb.com/products/b0202-t4-dna-ligase-reaction-buffer |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide | https://www.neb.com/products/n0447-deoxynucleotide-dntp-solution-mix |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml | https://www.neb.com/products/m0203-t4-dna-polymerase |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml | https://www.neb.com/products/m0210-dna-polymerase-i-large-klenow-fragment |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml | https://www.neb.com/products/m0201-t4-polynucleotide-kinase |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-pcr-purification-kit |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM | http://www.promega.com/products/pcr/routine-pcr/deoxynucleotide-triphosphates-_dntps_/ |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml | https://www.neb.com/products/m0212-klenow-fragment-3-5-exo |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/minelute-pcr-purification-kit |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml | https://www.neb.com/products/m0202-t4-dna-ligase |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | ||
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use | https://www.beckmancoulter.com/wsrportal/wsrportal/wsr/research-and-discovery/products-and-services/nucleic-acid-sample-preparation/agencourt-ampure-xp-pcr-purification/index.htm?i=A63882#2/10//0/25/1/0/asc/2/A63882///0/1//0/ |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards | http://store.sagescience.com/s.nl/it.A/id.1036/.f |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | http://www.bio-rad.com/en-us/sku/161-3106-certified-low-range-ultra-agarose | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | http://www.sigmaaldrich.com/catalog/product/sigma/t4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/e1510 |
50 bp DNA Ladder | NEB | N3236S | https://www.neb.com/products/n3236-50-bp-dna-ladder | |
100 bp DNA Ladder | NEB | N3231S | https://www.neb.com/products/n3231-100-bp-dna-ladder | |
Gel Loading Dye, Orange (6X) | NEB | B7022S | https://www.neb.com/products/b7022-gel-loading-dye-orange-6x | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | http://www.fishersci.com/ecomm/servlet/fsproductdetail?position=content&tab=Items&productId=11876776 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-gel-extraction-kit | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-kits/ez-dna-methylation-kit |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-lightning-kit |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control | http://www.zymoresearch.com/epigenetics/dna-methylation/methylated-dna-standards/universal-methylated-human-dna-standard |
FastStart High Fidelity PCR System | Roche | 03553426001 | http://lifescience.roche.com/shop/products/faststart-high-fidelity-pcr-system#tab-0 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 | http://www.lifetechnologies.com/order/catalog/product/Q32854 |
DynaMag-2 Magnet | Life Technologies | 12321D | https://www.lifetechnologies.com/order/catalog/product/12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | http://www.genomics.agilent.com/en/Bioanalyzer-DNA-RNA-Kits/High-Sensitivity-DNA-Analysis-Kits/?cid=AG-PT-105&tabId=AG-PR-1069 | |
2100 Bioanalyzer | Agilent Technologies | http://www.genomics.agilent.com/en/Bioanalyzer-System/2100-Bioanalyzer-Instruments/?cid=AG-PT-106&tabId=AG-PR-1001 | ||
PhiX Control v3 | Illumina | FC-110-3001 | http://www.illumina.com/products/phix_control_v3.ilmn | |
HiSeq 2500 | Illumina | http://www.illumina.com/systems/hiseq_2500_1500.ilmn | ||
Pippin Prep | Sage Science | http://www.sagescience.com/products/pippin-prep/ | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | http://www.lifetechnologies.com/order/catalog/product/Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | http://www.illumina.com/products/truseq_sr_cluster_kit_v3-cbot-hs.ilmn | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | http://www.illumina.com/products/truseq_sbs_kit_v3-hs.ilmn | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol | http:/http://www.illumina.com/products/truseq-rna-access-kit.ilmn |
Microcentrifuge | ||||
Vortex Mixer | ||||
Dry Block Heater | ||||
Thermal Cycler | ||||
Water Bath | ||||
Gel electrophoresis system | ||||
Electrophoresis power supply | ||||
Gel doc | ||||
UV or blue light transilluminator |