Enhanced Reduced Representation Bisulfite Sequencing is a method for the preparation of sequencing libraries for DNA methylation analysis based on restriction enzyme digestion combined with cytosine bisulfite conversion. This protocol requires 50 ng of starting material and yields base pair resolution data at GC-rich genomic regions.
DNA metilazione mapping è fortemente studiato in tessuti normali e patologici. Una varietà di metodi sono stati stabiliti per interrogare i modelli citosina metilazione nelle cellule. Rappresentazione ridotta di sequenziamento dell'intero genoma bisolfito è stato sviluppato per individuare coppie di basi modelli risoluzione citosina metilazione quantitativi a ricchi di GC loci genomici. Questo si ottiene combinando l'uso di un enzima di restrizione seguita da conversione bisolfito. Maggiore ridotto Rappresentanza bisolfito Sequencing (ERRBS) aumenta la loci genomici biologicamente rilevanti coperti ed è stato usato per profilare citosina metilazione del DNA da umano, mouse e altri organismi. ERRBS inizia con enzimi di restrizione del DNA per generare frammenti a basso peso molecolare per la redazione biblioteca. Questi frammenti sono sottoposti alla costruzione della libreria standard per la prossima generazione di sequenziamento. Conversione bisolfito di cytosines non metilato prima della amplificati finalesul gradino permette per la risoluzione di base quantitativa dei livelli di metilazione citosina in coperta loci genomici. Il protocollo può essere completata nel giro di quattro giorni. Nonostante bassa complessità nei primi tre basi in sequenza, le biblioteche ERRBS producono dati di alta qualità quando si utilizza una corsia di controllo sequenza designato. Mappatura e bioinformatica analisi viene quindi eseguita e dati produce che può essere facilmente integrato con una varietà di piattaforme genoma. ERRBS può utilizzare piccole quantità di materiale in entrata rendendo così possibile elaborare campioni clinici umani e applicabile in una vasta gamma di applicazioni di ricerca. Il video prodotto dimostra passaggi critici del protocollo ERRBS.
La metilazione del DNA a citosina (5-metilcitosina) è un marchio epigenetico critica in cellule di mammifero per una varietà di processi biologici, compreso ma non limitato a imprinting, inattivazione del cromosoma X, lo sviluppo, e la regolazione dell'espressione genica 1-8. Lo studio della metilazione del DNA in maligne e altri disturbi ha determinato malattie modelli specifici e contribuito alla comprensione della patogenesi della malattia e potenziali scoperte biomarker 9-17. Ci sono molti protocolli che interrogano dell'epigenoma per lo stato di metilazione del DNA. Questi possono essere suddivisi in base affinità, enzima di restrizione-based, e saggi basati conversione-bisolfito che utilizzano le piattaforme di microarray o sequenziamento valle. Inoltre, ci sono alcuni protocolli che colmano queste categorie generali compresi, ma non limitatamente a, combinato bisolfito Restriction Analysis 18 e ridotto Rappresentanza bisolfito Sequencing (RRBs 19). </p>
RRBs stato originariamente descritto da Meissner et al. 19,20. Il protocollo ha introdotto un passo per arricchire regioni genomiche ricche di GC seguiti da sequenziamento bisolfito, che ha portato i dati risoluzione di base-pair quantitativo, che è economicamente vantaggioso 21,22. Le regioni ricche di GC sono mirati dal MspI (C ^ CGG) enzima di restrizione, e citosina metilazione si risolve con la conversione bisolfito di cytosines (deamination di cytosines modificati a uracile), seguita dalla reazione a catena della polimerasi (PCR). RRBs coperto la maggioranza dei promotori genici e isole CpG in una frazione del sequenziamento richiesto per un intero genoma; tuttavia RRBs avevano copertura limitata delle coste CPG e altre regioni intergeniche di rilevanza biologica. Diversi gruppi hanno pubblicato aggiornati protocolli RRBs rispetto alla relazione originale che migliorano la metodologia e la copertura risultante di queste regioni genomiche 23-25. Maggiore rappresentanza ridotta Bisulfite Sequscere (ERRBS) include modifiche preparazione di libreria e di un allineamento di dati alternativo approccio 26 quando rispetto al RRBs. ERRBS provocato un maggior numero di CPGs rappresentata nei dati generati e aumentato la copertura di tutte le regioni genomiche interrogato 26. Questo metodo è stato utilizzato per risolvere schemi di metilazione del DNA in paziente umano e altri esemplari di animali 26-30.
Il protocollo ERRBS descritto particolari offerte su tutti i passi necessari per il completamento e dati sono stati generati utilizzando rappresentante DNA umano (i campioni sono stati ottenuti da precedentemente riportati, i campioni dei pazienti de-identificati 31, e CD34 + midollo osseo da un campione normale donatore umano). Il protocollo comprende una procedura automatica di selezione del formato, che riduce il tempo di elaborazione per campione e consente una maggiore precisione nella selezione della libreria dimensioni. Il protocollo combina una serie di tecniche di biologia molecolare stabiliti. Alto peso molecolare DNA viene digerito won una metilazione-insensitive enzima di restrizione (MspI) seguita da fine-riparazione, A-tailing, e legatura di adattatori denaturato. Dimensione selezione dei frammenti ricchi di GC è seguita da conversione bisolfito e PCR di amplificazione prima sequenziamento. Conversione bisolfito è stato descritto in precedenza 32 e dettagliata revisione di analisi e applicazioni dati è oltre la portata di questo articolo, tuttavia consigli e riferimenti sono inclusi per l'uso dei lettori. Il protocollo può essere eseguita in quattro giorni ed è suscettibile di piccolo ingresso (50 ng o meno) importi rilevanti. Il protocollo, come descritto produce dati con elevata copertura per sito CpG sufficiente non solo per differenziali sito metilazione e regione determinazioni, ma anche per il rilevamento del polimorfismo epigenetico come descritto da Landan, et al. 33.
I dati di risoluzione rendimenti base-pair protocollo presentato di citosina metilazione a biologicamente rilevanti regioni genomiche. Il protocollo come scritto è ottimizzato per 50 ng di materiale di partenza, tuttavia, può essere adattato per gestire una gamma di materiali di ingresso (5 ng o più) 26. Ciò richiederà aggiustamenti di alcuni dei passaggi del protocollo, come visto nella tabella 6. Le librerie ERRBS sono suscettibili di sequenziamento fine associato e ulteriormente la copertura genomica può anche essere realizzato mediante sequenziamento legge più di 51 cicli. Sequenziamento Multiplexed offrirà un protocollo minor costo per campione, tuttavia, questo comporta copertura ridotta per sito CpG rappresentato nei dati (Figura 5 e la Tabella 8), e non produrrà sufficiente profondità di copertura effettuare analisi che richiedono elevata copertura per sito CpG (ad esempio come descritto da Landan et al. 33). Infine, questo protocollo (o qualsiasi protoco basata bisolfito-l) non può distinguere tra metil-citosina e idrossimetil-citosina 46,47. Tuttavia, i dati generati può essere integrato con altri protocollo risultati 48,49 per delineare le diverse modifiche, e altre modifiche citosina recentemente riportato 50, dovrebbero essere di interesse.
Appariranno librerie di alta qualità come mostrato nella figura 3A-C, e una volta aggregate per sequenziamento produce una traccia, come mostrato nella figura 3G (traccia rossa) rappresenta contributi molari uguali da due frazioni di libreria. Insufficienza preparazione Libreria può derivare da qualsiasi punto durante la procedura. Se il DNA degradato viene elaborato il risultato sarà in librerie che non sono arricchiti in frammenti MspI e quindi nella copertura bassa CpG utilizzando i parametri di sequenziamento descritti in questo protocollo. Se un enzima è non funzionale o inavvertitamente esclusi da una delle reazioni, il protocollo non produrrà la libreria previsto. Se la rea legaturaction è inefficiente, adattatori sono ad una maggiore concentrazione del previsto, e / o la concentrazione di primer utilizzato è un reagente limitante per le fasi finali di amplificazione, può verificarsi insufficienza libreria. Adattatori in eccesso (visto come un picchi a ~ 150 bp a risultati Bioanalyzer, Figura 3D-F) nella libreria sarà anche interferire con il sequenziamento causa del raggruppamento indiscriminata sia della biblioteca e gli adattatori in eccesso. Mentre una tale libreria può sequenziare apparentemente normalmente, una parte significativa della legge sarà sequenze semplicemente adattatore. Se gli adattatori in eccesso si osservano in una libreria, è meglio ripetere la preparazione biblioteca se il materiale è disponibile usando il materiale in ingresso ottimale all'adattatore rapporti quantitativi. Infine, per garantire efficienza di amplificazione PCR delle librerie, le frazioni biblioteca inferiori e superiori sono mantenuti come campioni separati per tutta la conversione bisolfito e fasi di arricchimento PCR. In caso contrario si produce efficienza differenziale dell'amplificazione durante la PCR reazione di frazioni superiori e inferiori (come si vede nella Figura 3G traccia blu) e il potenziale per la rappresentazione disuguale dei rispettivi loci genomici coperto in ogni frazione libreria durante sequenziamento. L'utente può scegliere di includere una PCR quantitativa passo immediatamente dopo la conversione bisolfito per ulteriore titolazione di cicli PCR ottimali necessari per amplificare le librerie generati.
ERRBS protocollo di preparazione biblioteca ha diversi passaggi chiave in cui sono raccomandati reagenti specifici. Nella fase finale di riparazione, l'uso di una miscela dNTP quattro nucleotidi consente end-riparazione di qualsiasi prodotto che non contengono la sporgenza CG, come quelli derivanti da attività enzimatica MspI stella e frammenti di DNA tranciate presenti nel campione di DNA originale. Ciò si traduce in una migliore rappresentazione CpG nei risultati. Al passo legatura è fondamentale utilizzare una ligasi alta concentrazione (2.000.000 unità / ml) e adattatori metilati per garantire che il riatti legaturaon è efficiente e che la conversione bisolfito non influenza le sequenze essenziali per l'allineamento dei dati accurati adattatore. Nella fase PCR, utilizzando una polimerasi grado di amplificare ricchi GC frammenti di DNA bisolfito trattati è necessaria per alta specificità. Infine, per garantire l'eliminazione di adattatori eccesso e primer, SPRI purificazione tallone (per esempio: Agencourt AMPure XP) è consigliato anziché test basati colonna per legatura ed isolamenti prodotto PCR.
Al fine di generare dati di alta qualità, è importante assicurare la conversione bisolfito efficiente. Il controllo ha presentato offre all'utente la possibilità di determinare l'efficienza di conversione prima di sequenziamento. In alternativa, un DNA non umano come DNA lambda può essere utilizzato come controllo interno (picco-in). A causa delle differenze nelle specie, questo tipo di controllo può essere direttamente incluso nella sequenza a valle (es usati per Yu et al. 34). Tuttavia, se l'i-picco ins utilizzato, non può essere utilizzato per determinare l'efficienza di conversione prima sequenziamento libreria a meno amplificato modo separato ed indipendente sequenziato prima sequenziamento libreria. I tassi di conversione determinati sono basate sullo stato di metilazione in siti non-CpG. Questo può non essere adatto per l'uso nel contesto di alta metilazione citosina in non-CpG contesto (ad esempio cellule staminali embrionali) e campioni paralleli o altri mezzi per valutare l'efficienza di conversione può essere utilizzato per questo scopo.
Ci sono alcune avvertenze da affrontare che sono unici per il sequenziamento del biblioteche ERRBS. I primi tre basi delle frazioni di libreria sequenziate sono quasi uniformemente non casuale dovuta al sito di riconoscimento MspI taglio (C ^ CGG; vedi Figura 4B, C). Il risultato è la possibilità di una significativa perdita di dati a causa di bassa qualità derivanti da letture di localizzazione grappolo scarsa nonostante apparente ad alta densità di cluster durante la sequenza. Per superare questo ostacolo,includere una libreria di complessità in una corsia indipendente (controllo Phix o altro tipo di biblioteca) come una corsia di controllo dedicato. Biblioteche elevata complessità hanno estremità che contengono una rappresentanza equilibrata di A, C, T e G nelle prime quattro basi in sequenza. Corsie di controllo adatti comprendono biblioteche, come RNA-Seq, ChIP-seq, sequenziamento dell'intero genoma, o un controllo offerto dal costruttore della macchina sequenza (ad esempio Phix controllo v3). Quando designato come una corsia di controllo del rispettivo corsa sequenziamento, può servire come base per la generazione della matrice che viene utilizzata durante i primi quattro basi di sequenziamento per rilevare posizioni cluster. La qualità superiore si legge catturato aumenterà la copertura media per sito CpG 5,2 (n = 4). In alternativa, questa difficoltà tecnica può anche essere superato utilizzando un approccio di sequenziamento scuro come descritto in precedenza 23. Altri criteri di sequenziamento seguire le procedure operative standard per i protocolli del produttore. Infine, la copertura per CpG chosen per l'analisi dei dati sarà guidato dall'utente e in parte dalle domande biologiche di interesse. 10x soglia di copertura offre un approccio di analisi ad alta copertura, ma questa soglia può essere abbassata che dovrebbe essere di interesse.
Una discussione completa di analisi dei dati ERRBS è oltre la portata di questo articolo, tuttavia, differenziale cytosines e regioni denaturato possono essere determinate utilizzando strumenti open source 31,51-53. Considerazioni ulteriori analisi e approcci sono stati ben descritto 54,55, e il lettore è incoraggiato a cercare letteratura per strumenti più adeguati per l'analisi pianificata.
Rispetto ad altri metodi pubblicati, ERRBS offre un protocollo di quattro giorni che, quando eseguita come descritto rendimenti elevati tassi di riproducibilità. E 'stato convalidato rispetto al gold standard di MassARRAY EpiTYPER 26, è conveniente per i dati di copertura alte, ed è adattabile per vari materiale in entrataimporti (favorevoli per l'elaborazione del campione clinico e altri tipi di cellule a bassa frequenza) e approcci di sequenziamento. Offre risoluzione di base-pair a loci biologicamente rilevanti e può essere utilizzato in integrativo analisi con altre tecniche di profilazione genome-wide fattore di trascrizione vincolante, il rimodellamento della cromatina, segni epigenetici e altre modifiche citosina di interesse. ERRBS uso dei dati in tali studi possono contribuire ad un approccio molecolare completa e consentire per alta dimensionale analisi nello studio dei modelli biologici e le malattie umane.
The authors have nothing to disclose.
We thank all the authors of the original ERRBS report. We thank Mame Fall for technical assistance. We acknowledge the Weill Cornell Medical College Epigenomics Core for technical services and assistance. The work was supported by a Sass Foundation Judah Folkman Fellowship, an NCI K08CA169055 and ASH-AMFDP12005 to FGB, NIH R01HG006798 and R01NS076465, funding from the Irma T. Hirschl and Monique Weill-Caulier Charitable Trusts and STARR Consortium (I7-A765) to CEM, and an LLS SCORE grant (7006-13) to AMM.
Name of Reagent/ Equipment | Company | Catalog Number | Comments/Description | URL |
MspI | New England Biolabs | R0106M | 100,000 units/ml | https://www.neb.com/products/r0106-mspi |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 | https://www.neb.com/products/b7002-nebuffer-2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 | http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 | http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/g1767 |
NaOAc | Sigma-Aldrich | S7899 | 3M pH 5.2 | http://www.sigmaaldrich.com/catalog/product/sigma/s7899 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology | http://www.sigmaaldrich.com/catalog/product/sial/e7023 |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 | http://www.qiagen.com/products/catalog/lab-essentials-and-accessories/buffer-eb |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1M pH 8.5 solution | http://www.sigmaaldrich.com/catalog/product/sigma/t1503 |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1X buffer solution per manufacturer's recommendations | http://www.sigmaaldrich.com/catalog/product/sigma/t9285 |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10X concentration | https://www.neb.com/products/b0202-t4-dna-ligase-reaction-buffer |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide | https://www.neb.com/products/n0447-deoxynucleotide-dntp-solution-mix |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml | https://www.neb.com/products/m0203-t4-dna-polymerase |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml | https://www.neb.com/products/m0210-dna-polymerase-i-large-klenow-fragment |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml | https://www.neb.com/products/m0201-t4-polynucleotide-kinase |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-pcr-purification-kit |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM | http://www.promega.com/products/pcr/routine-pcr/deoxynucleotide-triphosphates-_dntps_/ |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml | https://www.neb.com/products/m0212-klenow-fragment-3-5-exo |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/minelute-pcr-purification-kit |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml | https://www.neb.com/products/m0202-t4-dna-ligase |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | ||
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use | https://www.beckmancoulter.com/wsrportal/wsrportal/wsr/research-and-discovery/products-and-services/nucleic-acid-sample-preparation/agencourt-ampure-xp-pcr-purification/index.htm?i=A63882#2/10//0/25/1/0/asc/2/A63882///0/1//0/ |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards | http://store.sagescience.com/s.nl/it.A/id.1036/.f |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | http://www.bio-rad.com/en-us/sku/161-3106-certified-low-range-ultra-agarose | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | http://www.sigmaaldrich.com/catalog/product/sigma/t4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/e1510 |
50 bp DNA Ladder | NEB | N3236S | https://www.neb.com/products/n3236-50-bp-dna-ladder | |
100 bp DNA Ladder | NEB | N3231S | https://www.neb.com/products/n3231-100-bp-dna-ladder | |
Gel Loading Dye, Orange (6X) | NEB | B7022S | https://www.neb.com/products/b7022-gel-loading-dye-orange-6x | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | http://www.fishersci.com/ecomm/servlet/fsproductdetail?position=content&tab=Items&productId=11876776 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-gel-extraction-kit | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-kits/ez-dna-methylation-kit |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-lightning-kit |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control | http://www.zymoresearch.com/epigenetics/dna-methylation/methylated-dna-standards/universal-methylated-human-dna-standard |
FastStart High Fidelity PCR System | Roche | 03553426001 | http://lifescience.roche.com/shop/products/faststart-high-fidelity-pcr-system#tab-0 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 | http://www.lifetechnologies.com/order/catalog/product/Q32854 |
DynaMag-2 Magnet | Life Technologies | 12321D | https://www.lifetechnologies.com/order/catalog/product/12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | http://www.genomics.agilent.com/en/Bioanalyzer-DNA-RNA-Kits/High-Sensitivity-DNA-Analysis-Kits/?cid=AG-PT-105&tabId=AG-PR-1069 | |
2100 Bioanalyzer | Agilent Technologies | http://www.genomics.agilent.com/en/Bioanalyzer-System/2100-Bioanalyzer-Instruments/?cid=AG-PT-106&tabId=AG-PR-1001 | ||
PhiX Control v3 | Illumina | FC-110-3001 | http://www.illumina.com/products/phix_control_v3.ilmn | |
HiSeq 2500 | Illumina | http://www.illumina.com/systems/hiseq_2500_1500.ilmn | ||
Pippin Prep | Sage Science | http://www.sagescience.com/products/pippin-prep/ | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | http://www.lifetechnologies.com/order/catalog/product/Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | http://www.illumina.com/products/truseq_sr_cluster_kit_v3-cbot-hs.ilmn | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | http://www.illumina.com/products/truseq_sbs_kit_v3-hs.ilmn | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol | http:/http://www.illumina.com/products/truseq-rna-access-kit.ilmn |
Microcentrifuge | ||||
Vortex Mixer | ||||
Dry Block Heater | ||||
Thermal Cycler | ||||
Water Bath | ||||
Gel electrophoresis system | ||||
Electrophoresis power supply | ||||
Gel doc | ||||
UV or blue light transilluminator |