Summary

La detección de funcional no codificante-variantes genéticas Uso de movilidad electroforética Shift ensayo (EMSA) y el ADN afinidad Precipitación Ensayo (DAPA)

Published: August 21, 2016
doi:

Summary

We present a strategic plan and protocol for identifying non-coding genetic variants affecting transcription factor (TF) DNA binding. A detailed experimental protocol is provided for electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genotype-dependent TF DNA binding.

Abstract

Population and family-based genetic studies typically result in the identification of genetic variants that are statistically associated with a clinical disease or phenotype. For many diseases and traits, most variants are non-coding, and are thus likely to act by impacting subtle, comparatively hard to predict mechanisms controlling gene expression. Here, we describe a general strategic approach to prioritize non-coding variants, and screen them for their function. This approach involves computational prioritization using functional genomic databases followed by experimental analysis of differential binding of transcription factors (TFs) to risk and non-risk alleles. For both electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genetic variants, a synthetic DNA oligonucleotide (oligo) is used to identify factors in the nuclear lysate of disease or phenotype-relevant cells. For EMSA, the oligonucleotides with or without bound nuclear factors (often TFs) are analyzed by non-denaturing electrophoresis on a tris-borate-EDTA (TBE) polyacrylamide gel. For DAPA, the oligonucleotides are bound to a magnetic column and the nuclear factors that specifically bind the DNA sequence are eluted and analyzed through mass spectrometry or with a reducing sodium dodecyl sulfate polyacrylamide gel electrophoresis (SDS-PAGE) followed by Western blot analysis. This general approach can be widely used to study the function of non-coding genetic variants associated with any disease, trait, or phenotype.

Introduction

Secuenciación y genotipado basado en estudios, incluyendo estudios de genoma completo (GWAS Association), estudios candidato locus, y profundo de secuenciación de los estudios, han identificado muchas variantes genéticas que están estadísticamente asociados con una enfermedad, rasgo o fenotipo. Contrariamente a las predicciones iniciales, la mayoría de estas variantes (85-93%) se localizan en regiones no codificantes y no cambian la secuencia de aminoácidos de las proteínas de 1,2. Interpretación de la función de estas variantes no codificantes y la determinación de los mecanismos biológicos que los conectan a la enfermedad asociada, rasgo, o fenotipo ha demostrado ser un desafío 3-6. Hemos desarrollado una estrategia general para identificar los mecanismos moleculares que enlazan variantes a un fenotipo intermedio importante – la expresión génica. Esta tubería está específicamente diseñado para identificar la modulación de la unión por variantes genéticas TF. Esta estrategia combina los enfoques computacionales y técnicas de biología molecular destinadas a predecirefectos biológicos de las variantes candidatos in silico, y verificar estas predicciones empíricamente (Figura 1).

Figura 1
Figura 1:.. Enfoque estratégico para el análisis de los pasos no codificantes de variantes genéticas que no están incluidos en el protocolo detallado asociado a este manuscrito están sombreados en gris Haga clic aquí para ver una versión más grande de esta figura.

En muchos casos, es importante comenzar mediante la ampliación de la lista de variantes para incluir a todos los de alta desequilibrio de unión (LD) con cada variante estadísticamente asociado. LD es una medida de asociación no aleatoria de los alelos en dos posiciones cromosómicas diferentes, que se puede medir por el r 2 Estadística 7. r 2 es una medida de la linKage desequilibrio entre dos variantes, con una unión perfecta r 2 = 1 denota entre dos variantes. Alelos en alto LD se encuentran a co-segregar en el cromosoma a través de poblaciones ancestrales. matrices de genotipos actuales no incluyen todas las variantes conocidas en el genoma humano. En su lugar, se aprovechan de la LD dentro del genoma humano e incluyen un subconjunto de las variantes conocidas que actúan como representantes de otras variantes dentro de una región particular del LD 8. Por lo tanto, una variante sin ninguna consecuencia biológica puede estar asociado con una enfermedad en particular, ya que es en LD con la variante de la causal variante con un efecto biológico significativo. Del procedimiento, se recomienda para convertir la última versión de los 1.000 genomas Proyecto 9 archivos variante llamada (VCF) en archivos binarios compatibles con PLINK 10,11, una herramienta de código abierto para el análisis de asociación de genoma completo. Posteriormente, todas las demás variantes genéticas con LD r 2> 0,8 con cada entrada va genéticaRiant puede ser identificado como candidatos. Es importante la utilización de la población de referencia apropiada para este paso- por ejemplo, si una variante fue identificada en sujetos de ascendencia europea, los datos de los sujetos de ascendencia debe emplearse la misma para la expansión LD.

expansión LD a menudo resulta en variantes de candidatos docenas, y es probable que sólo una pequeña fracción de estos contribuyen a mecanismo de la enfermedad. A menudo, no es factible para examinar experimentalmente cada una de estas variantes de forma individual. Es por lo tanto útil para aprovechar los miles de conjuntos de datos de genómica funcional públicamente disponibles como un filtro para priorizar las variantes. Por ejemplo, el consorcio ENCODE 12 ha realizado miles de experimentos chip-ss que describen la unión de TFS y co-factores, y las marcas de las histonas en una amplia gama de contextos, junto con los datos de la cromatina accesibilidad de las tecnologías tales como DNasa-ss 13, ATAC -seq 14 y ss Faire-15. DatabASES y servidores web, tales como la UCSC Genome Browser 16, Hoja de Ruta Epigenómica 17, 18 Epigenoma Blueprint, Cistrome 19 y 20 de RECONFIGURACIÓN proporcionan acceso libre a los datos producidos por estas y otras técnicas experimentales a través de una amplia gama de tipos y condiciones de las celdas. Cuando hay demasiadas variantes para examinar experimentalmente, estos datos se pueden utilizar para dar prioridad a los situados dentro de las regiones reguladoras probables en los tipos de células y tejidos pertinentes. Además, en los casos en que es una variante dentro de un pico de chip-ss para una proteína específica, estos datos pueden proporcionar pistas potenciales en cuanto a la TF (s) específico o co-factores cuya unión podría estar afectando.

A continuación, las variantes resultantes prioridad son examinados experimentalmente para validar la unión usando EMSA 21,22 proteína genotipo dependiente predicho. EMSA mide el cambio en la migración de la oligo en un gel de TBE no reductor. oligo marcado con fluorescencia se incuba con ellisado nuclear, y la unión de factores nucleares retardará el movimiento del oligo en el gel. De esta manera, oligo que se ha unido factores más nucleares presentará como una señal fluorescente más fuerte sobre la exploración. En particular, la EMSA no requiere predicciones acerca de las proteínas específicas cuya unión se verán afectados.

Una vez que se identifican las variantes que se encuentran dentro de las regiones reguladoras predichos y son capaces de factores nucleares diferencialmente de unión, se emplean métodos computacionales para predecir el TF (s) específico cuya unión podrían afectar. Nosotros preferimos utilizar CIS-BP 23,24, RegulomeDB 25, Uniprobe 26 y 27 JASPAR. Una vez que se identifican candidato TFS, estas predicciones pueden ser probados específicamente el uso de anticuerpos contra estos TFS (EMSA-supershifts y DAPA-Oeste). Un EMSA-supershift implica la adición de un anticuerpo específico-TF al lisado nuclear y oligo. Un resultado positivo en un EMSA-supershift es represented como un cambio adicional en la banda de EMSA, o una pérdida de la banda (revisado en referencia 28). En la DAPA complementaria, un dúplex de oligo 5 'biotinilado que contiene la variante y la 20 pares de bases que flanquean nucleótidos se incuban con lisado nuclear de tipo de célula relevante (s) para capturar cualquier factores nucleares se unen específicamente a los oligos. El complejo del factor nuclear-duplex oligo es inmovilizado por estreptavidina microperlas en una columna magnética. Los factores nucleares unidas se recogieron directamente a través de la elución 29,48. predicciones de unión pueden ser evaluados por una transferencia de Western usando anticuerpos específicos para la proteína. En los casos en que no hay predicciones obvias, o demasiadas predicciones, las eluciones de variantes desplegables de los experimentos DAPA se pueden enviar a un núcleo de la proteómica para identificar TFS candidatos utilizando la espectrometría de masa, que posteriormente se pueden validar el uso de estos descritos anteriormente métodos.

En el resto de la article, se proporciona el protocolo detallado para el análisis EMSA y DAPA de variantes genéticas.

Protocol

1. Preparación de soluciones y reactivos Ordenar sondas de oligonucleótidos de ADN personalizados para su uso en la EMSA y la DAPA. Para reducir la proteína de unión no específica, diseñar oligos cortos (entre 35-45 pares de bases (pb) de longitud) 30, y colocar la variante de interés directamente en el centro, flanqueado por su secuencia genómica endógena 17 pb. Para oligos EMSA, añadir un 'fluoróforo 5. Para oligos DAPA, añadir una etiqueta 5 'con biotina. O…

Representative Results

En esta sección, los resultados representativos de lo que cabe esperar se proporcionan al realizar una EMSA o DAPA, y la variabilidad en cuanto a se caracteriza la calidad de lisado. Por ejemplo, se ha sugerido que la congelación y descongelación muestras de proteínas varias veces puede dar lugar a la desnaturalización. Con el fin de explorar la reproducibilidad del análisis EMSA en el contexto de estos ciclos de "congelación-descongelación", dos 35 oligos pb que difier…

Discussion

A pesar de los avances en las tecnologías de secuenciación y genotipado han mejorado enormemente nuestra capacidad para identificar variantes genéticas asociadas con la enfermedad, nuestra capacidad para comprender los mecanismos funcionales afectadas por estas variantes se está quedando. Una fuente importante del problema es que muchas variantes asociados a la enfermedad se encuentran en n en la codificación de las regiones del genoma, lo que probablemente afectará más difícil de predecir mecanismos que c…

Disclosures

The authors have nothing to disclose.

Acknowledgements

We thank Erin Zoller, Jessica Bene, and Lindsey Hays for input and direction in protocol development. MTW was supported in part by NIH R21 HG008186 and a Trustee Award grant from the Cincinnati Children’s Hospital Research Foundation. ZHP was supported in part by T32 GM063483-13.

Materials

Custom DNA Oligonucleotides Integrated DNA Technologies http://www.idtdna.com/site/order/oligoentry
Potassium Chloride Fisher Scientific BP366-500 KCl, for CE buffer
HEPES (1M) Fisher Scientific 15630-080 For CE and NE buffer
EDTA (0.5M), pH 8.0 Life Technologies R1021 For CE, NE, and annealing buffer
Sodium Chloride Fisher Scientific BP358-1 NaCl, for NE buffer
Tris-HCl (1M), pH 8.0 Invitrogen BP1756-100 For annealing buffer
Phosphate Buffered Saline (1X) Fisher Scientific MT21040CM PBS, for cell wash
DL-Dithiothreitol solution (1M) Sigma 646563 Reducing agent
PMSF Thermo Scientific 36978 Protease Inhibitor
Phosphatase Inhibitor Cocktail  Thermo Scientific 78420 Prevents dephosphorylation of TFs
Nonidet P-40 Substitute IBI Scientific IB01140 NP-40, for nuclear extraction
BCA Protein Assay Kit Thermo Scientific 23225 For measuring protein concentration
Odyssey EMSA Buffer Kit Licor 829-07910 Contains all necessary EMSA buffers
TBE Gels, 6%, 12 Wells Invitrogen EC6265BOX For EMSA
TBE Buffer (10X) Thermo Scientific B52 For EMSA
FactorFinder Starting Kit Miltenyi Biotec 130-092-318 Contains all necessary DAPA buffers
Licor Odyssey CLx Licor Recommended scanner for DAPA/EMSA
Antibiotic-Antimycotic Gibco 15240-062 Contains 10,000 units/mL of penicillin, 10,000 µg/mL of streptomycin, and 25 µg/mL of Fungizone® Antimycotic
Fetal Bovine Serum Gibco 26140-079 FBS, for culture media
RPMI 1640 Medium Gibco 22400-071 Contains L-glutamine and 25mM HEPES

References

  1. Hindorff, L. A., et al. Potential etiologic and functional implications of genome-wide association loci for human diseases and traits. Proc Natl Acad Sci U S A. 106 (23), 9362-9367 (2009).
  2. Maurano, M. T., et al. Systematic localization of common disease-associated variation in regulatory DNA. Science. 337 (6099), 1190-1195 (2012).
  3. Ward, L. D., Kellis, M. Interpreting noncoding genetic variation in complex traits and human disease. Nat Biotechnol. 30 (11), 1095-1106 (2012).
  4. Paul, D. S., Soranzo, N., Beck, S. Functional interpretation of non-coding sequence variation: concepts and challenges. Bioessays. 36 (2), 191-199 (2014).
  5. Zhang, F., Lupski, J. R. Non-coding genetic variants in human disease. Hum Mol Genet. , (2015).
  6. Lee, T. I., Young, R. A. Transcriptional regulation and its misregulation in disease. Cell. 152 (6), 1237-1251 (2013).
  7. Slatkin, M. Linkage disequilibrium–understanding the evolutionary past and mapping the medical future. Nat Rev Genet. 9 (6), 477-485 (2008).
  8. Bush, W. S., Moore, J. H. Chapter 11: Genome-wide association studies. PLoS Comput Biol. 8 (12), e1002822 (2012).
  9. 1000 Genomes Project Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  10. Chang, C. C., et al. Second-generation PLINK: rising to the challenge of larger and richer datasets. Gigascience. 4, 7 (2015).
  11. Purcell, S., et al. PLINK: a tool set for whole-genome association and population-based linkage analyses. Am J Hum Genet. 81 (3), 559-575 (2007).
  12. ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  13. Crawford, G. E., et al. Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing (MPSS). Genome Res. 16 (1), 123-131 (2006).
  14. Buenrostro, J. D., Giresi, P. G., Zaba, L. C., Chang, H. Y., Greenleaf, W. J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods. 10 (12), 1213-1218 (2013).
  15. Giresi, P. G., Kim, J., McDaniell, R. M., Iyer, V. R., Lieb, J. D. FAIRE Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin. Genome Res. 17 (6), 877-885 (2007).
  16. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12 (6), 996-1006 (2002).
  17. Roadmap Epigenomics Consortium. Integrative analysis of 111 reference human epigenomes. Nature. 518 (7539), 317-330 (2015).
  18. Martens, J. H., Stunnenberg, H. G. BLUEPRINT: mapping human blood cell epigenomes. Haematologica. 98 (10), 1487-1489 (2013).
  19. Liu, T., et al. Cistrome: an integrative platform for transcriptional regulation studies. Genome Biol. 12 (8), R83 (2011).
  20. Griffon, A., et al. Integrative analysis of public ChIP-seq experiments reveals a complex multi-cell regulatory landscape. Nucleic Acids Res. 43 (4), e27 (2015).
  21. Staudt, L. M., et al. A lymphoid-specific protein binding to the octamer motif of immunoglobulin genes. Nature. 323 (6089), 640-643 (1986).
  22. Singh, H., Sen, R., Baltimore, D., Sharp, P. A. A nuclear factor that binds to a conserved sequence motif in transcriptional control elements of immunoglobulin genes. Nature. 319 (6049), 154-158 (1986).
  23. Weirauch, M. T., et al. Determination and inference of eukaryotic transcription factor sequence specificity. Cell. 158 (6), 1431-1443 (2014).
  24. Ward, L. D., Kellis, M. HaploReg: a resource for exploring chromatin states, conservation, and regulatory motif alterations within sets of genetically linked variants. Nucleic Acids Res. 40 (Database issue), D930-D934 (2012).
  25. Boyle, A. P., et al. Annotation of functional variation in personal genomes using RegulomeDB. Genome Res. 22 (9), 1790-1797 (2012).
  26. Hume, M. A., Barrera, L. A., Gisselbrecht, S. S., Bulyk, M. L. UniPROBE, update 2015: new tools and content for the online database of protein-binding microarray data on protein-DNA interactions. Nucleic Acids Res. 43 (Database issue), D117-D122 (2015).
  27. Mathelier, A., et al. JASPAR 2014: an extensively expanded and updated open-access database of transcription factor binding profiles. Nucleic Acids Res. 42 (Database issue), 142-147 (2014).
  28. Smith, M. F., Delbary-Gossart, S. Electrophoretic Mobility Shift Assay (EMSA). Methods Mol Med. 50, 249-257 (2001).
  29. Franza, B. R., Josephs, S. F., Gilman, M. Z., Ryan, W., Clarkson, B. Characterization of cellular proteins recognizing the HIV enhancer using a microscale DNA-affinity precipitation assay. Nature. 330 (6146), 391-395 (1987).
  30. . BCA Protein Assay Kit: User Guide Available from: https://tools.thermofisher.com/content/sfs/manuals/MAN0011430_Pierce_BCA_Protein_Asy_UG.pdf (2014)
  31. Wijeratne, A. B., et al. Phosphopeptide separation using radially aligned titania nanotubes on titanium wire. ACS Appl Mater Interfaces. 7 (21), 11155-11164 (2015).
  32. Silva, J. M., McMahon, M. The Fastest Western in Town: A Contemporary Twist on the Classic Western Blot Analysis. J. Vis. Exp. (84), (2014).
  33. Lu, X., et al. Lupus Risk Variant Increases pSTAT1 Binding and Decreases ETS1 Expression. Am J Hum Genet. 96 (5), 731-739 (2015).
  34. Ramana, C. V., Chatterjee-Kishore, M., Nguyen, H., Stark, G. R. Complex roles of Stat1 in regulating gene expression. Oncogene. 19 (21), 2619-2627 (2000).
  35. Fillebeen, C., Wilkinson, N., Pantopoulos, K. Electrophoretic Mobility Shift Assay (EMSA) for the Study of RNA-Protein Interactions: The IRE/IRP Example. J. Vis. Exp. (94), e52230 (2014).
  36. Heng, T. S., Painter, M. W. Immunological Genome Project, C. The Immunological Genome Project: networks of gene expression in immune cells. Nat Immunol. 9 (10), 1091-1094 (2008).
  37. Wu, C., et al. BioGPS: an extensible and customizable portal for querying and organizing gene annotation resources. Genome Biol. 10 (11), R130 (2009).
  38. Wu, C., Macleod, I., Su, A. I. BioGPS and MyGene.info: organizing online, gene-centric information. Nucleic Acids Res. 41 (Database issue), D561-D565 (2013).
  39. Wang, J., et al. Sequence features and chromatin structure around the genomic regions bound by 119 human transcription factors. Genome Res. 22 (9), 1798-1812 (2012).
  40. Holden, N. S., Tacon, C. E. Principles and problems of the electrophoretic mobility shift assay. J Pharmacol Toxicol Methods. 63 (1), 7-14 (2011).
  41. Xu, J., Liu, H., Park, J. S., Lan, Y., Jiang, R. Osr1 acts downstream of and interacts synergistically with Six2 to maintain nephron progenitor cells during kidney organogenesis. Development. 141 (7), 1442-1452 (2014).
  42. Yang, T. -. P., et al. Genevar: a database and Java application for the analysis and visualization of SNP-gene associations in eQTL studies. Bioinformatics. 26 (19), 2474-2476 (2010).
  43. Fort, A., et al. A liver enhancer in the fibrinogen gene cluster. Blood. 117 (1), 276-282 (2011).
  44. Solberg, N., Krauss, S. Luciferase assay to study the activity of a cloned promoter DNA fragment. Methods Mol Biol. 977, 65-78 (2013).
  45. Rahman, M., et al. A repressor element in the 5′-untranslated region of human Pax5 exon 1A. Gene. 263 (1-2), 59-66 (2001).
  46. Mali, P., et al. RNA-Guided Human Genome Engineering via Cas9. Science. 339 (6121), 823-826 (2013).

Play Video

Cite This Article
Miller, D. E., Patel, Z. H., Lu, X., Lynch, A. T., Weirauch, M. T., Kottyan, L. C. Screening for Functional Non-coding Genetic Variants Using Electrophoretic Mobility Shift Assay (EMSA) and DNA-affinity Precipitation Assay (DAPA). J. Vis. Exp. (114), e54093, doi:10.3791/54093 (2016).

View Video