Summary

機能電気泳動移動度シフトアッセイ(EMSA)を用いた非コーディング遺伝的変異体およびDNA親和性沈殿アッセイ(DAPA)のスクリーニング

Published: August 21, 2016
doi:

Summary

We present a strategic plan and protocol for identifying non-coding genetic variants affecting transcription factor (TF) DNA binding. A detailed experimental protocol is provided for electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genotype-dependent TF DNA binding.

Abstract

Population and family-based genetic studies typically result in the identification of genetic variants that are statistically associated with a clinical disease or phenotype. For many diseases and traits, most variants are non-coding, and are thus likely to act by impacting subtle, comparatively hard to predict mechanisms controlling gene expression. Here, we describe a general strategic approach to prioritize non-coding variants, and screen them for their function. This approach involves computational prioritization using functional genomic databases followed by experimental analysis of differential binding of transcription factors (TFs) to risk and non-risk alleles. For both electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genetic variants, a synthetic DNA oligonucleotide (oligo) is used to identify factors in the nuclear lysate of disease or phenotype-relevant cells. For EMSA, the oligonucleotides with or without bound nuclear factors (often TFs) are analyzed by non-denaturing electrophoresis on a tris-borate-EDTA (TBE) polyacrylamide gel. For DAPA, the oligonucleotides are bound to a magnetic column and the nuclear factors that specifically bind the DNA sequence are eluted and analyzed through mass spectrometry or with a reducing sodium dodecyl sulfate polyacrylamide gel electrophoresis (SDS-PAGE) followed by Western blot analysis. This general approach can be widely used to study the function of non-coding genetic variants associated with any disease, trait, or phenotype.

Introduction

ゲノムワイド関連研究(GWAS)を含むシーケンシングおよびジェノタイピングベースの研究、候補遺伝子座の研究、およびディープシーケンシング研究は、統計学的疾患、形質または表現型と関連している多くの遺伝的変異を同定しました。初期の予測に反して、これらの変異体(85-93%)の大部分は非コード領域に位置しており、タンパク質1,2のアミノ酸配列を変更しません。これらの非コード変異体の機能の解釈と関連する疾患、形質または表現型にそれらを接続する生物学的メカニズムを決定することは3-6に挑戦証明されています。遺伝子発現 – 私たちは、重要な中間表現型にバリアントをリンクする分子メカニズムを識別するための一般的な戦略を開発しました。このパイプラインは、特に遺伝的変異による結合TFの調節を同定するために設計されています。この戦略を予測することを目的とした計算手法および分子生物学技術を組み合わせインシリコ候補変異体の生物学的効果、および( 図1)、経験的に、これらの予測を検証します。

図1
1: 非コード遺伝子変異体の解析のための戦略的アプローチ 、この原稿に関連付けられた詳細なプロトコールに含まれていない手順は灰色で網掛けされている。 この図の拡大版をご覧になるにはこちらをクリックしてください。

多くの場合、それぞれの統計的に関連する変異体と高い連鎖、不平衡(LD)にあるすべてのものを含むように変異体のリストを拡張することによって開始することが重要です。 LDは、R 2統計7によって測定することができる2つの異なる染色体位置における対立遺伝子の非ランダムな関連の尺度です。 r 2は林の尺度でありますR 2の変種間の完全な結合を示す= 1 2を持つ2つの変異体、間の影の不均衡。高LDにおける対立遺伝子は祖先集団全体の染色体上に同時分離することが判明しています。現在のジェノタイピングアレイは、ヒトゲノム中のすべての既知の亜種が含まれていません。その代わりに、彼らは人間のゲノム内のLDを利用し、LD 8の特定の領域内の他の変異体のためのプロキシとして機能する知られている変異体のサブセットを含みます。それは意味のある生物学的効果との因果バリアントバリアントとLDにあるため、このように、任意の生物学的影響のない変異体は、特定の疾患に関連することができます。手続きは、PLINK 10,11、全ゲノム関連解析のためのオープンソースのツールと互換性のあるバイナリファイルに千ゲノムプロジェクト9バリアントコールファイル(VCF)の最新リリースを変換することをお勧めします。続いて、各入力遺伝VAとLDのR 2> 0.8と他のすべての遺伝的変異ほほ笑むは候補として同定することができます。変異体がヨーロッパ系の科目で同定された場合、同様の祖先の被験者からのデータは、LDの拡張のために使用されるべきで、STEP- 例えばこのための適切な参照集団を使用することが重要です。

LDの拡張はしばしば、候補変異体の数十をもたらし、これらのうちのごく一部が、疾患機構に寄与する可能性があります。多くの場合、実験的に個別にこれらの変異体のそれぞれを調べることは実行不可能です。バリアントの優先順位を決定するためのフィルタとして一般に公開機能ゲノムデータセットの数千人を活用することが有効です。例えば、ENCODEコンソーシアム12は 、DNアーゼ-seqの13、ATACなどの技術からクロマチンアクセシビリティデータと共に、文脈の広い範囲でのTFおよび補因子の結合を記述したChIP-seqの実験で何千もの、およびヒストンマークを行いました-seq 14、およびFAIRE-seqの15。 DATABこのようなUCSCゲノムブラウザ16、ロードマップエピゲノミクス17、青写真エピゲノム18、Cistrome 19、及び再マップ20としてのASおよびWebサーバは、細胞型および条件の広い範囲にわたって、これらおよび他の実験技術によって生成されたデータへの無料アクセスを提供します。実験的に調べるためにあまりにも多くの変異体が存在する場合、これらのデータは、関連する細胞および組織型における可能性の調節領域内に位置するものを優先順位付けするために使用することができます。さらに、変異体​​は、特定のタンパク質のためのChIP-seqのピークの範囲内にある場合には、これらのデータは、特定のTF(複数可)またはその影響を与える可能性があります結合補因子に関して潜在的なリードを提供することができます。

次に、優先順位を付け、得られた変異体は、EMSA 21,22を使用して予測結合遺伝子型依存性タンパク質を検証するために実験的にスクリーニングされます。 EMSAは、非還元TBEゲル上でオリゴの移行の変化を測定します。蛍光標識オリゴとともにインキュベートします核溶解液、および核因子の結合は、ゲル上のオリゴの動きを遅らせるます。このように、より多くの核因子を結合した​​オリゴは、スキャン時に強い蛍光シグナルとして提示します。特に、EMSAは、バインディング影響される特定のタンパク質についての予測を必要としません。

変異体は、予測調節領域内に位置し、示差的結合核因子することができるされていることが確認されると、計算方法は、その結合それらが影響する可能性のある特定のTF(複数可)を予測するために使用されます。私たちは、CIS-BP 23,24、RegulomeDB 25、UniProbe 26、およびJASPAR 27を使用することを好みます。候補者のTFが識別されると、これらの予測は、具体的には、これらのTF(EMSA-スーパーシフトとDAPA-西部劇)に対する抗体を用いて試験することができます。 EMSA-スーパーシフトは、核溶解液とオリゴにTF特異的抗体の添加を含みます。 EMSA-スーパーシフトで陽性の結果がのreprですEMSAバンドのさらなるシフト、またはバンドの損失としてesented(参照28に概説されています)。相補DAPAにおいて、変異体および20塩基対の隣接ヌクレオチドを​​含む5 'ビオチン化オリゴ二本鎖を特異的オリゴを結合、核因子を捕捉するために、関連する細胞型(複数可)からの核溶解物と共にインキュベートします。オリゴ二重核因子複合体を磁気カラムにビーズをストレプトアビジンにより固定されています。バインドされた核要因が溶出29,48を介して直接収集されます。結合予測は、その後、タンパク質に特異的な抗体を用いたウェスタンブロットによって評価することができます。明らかな予測、またはあまりにも多くの予測が存在しない場合には、DAPA実験の変異プルダウンからの溶出は、質量分析を使用して候補のTFを同定するためにプロテオミクスコアに送信することができ、続いて前述のこれらを使用して検証することができますメソッド。

articlの残りの部分でE、EMSA及び遺伝的変異のDAPA分析のための詳細なプロトコルが提供されます。

Protocol

ソリューションおよび試薬の調製 EMSAとDAPAで使用するためのカスタムDNAオリゴヌクレオチドプローブを注文してください。 、非特異的タンパク質結合を減少させる(長さ35から45塩基対(bp)の間の)短いオリゴ30を設計し、その17 bpの内在性ゲノム配列によって挟ま中心部に関心の変形を配置します。 EMSAオリゴについては、5 '蛍光団を追加します。 DAPAオリゴについ…

Representative Results

このセクションでは、EMSAまたはDAPAを実行するときに何を期待するの代表的な結果が提供され、そして溶解物の品質に関して変動性が特徴です。例えば、複数回の凍結融解のタンパク質試料は変性をもたらし得ることが示唆されています。これらの「凍結融解」サイクルの文脈においてEMSA分析の再現性を調査するために、1遺伝子変異体で異なる2 35 bpのオリゴが指示?…

Discussion

シーケンシングおよびジェノタイピング技術の進歩は著しく、疾患に関連する遺伝子変異体を同定するために我々の能力を強化しているが、これらの変異体によって影響を受ける機能のメカニズムを理解するために我々の能力が遅れています。問題の主な原因は、多くの疾患関連変異体は、上のコード可能性が高い遺伝子発現を制御困難ツー予測メカニズムに影響を与えるゲノムの領域?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

We thank Erin Zoller, Jessica Bene, and Lindsey Hays for input and direction in protocol development. MTW was supported in part by NIH R21 HG008186 and a Trustee Award grant from the Cincinnati Children’s Hospital Research Foundation. ZHP was supported in part by T32 GM063483-13.

Materials

Custom DNA Oligonucleotides Integrated DNA Technologies http://www.idtdna.com/site/order/oligoentry
Potassium Chloride Fisher Scientific BP366-500 KCl, for CE buffer
HEPES (1M) Fisher Scientific 15630-080 For CE and NE buffer
EDTA (0.5M), pH 8.0 Life Technologies R1021 For CE, NE, and annealing buffer
Sodium Chloride Fisher Scientific BP358-1 NaCl, for NE buffer
Tris-HCl (1M), pH 8.0 Invitrogen BP1756-100 For annealing buffer
Phosphate Buffered Saline (1X) Fisher Scientific MT21040CM PBS, for cell wash
DL-Dithiothreitol solution (1M) Sigma 646563 Reducing agent
PMSF Thermo Scientific 36978 Protease Inhibitor
Phosphatase Inhibitor Cocktail  Thermo Scientific 78420 Prevents dephosphorylation of TFs
Nonidet P-40 Substitute IBI Scientific IB01140 NP-40, for nuclear extraction
BCA Protein Assay Kit Thermo Scientific 23225 For measuring protein concentration
Odyssey EMSA Buffer Kit Licor 829-07910 Contains all necessary EMSA buffers
TBE Gels, 6%, 12 Wells Invitrogen EC6265BOX For EMSA
TBE Buffer (10X) Thermo Scientific B52 For EMSA
FactorFinder Starting Kit Miltenyi Biotec 130-092-318 Contains all necessary DAPA buffers
Licor Odyssey CLx Licor Recommended scanner for DAPA/EMSA
Antibiotic-Antimycotic Gibco 15240-062 Contains 10,000 units/mL of penicillin, 10,000 µg/mL of streptomycin, and 25 µg/mL of Fungizone® Antimycotic
Fetal Bovine Serum Gibco 26140-079 FBS, for culture media
RPMI 1640 Medium Gibco 22400-071 Contains L-glutamine and 25mM HEPES

References

  1. Hindorff, L. A., et al. Potential etiologic and functional implications of genome-wide association loci for human diseases and traits. Proc Natl Acad Sci U S A. 106 (23), 9362-9367 (2009).
  2. Maurano, M. T., et al. Systematic localization of common disease-associated variation in regulatory DNA. Science. 337 (6099), 1190-1195 (2012).
  3. Ward, L. D., Kellis, M. Interpreting noncoding genetic variation in complex traits and human disease. Nat Biotechnol. 30 (11), 1095-1106 (2012).
  4. Paul, D. S., Soranzo, N., Beck, S. Functional interpretation of non-coding sequence variation: concepts and challenges. Bioessays. 36 (2), 191-199 (2014).
  5. Zhang, F., Lupski, J. R. Non-coding genetic variants in human disease. Hum Mol Genet. , (2015).
  6. Lee, T. I., Young, R. A. Transcriptional regulation and its misregulation in disease. Cell. 152 (6), 1237-1251 (2013).
  7. Slatkin, M. Linkage disequilibrium–understanding the evolutionary past and mapping the medical future. Nat Rev Genet. 9 (6), 477-485 (2008).
  8. Bush, W. S., Moore, J. H. Chapter 11: Genome-wide association studies. PLoS Comput Biol. 8 (12), e1002822 (2012).
  9. 1000 Genomes Project Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  10. Chang, C. C., et al. Second-generation PLINK: rising to the challenge of larger and richer datasets. Gigascience. 4, 7 (2015).
  11. Purcell, S., et al. PLINK: a tool set for whole-genome association and population-based linkage analyses. Am J Hum Genet. 81 (3), 559-575 (2007).
  12. ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  13. Crawford, G. E., et al. Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing (MPSS). Genome Res. 16 (1), 123-131 (2006).
  14. Buenrostro, J. D., Giresi, P. G., Zaba, L. C., Chang, H. Y., Greenleaf, W. J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods. 10 (12), 1213-1218 (2013).
  15. Giresi, P. G., Kim, J., McDaniell, R. M., Iyer, V. R., Lieb, J. D. FAIRE Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin. Genome Res. 17 (6), 877-885 (2007).
  16. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12 (6), 996-1006 (2002).
  17. Roadmap Epigenomics Consortium. Integrative analysis of 111 reference human epigenomes. Nature. 518 (7539), 317-330 (2015).
  18. Martens, J. H., Stunnenberg, H. G. BLUEPRINT: mapping human blood cell epigenomes. Haematologica. 98 (10), 1487-1489 (2013).
  19. Liu, T., et al. Cistrome: an integrative platform for transcriptional regulation studies. Genome Biol. 12 (8), R83 (2011).
  20. Griffon, A., et al. Integrative analysis of public ChIP-seq experiments reveals a complex multi-cell regulatory landscape. Nucleic Acids Res. 43 (4), e27 (2015).
  21. Staudt, L. M., et al. A lymphoid-specific protein binding to the octamer motif of immunoglobulin genes. Nature. 323 (6089), 640-643 (1986).
  22. Singh, H., Sen, R., Baltimore, D., Sharp, P. A. A nuclear factor that binds to a conserved sequence motif in transcriptional control elements of immunoglobulin genes. Nature. 319 (6049), 154-158 (1986).
  23. Weirauch, M. T., et al. Determination and inference of eukaryotic transcription factor sequence specificity. Cell. 158 (6), 1431-1443 (2014).
  24. Ward, L. D., Kellis, M. HaploReg: a resource for exploring chromatin states, conservation, and regulatory motif alterations within sets of genetically linked variants. Nucleic Acids Res. 40 (Database issue), D930-D934 (2012).
  25. Boyle, A. P., et al. Annotation of functional variation in personal genomes using RegulomeDB. Genome Res. 22 (9), 1790-1797 (2012).
  26. Hume, M. A., Barrera, L. A., Gisselbrecht, S. S., Bulyk, M. L. UniPROBE, update 2015: new tools and content for the online database of protein-binding microarray data on protein-DNA interactions. Nucleic Acids Res. 43 (Database issue), D117-D122 (2015).
  27. Mathelier, A., et al. JASPAR 2014: an extensively expanded and updated open-access database of transcription factor binding profiles. Nucleic Acids Res. 42 (Database issue), 142-147 (2014).
  28. Smith, M. F., Delbary-Gossart, S. Electrophoretic Mobility Shift Assay (EMSA). Methods Mol Med. 50, 249-257 (2001).
  29. Franza, B. R., Josephs, S. F., Gilman, M. Z., Ryan, W., Clarkson, B. Characterization of cellular proteins recognizing the HIV enhancer using a microscale DNA-affinity precipitation assay. Nature. 330 (6146), 391-395 (1987).
  30. . BCA Protein Assay Kit: User Guide Available from: https://tools.thermofisher.com/content/sfs/manuals/MAN0011430_Pierce_BCA_Protein_Asy_UG.pdf (2014)
  31. Wijeratne, A. B., et al. Phosphopeptide separation using radially aligned titania nanotubes on titanium wire. ACS Appl Mater Interfaces. 7 (21), 11155-11164 (2015).
  32. Silva, J. M., McMahon, M. The Fastest Western in Town: A Contemporary Twist on the Classic Western Blot Analysis. J. Vis. Exp. (84), (2014).
  33. Lu, X., et al. Lupus Risk Variant Increases pSTAT1 Binding and Decreases ETS1 Expression. Am J Hum Genet. 96 (5), 731-739 (2015).
  34. Ramana, C. V., Chatterjee-Kishore, M., Nguyen, H., Stark, G. R. Complex roles of Stat1 in regulating gene expression. Oncogene. 19 (21), 2619-2627 (2000).
  35. Fillebeen, C., Wilkinson, N., Pantopoulos, K. Electrophoretic Mobility Shift Assay (EMSA) for the Study of RNA-Protein Interactions: The IRE/IRP Example. J. Vis. Exp. (94), e52230 (2014).
  36. Heng, T. S., Painter, M. W. Immunological Genome Project, C. The Immunological Genome Project: networks of gene expression in immune cells. Nat Immunol. 9 (10), 1091-1094 (2008).
  37. Wu, C., et al. BioGPS: an extensible and customizable portal for querying and organizing gene annotation resources. Genome Biol. 10 (11), R130 (2009).
  38. Wu, C., Macleod, I., Su, A. I. BioGPS and MyGene.info: organizing online, gene-centric information. Nucleic Acids Res. 41 (Database issue), D561-D565 (2013).
  39. Wang, J., et al. Sequence features and chromatin structure around the genomic regions bound by 119 human transcription factors. Genome Res. 22 (9), 1798-1812 (2012).
  40. Holden, N. S., Tacon, C. E. Principles and problems of the electrophoretic mobility shift assay. J Pharmacol Toxicol Methods. 63 (1), 7-14 (2011).
  41. Xu, J., Liu, H., Park, J. S., Lan, Y., Jiang, R. Osr1 acts downstream of and interacts synergistically with Six2 to maintain nephron progenitor cells during kidney organogenesis. Development. 141 (7), 1442-1452 (2014).
  42. Yang, T. -. P., et al. Genevar: a database and Java application for the analysis and visualization of SNP-gene associations in eQTL studies. Bioinformatics. 26 (19), 2474-2476 (2010).
  43. Fort, A., et al. A liver enhancer in the fibrinogen gene cluster. Blood. 117 (1), 276-282 (2011).
  44. Solberg, N., Krauss, S. Luciferase assay to study the activity of a cloned promoter DNA fragment. Methods Mol Biol. 977, 65-78 (2013).
  45. Rahman, M., et al. A repressor element in the 5′-untranslated region of human Pax5 exon 1A. Gene. 263 (1-2), 59-66 (2001).
  46. Mali, P., et al. RNA-Guided Human Genome Engineering via Cas9. Science. 339 (6121), 823-826 (2013).

Play Video

Cite This Article
Miller, D. E., Patel, Z. H., Lu, X., Lynch, A. T., Weirauch, M. T., Kottyan, L. C. Screening for Functional Non-coding Genetic Variants Using Electrophoretic Mobility Shift Assay (EMSA) and DNA-affinity Precipitation Assay (DAPA). J. Vis. Exp. (114), e54093, doi:10.3791/54093 (2016).

View Video