Kombinasjonen av kromatin immunoprecipitation og ultra-high-throughput sekvensering (ChIP-seq) kan identifisere og kartlegge protein-DNA vekselvirkninger i et gitt vev eller cellelinje. Skissert er hvordan å generere en høy kvalitet ChIP mal for etterfølgende sekvensering, ved hjelp av erfaring med transkripsjonsfaktor TCF7L2 som et eksempel.
ChIP-sekvensering (chip-seq) metoder direkte gir hel-genom dekning, hvor kombinere kromatin immunoutfelling (chip) og massivt parallelle sekvensering kan benyttes til å identifisere den repertoaret av pattedyr-DNA-sekvenser som er bundet av transkripsjonsfaktorer in vivo. "Neste generasjon" genom sekvensering teknologi gir 1-2 størrelsesordener økning i mengden av sekvensen som kan være kostnadseffektivt generert over eldre teknologier og dermed gir for ChIP-seq metoder for å direkte gi hel-genom dekning for effektiv profilering av pattedyr protein-DNA vekselvirkninger.
For vellykkede ChIP-seq nærmer seg, må man generere høy kvalitet ChIP DNA mal for å oppnå de beste sekvensering utfall. Beskrivelsen er basert rundt erfaring med proteinproduktet av genet mest sterkt implisert i patogenesen av type 2 diabetes, nemlig transkripsjonsfaktor transkripsjonsfaktor 7-lignende 2 (TCF7L2). Denne faktor har også blitt innblandet i ulike kreftformer.
Skissert er hvordan å generere høy kvalitet ChIP DNA mal avledet fra kolorektal karsinom cellelinje, HCT116, for å bygge en høy oppløsning kartet gjennom sekvensering finne de genene som er bundet av TCF7L2, noe som gir ytterligere innsikt i sin nøkkelrolle i patogenesen av komplekse egenskaper.
I mange år har det vært et udekket behov for å identifisere sett av gener bundet og regulert av et gitt protein genom bred, særlig de i transkripsjonsfaktor klassen.
Odom et al. En brukt kromatin immunoprecipitation (chip) kombinert med promoter mikromatriser å systematisk identifisere genene okkupert av pre-spesifiserte transkripsjonelle regulatorer i human lever og bukspyttkjertelen holmer. Deretter utviklet Johnson et al. 2 en storstilt kromatin immunoprecipitation analysen basert på direkte ultra high-throughput DNA-sekvensering (ChIP-seq) for å grundig kartlegge protein-DNA interaksjoner på tvers av hele pattedyr genomer. Som en test, kartlagt de in vivo binding av nervecellen-restriktiv lyddemper faktor (NRSF) til 1946 steder i det menneskelige genom. Dataene vises skarp oppløsning av forpliktende stilling (+ 50 basepar), som tilrettelagt både isolation av motiver og identifisering av NRSF-bindende motiver. Disse ChIP-seq data også hadde høy sensitivitet og spesifisitet og statistisk sikkerhet (P <10 -4), egenskaper som er viktige for dedusere nye kandidat interaksjoner.
Robertson et al. 3 også brukt ChIP-seq for å kartlegge STAT1 mål i interferon-γ (IFN-γ)-stimulert og unstimulated humane HeLa S3 celler in vivo. Av Chip-seq, bruker 15,1 og 12,9 millioner unikt kartlagt sekvens leser, og en estimert falske funnrate på mindre enn 0.001, identifiserte de 41 582 og 11 004 antatte STAT1-bindende regioner i stimulert og unstimulated celler, henholdsvis. Av de 34 loci kjent for å inneholde STAT1 interferonresponsive bindingssteder 4-8, funnet brikkespoler seq 24 (71%). ChIP-seq målene ble beriket i sekvenser som ligner på kjente STAT1 bindende motiver. Sammenligninger med to eksisterende ChIP-PCR datasett foreslåttDen brikken-seq følsomhet var mellom 70% og 92% og spesifisiteten var minst 95%. I tillegg var det klart at ChIP-seq tilbyr både lav analytisk kompleksitet og følsomhet som øker med sekvensering dybde.
Som sådan, "neste-generasjons" genom sekvensering teknologi gir 1-2 størrelsesordener økning i mengden av sekvensen som kan være kostnadseffektivt generert over eldre teknologier ni. ChIP-seq metoder derfor direkte gi hel-genom dekning for effektiv profilering av pattedyr protein-DNA vekselvirkninger tre.
I 2006 ble en sterk sammenslutning av varianter i transkripsjonsfaktor 7-aktig 2 (TCF7L2) genet med type 2 diabetes oppdaget 10. Andre forskere har allerede uavhengig kopiert dette funnet i ulike etnisiteter og interessant, fra de første genomet wide forening studier av type 2 diabetes publisert i Nature 11,12 </sopp>, Science 13-15 og ellers 16,17, var den sterkeste foreningen faktisk med TCF7L2, og dette er nå ansett som den mest betydningsfulle genetiske funn i type 2 diabetes hittil 18-20. I tillegg har TCF7L2 blitt knyttet til kreft risiko 21,22, ja, denne forbindelsen ble mer tydelig når 8q24 locus avslørte av genomet wide forening studier av en rekke kreftformer, inkludert kolorektale karsinomer, ble vist å være på grunn av en ekstrem oppstrøms TCF7L2-bindende element kjøring transkripsjon av MYC 23,24. Som sådan, det er stor interesse i å bestemme nedstrøms gener som reguleres av denne tasten transkripsjonsfaktor.
Basert på erfaring med TCF7L2 som et eksempel på metodikken, skisserer denne artikkelen hvordan å generere høy kvalitet ChIP DNA mal. Brikken ble utført i kolorektal karsinom-cellelinje, HCT116, for etterfølgende sekvensering for å bygge en høy resolution kart over genene bundet av TCF7L2 25 i en forsøke å gi ytterligere innsikt i sin nøkkelrolle i patogenesen av komplekse egenskaper.
Det er nå mulig å gjennomføre et stort genom-profil av protein-DNA-interaksjoner forening ved hjelp brikkespoler seq, som har nylig blitt demonstrert med andre transkripsjonsfaktorer 2,3. Nøkkelen til en vellykket sekvensering utfallet er den generasjonen av høy kvalitet kromatin immunoprecipitation DNA mal.
Når DNA-malen har blitt generert og forsikret å være tilstrekkelig anriket, kan man deretter ta det i bibliotek forberedelse for etterfølgende sekvensering. For eksem…
The authors have nothing to disclose.
Arbeidet er støttet av en Institute Development Award fra The Children Hospital of Philadelphia.
Name of the reagent | Company | Catalogue number | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
EZ-ChIP Kit | Millipore | 17-371 | |
GoTaq Hot Start Polymerase | Promega | M5001 | |
Misonix Sonicator | Qsonica | XL-2000 | |
NanoDrop 1000 Spectrophotometer | Thermo-Scientific | ||
Positive control primer sequences (TCF7L2-1) Forward- 5′-TCGCCCTGTCAATAATCTCC-3′ Reverse- 5′-GCTCACCTCCTGTATCTTCG-3′ Negative control primer sequences (CTRL-1) Forward-5′-ATGTGGTGTGGCTGTGATGGGAAC-3′ Reverse- 5′-CGAGCAATCGGTAAATAGGTCTGG-3′ |