Iboende uordnede domener er viktige for onkogen fusjonstranskripsjonsfaktorfunksjon. For å terapeutisk målrette disse proteinene, er det nødvendig med en mer detaljert forståelse av reguleringsmekanismene som brukes av disse domenene. Her bruker vi transkripsjon for å kartlegge viktige strukturelle egenskaper ved det iboende uordnede EWS-domenet i Ewing sarkom.
Mange kreftformer er preget av kromosomale translokasjoner som resulterer i uttrykk for onkogene fusjonstranskripsjonsfaktorer. Vanligvis inneholder disse proteinene et iboende uorden domene (IDD) smeltet sammen med DNA-bindende domene (DBD) av et annet protein og orkestrerer utbredte transkripsjonsendringer for å fremme malignitet. Disse fusjonene er ofte den eneste tilbakevendende genomiske avviket i kreften de forårsaker, noe som gjør dem attraktive terapeutiske mål. Imidlertid krever målretting av onkogen transkripsjonsfaktorer en bedre forståelse av den mekanistiske rollen som lav kompleksitet, IDD-er spiller i deres funksjon. N-terminaldomenet til EWSR1 er en IDD involvert i en rekke onkogene fusjonstranskripsjonsfaktorer, inkludert EWS / FLI, EWS / ATF og EWS / WT1. Her bruker vi RNA-sekvensering for å undersøke de strukturelle egenskapene til EWS-domenet som er viktig for transkripsjonsfunksjonen til EWS / FLI i Ewing sarkom. Første shRNA-medierte uttømming av den endogene fusjonen fra Ewing sarkomceller sammen med ektopisk uttrykk for en rekke EWS-mutantkonstruksjoner utføres. Deretter brukes RNA-sekvensering til å analysere transkripsjonen av celler som uttrykker disse konstruksjonene for å karakterisere de funksjonelle underskuddene forbundet med mutasjoner i EWS-domenet. Ved å integrere de transkripsjonsanalysene med tidligere publisert informasjon om EWS/FLI DNA-bindende motiver, og genomisk lokalisering, samt funksjonelle analyser for transformeringsevne, kunne vi identifisere strukturelle trekk ved EWS/FLI som er viktige for onkogenese og definere et nytt sett med EWS/FLI-målgener som er kritiske for Ewing sarkom. Dette dokumentet demonstrerer bruken av RNA-sekvensering som en metode for å kartlegge strukturfunksjonsforholdet til det iboende uordnede domenet til onkogene transkripsjonsfaktorer.
En undergruppe av kreft, inkludert mange maligniteter i barndommen og ungdomsårene, er preget av kromosomale translokasjoner som genererer nyfusjononcogenes 1,2,3,4,5,6. De resulterende fusjonsproteinene fungerer ofte som onkogene transkripsjonsfaktorer, og orkestrerer utbredte endringer i transkripsjonsregulering for å fremme tumorigenesis7,8. Kreft med disse translokasjonene har vanligvis et ellers stille mutasjonslandskap, med få tilbakevendende genomiske avvik bortsett fra den patognomiskefusjonen 4,9. Som sådan er direkte målretting av fusjonsproteinet en attraktiv terapeutisk strategi i disse sykdommene. Imidlertid består disse onkogene transkripsjonsfaktorene vanligvis av en lav kompleksitet, iboende uorden, transkripsjonelt aktiverende domene smeltet sammen med et DNA-bindende domene (DBD)10,11,12,13,14. Både de iboende uordnede domenene (IDDene) og DBDene til disse proteinene har vist seg vanskelig å målrette mot konvensjonelle farmakologiske tilnærminger. Utvikling av nye terapeutiske tilnærminger krever derfor en mer detaljert molekylær forståelse av mekanismene som brukes av disse fusjonene for å regulere genuttrykket.
Den N-terminale IDD-delen av EWSR1 smeltes vanligvis sammen til en DBD i kreft, inkludert EWS/FLI i Ewing sarkom, EWS/WT1 i diffus liten rundcelletumor og EWS/ATF1 i klarcellet sarkom av myke deler10. Den mekanistiske rollen til EWS IDD i hver av disse fusjonene er ufullstendig forstått. EWS/ETS-familien av fusjoner, spesielt EWS/FLI, er den mest funksjonelt karakteriserte til dags dato. EWS/FLI koordinerer genomomfattende epigenetiske og transkripsjonelle endringer som fører til aktivering og undertrykkelse av tusenvis av gener7,11,15,16. Studier har vist at IDD er viktig for rekruttering av både transkripsjonelle medaktivatorer (som p300, WDR5 og BAF-komplekset), samt medundertrykkere (for eksempel NuRD-komplekset)11,15,17. Sammensmeltingen av EWS IDD til C-terminaldelen av FLI1 gir ny DNA-bindende spesifisitet til ETS DBD av FLI1, slik at fusjons-onkoproteinet (EWS/FLI) binder seg til repeterende GGAA-mikrosalittregioner av genomet i tillegg til konsensus ETS-motivet18,19,20. Kombinert med rekrutteringsfunksjonen for medaktivator, denne nye DNA-bindende aktiviteten til EWS/FLI fremmer de novo enhancerformasjon ved GGAA-mikrosatellitter som er distale for transkripsjonsstartsteder (TSS) (“enhancer-lignende” mikrosatellitter) og rekrutterer RNA polymerase II for å fremme transkripsjon ved GGAA-mikrosatellitter proksimalt til TSS (“promotorlignende” mikrosatellitter)11,15,16,21.
Samlet sett førte disse dataene oss til å hypotese at diskrete elementer i EWS-domenet bidrar til rekruttering av distinkte medregulatorer til forskjellige typer EWS / FLI-bindingssteder. Imidlertid har det å skjelne disse elementene i EWS-delen av EWS / FLI, og hvordan de fungerer, blitt hindret av domenets svært repeterende og uordnede natur. Her bruker vi et tidligere publisert knockdown-redningssystem i Ewing sarkomceller for å kartlegge disse elementene i EWS IDD funksjonelt. I dette systemet EWS/FLI er utarmet ved hjelp av en shRNA rettet mot 3’UTR av FLI1 genet, og uttrykket er reddet med varierende EWS / FLI mutant cDNA konstruksjoner mangler 3’UTR7,17,22. Disse eksperimentene fokuserte på konstruksjoner med ulike slettinger for å kartlegge strukturfunksjonsforholdet mellom EWS IDD og viktige onkogene fenotyper, inkludert aktivering av en GGAA-mikrosalittreporterkonstruksjon, koloniformasjonsanalyser og målrettet validering av EWS / FLI-aktiverte og -undertrykte gener7,17,22 . Disse studiene fant imidlertid ikke atskilte underdomener i EWS IDD i EWS/FLI som er unikt viktige for enten aktivering eller undertrykkelse. Alle testede konstruksjoner var enten i stand til både å aktivere og undertrykke spesifikke målgener, noe som førte til effektiv kolonidannelse, eller ute av stand til å regulere noen av EWS / FLI-målgenene, noe som førte til tap av kolonidannelse7,17,22.
Transkripsjonsanalyser som aktiveres av den utbredte adopsjonen av neste generasjons sekvensering, brukes ofte til å sammenligne genuttrykkssignaturer under to forhold, ofte i sammenheng med screening eller beskrivende studier. Vi ønsket i stedet å utnytte evnen til å fange opp genomomfattende uttrykksdata ved hjelp av RNA-sekvensering (RNA-seq) for å karakterisere bidragene fra IDD-er til transkripsjonsfaktorfunksjon. I dette tilfellet er RNA-seq forbundet med knockdown-redningssystemet for å utforske strukturfunksjonsforholdet til EWS-domenet. Denne tilnærmingen gjelder for andre fusjonstranskripsjonsfaktorer, inkludert andre EWS-fusjoner eller wildtype transkripsjonsfaktorer med dårlig forstått funksjon, og har flere fordeler i forhold til de andre analysene som brukes til funksjonelle kartstudier, for eksempel reporteranalyser eller målrettet qRT-PCR. Disse inkluderer testing av strukturelle determinanter av funksjon i relevant kromatinkontekst, evnen til å teste flere typer responselementer i en analyse (dvs. aktivert og undertrykt, GGAA-mikrosalat og ikke-mikrosalat, etc.), og den resulterende evnen til bedre å oppdage delvis funksjon.
Vellykket implementering av denne tilnærmingen avhenger av et cellebasert system som fanger opp fenotypene av interesse (i dette tilfellet A673-celler med shRNA-mediert EWS / FLI-uttømming), og et panel av mutantkonstruksjoner i en uttrykksvektor som passer for det cellebaserte systemet (i dette tilfellet pMSCV-hygro med forskjellige 3x-FLAG-taggede EWS / FLI-mutanter som skal leveres av retroviral transduksjon). Viral transduksjon av enten CRISPR-baserte uttømmingskonstruksjoner, shRNA-baserte uttømmingskonstruksjoner og cDNA-uttrykkskonstruksjoner med passende valg for å generere stabile cellelinjer anbefales over forbigående transfeksjon. Nedstrøms tolkningen av resultatene styrkes når de transkripsjonsmessige dataene kan kobles sammen med andre data relatert til lokalisering av transkripsjonsfaktoren og andre fenotypiske avlesninger der det er tilgjengelig.
I dette dokumentet bruker vi denne tilnærmingen til å karakterisere aktiviteten til DAF-mutanten til EWS / FLI14. DAF-mutanten har 17 tyrosin til alaninmutasjoner i de repeterende områdene i EWS IDD for EWS/FLI14. Denne spesielle EWS-mutanten hadde tidligere blitt rapportert og kan ikke aktivere reportergenuttrykk når den ble smeltet sammen til ATF1 DBD14. Foreløpige qRT-PCR-data antydet imidlertid at denne mutanten var i stand til å aktivere transkripsjon av EWS / FLI-målet NR0B123. Den transkripsjonsomiske tilnærmingen som er beskrevet her, gjorde det mulig å oppdage delvis funksjon av DAF-mutanten. Ved å parre disse transkripsjonsdataene med informasjon om EWS/FLI-bindings- og anerkjennelsesmotiver viser vi videre at DAF-mutanten beholder funksjonen ved GGAA-mikrosalat repetisjoner. Disse resultatene identifiserer DAF som den første delvis funksjonelle EWS/FLI mutant og fremhever funksjon ved ikke-mikrosatellittgener som viktige for onkogenese (som rapportert23). Dette viser kraften i denne transkripsjonsstrukturfunksjonskartleggingsmetoden for å gi innsikt i funksjonen til onkogene transkripsjonsfaktorer.
Å studere de biokjemiske mekanismene til onkogene transkripsjonsfaktorer er kritisk viktig for å forstå sykdommene de forårsaker og å designe nye terapeutiske strategier. Dette gjelder spesielt i maligniteter preget av kromosomale translokasjoner som resulterer i fusjonstranskripsjonsfaktorer. Domenene som inngår i disse chimeriske proteinene kan mangle meningsfulle interaksjoner med regulatoriske domener som finnes i de ville proteinene, noe som kompliserer evnen til å tolke strukturfunksjonsinformasjon i sammenheng medfusjonen 26,27,28. Videre er mange av disse onkogene fusjoner preget av lav kompleksitet i iboende uordnede domener10,13,29,30.
EWS-domenet er et eksempel på et slikt iboende uorden domene som er involvert i en rekke onkogene fusjoner10. Den iboende uordnede og repeterende naturen har hindret arbeidet med å forstå molekylære mekanismer som brukes av EWS-domenet. Tidligere forsøk på å undersøke strukturfunksjonen har i stor grad tydd til å bruke forskjellige mutanter i sammenheng med reportergenanalyser eller i cellebakgrunner som ikke klarer å rekapitulere den relevante cellulære konteksten, eller mangler strukturelle variasjoner som gir meningsfull delvis funksjon11,17,25. Metoden som presenteres her, løser disse problemene. Strukturfunksjonskartlegging utføres i en sykdoms-relevant cellekontekst, og neste generasjons sekvensering gjør det mulig for transkripsjonsprofilering å evaluere transkripsjonsfaktorfunksjon i innstillingen av innfødt kromatin. I det spesifikke tilfellet av DAF-mutanten til EWS / FLI ble DAF rapportert å vise liten aktivitet i reporteranalyser ved hjelp av isolerte responselementer, men for å vise aktivitet i sammenheng med full genpromotor, enten i en reporteranalyse eller i innfødt kromatin, noe som tyder på en interessant fenotype23. Ved hjelp av metoden som er beskrevet her, løser mer direkte spørsmålet om hvilken type regulatoriske elementer på tvers av genomet som er mest responsive i sykdomsinnstillingen. Ved å teste alle kandidatmålgener i sin opprinnelige kromatinkontekst samtidig, er det mer sannsynlig at en transkripsjonsmetode identifiserer konstruksjoner med delvis funksjon.
Den iboende styrken ved å bruke en sykdoms-relevant cellebakgrunn er kanskje den største begrensningen i denne teknikken. En av de viktigste faktorene er å velge riktig cellesystem for disse eksperimentene. Mange cellelinjer avledet fra maligniteter med patognomiske transkripsjonsfaktorer tolererer ikke lett knockdown av den transkripsjonsfaktoren, og i mange tilfeller, spesielt for barnekreft, forblir den sanne opprinnelsescellen kontroversiell og uttrykket av oncogene i andre cellebakgrunner er uoverkommelig giftig31,32 . I disse tilfellene kan det være nyttig å utføre eksperimenter i en annen cellebakgrunn, så lenge forskeren utviser forsiktighet i tolkningen av resultatene og validerer relevante funn i en mer sykdomsrelevant celletype.
Det er kritisk viktig å nøye validere stabiliteten og fenotypiske konsekvenser av uttrykk for oncogene og bare sende inn prøver for sekvensering som oppfyller strenge kriterier. Her inkluderte dette vestlig blott for å bekrefte knockdown og redning, og qRT-PCR av et lite antall kjente målgener for å validere den positive kontrollen (Figur 2). Det er også viktig å redusere så mye batchvariabilitet som mulig ved å nøye utføre cellen og RNA-preparatene så likt som mulig gjennom hver batch.
Metoden beskrevet her blir spesielt kraftig når den er parret med andre typer genomiske data som snakker til den genomomfattende funksjonen til transkripsjonsfaktoren som studeres. Fremtidige retninger for denne typen strukturfunksjonsanalyse vil utvides til å omfatte ChIP-seq og ATAC-seq for å bestemme bindingen av transkripsjonsfaktoren og eventuelle induserte endringer i kromatintilgjengelighet. Som en pakke kan denne typen data peke på hvor forskjellige strukturelle komponenter i en onkogen transkripsjonsfaktor bidrar til ulike aspekter av funksjonen (dvs. DNA-binding vs. kromatinmodifisering vs. co-regulator rekruttering). Totalt sett kan bruk av NGS-baserte tilnærminger for å kartlegge strukturfunksjonsrelasjonene til fusjonstranskripsjonsfaktorer avsløre ny innsikt i de biokjemiske determinantene til den onkogene funksjonen til disse proteinene. Dette er viktig for å fremme vår forståelse av sykdommene de forårsaker og for å muliggjøre utvikling av nye terapeutiske strategier.
The authors have nothing to disclose.
Denne forskningen ble støttet av High Performance Computing Facility ved Abigail Wexner Research Institute ved Nationwide Children’s Hospital. Dette arbeidet ble støttet av National Institutes of Health National Cancer Institute [U54 CA231641 til SLL, R01 CA183776 til SLL]; Alex’s Lemonade Stand Foundation [Young Investigator Award til ERT]; Pelotonia [Fellesskap til ERT]; og National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 til KIP].
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |