Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Kortlægning af strukturfunktionsforhold for uordnede onkogene transskriptionsfaktorer ved hjælp af transskriptomisk analyse

Published: June 27, 2020 doi: 10.3791/61564

Summary

Iboende uorden domæner er vigtige for onkogen fusion transskription faktor funktion. For terapeutisk at målrette disse proteiner er det nødvendigt med en mere detaljeret forståelse af de reguleringsmekanismer, der anvendes af disse domæner. Her bruger vi transcriptomics til at kortlægge vigtige strukturelle træk ved det iboende uordnede EWS-domæne i Ewing sarkom.

Abstract

Mange kræftformer er karakteriseret ved kromosomale translokationer, som resulterer i udtryk for onkogen fusion transskription faktorer. Disse proteiner indeholder typisk et iboende uordnet domæne (IDD), der er smeltet sammen med DNA-bindende domæne (DBD) af et andet protein og orkestrerer udbredte transskriptionelle ændringer for at fremme malignitet. Disse fusioner er ofte den eneste tilbagevendende genomiske aberration i de kræftformer, de forårsager, hvilket gør dem attraktive terapeutiske mål. Men målretning onkogen transskription faktorer kræver en bedre forståelse af den mekanistiske rolle, lav kompleksitet, IDD'er spiller i deres funktion. EWSR1's N-terminaldomæne er et IDD, der er involveret i en række onkogene fusionstransskriptionsfaktorer, herunder EWS/FLI, EWS/ATF og EWS/WT1. Her bruger vi RNA-sekventering til at undersøge de strukturelle træk ved EWS-domænet, der er vigtige for ews/ FLI's transskriptionsfunktion i Ewing sarkom. Første shRNA-medierede udtømning af den endogene fusion fra Ewing sarkomceller parret med ektopisk udtryk for en række EWS-mutant konstruktioner udføres. Derefter RNA-sekventering bruges til at analysere transcriptomes af celler, der udtrykker disse konstruktioner til at karakterisere de funktionelle underskud forbundet med mutationer i EWS domæne. Ved at integrere transskriptoriske analyser med tidligere offentliggjorte oplysninger om EWS/FLI DNA-bindende motiver og genomisk lokalisering samt funktionelle analyser til transformering af evne, var vi i stand til at identificere strukturelle træk ved EWS/FLI, der er vigtige for onkogenese, og definere et nyt sæt EWS/FLI-målgener, der er afgørende for Ewing sarkom. Dette papir viser brugen af RNA-sekventering som en metode til at kortlægge struktur-funktion forholdet mellem den iboende uorden domæne onkogen transskription faktorer.

Introduction

En delmængde af kræftformer, herunder mange maligniteter i barndommen og ungdommen, er karakteriseret ved kromosomale translokationer, der genererer ny fusion oncogenes1,2,3,4,5,6. De resulterende fusion proteiner ofte fungerer som onkogen transskription faktorer, orkestrere udbredte ændringer i transskription regulering til fremme tumorigenese7,8. Kræftformer med disse translokationer almindeligvis besidder en ellers stille mutationslandskab, med få tilbagevendende genomiske afvigelser bortset fra patognomonic fusion4,9. Som sådan er direkte rettet mod fusionsproteinet en attraktiv terapeutisk strategi i disse sygdomme. Disse onkogne transskriptionsfaktorer består dog ofte af et lavkompleksitet, iboende uordnet, transskriptionsaktiverende domæne, der er smeltet sammen med et DNA-bindende domæne (DBD)10,11,12,13,14. Både de iboende uordnede domæner (IDD'er) og DBD'er af disse proteiner har vist sig vanskelige at målrette mod med konventionelle farmakologiske tilgange. Udvikling af nye terapeutiske tilgange kræver derfor en mere detaljeret molekylær forståelse af de mekanismer, der anvendes af disse fusioner til afvigende at regulere genekspression.

N-terminal IDD del af EWSR1 er almindeligt smeltet til en DBD i kræft, herunder EWS / FLI i Ewing sarkom, EWS / WT1 i diffus lille runde celle tumor, og EWS / ATF1 i klar celle sarkom af bløde dele10. Ews IDD's mekanistiske rolle i hver af disse fusioner er ufuldstændigt forstået. EWS/ETS-fusionens familie, specielt EWS/FLI, er den mest funktionelt karakteriserede til dato. EWS/FLI koordinerer genomom-dækkende epigenetiske og transskriptionelle ændringer , der fører til aktivering og undertrykkelse af tusindvis af gener7,11,15,16. Undersøgelser har vist, at IDD er vigtig for rekrutteringen af både transskriptionelle medaktivatorer (såsom p300, WDR5 og BAF-komplekset) samt co-repressorer (såsom NuRD-komplekset)11,15,17. Sammensmeltningen af EWS IDD til C-terminaldelen af FLI1 giver et nyt DNA-bindende specificitet til ETS DBD af FLI1, således at fusion oncoprotein (EWS/FLI) binder sig til gentagne GGAA-mikrosatellit regioner i genomet ud over konsensus ETS motiv18,19,20. Kombineret med co-activator rekruttering funktion, denne emergent DNA-bindende aktivitet EWS/FLI fremmer de novo forstærker dannelse på GGAA-microsatellites distal til transskription start sites (TSS) ("forstærker-lignende" mikrosatellitter) og rekrutterer RNA polymerase II at fremme transskription på GGAA-microsatellites proksimale til TSS ("promotor-lignende" mikrosatellitter)11,15,16,21.

Samlet set førte disse data os til at antage, at diskrete elementer inden for EWS-området bidrager til rekrutteringen af forskellige medregulatorer til forskellige typer EWS / FLI-bindingssteder. Men kræsne disse elementer inden for EWS del af EWS / FLI, og hvordan de fungerer, er blevet hæmmet af den meget gentagne og uordnede karakter af domænet. Her bruger vi et tidligere offentliggjort knockdown-redningssystem i Ewing sarkomceller til funktionelt at kortlægge disse elementer i EWS IDD. I dette system er EWS/FLI udtømt ved hjælp af en shRNA rettet mod 3'UTR af FLI1-genet, og ekspressionen reddes med varierende EWS /FLI mutant cDNA-konstruktioner, der mangler 3'UTR7,17,22. Disse eksperimenter fokuserede på konstruktioner med forskellige sletninger for at kortlægge strukturfunktionsforholdet mellem EWS IDD og vigtige onogene fænotyper, herunder aktivering af en GGAA-mikrosatellit reporterkonstruktion, kolonidannelsesanalyser og målrettet validering af EWS / FLI-aktiverede og -undertrykte gener7,17,22 . Disse undersøgelser fandt imidlertid ikke diskrete underdomæner inden for EWS IDD i EWS/FLI, som er entydigt vigtige for enten aktivering eller undertrykkelse. Alle testede konstruktioner var enten i stand til både at aktivere og undertrykke specifikke målgener, hvilket førte til effektiv kolonidannelse eller ude af stand til at regulere nogen af EWS / FLI-målgener, hvilket førte til tab af kolonidannelse7,17,22.

Transskriptoriske analyser, der er muliggjort af den udbredte indførelse af den næste generations sekventering, anvendes ofte til at sammenligne genekspressionssignaturer under to forhold, ofte i forbindelse med screening eller beskrivende undersøgelser. Vi ønskede i stedet at udnytte evnen til at fange genom-dækkende udtryksdata ved hjælp af RNA-sekventering (RNA-seq) til at karakterisere bidrag fra IDD'er til transskription faktor funktion. I dette tilfælde er RNA-seq parret med knockdown-redningssystemet for at udforske strukturfunktionsforholdet mellem EWS-domænet. Denne tilgang gælder for andre fusion transskription faktorer, herunder andre EWS fusioner eller wildtype transskription faktorer med dårligt forstået funktion, og har flere fordele i forhold til de andre assays, der anvendes til funktionelle kortlægning undersøgelser, såsom reporter assays eller målrettet qRT-PCR. Disse omfatter afprøvning af strukturelle determinanter for funktion i den relevante kromatinkontekst, evnen til at teste flere typer responselementer i en analyse (dvs. aktiverede og undertrykte, GGAA-mikrosatellit og ikke-mikrosatellit osv.) og den resulterende evne til bedre at opdage delvis funktion.

En vellykket gennemførelse af denne tilgang afhænger af et cellebaseret system, der indfanger interessefænotyperne (i dette tilfælde A673-celler med shRNA-medieret EWS/FLI-udtømning), og et panel af mutantkonstruktioner i en ekspresvektor, der passer til det cellebaserede system (i dette tilfælde pMSCV-hygro med forskellige 3x-FLAG-mærkede EWS/FLI-mutanter, der skal leveres ved retroviral transduktion). Viral transduktion af enten CRISPR-baserede udtømning konstruktioner, shRNA-baserede udtømning konstruktioner, og cDNA udtryk konstruktioner med passende valg til at generere stabile celle linjer anbefales over forbigående transfection. Downstream fortolkning af resultater styrkes, når transcriptomic data kan parres med andre data i forbindelse med lokalisering af transskription faktor og andre fænotypiske udlæsninger, hvor det er muligt.

I dette papir anvender vi denne tilgang til at karakterisere aktiviteten af DAF mutant af EWS / FLI14. DAF mutant har 17 tyrosin til alanin mutationer i de gentagne regioner i EWS IDD af EWS / FLI14. Denne særlige EWS mutant var tidligere blevet rapporteret og er ude af stand til at aktivere reporter genekspression, når smeltet til ATF1 DBD14. Foreløbige qRT-PCR-data antydede imidlertid , at denne mutant var i stand til at aktivere transskription af EWS/FLI-målet NR0B123. Den transskriptomiske tilgang, der er beskrevet her, muliggjorde en vellykket påvisning af DAF-mutantens delvise funktion. Ved at parre disse transskriptomiske data med oplysninger om EWS/FLI bindings- og genkendelsesmotiver viser vi yderligere, at DAF-mutanten bevarer funktionen ved GGAA-microsatellit repeats. Disse resultater identificerer DAF som den første delvist funktionelle EWS/FLI mutant og fremhæver funktion på ikke-mikrosatellit gener som vigtigt for onkogenese (som rapporteret23). Dette viser styrken af denne transskriptomiske struktur-funktion kortlægning tilgang til at give indsigt i funktionen af onkogen transskription faktorer.

Protocol

1. Opsætning af in vitro panel af konstruktioner

BEMÆRK: Dette trin vil variere afhængigt af det specifikke protein, der skal analyseres.

  1. Forbered aliquots af virus til udtømning og udtryk konstruktioner efter behov.
    1. Frø en 10 cm vævskultur skål med 3-5 x 106 HEK293-EBNA eller HEK293T celler for hver konstruktion, der er nødvendig for viral transduktion. Lad cellerne klæbe natten over i Dulbecco's Modified Eagle Media (DMEM) suppleret med 10% fosterkvægsserum (FBS), penicillin/streptomycin/glutamin (P/S/Q) og 0,3 mg/mL G418.
      BEMÆRK: HEK293-EBNA og HEK293T celler anbefales til viral produktion, fordi de er nemme at dyrke, har høj transfection effektivitet, og effektivt udtrykke rekombinante proteiner fra episomal plasmid. Cellerne skal være mellem 50-70% sammenflydende dagen for transfection.
    2. Forbered en transfection mix for hver viral transduktion konstruktion. Kombiner 2 mL af reducerede serummedier med 90 μL transfection reagens.
      BEMÆRK: Det anbefales at reducere serummedierne før opvarmningen.
    3. Tilsæt 10 μg hver af en viral emballage plasmid (f.eks gag-pol), viral kuvert plasmid (f.eks VSV-G), og en af enten CRISPR-baserede udtømning, shRNA-baserede udtømning, eller cDNA udtryk konstruere (f.eks pMKO eller pMSCV) til transfection mix. Bland godt ved blid pipettering.
    4. Lad transfectionblandingen sidde i 20 minutter ved stuetemperatur. Fjern HEK293-EBNA vækstmedier fra vævskulturretter og tilsæt 3 mL DMEM suppleret med 10% FBS, P/S/Q og 10 mM natrium pyruvat. Til hver skål, tilsæt 2 mL transfection mix dropwise. Lad celler sidde i transfektionsmedier natten over i en inkubator ved 37 °C og 5 % CO2.
    5. Den følgende morgen tilsættes 20 mL DMEM medier med 10% FBS, P /S/Q tilskud, og 10 mM natrium pyruvat. Inkuber cellerne i det ved 37 °C og 5% CO2 for natten over.
    6. Næste morgen skal du udskifte medier med 5 mL virale indsamlingsmedier (VCM) (DMEM suppleret med 10% varmeinaktiveret FBS, P/S/Q og 20 mM HEPES).
    7. Efter 4 timer opsamles VCM fra plader og opbevares i et 50 mL konisk rør på is ved 4 °C. Udskift med 5 mL frisk VCM.
    8. Efter 4 timer opsamles VCM fra plader i samme 50 mL koniske rør og opbevares på is ved 4 °C. Udskift med 8 mL frisk VCM til afhentning natten over.
    9. Om morgenen opsamles VCM fra plader og opbevares i 50 mL koniske rør på is ved 4 °C. Udskift med 5 mL frisk VCM.
    10. Efter 4 timer opsamles VCM fra plader og opbevares i 50 mL koniske rør på is ved 4 ° C. Udskift med 5 mL frisk VCM. Efter 4 timer opsamles VCM fra plader og tilsættes til 50 mL koniske rør.
    11. Aliquot samlinger fra 50 mL rør i cryotubes (2 mL per aliquot) efter filtrering gennem en 0,45 μm filter. Opbevar virale aliquots ved -80 °C, indtil de anvendes.
      BEMÆRK: Protokollen kan sættes på pause her, og de virale aliquots kan opbevares, indtil de er klar til brug.
  2. Frøceller ved den passende tæthed i en 10 cm vævskulturskål. Mål 50% sammenløb. Lad cellerne klæbe natten over ved at placere i inkubatoren ved 37 °C indeholdende 5 % CO2.
    BEMÆRK: For A673-celler er dette 5 x 106 celler i 10 mL DMEM-medier med 10% FBS, P/S/Q tilskud og 10 mM natrium pyruvat. Disse betingelser kan variere afhængigt af vækstraten for de anvendte celler.
  3. Nedbrydende endogene faktor af interesse. Hvis celler ikke behøver at have det endogene protein af interesse udtømt, springe videre til trin 1.4.
    1. Optø viral aliquot til transduktion af shRNA eller CRISPR konstruktion rettet mod protein af interesse. Optø frosne aliquots hurtigt i et 37 °C vandbad.
    2. Der tilsættes 2,5 μL 8 mg/mL polybren til hver viral aliquot og blandes ved skånsom pipettering. Fjern medier fra plader af celler og tilsæt forsigtigt viral aliquot til 10 cm plade ved pipetter langs siden af pladen. Rock pladen for at sprede 2 mL viral aliquot.
    3. Inkuberes ved 37 °C i vævskulturinkubatoren i 2 timer. Rock pladen hvert 30. minut for at forhindre, at områder af pladen tørrer ud.
    4. Der tilsættes 5 mL DMEM-medier med 10% FBS, P/S/Q-tilskud og 10 mM natrium pyruvat med 5 μL på 8 mg/mL polybren. Lad cellerne inkubere natten over.
    5. Om morgenen skal du fjerne medier fra celler og overgangsceller i medier suppleret med et markeringsreagens. Når passaging celler, sås dem på en måde, så de kan vokse i 48-72 timer og nå 50% sammenløb.
      BEMÆRK: For A673-celler med pSRP-iEF-2 sås cellerne i en 1:5 split og vælges til 72 timer med 2 μg/mL puromycin.
  4. Transduce cDNA udtryk konstruktioner.
    1. Kontroller cellerne for at bekræfte 50-70% sammenløb.
    2. Optø viral aliquot(er) til transduktion af cDNA konstruktion (r) af interesse. Optø frosne aliquots hurtigt i et 37 °C vandbad. Der tilsættes 2,5 μL 8 mg/mL polybren til hver viral aliquot og blandes ved forsigtigt pipettering.
    3. Fjern medier fra belagt celler og tilsæt forsigtigt viral aliquot til 10 cm plade ved pipetter langs siden af pladen. Rock pladen for at sprede 2 mL viral aliquot.
    4. Inkuberes ved 37 °C i vævskulturinkubatoren i 2 timer. Rock pladen hvert 30. minut for at forhindre, at områder af pladen tørrer ud.
    5. Der tilsættes 5 mL DMEM-medier med 10% FBS, P/S/Q-tilskud og 10 mM natrium pyruvat med 5 μL på 8 mg/mL polybren. Lad cellerne inkubere natten over.
    6. Om morgenen skal du fjerne medier fra celler og overgangsceller til dobbeltmarkeringsmedier. Vokse og passage celler efter behov for 7-10 dage for at give mulighed for dobbelt udvælgelse og udtryk af cDNA konstruktion.
      BEMÆRK: Denne opdeling af denne passage kan kræve optimering for forskellige cellelinjer. For A673-celler med pSRP-iEF-2 og en pMSCV-hygro-konstruktion overføres cellerne uden at opdeles i 2 μg/mL puromycin og 100 μg/mL hygromycin.

2. Indsamle celler, validere udtryk for konstruktioner, og oprette korrelative fænotypiske assays

  1. Efter 7-10 dages dobbeltvalg indsamle celler i en 15 mL konisk rør. Tæl indsamlede celler med et hæmocytometer. Aliquot indsamlede celler til RNA-sekventering og til validering af udtryk for cDNA-konstruktioner.
    BEMÆRK: Oprette korrelative fænotypiske analyser, der kræves af det undersøgte forskningsspørgsmål. Koloni danner assays er et eksempel på en korrelativ fænotypisk assay, der anvendes her.
    1. Saml mellem 5 x 105 og 1 x 106 celler til RNA-sekventering og 2 x 106 celler til proteinudvinding. Pelletceller ved centrifugering ved 1.000 x g ved 4 °C i 5 min og fjern supernatanten.
    2. Vask pellet med 1 mL kold PBS. Pellet ved centrifugering ved 1.000 x g ved 4 °C i 5 min og fjern supernatant. Flash fryse pellets i flydende nitrogen og opbevares ved -80 °C.
    3. Opsætning af korrelative analyser med de resterende celler.
      BEMÆRK: Protokollen kan sættes på pause her med indsamlede prøver, der er gemt i -80 °C-fryseren.
  2. Valider knockdown af protein af interesse (hvis de anvendes) og udtryk for panelet af konstruktioner.
    1. Optø cellepiller til proteinudvinding på is. Resuspend celler i iskold 500 μL nuklear udvinding buffer (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glycerol, 1,5 mM MgCl2, 1 mM EDTA, 1 mM DTT, 1% IGEPAL) med protease hæmmer. Lad det sidde i 5 minutter på is.
    2. Pelletkerner ved centrifugering ved 1.000 x g ved 4 °C i 5 min og fjern supernatant. Vask kerner i 500 μL iskold nuklear udvindingsbuffer (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glycerol, 1,5 mM MgCl2, 1 mM EDTA, 1 mM DTT, 1% IGEPAL) med proteasehæmmer.
    3. Pelletkerner ved centrifugering ved 1.000 x g ved 4 °C i 5 min og fjern supernatanten. Resuspend kerner i 200 μL kold RIPA buffer med protease hæmmer (justere mængden af RIPA buffer i henhold til pellet størrelse.) Lad det sidde på is i 45-60 minutter med kraftig hvirvlen hvert 15. minut.
    4. Pillecelleaffald ved centrifugering ved 16.000 x g ved 4 °C i 45-60 min. Hold supernatanten og overfør til et frisk koldt rør
    5. Forbered prøver til SDS-PAGE elektroforese ved kogning 5-10 μg protein med 1x belastning buffer i 5 min. Kør en SDS-PAGE gel efter behov for protein af interesse.
    6. Overfør til en nitrocellulose eller PVDF membran efter behov for protein af interesse. Bloker, og blot med de relevante primære og sekundære antistoffer for at bekræfte knockdown af det endogene protein (hvis det anvendes) og ektopisk udtryk for cDNA-konstruktionen.
      BEMÆRK: Protokollen kan sættes på pause her.
  3. Uddrag RNA. Vurder RNA kvalitet og kvantitet.
    1. Optø cellepiller på is. Uddrag det samlede RNA ved hjælp af et silica spin-kolonne baseret ekstraktionssæt i henhold til producentens anvisninger.
    2. Kort, lyse cellerne ved hjælp af lysis buffer fra sættet. Enten anvende lysatet til en silica spin-kolonne med et kort spin ved >13000 rpm i 30-60 sekunder eller fjerne gDNA ved at anvende lysatet til en gDNA fjernelse kolonne med et kort spin ved > 13000 rpm i 30-60 sekunder.
    3. Udfør en DNA-fordøjelse på kolonnen, hvis lysatet blev anvendt direkte på en silica spin-kolonne. Hvis du bruger en gDNA fjernelse kolonne, anvende eluate til en silica-spin kolonne med et kort spin ved >13000 rpm for 30-60 s.
    4. Vask RNA på kolonnen i henhold til producentens anvisninger. Elute RNA i 30 μL elution buffer.
    5. Vurder RNA-kvalitet og kvantitet ved hjælp af et fluorometer eller et andet sammenligneligt instrument. Sørg for, at forholdet på 260/280 er tæt på 2, og at der er mindst 2,5 μg RNA at indsende til sekventering.
      BEMÆRK: Efterhånden som der indsamles replikeringer, skal hver replikation behandles med den samme RNA-udvindingsprotokol.
    6. Brug en lille aliquot af RNA til at bekræfte den stabile knockdown af protein af interesse, hvis det kræves, af qRT-PCR. Den resterende RNA-prøve opbevares ved -80 °C.
    7. Saml biologiske replikater ved at gentage trin 1-2 indtil 3-4 komplette sæt RNA er blevet indsamlet. Sørg for, at hver replikation viser et tilstrækkeligt udtryk for cDNA-konstruktioner og stabil knockdown af det endogene protein (hvis det anvendes).

3. Næste generations sekventering

  1. Indsend udvundet RNA, der skal sekventeres ved hjælp af en næste generation sekventering platform med et mål på 50 millioner 150 base par (bp) parret ende læser. Følg instruktionerne på det anlæg, der behandler prøverne. Vælg for poly-adenylerede RNA'er og strengspecifik sekventering.

4. Justering og Udskrift Counting Pipeline

BEMÆRK: Denne protokol forudsætter, at der efter eksempelafsendelse og -behandling returneres et sæt parrede FASTQ-filer for hvert eksempel. Disse filer komprimeres ofte med et suffiks af "fastq.gz". Yderligere analyse af disse FASTQ-filer vil kræve adgang til en HPC-facilitet (High Performance Computing), der kører et Linux-operativsystem.

  1. Overfør filer
    1. Åbn en terminal til HPC-miljøet med PuTTY. Opret en mappe til analysen kaldet "projekt".
    2. Gå til mappen "path_to/project", og opret en ny mappe til de komprimerede raw fastq.gz filer kaldet "fastq". Lav også en mappe kaldet "trimmet". Dette fremgår af figur S1A-C.
    3. Overfør de komprimerede raw fastq.gz filer fra lokalt lager til mappen "path_to/project/fastq/" ved hjælp af WinSCP eller et lignende program. Kontroller, at der er en "R1" og en "R2"-fil for hvert eksempel som vist i figur S1B.
    4. Valgfrit: Installer TrimGalore, hvis det er nødvendigt. Angiv den mappe, der indeholder den trim_galore eksekverbare fil i PATH-miljøvariablen i Linux.
      BEMÆRK: Læs og adaptere af lav kvalitet er trimmet med TrimGalore. TrimGalore fås på https://github.com/FelixKrueger/TrimGalore.
    5. Valgfrit: Naviger til mappen for downloadede softwarepakker (dvs. "path_to/software"). Hent den nyeste TrimGalore-pakke ved hjælp af kommandoen "curl -fsSL https://github.com/FelixKrueger/TrimGalore/archive/[version].tar.gz -o trim_galore-[version].tar.gz."
    6. Valgfrit: Pak tjærefilen ud.gz. Brug kommandoen "tar -xvzf trim_galore-[version_number].tar.gz".
    7. Valgfrit: Gør TrimGalore eksekverbar. Brug kommandoen "chmod a+x path_to/software/TrimGalore-[version]/trim_galore". Kontroller, at denne nye mappe findes i PATH. Brug kommandoen "export PATH=path_to/software/TrimGalore-[version]:$PATH".
    8. Naviger til path_to/projekt/fastq/. Brug TrimGalore til at trimme de læste af lav kvalitet fra fastq.gz filer ved hjælp af kommandoen vist i figur S1C.
      BEMÆRK: Yderligere flag for denne kommando kan være relevante og kan findes her: https://github.com/FelixKrueger/TrimGalore/blob/master/Docs/
      Trim_Galore_User_Guide.md
    9. Kontroller, om der er trimmet fastq.gz filer i mappen path_to/project/trimmet. Sørg for, at de kaldes sample1_R1_val_1.fq.gz og sample1_R2_val_2.fq.gz
  2. Juster trimmede FASTQ-filer med STAR, og generer udskrifter.
    BEMÆRK: STAR er tilgængelig på https://github.com/alexdobin/STAR)
    1. Valgfrit: Installer STAR version 2.6 eller nyere. Angiv den eksekverbare STAR-fil i stien.
    2. Valgfrit: Naviger til mappen for downloadede softwarepakker (dvs. "path_to/software").
    3. Valgfrit: Hent STAR-pakken ved hjælp af kommandoen "curl -SLO https://github.com/alexdobin/STAR/archive/[version].tar.gz". Pak tjærefilen ud.gz.
    4. Valgfrit: Brug kommandoen "tar -xzf [version].tar.gz". Gør STAR eksekverbar. Brug kommandoen "chmod a+x path_to/software/STAR-[version]/bin".
    5. Valgfrit: Kontroller, at denne nye mappe er i stien. Brug kommandoen "export PATH=path_to/software/STAR-[version_number]/bin/linux_x86_64_static:$PATH".
      BEMÆRK: STAR-manualen fås på: (https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf).
    6. Sørg for, at der er genomindeks til brug sammen med STAR. Placer dette i en mappe, der er adskilt fra mappen path_to/project/. Hvis der tidligere er oprettet et indeks til tidligere forsøg, skal du bruge det. Alternativt kan du bruge et passende foruddefineret indeks, hvis det er tilgængeligt her: http://refgenomes.databio.org/. Ellers skal du konstruere et nyt indeks ved hjælp af kommandoen "STAR-runMode genomeGenerate" ved hjælp af instruktionerne i STAR-manualen.
      BEMÆRK: For resten af denne protokol vil stien til STAR-indekset blive omtalt som "path_to/STAR_index".
    7. Gå til mappen path_to/project/. Opret en ny mappe med navnet "STAR_output" som vist i figur S1D.
    8. Gå til mappen path_to/projekt/trimmet/. Brug den kommando, der vises i figur S1D, til at køre STAR for at justere de trimmede fastq.gz-filer.
      BEMÆRK: Dette trin er det mest beregningsmæssigt intensive, og det anbefales at udføre dette på en HPC-klynge med flere tråde (dvs. >16), der er udpeget til opgaven med justering. Afhængigt af antallet af prøver og tilgængelige beregningsmæssige ressourcer kan dette trin tage mange timer til dage.
    9. Find det nødvendige output for de næste trin, der indeholder optællinger pr. udskrift på følgende placering: path_to/projekt/STAR_output/sampleN_ReadsPerGene.out..
      BEMÆRK: I filen ReadsPerGene.out.tab indeholder kolonne 1 oplysninger om den funktion, der tælles. Kolonne 2 indeholder de ikke-strandede læsetal, kolonne 3 indeholder de fremadrettede strandede læsetal, og kolonne 4 indeholder de omvendte strandede læsetal. De første fire rækker i denne fil vil have oplysninger om de justerede læser, der ikke stemte overens med et enkelt gen. Denne protokol kræver de ikke-ødelagte læsetal.
    10. Brug RStudio (at foretrække) eller R i HPC-miljøet til at kompilere dataene fra række 5 og derunder for kolonne 1 og 2 for hver prøve. Indstil arbejdsmappen til "projekt" i R.
    11. Læs i hver filen ReadsPerGene.out.tab ved hjælp af kommandoen i Figur S2A. For den første kolonne skal du kun tage tegnene før kolonnen "." i kolonnen "Ensembl-gen-id" for at lette downstream-behandlingen.
    12. Kompiler tæller fra alle eksempler i en dataramme kaldet "totcts" ved hjælp af kommandoerne i figur S2B. Gem denne nye tabel med råtællingsdata som en faneafgrænset .txt fil, dvssample_counts.txt.
      BEMÆRK: Rækkefølgen af Ensembl-gen-id'et er den samme for hver ReadsPerGene.out.tab-fil på tværs af prøver.

5. Differentieret udtryk og downstream-analyse

  1. Normaliser for batcheffekter mellem prøver med ComBat.
    BEMÆRK: Der er to mulige variabler, der forklarer ændringer i genekspressionen, hvoraf den første er den anvendte konstruktion (dvs. prøven), og den anden er eksterne faktorer forbundet med cellepassagen gennem tiden (dvs. batch). Det anbefales at normalisere prøver for batch-to-batch-variation med R-pakken ComBat.
    1. Installer om nødvendigt, og indlæs bibliotekerne til sva, DESeq2, AnnotationDBI, org. Hs.f.eks.db, pheatmap, RColorBrewer, genfilter, Kairo, ggplot2, ggbiplot, rgl, og omforme2 som vist i figur S2C. Til installation skal du bruge kommandoen "install.packages" eller Bioconductor i dokumentationen til hver pakke.
    2. Filtrer først dataene til kun de gener, der har mindst ét antal pr. læsning. Gem denne nye tabel for at angive filtrering som set i figur S2D.
      BEMÆRK: Ofte vil mange gener have meget lave eller ingen læsetal.
    3. Forbered en anden tabel til batch normalisering kaldet "vars" som vist i figur S2E. Angiv rækkenavnene til de entydige navne på hvert eksempel. Angiv kolonnenavnene til "eksempel", "batch" og "construct".
    4. Tildel alle eksempler et entydigt tal i kolonnen "eksempel" fra 1 til n, hvor n er antallet af prøver. Tildel batchnumre til alle prøver i kolonnen "batch", så betingelses- a_1 og betingelses-b_1 begge tildeles 1, og betingelses- a_2 og betingelses-b_2 tildeles begge 2. Tildel alle betingelsesbetegnelser til alle prøver i kolonnen "konstruktion", således at betingelses-en prøver er alle "A" og betingelse-b prøver er alle "B".
    5. Definer også batchvariablen og en bestemt null-modelmatrix for ComBat som vist i figur S2F. Kør ComBat med den kommando, der er defineret i Figur S2F.
  2. Yderligere kuratere data ved at afrunde til nærmeste heltal. Fjern også gener med en negativ værdi. Brug de kommandoer, der vises i figur S3A.
    BEMÆRK: Outputtet af batch normalisering vil have ikke-heltal læse tæller og nogle gener med negative værdier. Dette trin er påkrævet, fordi analysen af differentialudtryk i downstream ikke understøtter negative læsetal.
  3. Definer differentialudtryksprofilen for hver konstruktion ved hjælp af DESeq2.
    1. Input eksperimentet design for DESeq2 som vist i figur S3B. Opret et DESeqDataSet (dds) ved hjælp af funktionen DESeqDataSetFromMatrix, vurder størrelsesfaktorerne, og kør DESEq2 som vist i figur S3B.
      BEMÆRK: Det er bydende nødvendigt, at de kolonnedata, der er indtastet for "betingelse", er i samme rækkefølge som kolonnen i tællematrixen.
    2. For at vurdere analysens kvalitet udtrækkes de rlog-normaliserede tællinger, der anvendes af DESeq2 som vist i figur S3B.
      BEMÆRK: Under analysen, DESeq2 forvandler tæller med en "legaliseret log," rlog, transformation til at skrumpe prøve-til-prøve forskelle for gener med lave tællinger (lav information) for at bevare forskelle i gener med højere tæller på tværs af prøver (høj information).
    3. Når du udtrækker resultaterne for hver transskriptionsprofil fra resultaterne af DESeq2, skal du foretage sammenligninger på parvis med henvisning til enten knockdown-betingelsen eller den tomme oprindelige vektor som vist i figur S3C. Yderligere ændre disse resultater med HGNC gensymboler som vist i figur S3D.
    4. Som det fremgår af figur S3E, udtrække data fra DESeq2 resultater. Eksporter som en enkelt fil med Ensembl-gen-id'et, HGNC-symbolet, basis mean expression og differentialudtryksdata for alle konstruktioner med log2FoldChange og rå og justerede p-værdier.
      BEMÆRK: Brug af en justeret p-værdi < 0,05 er den anbefalede cutoff for differentieret udtryk.
    5. Vurder vellykket batch normalisering og intra-prøve lighed. Kontroller eksempelklynger med PCA og eksempel-til-prøve-afstandsplotter ved hjælp af de normaliserede antal rlog ved hjælp af den kode, der er vist i Figur S4A-B.
  4. Brug differentialudtryksprofilerne til at generere vulkanplotter ved hjælp af koden i Figur S4C. Vurder ændringer i genekspression på tværs af konstruktioner.
  5. Brug de normaliserede antal rlog og hierarkiske klynger til at identificere gensignaturer, der er unikke for de forskellige konstruktioner. Brug den kode, der vises i figur S4D.
    1. Uddrag de 1000 mest variable gener på tværs af alle konstruktioner i en matrix. Brug pheatmap til at udføre uovervåget hierarkisk klyngedannelse af dine prøver baseret på disse gener.
    2. Uddrag klynger af interesse fra dendrogram ved at beslutte, på hvilket niveau af dendrogram klynger af interesse vises. Angiv "k" svarende til antallet af klynger på dette niveau. Replot det varmekort, der er bestilt af klyngen for at bestemme, hvilke klynger der er af interesse som vist i figur S5.
    3. Eksporter listen over gener, der er knyttet til hver klynge, som vist i tabel S1. Brug disse oplysninger til at bestemme generne i klynger af interesse.
  6. Identificere de biologiske roller for forskellige klynger af gener identificeret og sammenligne mellem klasserne. Dette kan udføres ved hjælp af en række bioinformatik værktøjer. ToppGene24 bruges her og er frit tilgængelig online.
    BEMÆRK: Der er mange gratis værktøjer, der kræver blot en liste over gener til at kopiere og indsætte i et felt på et websted. Vælg de analytiske værktøjer, der passer bedst til de forskningsspørgsmål, der undersøges.
  7. Eventuelt, hvis der er data tilgængelige om genomisk binding, der driver transskription faktor af interesse, sammenligne transcriptional respons på gener forbundet med forskellige bindende elementer til yderligere at evaluere mutant funktion.

6. Sammenligning med relevante fænotyper

  1. Sammenlign de korrelative fænotyper med de transskriptomiske profildata, der genereres og fortolkes efter behov.

Representative Results

Foreløbige qRT-PCR-data antydede, at en EWS /FLI mutant kaldet DAF, med specifikke tyrosin til alanin mutationer i den gentagne og uordnede region EWS, opretholdt evnen til at aktivere EWS / FLI mål gener, men undlod at undertrykke kritiske mål gener23. For bedre at forstå forholdet mellem disse restkoncentrationer i EWS-domænet og EWS/FLI-funktionen blev den ovenfor beskrevne protokol og skitseret i figur 1 anvendt. A673 Ewing sarkomceller blev viralt transduced med en shRNA rettet mod 3'UTR af FLI1, hvilket resulterer i udtømning af endogene EWS / FLI. Efter fire dages udvælgelse blev EWS/FLI-funktionen reddet med viral transduktion af forskellige 3XFLAG-mærkede EWS/FLI mutantkonstruktioner med tom vektor som kontrol for ingen redning. En ikke-funktionel mutant, der manglede EWS-domænet, kaldet Δ22, blev brugt som en negativ kontrol, og wild-type EWS /FLI, kaldet wtEF, blev brugt som en positiv kontrol (Figur 2A). DAF blev brugt som testkonstruktion, selvom mere end én testkonstruktion kan bruges, hvis det ønskes. Celler blev udvalgt i yderligere 10 dage for at gøre det muligt at konstruere udtryk til at stabilisere og derefter indsamlet til RNA (med en gDNA fjernelse trin), protein og koloni danner assays. Fire replikater blev indsamlet og repræsentative qRT-PCR og vestlige blots viser effektiv knockdown og redning er vist i figur 2B-D. Det skal bemærkes, at DAF-reddede celler ikke har danne kolonier som vist i figur 2E, hvilket tyder på nedsat onkogen transformation.

Efter afslutningen af replika validering og fænotypiske assays, RNA blev forelagt Institut for Genomisk Medicin på Nationwide Children's Hospital for bibliotek forberedelse og næste generation sekventering med ~ 50 millioner 150-bp parret-end læser indsamlet. Dataene blev returneret som fastq.gz filer. Lav kvalitet læser blev trimmet fra disse filer med TrimGalore og STAR blev brugt til at tilpasse læser til det menneskelige genom hg19 og tælle læser pr gen. hg19 blev anvendt til forenelighed med de andre kuraterede datasæt for EWS/FLI, der blev anvendt i downstream-analysen. Disse læsetællinger blev kombineret i en enkelt tællematrix for alle prøver, hvoraf de første 6 rækker er vist i figur 3.

Antallet blev oprindeligt kørt gennem DESeq2 uden batch normalisering, men visuel inspektion af prøven-til-prøve afstand viste potentielle forvirrende batch effekter som vist fremhævet med røde pile i figur 4A. Dette opstod sandsynligvis på grund af biologisk variation indført ved passage af celler i kultur og forskelle i behandlingen af hvert parti. Normalisering for batcheffekter blev udført med ComBat og anbefales generelt. Stikprøveafstandene fra batchn normaliserede data vises i figur 4B. Efter batch normalisering blev DESeq2 brugt til at generere transskriptionsprofiler for de tre konstruktioner (wtEF, Δ22 og DAF) i forhold til basislinjen. Bemærk, at mens "forældre" A673 celler (mock knockdown og mock redning, kaldet "iLuc" her) blev medtaget i differentialanalysen, referencen for dette eksperiment er cellerne med EWS / FLI-udtømte, kaldet iEF celler. Den transskriptionelle profil kan genereres for det endogene protein her ved at sammenligne iLuc-prøven med iEF, og dette kan være af interesse i at forstå, hvordan redningssystemet fungerer, men det er ikke målet med denne særlige analyse. De transskriptionsprofiler, der genereres for mutanterne, omfatter positive (wtEF) og negative (Δ22) kontroller med hensyn til iEF, således at disse bør fungere som benchmarks for andre mutanter. Dette er vigtigt , da den positive kontrol i dette eksempel ikke helt opsummerede funktionen af endogene EWS/FLI som beskrevet andetsteds7,23.

Den vigtigste komponentanalyse (PCA) i figur 5 tyder på, at DAF's transskriptionsprofil er mellemliggende mellem wtEF og Δ22, hvilket bekræfter delvis funktion. Desuden viste hierarkisk klyngedannelse af de 1000 mest variable gener på tværs af prøver, at DAF ikke kunne undertrykke EWS/FLI-målgener og kun delvist bevarede genaktiveringsaktiviteten som vist i figur 6A og figur S5. ToppGene-analyse antydede, at de genersklasser, som DAF aktiverer, er funktionelt forskellige fra de EWS/FLI-aktiverede mål, hvor DAF ikke fungerer (Figur 6B). Interessant nok synes funktionen af aktiverede gener reddet af wtEF, men ikke af DAF, at være relateret til transskriptionskontrol og kromatinregulering. Baseret på resultaterne af kolonidannelsesanalyserne bør generne fra denne kernegensignatur analyseres yderligere for deres rolle i EWS/FLI-medieret onkogenese. Betydningen af EWS/FLI-medieret genundertrykkelse er tidligere blevet beskrevet17.

Det er kendt, at EWS/FLI besidder en unik bindende affinitet for GGAA-microsatellit repeat elements19,22, og at binding ved disse elementer driver downstream genregulering11,15,18,20,22. Disse mikrosatellitter er blevet karakteriseret som enten forbundet med aktivering eller undertrykkelse, og enten proksimale til (< 5 kb) TSS eller distale til (> 5 kb) TSS25. Derudover er der EWS/FLI-regulerede gener med høj affinitet (HA) ETS-motiver, der er proksimale for TSS23. For yderligere at analysere daf-funktionens egenskaber og hvilke typer EWS/FLI-aktiverede gener DAF var i stand til at redde, blev differentieret ekspression af gener forbundet med disse forskellige klasser analyseret. Interessant nok var DAF mest i stand til at redde GGAA-mikrosatellitaktiverede gener, men ude af stand til at redde aktiverede gener nær et HA-sted som set i figur 7. Som det ses med hierarkisk klyngedannelse, undlader DAF at redde EWS / FLI-medieret undertrykkelse på tværs af motivklasser. Disse data tyder på, at DAF bevarer tilstrækkelige strukturelle træk ved EWS til at binde sig til og aktivere fra GGAA-mikrosatellitter, både proksimale og distale over for TSS. Dette skyldes sandsynligvis det intakte SYGQ-domæne, der menes at være vigtigt for EWS/FLI-aktiviteten på GGAA, gentager11. Disse data tyder også på, at de specifikke tyrosiner, der muteres i DAF, spiller vigtige, men dårligt forstået roller i EWS/FLI-medieret genregulering fra HA-websteder samt i genundertrykkelse, hvilket fremhæver et vigtigt område for yderligere undersøgelse.

Figure 1
Figur 1: Arbejdsproces. Skildring af den trinvise procedure til at udføre strukturfunktionstilknytning ved transskriptomics. Celler blev først forberedt til at udtrykke den suite af konstruktioner, der kræves for struktur-funktion kortlægning. Efter udtryk blev celler høstet til RNA og protein og analyseret for korrelative fænotyper. Ekspression af konstruktionerne blev valideret, og denne proces blev gentaget 3-4 gange for at samle uafhængige biologiske replikter. RNA blev derefter indsendt til næste generations sekventering (NGS). Da data blev modtaget, blev data trimmet for kvalitet, justeret, og der blev beregnet optællinger pr. udskrift. Batcheffekter blev kontrolleret for, og transskriptomiske signaturer og differentialudtryk blev bestemt ved hjælp af DESeq2. Hierarkisk klynge- og downstream-analyse, der integrerer andre datasæt og forskellige veje eller funktionelle analyser, kan indarbejdes. Klik her for at se en større version af dette tal.

Figure 2
Figur 2: Validering af konstruktionsudtryk og korrelative analyser. (A) Skematisk skildrer de konstruktioner, der er testet i dette eksempel. (B) Validering af knockdown af endogene EWS/FLI og udtryk for 3X-FLAG-mærkede konstruktioner med immunoblot. (C,D) Validering af konstruktionsaktivitet ved et EWS/FLI (C) aktiveret målgen, NR0B1og (D) undertrykte målgen, TGFBR2, med qRT-PCR. Data præsenteres som middelværdi +/- standardafvigelse. P-værdier blev beregnet med en Tukeys ærlige betydningstest. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Koloni tæller fra soft-agar assays udført for at vurdere omdanne aktivitet konstruktioner. P-værdier blev beregnet med en Tukeys ærlige betydningstest. * p < 0,05, ** p < 0,01, *** p < 0,005. Dette tal er tilpasset fra Theisen, et al.23Klik her for at se en større version af dette tal.

Figure 3
Figur 3: Endelige indsamlede optællingsdata til analyse. Skærmbillede af de første 6 rækker af tællefilen med gentællinger for alle prøverne, der skal batch normaliseres og analyseres. Klik her for at se en større version af dette tal.

Figure 4
Figur 4: Prøve-til-prøve afstand varmekort. (A) Eksempel-til-eksempel-afstandsplot, der viser eksempelklyngen af de rå tælledata. Prøver, der grupperer både efter batch og stikprøve, er angivet med røde pile. (B) Prøve-til-prøve afstand plot efter batch normalisering med ComBat. Her, prøver fra alle replikerer klynge sammen, uafhængig af batch. Klik her for at se en større version af dette tal.

Figure 5
Figur 5: Resultater af analyse af differentialudtryk. (A) Principkomponentanalyse (PCA) plot af de transskriptomiske signaturer, der genereres for alle prøverne, viser stærk klyngedannelse inden for stikprøven og påviser, at DAF er mellemliggende mellem de positive (wtEF) og negative (Δ22) kontroller. (B) Vulkanplotter, der viser -log(p-værdi) afbildet mod log2FoldChange for gener i hver konstruktion. Gener med en justeret p-værdi < 0,05 og en |log2(FoldChange) | > 1 betragtes som signifikante og er vist med rødt. Panel 5B er tilpasset fra Theisen, et al.23Klik her for at se en større version af dette tal.

Figure 6
Figur 6: Hierarkisk klyngedannelse til identifikation af genklasser. (A) Hierarkisk klyngedannelse af de 1000 mest variable gener på tværs af alle konstruktioner, og baseline, iEF, viser DAF delvist redder EWS / FLI-medieret genaktivering. (B) Gen ontologi (molekylær funktion) resultater fra ToppGene viser den funktionelle berigelse af EWS/FLI-aktiverede gener, der enten reddes eller ikke reddes af DAF. Panel 6B er tilpasset fra Theisen, et al.23Klik her for at se en større version af dette tal.

Figure 7
Figur 7: Detaljeret analyse af forskellige transskriptionsfaktorresponselementer til forskellige konstruktioner: (A) Skematisk skildrer databehandlingen, der bruges til at generere paneler (B) og (C) ved at indarbejde andre tilgængelige datasæt med de transskriptomiske profiler her. (B,C) Samling, der viser redning af forskellige klasser af direkte EWS/FLI- (B) aktiveret og (C)undertrykte mål. Gener inkluderet var kun de gener med påviselige differentieret udtryk ved endogene EWS / FLI. I hvert cirkeldiagram skildrer grå den del af gener, der ikke reddes af konstruktionen. Rød skildrer den del af gener, der er differentieret aktiveret, og blå skildrer den del af gener, der er differentieret undertrykt. Dette tal er tilpasset fra Theisen, et al.23Klik her for at se en større version af dette tal.

Figur S1: Indlæser fastq.gz filer til HPC miljø, trimning og justering. Klik her for at downloade dette tal.

Figur S2: Sortering af læsetal på tværs af prøver og løbende batch normalisering med ComBat. Klik her for at downloade dette tal.

Figur S3: Kørsel af DESeq2 og udvinding af resultater af analyse af differentialudtryk. Klik her for at downloade dette tal.

Figur S4: Analyse af output. Klik her for at downloade dette tal.

Figur S5: Hierarkisk klyngedannelse til identifikation af genklasser: Hierarkisk klyngedannelse af de 1000 mest variable gener på tværs af alle konstruktioner og baseline, iEF, sorteret i k klynger. I dette tilfælde k=7, men denne parameter er angivet af brugeren som vist i figur S4D. Klik her for at downloade dette tal.

Tabel S1: Liste over gener (Ensembl gen-id) med klyngeanmærkning. Klik her for at downloade denne tabel.

Discussion

Undersøgelse af de biokemiske mekanismer af onkogne transskription faktorer er af afgørende betydning for at forstå de sygdomme, de forårsager, og at designe nye terapeutiske strategier. Dette gælder især i maligniteter karakteriseret ved kromosomtranslokationer, der resulterer i fusionstransskriptionsfaktorer. De domæner, der indgår i disse kimærproteiner , kan mangle meningsfulde interaktioner med reguleringsområder , der findes i de vilde proteiner, hvilket komplicerer evnen til at fortolke strukturfunktionsoplysninger i forbindelse med fusion26,27,28. Desuden er mange af disse onkogene fusioner karakteriseret ved lav kompleksitet i sig selv uorden domæner10,13,29,30.

EWS-domænet er et eksempel på et sådant iboende uordnet domæne, der er involveret i en række onkogene fusioner10. Den iboende uordnede og gentagne karakter har hindret bestræbelserne på at forstå de molekylære mekanismer, der anvendes af EWS-domænet. Tidligere bestræbelser på at undersøge strukturfunktionen har i vid udstrækning tyet til at bruge forskellige mutanter i forbindelse med reporter genanalyser eller i celle baggrunde, der undlader at generobre den relevante cellulære sammenhæng, eller mangler strukturelle variationer, der producerer meningsfuld delvis funktion11,17,25. Den metode, der præsenteres her, behandler disse problemer. Strukturfunktionskortlægning udføres i en sygdomsrelevant cellekontekst, og næste generations sekventering gør det muligt for transskriptom profilering at evaluere transskriptionsfaktorfunktion i indstillingen af native chromatin. I det specifikke tilfælde af DAF mutant af EWS / FLI, DAF blev rapporteret at vise lidt aktivitet i reporter assays ved hjælp af isolerede respons elementer, men at vise aktivitet i forbindelse med den fulde gen promotor, enten i en reporter assay eller i hjemmehørende kromatin, hvilket tyder på en interessant fænotype23. Ved hjælp af den metode, der er beskrevet her mere direkte løser spørgsmålet om, hvilken type lovgivningsmæssige elementer på tværs af genomet er mest lydhøre i sygdomsindstillingen. Ved at teste alle kandidatmål gener i deres oprindelige kromatin sammenhæng samtidigt, en transskriptomisk tilgang er mere tilbøjelige til at identificere konstruktioner med delvis funktion.

Den iboende styrke ved at bruge en sygdomsrelevant cellebaggrund er måske den største begrænsning af denne teknik. En af de vigtigste faktorer er at vælge det relevante cellesystem til disse eksperimenter. Mange cellelinjer afledt af maligniteter med patognomoniske transskription faktorer ikke let tolerere knockdown af denne transskription faktor, og i mange tilfælde, især for pædiatriske kræftformer, den sande celle af oprindelse er stadig kontroversielt og udtryk for onkogen i andre celle baggrunde er uoverkommeligt giftige31,32 . I disse tilfælde kan det være nyttigt at udføre eksperimenter i en anden cellebaggrund, så længe forskeren udviser forsigtighed i fortolkningen af resultater og validerer passende alle relevante fund i en mere sygdomsrelevant celletype.

Det er af afgørende betydning omhyggeligt at validere stabiliteten og de fænotypiske konsekvenser af onkogenes udtryk og kun indsende prøver til sekventering, der opfylder strenge kriterier. Her omfattede dette western blot for at bekræfte knockdown og redning og qRT-PCR af et lille antal kendte målgener for at validere den positive kontrol (Figur 2). Det er ligeledes afgørende at reducere så meget batchvariation som muligt ved omhyggeligt at udføre cellen og RNA præparater så samme som muligt gennem hvert parti.

Den metode, der er beskrevet her, bliver særlig kraftfuld, når den kombineres med andre typer genomdata, der taler til genomom-dækkende funktion af transskription faktor under undersøgelse. Fremtidige retninger for denne type strukturfunktionsanalyse vil udvides til at omfatte ChIP-seq og ATAC-seq for at bestemme bindingen af transskriptionsfaktoren og eventuelle inducerede ændringer i kromatinstilgængeligheden. Som en suite kan denne type data pege på, hvor forskellige strukturelle komponenter i en onogen transskription faktor bidrager til forskellige aspekter af funktion (dvs. DNA-binding vs chromatin modifikation vs. co-regulator rekruttering). Samlet set kan brug af NGS-baserede tilgange til at kortlægge strukturfunktionsrelationerne mellem fusionstransskriptionsfaktorer afsløre ny indsigt i de biokemiske determinanter for disse proteiners onogene funktion. Dette er vigtigt for at fremme vores forståelse af de sygdomme, de forårsager, og for at muliggøre udviklingen af nye terapeutiske strategier.

Disclosures

SLL erklærer en interessekonflikt som medlem af det rådgivende udvalg for og en egenkapital indehaver af Salarius Pharmaceuticals. SLL er også en børsnoteret opfinder på United States Patents No. US 7,393,253 B2, "Metoder og kompositioner til diagnosticering og behandling af Ewing's Sarkom," og USA 8.557.532, "Diagnose og behandling af resistente Ewing's sarkom." Dette ændrer ikke vores overholdelse af JoVE's politikker om deling af data og materialer.

Acknowledgments

Denne forskning blev støttet af High Performance Computing Facility på Abigail Wexner Research Institute på Nationwide Children's Hospital. Dette arbejde blev støttet af National Institutes of Health National Cancer Institute [U54 CA231641 til SLL, R01 CA183776 til SLL]; Alex's Lemonade Stand Foundation [Young Investigator Award til ERT]; Pelotonia [Fællesskab til ERT]; og National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 til KIP].

Materials

Name Company Catalog Number Comments
Wet Lab Reagents
anti-FLI rabbit pAb Abcam ab15289 1:500
anti-lamin B1 rabbit pAb Abcam ab16048 1:2000
Cell-based system for introduction of mutant constructs Determined by cell system used
Cryotubes For viral aliquots
DMEM Corning Cellgro 10-013-CV For viral production
Fetal bovine serum Gibco 16000-044 For viral production
G418 ThermoFisher 10131027 For viral production
HEK293-EBNAs ATCC CRL-10852 For viral production
HEPES Gibco 15630106
Hygromycin B ThermoFisher 10687010
M2 anti-FLAG mouse mAb Sigma F3165 1:2000
Near IR-secondary antibodies Li-Cor
Optimem Gibco 31985062 For viral production
Penicillin/Streptomycin/Glutamine Gibco 10378-016 For viral production
Polybrene Sigma TR-1003-G For viral transduction
Puromycin Sigma P8833 Stored at 2 mg/mL stock
RNeasy Plus kit Qiagen 74136 Has gDNA removal columns
Selection reagents As dictated by cell system used
Sodium Pyruvate Gibco 11360-070 For viral production
Tissue culture media Determined by cell system used
TransIT-LT1 Mirus MIR 2304 For viral production
Software
Access to HPC environment
AnnotationDbi 1.38.2
Cairo 1.5-10
DESeq2 1.16.1
genefilter 1.58.1
ggbiplot 0.55
ggplot2 3.1.1
org.Hs.eg.db 3.4.1
pheatmap 1.0.12
PuTTY
R 3.4.0
RColorBrewer 1.1-2
reshape2 1.4.3
rgl 0.100.19
R-studio
STAR Version 2.6 or later
sva 3.24.4
TrimGalore!
WinSCP

DOWNLOAD MATERIALS LIST

References

  1. Miettinen, M., et al. New fusion sarcomas: histopathology and clinical significance of selected entities. Human Pathology. 86, 57-65 (2019).
  2. Knott, M. M. L., et al. Targeting the undruggable: exploiting neomorphic features of fusion oncoproteins in childhood sarcomas for innovative therapies. Cancer and Metastasis Reviews. 38, 625-642 (2019).
  3. Yoshihara, K., et al. The landscape and therapeutic relevance of cancer-associated transcript fusions. Oncogene. 34, 4845-4854 (2015).
  4. Duesberg, P. H. Cancer genes generated by rare chromosomal rearrangements rather than activation of oncogenes. Medical Oncology and Tumor Pharmacotherapy. 4, 163-175 (1987).
  5. Dupain, C., Harttrampf, A. C., Urbinati, G., Geoerger, B., Massaad-Massade, L. Relevance of Fusion Genes in Pediatric Cancers: Toward Precision Medicine. Molecular Therapy - Nucleic Acids. 6, 315-326 (2017).
  6. Mitelman, F., Johansson, B., Mertens, F. The impact of translocations and gene fusions on cancer causation. Nature Reviews Cancer. 7, 233-245 (2007).
  7. Smith, R., et al. Expression profiling of EWS/FLI identifies NKX2.2 as a critical target gene in Ewing's sarcoma. Cancer Cell. 9, 405-416 (2006).
  8. Davicioni, E., et al. Identification of a PAX-FKHR gene expression signature that defines molecular classes and determines the prognosis of alveolar rhabdomyosarcomas. Cancer Research. 66, 6936-6946 (2006).
  9. Gröbner, S. N., et al. The landscape of genomic alterations across childhood cancers. Nature. 555, 321-327 (2018).
  10. Kim, J., Pelletier, J. Molecular genetics of chromosome translocations involving EWS and related family members. Physiological Genomics. 1, 127-138 (1999).
  11. Boulay, G., et al. Cancer-Specific Retargeting of BAF Complexes by a Prion-like Domain. Cell. 171, 163-178 (2017).
  12. Lessnick, S. L., Braun, B. S., Denny, C. T., May, W. A. Multiple domains mediate transformation by the Ewing’s sarcoma EWS/FLI-1 fusion gene. Oncogene. 10, 423-431 (1995).
  13. Leach, B. I., et al. Leukemia fusion target AF9 is an intrinsically disordered transcriptional regulator that recruits multiple partners via coupled folding and binding. Structure. 21, 176-183 (2013).
  14. Ng, K. P., et al. Multiple aromatic side chains within a disordered structure are critical for transcription and transforming activity of EWS family oncoproteins. Proceedings of the National Academy of Sciences U.S.A. 104, 479-484 (2007).
  15. Riggi, N., et al. EWS-FLI1 Divergent Chromatin Remodeling Mechanisms to Directly Activate or Repress Enhancer Elements in Ewing Sarcoma. Cancer Cell. 26, 668-681 (2014).
  16. Tomazou, E. M., et al. Epigenome Mapping Reveals Distinct Modes of Gene Regulation and Widespread Enhancer Reprogramming by the Oncogenic Fusion Protein EWS-FLI1. Cell Reports. 10, 1082-1095 (2015).
  17. Sankar, S., et al. Mechanism and relevance of EWS/FLI-mediated transcriptional repression in Ewing sarcoma. Oncogene. 32, 5089-5100 (2013).
  18. Gangwal, K., et al. Microsatellites as EWS/FLI response elements in Ewing's sarcoma. Proceedings of the National Academy of Sciences U.S.A. 105, 10149-10154 (2008).
  19. Gangwal, K., Close, D., Enriquez, C. A., Hill, C. P., Lessnick, S. L. Emergent Properties of EWS/FLI Regulation via GGAA Microsatellites in Ewing's Sarcoma. Genes & Cancer. 1, 177-187 (2010).
  20. Guillon, N., et al. The Oncogenic EWS-FLI1 Protein Binds In Vivo GGAA Microsatellite Sequences with Potential Transcriptional Activation Function. PLoS One. 4, 4932 (2009).
  21. Chong, S., et al. Imaging dynamic and selective low-complexity domain interactions that control gene transcription. Science. 361, (2018).
  22. Johnson, K. M., et al. Role for the EWS domain of EWS/FLI in binding GGAA-microsatellites required for Ewing sarcoma anchorage independent growth. Proceedings of the National Academy of Sciences U.S.A. 114, 9870-9875 (2017).
  23. Theisen, E. R., et al. Transcriptomic analysis functionally maps the intrinsically disordered domain of EWS/FLI and reveals novel transcriptional dependencies for oncogenesis. Genes & Cancer. 10, 21-38 (2019).
  24. Chen, J., Bardes, E. E., Aronow, B. J., Jegga, A. G. ToppGene Suite for gene list enrichment analysis and candidate gene prioritization. Nucleic Acids Research. 37, 305-311 (2009).
  25. Johnson, K. M., Taslim, C., Saund, R. S., Lessnick, S. L. Identification of two types of GGAA-microsatellites and their roles in EWS/FLI binding and gene regulation in Ewing sarcoma. PLOS One. 12, 0186275 (2017).
  26. Kim, P., Ballester, L. Y., Zhao, Z. Domain retention in transcription factor fusion genes and its biological and clinical implications: a pan-cancer study. Oncotarget. 8, 110103-110117 (2017).
  27. de Mendíbil, I. O., Vizmanos, J. L., Novo, F. J. Signatures of Selection in Fusion Transcripts Resulting from Chromosomal Translocations in Human Cancer. PLOS One. 4, 4805 (2009).
  28. Frenkel-Morgenstern, M., Valencia, A. Novel domain combinations in proteins encoded by chimeric transcripts. Bioinformatics. 28, 67-74 (2012).
  29. Hegyi, H., Buday, L., Tompa, P. Intrinsic Structural Disorder Confers Cellular Viability on Oncogenic Fusion Proteins. PLoS Computational Biology. 5, 1000552 (2009).
  30. Latysheva, N. S., Babu, M. M. Discovering and understanding oncogenic gene fusions through data intensive computational approaches. Nucleic Acids Research. 44, 4487-4503 (2016).
  31. Deneen, B., Denny, C. T. Loss of p16 pathways stabilizes EWS/FLI1 expression and complements EWS/FLI1 mediated transformation. Oncogene. 20, 6731-6741 (2001).
  32. Kendall, G. C., et al. PAX3-FOXO1 transgenic zebrafish models identify HES3 as a mediator of rhabdomyosarcoma tumorigenesis. eLife. 7, 33800 (2018).

Tags

Kræftforskning Udgave 160 transcriptomics RNA-seq strukturfunktion transskriptionsfaktorer iboende uordnede domæner EWS/FLI Ewing sarkom genregulering
Kortlægning af strukturfunktionsforhold for uordnede onkogene transskriptionsfaktorer ved hjælp af transskriptomisk analyse
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Showpnil, I. A., Miller, K. R.,More

Showpnil, I. A., Miller, K. R., Taslim, C., Pishas, K. I., Lessnick, S. L., Theisen, E. R. Mapping the Structure-Function Relationships of Disordered Oncogenic Transcription Factors Using Transcriptomic Analysis. J. Vis. Exp. (160), e61564, doi:10.3791/61564 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter