Cancer Research

Het in kaart brengen van de structuur-functierelaties van ongeordende oncogene transcriptiefactoren met behulp van transcriptomische analyse

Published: June 27, 2020 doi: 10.3791/61564

Iftekhar A. Showpnil^1,2, Kyle R. Miller¹, Cenny Taslim¹, Kathleen I. Pishas¹, Stephen L. Lessnick^1,3, Emily R. Theisen^1,4

¹Center for Childhood Cancer and Blood Diseases, Abigail Wexner Research Institute at Nationwide Children's Hospital, ²Molecular, Cellular, and Developmental Biology Program, The Ohio State University, ³Division of Pediatric Hematology/Oncology/Blood & Marrow Transplant, The Ohio State University, ⁴Department of Pediatrics, The Ohio State University

Summary

Intrinsiek ongeordende domeinen zijn belangrijk voor de functie van de oncogene fusietranscriptiefactor. Om deze eiwitten therapeutisch te targeten, is een meer gedetailleerd begrip van de regulerende mechanismen die door deze domeinen worden gebruikt, vereist. Hier gebruiken we transcriptomics om belangrijke structurele kenmerken van het intrinsiek ongeordende EWS-domein in Ewing-sarcoom in kaart te brengen.

Abstract

Veel kankers worden gekenmerkt door chromosomale translocaties die resulteren in de expressie van oncogene fusietranscriptiefactoren. Typisch bevatten deze eiwitten een intrinsiek ongeordend domein (IDD) gefuseerd met het DNA-bindende domein (DBD) van een ander eiwit en orkestreren wijdverspreide transcriptionele veranderingen om maligniteit te bevorderen. Deze fusies zijn vaak de enige terugkerende genomische aberratie in de kankers die ze veroorzaken, waardoor ze aantrekkelijke therapeutische doelen zijn. Het richten op oncogene transcriptiefactoren vereist echter een beter begrip van de mechanistische rol die idd's met een lage complexiteit spelen in hun functie. Het N-terminale domein van EWSR1 is een IDD die betrokken is bij een verscheidenheid aan oncogene fusietranscriptiefactoren, waaronder EWS / FLI, EWS / ATF en EWS / WT1. Hier gebruiken we RNA-sequencing om de structurele kenmerken van het EWS-domein te onderzoeken die belangrijk zijn voor de transcriptionele functie van EWS / FLI in Ewing-sarcoom. Eerst wordt shRNA-gemedieerde uitputting van de endogene fusie van Ewing-sarcoomcellen in combinatie met ectopische expressie van een verscheidenheid aan EWS-mutante constructen uitgevoerd. Vervolgens wordt RNA-sequencing gebruikt om de transcriptomen van cellen die deze constructen tot expressie brengen te analyseren om de functionele tekorten geassocieerd met mutaties in het EWS-domein te karakteriseren. Door de transcriptomische analyses te integreren met eerder gepubliceerde informatie over EWS / FLI DNA-bindingsmotieven en genomische lokalisatie, evenals functionele testen voor het transformeren van vermogen, waren we in staat om structurele kenmerken van EWS / FLI te identificeren die belangrijk zijn voor oncogenese en een nieuwe set EWS / FLI-doelgenen te definiëren die cruciaal zijn voor Ewing-sarcoom. Dit artikel demonstreert het gebruik van RNA-sequencing als een methode om de structuur-functierelatie van het intrinsiek ongeordende domein van oncogene transcriptiefactoren in kaart te brengen.

Introduction

Een subset van kankers, waaronder veel maligniteiten van de kindertijd en adolescentie, worden gekenmerkt door chromosomale translocaties die nieuwe fusie-oncogenen genereren^1,^2,^3,^4,^5,⁶. De resulterende fusie-eiwitten functioneren vaak als oncogene transcriptiefactoren en orkestreren wijdverspreide veranderingen in transcriptionele regulatie om tumorigenese te bevorderen^7,⁸. Kankers met deze translocaties bezitten gewoonlijk een verder rustig mutatielandschap, met weinig terugkerende genomische aberraties afgezien van de pathognomonische fusie⁴^,⁹. Als zodanig is het direct richten op het fusie-eiwit een aantrekkelijke therapeutische strategie bij deze ziekten. Deze oncogene transcriptiefactoren bestaan echter vaak uit een laagcomplex, intrinsiek ongeordend, transcriptioneel activerend domein gefuseerd met een DNA-bindend domein (DBD)^10,^11,^12,^13,¹⁴. Zowel de intrinsiek ongeordende domeinen (IDD's) als DBD's van deze eiwitten zijn moeilijk te targeten gebleken met conventionele farmacologische benaderingen. De ontwikkeling van nieuwe therapeutische benaderingen vereist daarom een meer gedetailleerd moleculair begrip van de mechanismen die door deze fusies worden gebruikt om genexpressie op afwijkende wijze te reguleren.

Het N-terminale IDD-gedeelte van EWSR1 wordt vaak gefuseerd met een DBD bij kanker, waaronder EWS / FLI in Ewing-sarcoom, EWS / WT1 in diffuse kleine ronde celtumor en EWS / ATF1 in heldercellig sarcoom van zachte delen¹⁰. De mechanistische rol van de EWS IDD in elk van deze fusies is onvolledig begrepen. De EWS/ETS-familie van fusies, met name EWS/FLI, is de meest functioneel gekarakteriseerde tot nu toe. EWS/FLI coördineert genoombrede epigenetische en transcriptionele veranderingen die leiden tot de activering en onderdrukking van duizenden genen^7,^11,^15,^16. Studies hebben aangetoond dat de IDD belangrijk is voor de rekrutering van zowel transcriptionele co-activatoren (zoals p300, WDR5 en het BAF-complex), als co-onderdrukkers (zoals het NuRD-complex)^11,^15,¹⁷. De fusie van de EWS IDD met het C-terminale deel van FLI1 verleent nieuwe DNA-bindende specificiteit aan de ETS DBD van FLI1, zodanig dat de fusie oncoproteïne (EWS / FLI) bindt aan repetitieve GGAA-microsatellietgebieden van het genoom naast het consensus ETS-motief¹⁸^,¹⁹^,²⁰. In combinatie met de co-activator rekruteringsfunctie bevordert deze emergente DNA-bindende activiteit van EWS /FLI de novo enhancervorming op GGAA-microsatellieten distale naar transcriptiestartplaatsen (TSS) ("enhancer-achtige" microsatellieten) en rekruteert RNA-polymerase II om transcriptie te bevorderen bij GGAA-microsatellieten proximaal aan TSS ("promotor-achtige" microsatellieten)^11,^15,^16,²¹.

Alles bij elkaar hebben deze gegevens ons ertoe gebracht te veronderstellen dat discrete elementen binnen het EWS-domein bijdragen aan de werving van verschillende co-regulatoren voor verschillende soorten EWS / FLI-bindingssites. Het onderscheiden van deze elementen binnen het EWS-gedeelte van EWS/FLI, en hoe ze functioneren, is echter belemmerd door de zeer repetitieve en ongeordende aard van het domein. Hier gebruiken we een eerder gepubliceerd knockdown-rescue-systeem in Ewing-sarcoomcellen om deze elementen functioneel in kaart te brengen in de EWS IDD. In dit systeem wordt EWS/FLI uitgeput met behulp van een shRNA gericht op de 3'UTR van het FLI1 gen, en expressie wordt gered met verschillende EWS/FLI mutante cDNA constructen zonder de 3'UTR⁷^,¹⁷^,²². Deze experimenten richtten zich op constructies met verschillende deleties om de structuur-functierelatie tussen de EWS IDD en belangrijke oncogene fenotypes in kaart te brengen, waaronder activering van een GGAA-microsatelliet reporter construct, kolonievormingstests en gerichte validatie van EWS / FLI-geactiveerde en -onderdrukte genen^7,^17,²² . Deze studies slaagden er echter niet in om afzonderlijke subdomeinen binnen de EWS IDD in EWS / FLI te vinden die uniek belangrijk zijn voor activering of repressie. Alle geteste constructies waren ofwel in staat om specifieke doelgenen te activeren en te onderdrukken, wat leidde tot efficiënte kolonievorming, of niet in staat om een van de EWS / FLI-doelgenen te reguleren, wat leidde tot verlies van kolonievorming^7,^17,²².

Transcriptomische analyses die mogelijk worden gemaakt door de wijdverspreide toepassing van de volgende generatie sequencing worden vaak gebruikt om genexpressiehandtekeningen in twee omstandigheden te vergelijken, vaak in de context van screening of beschrijvende studies. In plaats daarvan wilden we gebruik maken van de mogelijkheid om genoombrede expressiegegevens vast te leggen met behulp van RNA-sequencing (RNA-seq) om de bijdragen van IDD's aan de transcriptiefactorfunctie te karakteriseren. In dit geval wordt RNA-seq gekoppeld aan het knockdown-rescue-systeem om de structuur-functierelatie van het EWS-domein te onderzoeken. Deze benadering is van toepassing op andere fusietranscriptiefactoren, waaronder andere EWS-fusies of wildtype-transcriptiefactoren met een slecht begrepen functie, en heeft meerdere voordelen ten opzichte van de andere assays die worden gebruikt voor functionele mappingstudies, zoals reporter-assays of gerichte qRT-PCR. Deze omvatten het testen van structurele determinanten van functie in de relevante chromatinecontext, het vermogen om meerdere soorten responselementen in één test te testen (d.w.z. geactiveerd en onderdrukt, GGAA-microsatelliet en niet-microsatelliet, enz.), En het resulterende vermogen om gedeeltelijke functie beter te detecteren.

Succesvolle implementatie van deze aanpak hangt af van een celgebaseerd systeem dat de fenotypen van belang vastlegt (in dit geval A673-cellen met shRNA-gemedieerde EWS / FLI-depletie) en een panel van mutante constructen in een expressievector die geschikt is voor het celgebaseerde systeem (in dit geval pMSCV-hygro met verschillende 3x-FLAG-gelabelde EWS / FLI-mutanten die moeten worden afgeleverd door retrovirale transductie). Virale transductie van crispr-gebaseerde depletieconstructies, shRNA-gebaseerde depletieconstructies en cDNA-expressieconstructies met de juiste selectie om stabiele cellijnen te genereren, wordt aanbevolen boven voorbijgaande transfectie. De downstream-interpretatie van resultaten wordt versterkt wanneer de transcriptomische gegevens kunnen worden gecombineerd met andere gegevens met betrekking tot lokalisatie van de transcriptiefactor en andere fenotypische uitlezingen waar beschikbaar.

In dit artikel passen we deze benadering toe om de activiteit van de DAF-mutant van EWS/FLI¹⁴te karakteriseren. De DAF-mutant heeft 17 tyrosine- tot alaninemutaties in de repetitieve gebieden van de EWS IDD van EWS/FLI¹⁴. Deze specifieke EWS-mutant was eerder gemeld en is niet in staat om reporter-genexpressie te activeren wanneer deze is gefuseerd met de ATF1 DBD¹⁴. Voorlopige qRT-PCR-gegevens suggereerden echter dat deze mutant in staat was om transcriptie van het EWS / FLI-doel NR0B1²³te activeren. De transcriptomische benadering die hier wordt beschreven, maakte een succesvolle detectie van de partiële functie van de DAF-mutant mogelijk. Door deze transcriptomische gegevens te koppelen aan informatie over EWS/FLI bindings- en herkenningsmotieven laten we verder zien dat de DAF mutant functie behoudt bij GGAA-microsatelliet repeats. Deze resultaten identificeren DAF als de eerste gedeeltelijk functionele EWS/FLI-mutant en benadrukken de functie bij niet-microsatellietgenenen als belangrijk voor oncogenese (zoals gerapporteerd^23). Dit toont de kracht aan van deze transcriptomische structuur-functie mapping benadering om inzicht te geven in de functie van oncogene transcriptiefactoren.

Protocol

1. Opzetten van in vitro panel van constructen

OPMERKING: Deze stap is afhankelijk van het specifieke eiwit dat moet worden geanalyseerd.

Bereid aliquots van virus voor uitputting en expressieconstructies indien nodig.
1. Zaai een 10 cm weefselkweekschaal met 3-5 x 10⁶ HEK293-EBNA- of HEK293T-cellen voor elk construct dat nodig is voor virale transductie. Laat cellen zich 's nachts hechten in Dulbecco's Modified Eagle Media (DMEM) aangevuld met 10% foetaal runderserum (FBS), penicilline / streptomycine / glutamine (P / S / Q) en 0,3 mg / ml G418.
  OPMERKING: HEK293-EBNA- en HEK293T-cellen worden aanbevolen voor virale productie omdat ze gemakkelijk te kweken zijn, een hoge transfectie-efficiëntie hebben en efficiënt recombinante eiwitten uit episomale plasmiden tot expressie brengen. De cellen moeten tussen 50-70% confluent zijn op de dag van transfectie.
2. Bereid een transfectiemix voor elk viraal transductieconstruct. Combineer 2 ml gereduceerde serummedia met 90 μl transfectiereagens.
  OPMERKING: Voorverwarmende gereduceerde serummedia wordt aanbevolen.
3. Voeg 10 μg elk van een virale verpakkingsplasmide (bijv. gag-pol), virale envelopplasmide (bijv. VSV-G) en een van crispr-gebaseerde depletie, shRNA-gebaseerde depletie of cDNA-expressieconstructie (bijv. pMKO of pMSCV) toe aan de transfectiemix. Meng goed door zachtjes te pipetteren.
4. Laat het transfectiemengsel 20 minuten op kamertemperatuur staan. Verwijder HEK293-EBNA groeimedia uit weefselkweekschalen en voeg 3 ml DMEM toe aangevuld met 10% FBS, P/S/Q en 10 mM natriumpyruvaat. Voeg aan elk gerecht 2 ml transfectiemix druppelsgewijs toe. Laat cellen een nacht in transfectiemedia zitten in een incubator bij 37 °C en 5% CO₂.
5. Voeg de volgende ochtend 20 ml DMEM-media toe met 10% FBS, P / S / Q-suppletie en 10 mM natriumpyruvaat. Incubeer de cellen erin bij 37 °C en 5% CO₂ voor een nacht.
6. Vervang de volgende ochtend media door 5 ml virale verzamelingsmedia (VCM) (DMEM aangevuld met 10% warmte-geïnactiveerde FBS, P / S / Q en 20 mM HEPES).
7. Verzamel na 4 uur VCM van platen en bewaar in een conische buis van 50 ml op ijs bij 4 °C. Vervang door 5 ml verse VCM.
8. Verzamel na 4 uur VCM van platen in dezelfde conische buis van 50 ml en bewaar op ijs bij 4 °C. Vervang door 8 ml verse VCM voor 's nachts verzamelen.
9. Verzamel 's ochtends VCM van platen en bewaar in de conische buis van 50 ml op ijs bij 4 °C. Vervang door 5 ml verse VCM.
10. Na 4 uur, verzamel VCM van platen en bewaar in de 50 ml conische buis op ijs bij 4 °C. Vervang door 5 ml verse VCM. Verzamel na 4 uur VCM van platen en voeg toe aan de conische buis van 50 ml.
11. Aliquot verzamelt van 50 ml buis in cryobuizen (2 ml per aliquot) na filtratie door een filter van 0,45 μm. Bewaar virale aliquots bij -80 °C tot gebruik.
  OPMERKING: Het protocol kan hier worden gepauzeerd en de virale aliquots kunnen worden opgeslagen totdat ze klaar zijn voor gebruik.
Zaadcellen met de juiste dichtheid in een weefselkweekschaal van 10 cm. Streef naar 50% samenvloeiing. Laat cellen zich een nacht hechten door ze in de couveuse bij 37 °C te plaatsen met 5% CO₂.
OPMERKING: Voor A673-cellen is dit 5 x 10⁶ cellen in 10 ml DMEM-media met 10% FBS, P / S / Q-suppletie en 10 mM natriumpyruvaat. Deze omstandigheden kunnen variëren afhankelijk van de groeisnelheid van de gebruikte cellen.
Endogene factor van belang uitputten. Als cellen het endogene eiwit van belang niet hoeven te hebben uitgeput, ga dan verder met stap 1.4.
1. Ontdooi virale aliquot voor transductie van shRNA of CRISPR-construct gericht op het eiwit van belang. Ontdooi bevroren aliquots snel in een waterbad van 37 °C.
2. Voeg 2,5 μL 8 mg/ml polybrenet toe aan elke virale aliquot en meng door zachtjes te pipetteren. Verwijder media van platen van cellen en voeg voorzichtig virale aliquot toe aan de plaat van 10 cm door langs de zijkant van de plaat te pipetteren. Rock de plaat om de 2 ml virale aliquot te verspreiden.
3. Incubeer bij 37 °C in de weefselkweekincubator gedurende 2 uur. Rock de plaat elke 30 minuten om te voorkomen dat delen van de plaat uitdrogen.
4. Voeg 5 ml DMEM-media toe met 10% FBS, P/S/Q-suppletie en 10 mM natriumpyruvaat, met 5 μL 8 mg/ml polybreen. Laat cellen een nacht incuberen.
5. Verwijder 's ochtends media uit cellen en passeer cellen in media aangevuld met een selectiereagens. Bij het passeren van cellen, zaai ze op een manier zodat ze 48-72 uur kunnen groeien en 50% confluentie bereiken.
  OPMERKING: Voor A673-cellen met pSRP-iEF-2 worden cellen gezaaid in een 1:5-verdeling en geselecteerd voor 72 uur met 2 μg / ml puromycine.
Transduceer cDNA-expressieconstructen.
1. Controleer cellen om 50-70% confluentie te bevestigen.
2. Ontdooi virale aliquot(s) voor transductie van cDNA-construct(en) van belang. Ontdooi bevroren aliquots snel in een waterbad van 37 °C. Voeg 2,5 μL 8 mg/ml polybrenet toe aan elke virale aliquot en meng door voorzichtig te pipetteren.
3. Verwijder de media uit vergulde cellen en voeg voorzichtig virale aliquot toe aan de plaat van 10 cm door langs de zijkant van de plaat te pipetteren. Rock de plaat om de 2 ml virale aliquot te verspreiden.
4. Incubeer bij 37 °C in de weefselkweekincubator gedurende 2 uur. Rock de plaat elke 30 minuten om te voorkomen dat delen van de plaat uitdrogen.
5. Voeg 5 ml DMEM-media toe met 10% FBS, P/S/Q-suppletie en 10 mM natriumpyruvaat, met 5 μL 8 mg/ml polybreen. Laat cellen een nacht incuberen.
6. Verwijder 's ochtends media uit cellen en passeer cellen naar dubbele selectiemedia. Groei en passeer cellen indien nodig gedurende 7-10 dagen om dubbele selectie en expressie van het cDNA-construct mogelijk te maken.
  OPMERKING: Deze splitsing van deze passage kan optimalisatie vereisen voor verschillende cellijnen. Voor A673-cellen met pSRP-iEF-2 en een pMSCV-hygro-construct worden cellen doorgegeven zonder te splitsen in 2 μg / ml puromycine en 100 μg / ml hygromycine.

2. Verzamel cellen, valideer expressie van constructen en stel correlatieve fenotypische assays in

Na 7-10 dagen dubbele selectie verzamelen cellen in een conische buis van 15 ml. Tel verzamelde cellen met een hemocytometer. Aliquot verzamelde cellen voor RNA-sequencing en om expressie van cDNA-constructen te valideren.
OPMERKING: Stel alle correlatieve fenotypische assays op die vereist zijn voor de onderzochte onderzoeksvraag. Kolonievormende assays zijn een voorbeeld van een correlatieve fenotypische assay die hier worden gebruikt.
1. Verzamel tussen 5 x 10⁵ en 1 x 10⁶ cellen voor RNA-sequencing en 2 x 10⁶ cellen voor eiwitextractie. Pelletcellen door centrifugering bij 1.000 x g bij 4 °C gedurende 5 minuten en verwijder het supernatant.
2. Was de pellet met 1 ml koude PBS. Pellet door centrifugeren bij 1.000 x g bij 4 °C gedurende 5 minuten en verwijder supernatant. Flash vries pellets in vloeibare stikstof en bewaar bij -80 °C.
3. Stel eventuele correlatieve assays in met de resterende cellen.
  OPMERKING: Het protocol kan hier worden gepauzeerd met verzamelde monsters die zijn opgeslagen in de vriezer van -80 °C.
Valideer de knockdown van eiwit van belang (indien gebruikt) en expressie van het paneel van constructen.
1. Ontdooi celkorrels voor eiwitextractie op ijs. Resuspend cellen in ijskoude 500 μL nucleaire extractiebuffer (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glycerol, 1,5 mM MgCl_2,1 mM EDTA, 1 mM DTT, 1% IGEPAL) met proteaseremmer. Laat het 5 minuten op ijs staan.
2. Pelletkernen door centrifugeren bij 1.000 x g bij 4 °C gedurende 5 minuten en verwijder het supernatant. Waskernen in 500 μL ijskoude nucleaire extractiebuffer (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glycerol, 1,5 mM MgCl_2,1 mM EDTA, 1 mM DTT, 1% IGEPAL) met proteaseremmer.
3. Pelletkernen door centrifugeren bij 1.000 x g bij 4 °C gedurende 5 minuten en verwijder het supernatant. Resuspend kernen in 200 μL koude RIPA-buffer met proteaseremmer (pas het volume van de RIPA-buffer aan volgens de grootte van de pellet.) Laat het 45-60 minuten op ijs zitten met krachtige vortexing om de 15 minuten.
4. Pelletcelresten door centrifugeren bij 16.000 x g bij 4 °C gedurende 45-60 min. Bewaar het supernatant en breng het over op een verse koude buis
5. Bereid monsters voor SDS-PAGE elektroforese door 5-10 μg eiwit te koken met 1x laadbuffer gedurende 5 minuten. Voer een SDS-PAGE-gel uit zoals vereist voor het eiwit van belang.
6. Breng over naar een nitrocellulose- of PVDF-membraan als dat nodig is voor het eiwit van belang. Blok en dep met de juiste primaire en secundaire antilichamen om de knockdown van het endogene eiwit (indien gebruikt) en ectopische expressie van het cDNA-construct te bevestigen.
  OPMERKING: Het protocol kan hier worden gepauzeerd.
Extract RNA. Beoordeel de kwaliteit en kwantiteit van RNA.
1. Ontdooi celkorrels op ijs. Extraheer totaal RNA met behulp van een silica spin-kolom gebaseerde extractie kit volgens de instructies van de fabrikant.
2. Lyseer de cellen kort met behulp van de lysisbuffer uit de kit. Breng het lysaat aan op een silica spin-kolom met een korte spin bij >13000 tpm gedurende 30-60 seconden of verwijder gDNA door het lysaat aan te brengen op een gDNA-verwijderingskolom met een korte spin bij >13000 tpm gedurende 30-60 seconden.
3. Voer een DNA-vertering op de kolom uit als lysaat rechtstreeks op een silica-spinkolom is aangebracht. Als u een gDNA-verwijderingskolom gebruikt, brengt u het eluaat aan op een silica-spinkolom met een korte spin bij >13000 tpm gedurende 30-60 s.
4. Was RNA op de kolom volgens de instructies van de fabrikant. Eluut RNA in 30 μL elutiebuffer.
5. Beoordeel de kwaliteit en kwantiteit van RNA met behulp van een fluorometer of een ander vergelijkbaar instrument. Zorg ervoor dat de 260/280-verhouding dicht bij 2 ligt en dat er ten minste 2,5 μg RNA moet worden ingediend voor sequencing.
  OPMERKING: Wanneer replicaties worden verzameld, moet elke replicaat worden verwerkt met hetzelfde RNA-extractieprotocol.
6. Gebruik een kleine hoeveelheid RNA om de stabiele knockdown van het eiwit van belang te bevestigen, indien nodig, door qRT-PCR. Bewaar het resterende RNA-monster bij -80 °C.
7. Verzamel biologische replicaties door stap 1-2 te herhalen totdat 3-4 volledige sets RNA zijn verzameld. Zorg ervoor dat elke replicatie voldoende expressie van cDNA-constructies en stabiele knockdown van het endogene eiwit (indien gebruikt) vertoont.

3. Sequencing van de volgende generatie

Dien geëxtraheerd RNA in om te worden gesequenced met behulp van een next generation sequencing platform met een doel van 50 miljoen 150 basenpaar (bp) gepaarde eindlezingen. Volg de instructies van de faciliteit die de monsters verwerkt. Selecteer voor poly-gedenyleerde RNA's en strengspecifieke sequencing.

4. Pijplijn voor uitlijning en transcripttelling

OPMERKING: Dit protocol gaat ervan uit dat na het indienen en verwerken van voorbeelden een set gekoppelde FASTQ-bestanden wordt geretourneerd voor elk monster. Deze bestanden worden vaak gecomprimeerd met het achtervoegsel "fastq.gz". Verdere analyse van deze FASTQ-bestanden vereist toegang tot een high-performance computing (HPC) -faciliteit met een Linux-besturingssysteem.

Bestanden overbrengen
1. Open een terminal naar de HPC-omgeving met PuTTY. Maak een map voor de analyse genaamd "project".
2. Navigeer naar de map "path_to/project" en maak een nieuwe map voor de gecomprimeerde raw fastq.gz bestanden genaamd "fastq". Maak ook een map genaamd "bijgesneden". Dit is weergegeven in figuur S1A-C.
3. Breng de gecomprimeerde raw fastq.gz bestanden over van lokale opslag naar de map "path_to/project/fastq/" met WinSCP of een vergelijkbaar programma. Controleer of er een "R1" en een "R2" bestand is voor elk monster zoals weergegeven in Figuur S1B.
4. Optioneel: Installeer indien nodig TrimGalore. Stel de map met het uitvoerbare bestand trim_galore in de omgevingsvariabele PATH in Linux in.
  OPMERKING: Leesbewerkingen en adapters van lage kwaliteit worden bijgesneden met TrimGalore. TrimGalore is verkrijgbaar bij https://github.com/FelixKrueger/TrimGalore.
5. Optioneel: Navigeer naar de map voor gedownloade softwarepakketten (d.w.z. "path_to/software"). Download het nieuwste TrimGalore-pakket met de opdracht "curl -fsSL https://github.com/FelixKrueger/TrimGalore/archive/[version].tar.gz -o trim_galore-[version].tar.gz."
6. Optioneel: Pak het tar.gz bestand uit. Gebruik het commando "tar -xvzf trim_galore-[version_number].tar.gz".
7. Optioneel: TrimGalore uitvoerbaar maken. Gebruik het commando "chmod a+x path_to/software/TrimGalore-[version]/trim_galore". Zorg ervoor dat deze nieuwe map zich in path bevindt. Gebruik het commando "export PATH=path_to/software/TrimGalore-[version]:$PATH".
8. Navigeer naar path_to/project/fastq/. Gebruik TrimGalore om de leesbewerkingen van lage kwaliteit van de fastq.gz bestanden bij te snijden met behulp van de opdracht die wordt weergegeven in Figuur S1C.
  OPMERKING: Extra vlaggen voor deze opdracht kunnen relevant zijn en zijn hier te vinden: https://github.com/FelixKrueger/TrimGalore/blob/master/Docs/
  Trim_Galore_User_Guide.md
9. Controleer op de bijgesneden fastq.gz bestanden in de map path_to/project/trimmed. Zorg ervoor dat ze sample1_R1_val_1.fq.gz en sample1_R2_val_2.fq worden genoemd.gz
Lijn bijgesneden FASTQ-bestanden uit met STAR en genereer transcripttellingen.
OPMERKING: STAR is beschikbaar op https://github.com/alexdobin/STAR)
1. Optioneel: Installeer STAR versie 2.6 of hoger. Stel het uitvoerbare STAR-bestand in het pad in.
2. Optioneel: Navigeer naar de map voor gedownloade softwarepakketten (d.w.z. "path_to/software").
3. Optioneel: Download het STAR-pakket met het commando "curl -SLO https://github.com/alexdobin/STAR/archive/[version].tar.gz". Pak het tar.gz bestand uit.
4. Optioneel: Gebruik het commando "tar -xzf [version].tar.gz". Maak STAR uitvoerbaar. Gebruik het commando "chmod a+x path_to/software/STAR-[version]/bin".
5. Optioneel: Zorg ervoor dat deze nieuwe map zich in het pad bevindt. Gebruik het commando "export PATH=path_to/software/STAR-[version_number]/bin/linux_x86_64_static:$PATH".
  OPMERKING: De STAR-handleiding is beschikbaar op: (https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf).
6. Zorg ervoor dat er een genoomindex is om te gebruiken met STAR. Plaats dit in een map die losstaat van de map path_to/project/. Als er eerder een index is gegenereerd voor eerdere experimenten, gebruik dat dan. U kunt ook een geschikte vooraf gegenereerde index gebruiken, indien hier beschikbaar: http://refgenomes.databio.org/. Maak anders een nieuwe index met het commando "STAR--runMode genomeGenerate" met behulp van de instructies in de STAR-handleiding.
  OPMERKING: Voor de rest van dit protocol wordt het pad naar de STAR-index aangeduid als "path_to/STAR_index".
7. Navigeer naar de map path_to/project/. Maak een nieuwe map met de naam "STAR_output" zoals weergegeven in Figuur S1D.
8. Navigeer naar de map path_to/project/trimmed/. Gebruik de opdracht in Figuur S1D om STAR uit te voeren om de bijgesneden fastq.gz bestanden uit te lijnen.
  OPMERKING: Deze stap is het meest rekenintensief en het wordt aanbevolen om dit uit te voeren op een HPC-cluster met meerdere threads (d.w.z. >16) die zijn aangewezen voor de taak van uitlijning. Afhankelijk van het aantal monsters en beschikbare rekenkracht kan deze stap vele uren tot dagen duren.
9. Zoek de vereiste uitvoer voor de volgende stappen die de tellingen per transcript bevatten op de volgende locatie: path_to/project/STAR_output/sampleN_ReadsPerGene.out.tab.
  OPMERKING: In het bestand ReadsPerGene.out.tab bevat kolom 1 informatie over de functie die wordt geteld. Kolom 2 bevat de ongestrande leestellingen, kolom 3 bevat de vooruitgestrande leestellingen en kolom 4 bevat de omgekeerde gestrande leestellingen. De eerste vier rijen van dit bestand bevatten informatie over de uitgelijnde reads die niet zijn uitgelijnd op een enkel gen. Dit protocol vereist de ongestrande leestellingen.
10. Gebruik RStudio (bij voorkeur) of R in de HPC-omgeving om de gegevens uit rij 5 en lager voor de kolommen 1 en 2 voor elk monster te compileren. Stel de werkmap in op "project" in R.
11. Lees in elk bestand ReadsPerGene.out.tab met de opdracht in Figuur S2A. Neem voor de eerste kolom alleen de tekens vóór de "." in de kolom "Ensembl-gen-ID" voor het gemak van downstream-verwerking.
12. Compileer tellingen van alle voorbeelden in een dataframe genaamd "totcts" met behulp van de opdrachten in Figuur S2B. Sla deze nieuwe tabel met onbewerkte telgegevens op als een door tabs gescheiden .txt bestand, d.w.z. sample_counts.txt, indien gewenst, met de opdracht "write.table".
  OPMERKING: De volgorde van de Ensembl-gen-ID is hetzelfde voor elk ReadsPerGene.out.tab-bestand in verschillende monsters.

5. Differentiële expressie en downstream analyse

Normaliseer voor batcheffecten tussen monsters met ComBat.
OPMERKING: Er zijn twee mogelijke variabelen die veranderingen in genexpressie verklaren, de eerste is het gebruikte construct (d.w.z. het monster) en de tweede zijn externe factoren die verband houden met de passage van cellen door de tijd (d.w.z. de batch). Een stap om monsters te normaliseren voor batch-naar-batch variatie met het R-pakket ComBat wordt aanbevolen.
1. Installeer indien nodig en laad de bibliotheken voor sva, DESeq2, AnnotationDBI, org. Hs.eg.db, pheatmap, RColorBrewer, genefilter, Cairo, ggplot2, ggbiplot, rgl en reshape2 zoals weergegeven in Figuur S2C. Gebruik voor de installatie de opdracht "install.packages" of Bioconductor volgens de documentatie voor elk pakket.
2. Filter eerst de gegevens alleen op die genen die ten minste één telling per lezing hebben. Sla deze nieuwe tabel op om filtering aan te geven zoals te zien in Figuur S2D.
  OPMERKING: Vaak hebben veel genen een zeer laag of geen aantal afleeswaarden.
3. Bereid een tweede tabel voor batchnormalisatie voor met de naam "vars" zoals weergegeven in figuur S2E. Stel de rijnamen in op de unieke namen van elk voorbeeld. Stel de kolomnamen in op "sample", "batch" en "construct".
4. Wijs alle monsters een uniek nummer toe in de kolom "monster" van 1 tot n, waarbij n het aantal monsters is. Wijs batchnummers toe aan alle monsters in de kolom "batch", zodat conditie-a_1 en conditie-b_1 beide 1 krijgen toegewezen en condition-a_2 en condition-b_2 beide 2 krijgen toegewezen. Wijs alle conditieaanduidingen toe aan alle monsters in de kolom "construct", zodat conditie-a-monsters alle "A" en conditie-b-monsters allemaal "B" zijn.
5. Definieer ook de batchvariabele en een specifieke nulmodelmatrix voor ComBat zoals weergegeven in Figuur S2F. Voer ComBat uit met de opdracht die is gedefinieerd in Figuur S2F.
Beheer de gegevens verder door af te ronden op het dichtstbijzijnde gehele getal. Verwijder ook genen met een negatieve waarde. Gebruik de opdrachten in Figuur S3A.
OPMERKING: De uitvoer van batchnormalisatie heeft niet-integere leestellingen en sommige genen met negatieve waarden. Deze stap is vereist omdat de stroomafwaartse differentiële expressieanalyse geen negatieve leestellingen ondersteunt.
Definieer het differentiële expressieprofiel voor elke constructie met BEHULP VAN DESeq2.
1. Voer het experimentontwerp voor DESeq2 in zoals weergegeven in figuur S3B. Bouw een DESeqDataSet (dds) met de functie DESeqDataSetFromMatrix, schat de groottefactoren en voer DESEq2 uit, zoals weergegeven in Figuur S3B.
  OPMERKING: Het is absoluut noodzakelijk dat de kolomgegevens die zijn ingevoerd voor "voorwaarde" in dezelfde volgorde staan als de kolom in de telmatrix.
2. Om de kwaliteit van de analyse te evalueren, extraheert u de rlog-genormaliseerde tellingen die door DESeq2 worden gebruikt, zoals weergegeven in figuur S3B.
  OPMERKING: Tijdens de analyse transformeert DESeq2 tellingen met een "geregulariseerd logboek", rlog, transformatie om de monster-naar-monsterverschillen voor genen met lage tellingen (lage informatie) te verkleinen om verschillen in genen met hogere tellingen in monsters (hoge informatie) te behouden.
3. Wanneer u de resultaten voor elk transcriptioneel profiel uit de resultaten van DESeq2 haalt, voert u paarsgewijze vergelijkingen uit met betrekking tot de knockdown-toestand of de lege basislijnvector zoals weergegeven in figuur S3C. Wijzig deze resultaten verder met de HGNC-gensymbolen zoals weergegeven in figuur S3D.
4. Zoals te zien is in figuur S3E,extraheer gegevens uit DESeq2-resultaten. Exporteer als één bestand met de Ensembl-gen-ID, het HGNC-symbool, de basisgemiddelde-expressie en differentiële expressiegegevens voor alle constructen met log2FoldChange en onbewerkte en aangepaste p-waarden.
  OPMERKING: Het gebruik van een aangepaste p-waarde < 0,05 is de aanbevolen afbakening voor differentiële expressie.
5. Beoordeel succesvolle batchnormalisatie en gelijkenis binnen het monster. Controleer monsterclustering met PCA en sample-to-sample afstandsdiagrammen met behulp van de rlog genormaliseerde tellingen met behulp van de code in figuren S4A-B.
Gebruik de differentiële expressieprofielen om vulkaanplots te genereren met behulp van de code in figuur S4C. Evalueer veranderingen in genexpressie in verschillende constructen.
Gebruik de rlog genormaliseerde tellingen en hiërarchische clustering om genhandtekeningen te identificeren die uniek zijn voor de verschillende constructen. Gebruik de code die wordt weergegeven in Figuur S4D.
1. Extraheer de 1000 meest variabele genen in alle constructen in een matrix. Gebruik pheatmap om zonder toezicht hiërarchische clustering van uw monsters uit te voeren op basis van deze genen.
2. Haal de belangengroepen uit het dendrogram door te beslissen op welk niveau van de dendrogram-interesseclusters verschijnen. Stel "k" gelijk aan het aantal clusters op dat niveau. Plaats de heatmap per cluster opnieuw om te bepalen welke clusters van belang zijn, zoals weergegeven in figuur S5.
3. Exporteer de lijst met genen die aan elk cluster zijn gekoppeld, zoals aangegeven in tabel S1. Gebruik deze informatie om de genen in interesseclusters te bepalen.
Identificeer de biologische rollen voor verschillende clusters van geïdentificeerde genen en vergelijk tussen de klassen. Dit kan worden uitgevoerd met behulp van een verscheidenheid aan bioinformatica-tools. ToppGene²⁴ wordt hier gebruikt en is gratis online beschikbaar.
OPMERKING: Er zijn veel gratis tools die slechts een lijst met genen vereisen om te kopiëren en plakken in een veld op een website. Kies de analytische hulpmiddelen die het meest geschikt zijn voor de onderzochte onderzoeksvragen.
Optioneel, als er gegevens beschikbaar zijn over genomische binding die transcriptionele output voor transcriptiefactor van belang aandrijft, vergelijk dan de transcriptionele respons op genen geassocieerd met verschillende bindingselementen om de mutantfunctie verder te evalueren.

6. Vergelijking met relevante fenotypen

Vergelijk de correlatieve fenotypen met de gegenereerde transcriptomische profielgegevens en interpreteer indien nodig.

Representative Results

Voorlopige qRT-PCR-gegevens suggereerden dat een EWS / FLI-mutant genaamd DAF, met specifieke tyrosine- tot alaninemutaties in het repetitieve en ongeordende gebied van EWS, het vermogen behield om EWS / FLI-doelgenen te activeren, maar er niet in slaagde kritieke doelgenen te onderdrukken²³. Om de relatie tussen deze residuen in het EWS-domein en de EWS/FLI-functie beter te begrijpen, is het hierboven beschreven en in figuur 1 beschreven protocol gebruikt. A673 Ewing-sarcoomcellen werden viraal getransduceerd met een shRNA gericht op de 3'UTR van FLI1, wat resulteerde in de uitputting van endogene EWS / FLI. Na vier dagen selectie werd de EWS/FLI-functie gered met virale transductie van verschillende 3XFLAG-gelabelde EWS/FLI-mutantconstructen, met lege vector als controle zonder redding. Een niet-functionele mutant zonder het EWS-domein, genaamd Δ22, werd gebruikt als een negatieve controle en wild-type EWS / FLI, wtEF genaamd, werd gebruikt als een positieve controle (Figuur 2A). DAF werd gebruikt als testconstructie, hoewel indien gewenst meer dan één testconstructie kan worden gebruikt. Cellen werden geselecteerd voor nog eens 10 dagen om constructexpressie te stabiliseren en vervolgens verzameld voor RNA (met een gDNA-verwijderingsstap), eiwit- en kolonievormende assays. Vier replicaties werden verzameld en representatieve qRT-PCR en western blots die effectieve knockdown en redding laten zien, zijn weergegeven in figuur 2B-D. Opgemerkt moet worden dat DAF-geredde cellen er niet in slaagden kolonies te vormen zoals weergegeven in figuur 2E, wat wijst op verminderde oncogene transformatie.

Na voltooiing van de replicatievalidatie en fenotypische assays, werd RNA ingediend bij het Institute for Genomic Medicine in het Nationwide Children's Hospital voor bibliotheekvoorbereiding en next generation sequencing met ~ 50 miljoen 150-bp gepaarde eindlezingen verzameld. De gegevens werden geretourneerd als fastq.gz bestanden. Uit deze bestanden werden met TrimGalore leesbewerkingen van lage kwaliteit bijgesneden en STAR werd gebruikt om af te stemmen op het menselijk genoom hg19 en de reads per gen te tellen. hg19 werd gebruikt voor compatibiliteit met de andere samengestelde datasets voor EWS/FLI die worden gebruikt in downstream-analyse. Deze afgelezen tellingen werden gecombineerd tot een enkele telmatrix voor alle monsters, waarvan de eerste 6 rijen zijn weergegeven in figuur 3.

Tellingen werden aanvankelijk uitgevoerd door DESeq2 zonder batchnormalisatie, maar visuele inspectie van de monster-tot-monsterafstand toonde potentiële verstorende batcheffecten zoals weergegeven gemarkeerd met rode pijlen in figuur 4A. Dit is waarschijnlijk ontstaan als gevolg van biologische variabiliteit geïntroduceerd door de passage van cellen in cultuur en verschillen in de verwerking van elke batch. Normalisatie voor batcheffecten werd uitgevoerd met ComBat en wordt over het algemeen aanbevolen. De steekproef-tot-monsterafstanden van de batchgenormaliseerde gegevens zijn weergegeven in figuur 4B. Na batchnormalisatie werd DESeq2 gebruikt om transcriptionele profielen te genereren voor de drie constructen (wtEF, Δ22 en DAF) ten opzichte van de basislijn. Merk op dat terwijl "ouderlijke" A673-cellen (mock knockdown en mock rescue, hier "iLuc" genoemd) werden opgenomen in de differentiële analyse, de referentie voor dit experiment de cellen zijn met EWS / FLI-uitgeputte, iEF-cellen genoemd. Het transcriptionele profiel kan hier voor het endogene eiwit worden gegenereerd door het iLuc-monster te vergelijken met iEF, en dit kan van belang zijn om te begrijpen hoe het reddingssysteem werkt, maar dat is niet het doel van deze specifieke analyse. De transcriptionele profielen die voor de mutanten worden gegenereerd, omvatten positieve (wtEF) en negatieve (Δ22) controles met betrekking tot iEF, zodat deze moeten functioneren als de benchmarks voor andere mutanten. Dit is belangrijk, omdat de positieve controle in dit voorbeeld de functie van endogene EWS / FLI zoals elders besproken^7,²³niet volledig samenvatte.

De principal component analysis (PCA) in figuur 5 suggereert dat het transcriptieprofiel van DAF intermediair is tussen wtEF en Δ22, wat de partiële functie bevestigt. Bovendien toonde hiërarchische clustering van de 1000 meest variabele genen in de monsters aan dat DAF er niet in slaagde EWS/FLI-doelgenen te onderdrukken en slechts gedeeltelijk de genactiveringsactiviteit behield, zoals weergegeven in figuur 6A en figuur S5. ToppGene-analyse suggereerde dat de klassen genen die DAF activeert functioneel verschillen van die EWS/FLI-geactiveerde doelen waar DAF niet-functioneel is(figuur 6B). Interessant is dat de functie van geactiveerde genen gered door wtEF, maar niet door DAF, gerelateerd lijkt te zijn aan transcriptionele controle en chromatineregulatie. Op basis van de resultaten van de kolonievormingstests moeten de genen van deze kerngensignatuur verder worden geanalyseerd op hun rol in EWS / FLI-gemedieerde oncogenese. Het belang van EWS/FLI-gemedieerde genrepressie is eerder beschreven¹⁷.

Het is bekend dat EWS/FLI een unieke bindingsaffiniteit bezit voor GGAA-microsatellietrepetitie-elementen^19,^22,en dat binding aan deze elementen downstream genregulatie^11,^15,^18,^20,²²aandrijft. Deze microsatellieten zijn gekarakteriseerd als geassocieerd met activering of repressie, en ofwel proximaal aan (< 5 kb) TSS of distaal aan (> 5 kb) TSS²⁵. Daarnaast zijn er EWS/FLI-gereguleerde genen met hoge affiniteit (HA) ETS motieven proximaal aan TSS²³. Om de kenmerken van de DAF-functie verder te analyseren en welke soorten EWS/FLI-geactiveerde genen DAF kon redden, werd differentiële expressie van genen geassocieerd met deze verschillende klassen geanalyseerd. Interessant is dat DAF het meest in staat was om GGAA-microsatelliet geactiveerde genen te redden, maar niet in staat om geactiveerde genen in de buurt van een HA-site te redden, zoals te zien is in figuur 7. Zoals te zien is bij hiërarchische clustering, slaagt DAF er niet in om EWS/FLI-gemedieerde repressie over motiefklassen heen te redden. Deze gegevens suggereren dat DAF voldoende structurele kenmerken van EWS behoudt om te binden aan en te activeren van GGAA-microsatellieten, zowel proximaal als distaal aan TSS. Dit komt waarschijnlijk voort uit het intacte SYGQ-domein waarvan wordt gedacht dat het belangrijk is voor EWS / FLI-activiteit bij GGAA-herhalingen¹¹. Deze gegevens suggereren ook dat de specifieke tyrosines gemuteerd in DAF een belangrijke, maar slecht begrepen rol spelen in EWS / FLI-gemedieerde genregulatie van HA-sites, evenals in genrepressie, wat een belangrijk gebied van verder onderzoek benadrukt.

Figuur 1: Workflow. Weergave van de stapsgewijze procedure voor het uitvoeren van structuur-functie mapping door transcriptomics. Cellen werden eerst voorbereid om de reeks constructies uit te drukken die nodig zijn voor het in kaart brengen van structuurfuncties. Na expressie werden cellen geoogst op RNA en eiwit en getest op correlatieve fenotypen. Expressie van de constructen werd gevalideerd en dit proces werd 3-4 keer herhaald om onafhankelijke biologische replicaties te verzamelen. RNA werd vervolgens ingediend voor next-generation sequencing (NGS). Wanneer gegevens werden ontvangen, werden gegevens bijgesneden op kwaliteit, uitgelijnd en werden tellingen per transcript berekend. Batcheffecten werden gecontroleerd en transcriptomische handtekeningen en differentiële expressie werden bepaald met behulp van DESeq2. Hiërarchische clustering en downstream analyse integreren van andere -omics datasets en andere pathway of functionele analyse kan worden opgenomen. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 2: Validatie van constructexpressie en correlatieve assays. (A) Schema met de in dit voorbeeld geteste constructies. (B) Validatie van knockdown van endogene EWS/FLI en expressie van 3X-FLAG-tagged constructen door immunoblot. (C,D) Validatie van constructactiviteit bij een EWS/FLI(C)geactiveerd doelgen, NR0B1en(D)onderdrukt doelgen, TGFBR2, door qRT-PCR. De gegevens worden gepresenteerd als gemiddelde +/- standaarddeviatie. P-waarden werden berekend met een Tukey's eerlijke significantietest. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Kolonietellingen van soft-agar-assays die worden uitgevoerd om de transformerende activiteit van constructen te beoordelen. P-waarden werden berekend met een Tukey's eerlijke significantietest. * p < 0,05, ** p < 0,01, *** p < 0,005. Deze figuur is overgenomen van Theisen, et al.²³Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 3: Definitieve verzamelde telgegevens voor analyse. Screenshot van de eerste 6 rijen van het telbestand met gentellingen voor alle monsters die batchgenormaliseerd en geanalyseerd moeten worden. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 4: Heatmaps van monster tot monster. (A) Waarnemingspunt van monster tot monster met de steekproefclustering van de ruwe tellingsgegevens. Monsters die zowel per batch als per monster worden geclusterd, worden aangeduid met rode pijlen. (B) Sample-to-sample afstandsdiagram na batchnormalisatie met ComBat. Hier clusteren monsters van alle replicaties samen, onafhankelijk van batch. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 5: Resultaten van differentiële expressieanalyse. (A) Pca-plot (Principle component analysis) van de transcriptomische handtekeningen die voor alle monsters zijn gegenereerd, vertonen een sterke clustering binnen het monster en tonen aan dat DAF wordt bemiddeld tussen de positieve (wtEF) en negatieve (Δ22) controles. (B) Vulkaanplots met de -log(p-waarde) uitgezet tegen de log2FoldChange voor genen in elk construct. Genen met een aangepaste p-waarde < 0,05 en een |log2(FoldChange)| > 1 worden als significant beschouwd en worden in rood weergegeven. Paneel 5B is een bewerking van Theisen, et al.²³Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 6: Hiërarchische clustering om genklassen te identificeren. (A) Hiërarchische clustering van de top 1000 meest variabele genen in alle constructen en de baseline, iEF, laat zien dat DAF EWS/FLI-gemedieerde genactivatie gedeeltelijk redt. (B) Genontologie (moleculaire functie) resultaten van ToppGene die de functionele verrijking van EWS/FLI-geactiveerde genen laten zien die al dan niet door DAF worden gered. Paneel 6B is een bewerking van Theisen, et al.²³Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 7: Gedetailleerde analyse van verschillende transcriptiefactorresponselementen op verschillende constructies: (A) Schematische weergave van de gegevensverwerking die wordt gebruikt om panelen te genereren (B) en (C) door andere beschikbare datasets op te nemen met de transcriptomische profielen hier. (B, C) Compilatie met de redding van verschillende klassen van directe EWS/FLI- (B) geactiveerde en (C) onderdrukte doelen. De genen waren alleen die genen met detecteerbare differentiële expressie door endogene EWS/FLI. In elk cirkeldiagram toont grijs het deel van de genen dat niet door het construct wordt gered. Rood toont het deel van de genen dat differentieel wordt geactiveerd en blauw toont het deel van de genen dat differentieel wordt onderdrukt. Deze figuur is overgenomen van Theisen, et al.²³Klik hier om een grotere versie van deze figuur te bekijken.

Figuur S1: Het laden van de fastq.gz bestanden naar de HPC-omgeving, bijsnijden en uitlijnen. Klik hier om deze figuur te downloaden.

Figuur S2: Het aantal leeswaarden voor steekproeven verzamelen en batchnormalisatie uitvoeren met ComBat. Klik hier om deze figuur te downloaden.

Figuur S3: DESeq2 uitvoeren en resultaten van differentiële expressieanalyse extraheren. Klik hier om deze figuur te downloaden.

Figuur S4: Output analyseren. Klik hier om deze figuur te downloaden.

Figuur S5: Hiërarchische clustering om genklassen te identificeren: Hiërarchische clustering van de top 1000 meest variabele genen over alle constructen en de baseline, iEF, gesorteerd in k-clusters. In dit geval k=7, maar deze parameter wordt ingesteld door de gebruiker zoals weergegeven in Figuur S4D. Klik hier om deze figuur te downloaden.

Tabel S1: Lijst van genen (Ensembl gen ID) met cluster annotatie. Klik hier om deze tabel te downloaden.

Discussion

Het bestuderen van de biochemische mechanismen van oncogene transcriptiefactoren is van cruciaal belang om de ziekten die ze veroorzaken te begrijpen en om nieuwe therapeutische strategieën te ontwerpen. Dit geldt vooral bij maligniteiten die worden gekenmerkt door chromosomale translocaties die resulteren in fusietranscriptiefactoren. De domeinen die in deze chimere eiwitten zijn opgenomen, missen mogelijk zinvolle interacties met regulerende domeinen die aanwezig zijn in de wild-type eiwitten, wat het vermogen om structuur-functie-informatie te interpreteren in de context van de fusie^{bemoeilijkt 26,}^27,²⁸. Bovendien worden veel van deze oncogene fusies gekenmerkt door intrinsiek ongeordende domeinen met een lage complexiteit^10,^13,^29,^30.

Het EWS-domein is een voorbeeld van zo'n intrinsiek ongeordend domein dat betrokken is bij een verscheidenheid aan oncogene fusies¹⁰. De intrinsiek ongeordende en repetitieve aard heeft de inspanningen belemmerd om de moleculaire mechanismen te begrijpen die door het EWS-domein worden gebruikt. Eerdere pogingen om de structuurfunctie te onderzoeken, hebben grotendeels hun toevlucht genomen tot het gebruik van verschillende mutanten in de context van reporter-gentests of in celachtergronden die de relevante cellulaire context niet samenvatten, of geen structurele variaties hebben die zinvolle partiële functie^{produceren 11,}^17,²⁵. De hier gepresenteerde methode pakt deze problemen aan. Structuur-functie mapping wordt uitgevoerd in een ziekte-relevante celcontext en next generation sequencing maakt transcriptomische profilering mogelijk om transcriptiefactorfunctie te evalueren in de setting van native chromatine. In het specifieke geval van de DAF-mutant van EWS/FLI werd gemeld dat DAF weinig activiteit vertoonde in reporter-assays met behulp van geïsoleerde responselementen, maar activiteit vertoonde in de context van de volledige genpromotor, hetzij in een reporter-assay of in native chromatine, wat een interessant fenotype²³suggereert. Het gebruik van de hier beschreven methode lost directer de vraag op welk type regulerende elementen in het genoom het meest responsief zijn in de ziekteomgeving. Door alle kandidaat-doelgenen tegelijkertijd in hun oorspronkelijke chromatinecontext te testen, is het waarschijnlijker dat een transcriptomische benadering constructen met gedeeltelijke functie identificeert.

De inherente kracht van het gebruik van een ziekterelevante celachtergrond is misschien wel de grootste beperking van deze techniek. Een van de belangrijkste factoren is het kiezen van het juiste celsysteem voor deze experimenten. Veel cellijnen afgeleid van maligniteiten met pathognomonische transcriptiefactoren tolereren niet gemakkelijk knockdown van die transcriptiefactor, en in veel gevallen, met name voor pediatrische kankers, blijft de ware cel van oorsprong controversieel en is de expressie van het oncogen in andere celachtergronden onbetaalbaar^{toxisch 31}^,³² . In deze gevallen kan het nuttig zijn om experimenten uit te voeren in een andere celachtergrond, zolang de onderzoeker voorzichtig is bij de interpretatie van de resultaten en alle relevante bevindingen in een meer ziekterelevant celtype op de juiste manier valideert.

Het is van cruciaal belang om de stabiliteit en fenotypische gevolgen van expressie van het oncogen zorgvuldig te valideren en alleen monsters voor sequencing in te dienen die aan strikte criteria voldoen. Hier omvatte dit western blot om knockdown en redding te bevestigen, en qRT-PCR van een klein aantal bekende doelgenen om de positieve controle te valideren(figuur 2). Het is ook cruciaal om zoveel mogelijk batchvariabiliteit te verminderen door de cel- en RNA-preparaten zorgvuldig zo gelijk mogelijk uit te voeren door elke batch.

De hier beschreven methode wordt vooral krachtig in combinatie met andere soorten genomische gegevens die spreken over de genoombrede functie van de transcriptiefactor die wordt bestudeerd. Toekomstige richtingen voor dit type structuurfunctieanalyse zouden worden uitgebreid met ChIP-seq en ATAC-seq om de binding van de transcriptiefactor en eventuele geïnduceerde veranderingen in chromatinetoegankelijkheid te bepalen. Als suite kan dit type gegevens erop wijzen dat verschillende structurele componenten van een oncogene transcriptiefactor bijdragen aan verschillende aspecten van de functie (d.w.z. DNA-binding versus chromatinemodificatie versus co-regulator rekrutering). Over het algemeen kan het gebruik van op NGS gebaseerde benaderingen om de structuur-functierelaties van fusietranscriptiefactoren in kaart te brengen, nieuwe inzichten onthullen in de biochemische determinanten van de oncogene functie van deze eiwitten. Dit is belangrijk om ons begrip van de ziekten die ze veroorzaken te vergroten en om de ontwikkeling van nieuwe therapeutische strategieën mogelijk te maken.

Disclosures

SLL verklaart een belangenconflict als lid van de adviesraad voor en aandeelhouder van Salarius Pharmaceuticals. SLL is ook een beursgenoteerde uitvinder op United States Patents No. US 7.393.253 B2, "Methoden en samenstellingen voor de diagnose en behandeling van Ewing's Sarcoma", en US 8.557.532, "Diagnose en behandeling van resistent Ewing's sarcoom." Dit verandert niets aan onze naleving van het JoVE-beleid inzake het delen van gegevens en materialen.

Acknowledgments

Dit onderzoek werd ondersteund door de High Performance Computing Facility van het Abigail Wexner Research Institute in het Nationwide Children's Hospital. Dit werk werd ondersteund door het National Institutes of Health National Cancer Institute [U54 CA231641 naar SLL, R01 CA183776 naar SLL]; Alex's Lemonade Stand Foundation [Young Investigator Award aan ERT]; Pelotonia [Fellowship aan ERT]; en de National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 naar KIP].

Materials

Name	Company	Catalog Number	Comments
Wet Lab Reagents
anti-FLI rabbit pAb	Abcam	ab15289	1:500
anti-lamin B1 rabbit pAb	Abcam	ab16048	1:2000
Cell-based system for introduction of mutant constructs			Determined by cell system used
Cryotubes			For viral aliquots
DMEM	Corning Cellgro	10-013-CV	For viral production
Fetal bovine serum	Gibco	16000-044	For viral production
G418	ThermoFisher	10131027	For viral production
HEK293-EBNAs	ATCC	CRL-10852	For viral production
HEPES	Gibco	15630106
Hygromycin B	ThermoFisher	10687010
M2 anti-FLAG mouse mAb	Sigma	F3165	1:2000
Near IR-secondary antibodies	Li-Cor
Optimem	Gibco	31985062	For viral production
Penicillin/Streptomycin/Glutamine	Gibco	10378-016	For viral production
Polybrene	Sigma	TR-1003-G	For viral transduction
Puromycin	Sigma	P8833	Stored at 2 mg/mL stock
RNeasy Plus kit	Qiagen	74136	Has gDNA removal columns
Selection reagents			As dictated by cell system used
Sodium Pyruvate	Gibco	11360-070	For viral production
Tissue culture media			Determined by cell system used
TransIT-LT1	Mirus	MIR 2304	For viral production

Software
Access to HPC environment
AnnotationDbi			1.38.2
Cairo			1.5-10
DESeq2			1.16.1
genefilter			1.58.1
ggbiplot			0.55
ggplot2			3.1.1
org.Hs.eg.db			3.4.1
pheatmap			1.0.12
PuTTY
R			3.4.0
RColorBrewer			1.1-2
reshape2			1.4.3
rgl			0.100.19
R-studio
STAR			Version 2.6 or later
sva			3.24.4
TrimGalore!
WinSCP