$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Voorlopige qRT-PCR-gegevens suggereerden dat een EWS / FLI-mutant genaamd DAF, met specifieke tyrosine- tot alaninemutaties in het repetitieve en ongeordende gebied van EWS, het vermogen behield om EWS / FLI-doelgenen te activeren, maar er niet in slaagde kritieke doelgenen te onderdrukken23. Om de relatie tussen deze residuen in het EWS-domein en de EWS/FLI-functie beter te begrijpen, is het hierboven beschreven en in figuur 1 beschreven protocol gebruikt. A673 Ewing-sarcoomcellen werden viraal getransduceerd met een shRNA gericht op de 3'UTR van FLI1, wat resulteerde in de uitputting van endogene EWS / FLI. Na vier dagen selectie werd de EWS/FLI-functie gered met virale transductie van verschillende 3XFLAG-gelabelde EWS/FLI-mutantconstructen, met lege vector als controle zonder redding. Een niet-functionele mutant zonder het EWS-domein, genaamd Δ22, werd gebruikt als een negatieve controle en wild-type EWS / FLI, wtEF genaamd, werd gebruikt als een positieve controle (Figuur 2A). DAF werd gebruikt als testconstructie, hoewel indien gewenst meer dan één testconstructie kan worden gebruikt. Cellen werden geselecteerd voor nog eens 10 dagen om constructexpressie te stabiliseren en vervolgens verzameld voor RNA (met een gDNA-verwijderingsstap), eiwit- en kolonievormende assays. Vier replicaties werden verzameld en representatieve qRT-PCR en western blots die effectieve knockdown en redding laten zien, zijn weergegeven in figuur 2B-D. Opgemerkt moet worden dat DAF-geredde cellen er niet in slaagden kolonies te vormen zoals weergegeven in figuur 2E, wat wijst op verminderde oncogene transformatie.
Na voltooiing van de replicatievalidatie en fenotypische assays, werd RNA ingediend bij het Institute for Genomic Medicine in het Nationwide Children's Hospital voor bibliotheekvoorbereiding en next generation sequencing met ~ 50 miljoen 150-bp gepaarde eindlezingen verzameld. De gegevens werden geretourneerd als fastq.gz bestanden. Uit deze bestanden werden met TrimGalore leesbewerkingen van lage kwaliteit bijgesneden en STAR werd gebruikt om af te stemmen op het menselijk genoom hg19 en de reads per gen te tellen. hg19 werd gebruikt voor compatibiliteit met de andere samengestelde datasets voor EWS/FLI die worden gebruikt in downstream-analyse. Deze afgelezen tellingen werden gecombineerd tot een enkele telmatrix voor alle monsters, waarvan de eerste 6 rijen zijn weergegeven in figuur 3.
Tellingen werden aanvankelijk uitgevoerd door DESeq2 zonder batchnormalisatie, maar visuele inspectie van de monster-tot-monsterafstand toonde potentiële verstorende batcheffecten zoals weergegeven gemarkeerd met rode pijlen in figuur 4A. Dit is waarschijnlijk ontstaan als gevolg van biologische variabiliteit geïntroduceerd door de passage van cellen in cultuur en verschillen in de verwerking van elke batch. Normalisatie voor batcheffecten werd uitgevoerd met ComBat en wordt over het algemeen aanbevolen. De steekproef-tot-monsterafstanden van de batchgenormaliseerde gegevens zijn weergegeven in figuur 4B. Na batchnormalisatie werd DESeq2 gebruikt om transcriptionele profielen te genereren voor de drie constructen (wtEF, Δ22 en DAF) ten opzichte van de basislijn. Merk op dat terwijl "ouderlijke" A673-cellen (mock knockdown en mock rescue, hier "iLuc" genoemd) werden opgenomen in de differentiële analyse, de referentie voor dit experiment de cellen zijn met EWS / FLI-uitgeputte, iEF-cellen genoemd. Het transcriptionele profiel kan hier voor het endogene eiwit worden gegenereerd door het iLuc-monster te vergelijken met iEF, en dit kan van belang zijn om te begrijpen hoe het reddingssysteem werkt, maar dat is niet het doel van deze specifieke analyse. De transcriptionele profielen die voor de mutanten worden gegenereerd, omvatten positieve (wtEF) en negatieve (Δ22) controles met betrekking tot iEF, zodat deze moeten functioneren als de benchmarks voor andere mutanten. Dit is belangrijk, omdat de positieve controle in dit voorbeeld de functie van endogene EWS / FLI zoals elders besproken7,23niet volledig samenvatte.
De principal component analysis (PCA) in figuur 5 suggereert dat het transcriptieprofiel van DAF intermediair is tussen wtEF en Δ22, wat de partiële functie bevestigt. Bovendien toonde hiërarchische clustering van de 1000 meest variabele genen in de monsters aan dat DAF er niet in slaagde EWS/FLI-doelgenen te onderdrukken en slechts gedeeltelijk de genactiveringsactiviteit behield, zoals weergegeven in figuur 6A en figuur S5. ToppGene-analyse suggereerde dat de klassen genen die DAF activeert functioneel verschillen van die EWS/FLI-geactiveerde doelen waar DAF niet-functioneel is(figuur 6B). Interessant is dat de functie van geactiveerde genen gered door wtEF, maar niet door DAF, gerelateerd lijkt te zijn aan transcriptionele controle en chromatineregulatie. Op basis van de resultaten van de kolonievormingstests moeten de genen van deze kerngensignatuur verder worden geanalyseerd op hun rol in EWS / FLI-gemedieerde oncogenese. Het belang van EWS/FLI-gemedieerde genrepressie is eerder beschreven17.
Het is bekend dat EWS/FLI een unieke bindingsaffiniteit bezit voor GGAA-microsatellietrepetitie-elementen19,22,en dat binding aan deze elementen downstream genregulatie11,15,18,20,22aandrijft. Deze microsatellieten zijn gekarakteriseerd als geassocieerd met activering of repressie, en ofwel proximaal aan (< 5 kb) TSS of distaal aan (> 5 kb) TSS25. Daarnaast zijn er EWS/FLI-gereguleerde genen met hoge affiniteit (HA) ETS motieven proximaal aan TSS23. Om de kenmerken van de DAF-functie verder te analyseren en welke soorten EWS/FLI-geactiveerde genen DAF kon redden, werd differentiële expressie van genen geassocieerd met deze verschillende klassen geanalyseerd. Interessant is dat DAF het meest in staat was om GGAA-microsatelliet geactiveerde genen te redden, maar niet in staat om geactiveerde genen in de buurt van een HA-site te redden, zoals te zien is in figuur 7. Zoals te zien is bij hiërarchische clustering, slaagt DAF er niet in om EWS/FLI-gemedieerde repressie over motiefklassen heen te redden. Deze gegevens suggereren dat DAF voldoende structurele kenmerken van EWS behoudt om te binden aan en te activeren van GGAA-microsatellieten, zowel proximaal als distaal aan TSS. Dit komt waarschijnlijk voort uit het intacte SYGQ-domein waarvan wordt gedacht dat het belangrijk is voor EWS / FLI-activiteit bij GGAA-herhalingen11. Deze gegevens suggereren ook dat de specifieke tyrosines gemuteerd in DAF een belangrijke, maar slecht begrepen rol spelen in EWS / FLI-gemedieerde genregulatie van HA-sites, evenals in genrepressie, wat een belangrijk gebied van verder onderzoek benadrukt.

Figuur 1: Workflow. Weergave van de stapsgewijze procedure voor het uitvoeren van structuur-functie mapping door transcriptomics. Cellen werden eerst voorbereid om de reeks constructies uit te drukken die nodig zijn voor het in kaart brengen van structuurfuncties. Na expressie werden cellen geoogst op RNA en eiwit en getest op correlatieve fenotypen. Expressie van de constructen werd gevalideerd en dit proces werd 3-4 keer herhaald om onafhankelijke biologische replicaties te verzamelen. RNA werd vervolgens ingediend voor next-generation sequencing (NGS). Wanneer gegevens werden ontvangen, werden gegevens bijgesneden op kwaliteit, uitgelijnd en werden tellingen per transcript berekend. Batcheffecten werden gecontroleerd en transcriptomische handtekeningen en differentiële expressie werden bepaald met behulp van DESeq2. Hiërarchische clustering en downstream analyse integreren van andere -omics datasets en andere pathway of functionele analyse kan worden opgenomen. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 2: Validatie van constructexpressie en correlatieve assays. (A) Schema met de in dit voorbeeld geteste constructies. (B) Validatie van knockdown van endogene EWS/FLI en expressie van 3X-FLAG-tagged constructen door immunoblot. (C,D) Validatie van constructactiviteit bij een EWS/FLI(C)geactiveerd doelgen, NR0B1en(D)onderdrukt doelgen, TGFBR2, door qRT-PCR. De gegevens worden gepresenteerd als gemiddelde +/- standaarddeviatie. P-waarden werden berekend met een Tukey's eerlijke significantietest. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Kolonietellingen van soft-agar-assays die worden uitgevoerd om de transformerende activiteit van constructen te beoordelen. P-waarden werden berekend met een Tukey's eerlijke significantietest. * p < 0,05, ** p < 0,01, *** p < 0,005. Deze figuur is overgenomen van Theisen, et al.23Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 3: Definitieve verzamelde telgegevens voor analyse. Screenshot van de eerste 6 rijen van het telbestand met gentellingen voor alle monsters die batchgenormaliseerd en geanalyseerd moeten worden. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 4: Heatmaps van monster tot monster. (A) Waarnemingspunt van monster tot monster met de steekproefclustering van de ruwe tellingsgegevens. Monsters die zowel per batch als per monster worden geclusterd, worden aangeduid met rode pijlen. (B) Sample-to-sample afstandsdiagram na batchnormalisatie met ComBat. Hier clusteren monsters van alle replicaties samen, onafhankelijk van batch. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 5: Resultaten van differentiële expressieanalyse. (A) Pca-plot (Principle component analysis) van de transcriptomische handtekeningen die voor alle monsters zijn gegenereerd, vertonen een sterke clustering binnen het monster en tonen aan dat DAF wordt bemiddeld tussen de positieve (wtEF) en negatieve (Δ22) controles. (B) Vulkaanplots met de -log(p-waarde) uitgezet tegen de log2FoldChange voor genen in elk construct. Genen met een aangepaste p-waarde < 0,05 en een |log2(FoldChange)| > 1 worden als significant beschouwd en worden in rood weergegeven. Paneel 5B is een bewerking van Theisen, et al.23Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 6: Hiërarchische clustering om genklassen te identificeren. (A) Hiërarchische clustering van de top 1000 meest variabele genen in alle constructen en de baseline, iEF, laat zien dat DAF EWS/FLI-gemedieerde genactivatie gedeeltelijk redt. (B) Genontologie (moleculaire functie) resultaten van ToppGene die de functionele verrijking van EWS/FLI-geactiveerde genen laten zien die al dan niet door DAF worden gered. Paneel 6B is een bewerking van Theisen, et al.23Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 7: Gedetailleerde analyse van verschillende transcriptiefactorresponselementen op verschillende constructies: (A) Schematische weergave van de gegevensverwerking die wordt gebruikt om panelen te genereren (B) en (C) door andere beschikbare datasets op te nemen met de transcriptomische profielen hier. (B, C) Compilatie met de redding van verschillende klassen van directe EWS/FLI- (B) geactiveerde en (C) onderdrukte doelen. De genen waren alleen die genen met detecteerbare differentiële expressie door endogene EWS/FLI. In elk cirkeldiagram toont grijs het deel van de genen dat niet door het construct wordt gered. Rood toont het deel van de genen dat differentieel wordt geactiveerd en blauw toont het deel van de genen dat differentieel wordt onderdrukt. Deze figuur is overgenomen van Theisen, et al.23Klik hier om een grotere versie van deze figuur te bekijken.
Figuur S1: Het laden van de fastq.gz bestanden naar de HPC-omgeving, bijsnijden en uitlijnen. Klik hier om deze figuur te downloaden.
Figuur S2: Het aantal leeswaarden voor steekproeven verzamelen en batchnormalisatie uitvoeren met ComBat. Klik hier om deze figuur te downloaden.
Figuur S3: DESeq2 uitvoeren en resultaten van differentiële expressieanalyse extraheren. Klik hier om deze figuur te downloaden.
Figuur S4: Output analyseren. Klik hier om deze figuur te downloaden.
Figuur S5: Hiërarchische clustering om genklassen te identificeren: Hiërarchische clustering van de top 1000 meest variabele genen over alle constructen en de baseline, iEF, gesorteerd in k-clusters. In dit geval k=7, maar deze parameter wordt ingesteld door de gebruiker zoals weergegeven in Figuur S4D. Klik hier om deze figuur te downloaden.
Tabel S1: Lijst van genen (Ensembl gen ID) met cluster annotatie. Klik hier om deze tabel te downloaden.