$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Vorläufige qRT-PCR-Daten deuteten darauf hin, dass eine EWS/FLI-Mutante namens DAF mit spezifischen Tyrosin-zu-Alanin-Mutationen in der sich wiederholenden und ungeordneten Region des EWS die Fähigkeit zur Aktivierung von EWS/FLI-Zielgenen aufrechterhielt, aber kritische Zielgene nicht unterdrückenkonnte 23. Um die Beziehung zwischen diesen Resten im EWS-Bereich und der EWS/FLI-Funktion besser zu verstehen, wurde das oben beschriebene und in Abbildung 1 dargestellte Protokoll verwendet. A673 Ewing-Sarkomzellen wurden viral mit einer shRNA transduziert, die auf die 3'UTR von FLI1abzielt, was zur Erschöpfung des endogenen EWS/FLI führte. Nach vier Tagen der Selektion wurde die EWS/FLI-Funktion mit viraler Transduktion verschiedener 3XFLAG-markierter EWS/FLI-Mutantenkonstrukte gerettet, mit leerem Vektor als Kontrolle für keine Rettung. Eine nicht-funktionelle Mutante, der die EWS-Domäne fehlt, genannt Δ22, wurde als Negativkontrolle verwendet und Wildtyp-EWS/FLI, genannt wtEF, wurde als Positivkontrolle verwendet (Abbildung 2A). DAF wurde als Testkonstrukt verwendet, obwohl bei Bedarf mehr als ein Testkonstrukt verwendet werden kann. Die Zellen wurden für weitere 10 Tage ausgewählt, um die Konstruktexpression zu stabilisieren, und dann für RNA (mit einem gDNA-Entfernungsschritt), Protein- und Koloniebildungsassays gesammelt. Vier Replikate wurden gesammelt und repräsentative qRT-PCR und Western Blots, die einen effektiven Knockdown und eine effektive Rettung zeigen,sind in Abbildung 2B-Ddargestellt. Es sollte beachtet werden, dass DAF-gerettete Zellen keine Kolonien bilden konnten, wie in Abbildung 2Egezeigt, was auf eine beeinträchtigte onkogene Transformation hindeutet.
Nach Abschluss der Replikationsvalidierung und der phänotypischen Assays wurde die RNA beim Institut für Genomische Medizin am Nationwide Children's Hospital zur Bibliotheksvorbereitung und Next-Generation-Sequenzierung mit ~ 50 Millionen 150-bp-Paired-End-Lesevorgängen eingereicht. Die Daten wurden als fastq.gz-Dateien zurückgegeben. Low-Quality-Reads wurden mit TrimGalore aus diesen Dateien abgeschnitten und STAR wurde verwendet, um Reads auf das menschliche Genom hg19 auszurichten und die Reads pro Gen zu zählen. hg19 wurde aus Gründen der Kompatibilität mit den anderen kuratierten Datensätzen für EWS/FLI verwendet, die in der downstreamn Analyse verwendet wurden. Diese Lesezählungen wurden zu einer einzigen Zählmatrix für alle Stichproben zusammengefasst, von denen die ersten 6 Zeilen in Abbildung 3 dargestelltsind.
Die Zählungen wurden zunächst ohne Batch-Normalisierung durch DESeq2 durchgeführt, jedoch zeigte die visuelle Inspektion des Proben-zu-Probe-Abstands potenzielle verwirrende Batch-Effekte, wie in Abbildung 4Amit roten Pfeilen hervorgehoben. Dies ist wahrscheinlich auf die biologische Variabilität zurückzuführen, die durch die Passage von Zellen in Kultur und Unterschiede in der Verarbeitung jeder Charge eingeführt wurde. Die Normalisierung für Batch-Effekte wurde mit ComBat durchgeführt und wird im Allgemeinen empfohlen. Die Sample-to-Sample-Abstände der batch-normalisierten Daten sind in Abbildung 4B dargestellt. Nach der Batch-Normalisierung wurde DESeq2 verwendet, um Transkriptionsprofile für die drei Konstrukte (wtEF, Δ22 und DAF) relativ zur Baseline zu generieren. Beachten Sie, dass, während "elterliche" A673-Zellen (Mock-Knockdown und Mock-Rettung, hier "iLuc" genannt) in die Differentialanalyse einbezogen wurden, die Referenz für dieses Experiment die Zellen mit EWS / FLI-depleted sind, die als iEF-Zellen bezeichnet werden. Das Transkriptionsprofil kann hier für das endogene Protein generiert werden, indem die iLuc-Probe mit iEF verglichen wird, und dies kann für das Verständnis der Funktionsweise des Rettungssystems von Interesse sein, aber das ist nicht das Ziel dieser speziellen Analyse. Die für die Mutanten generierten Transkriptionsprofile umfassen positive (wtEF) und negative (Δ22) Kontrollen in Bezug auf iEF, so dass diese als Benchmarks für andere Mutanten fungieren sollten. Dies ist wichtig, da die Positivkontrolle in diesem Beispiel die Funktion des endogenen EWS/FLI nicht vollständig rekapituliert hat, wie an anderer Stellediskutiert 7,23.
Die Hauptkomponentenanalyse (PCA) in Abbildung 5 legt nahe, dass das Transkriptionsprofil von DAF zwischen wtEF und Δ22 liegt, was die Teilfunktion bestätigt. Darüber hinaus zeigte die hierarchische Clusterung der 1000 unterschiedlichsten Gene über Proben hinweg, dass DAF die EWS/FLI-Zielgene nicht unterdrückte und die Genaktivierungsaktivität nur teilweise beibehielt, wie in Abbildung 6A und Abbildung S5gezeigt. Die ToppGene-Analyse deutete darauf hin, dass sich die Klassen von Genen, die DAF aktiviert, funktionell von jenen EWS/FLI-aktivierten Zielen unterscheiden, bei denen DAF nicht funktionsfähig ist (Abbildung 6B). Interessanterweise scheint die Funktion aktivierter Gene, die durch wtEF, aber nicht durch DAF gerettet wurden, mit der Transkriptionskontrolle und der Chromatinregulation zusammenzuhängen. Basierend auf den Ergebnissen der Koloniebildungsassays sollten die Gene aus dieser Kerngensignatur weiter auf ihre Rolle in der EWS/FLI-vermittelten Onkogenese analysiert werden. Die Bedeutung der EWS/FLI-vermittelten Genrepression wurde bereits beschrieben17.
Es ist bekannt, dass EWS/FLI eine einzigartige Bindungsaffinität für GGAA-Mikrosatelliten-Wiederholungselemente19,22besitzt und dass die Bindung an diesen Elementen die nachgeschaltete Genregulation11,15,18,20,22steuert. Diese Mikrosatelliten wurden entweder als mit Aktivierung oder Repression assoziiert und entweder proximal zu (< 5 kb) TSS oder distal zu (> 5 kb) TSS25charakterisiert. Darüber hinaus gibt es EWS/FLI-regulierte Gene mit hochaffinen (HA) ETS-Motiven in der Nähe von TSS23. Um die Eigenschaften der DAF-Funktion weiter zu analysieren und welche Arten von EWS/FLI-aktivierten Genen DAF retten konnte, wurde die differentielle Expression von Genen analysiert, die mit diesen verschiedenen Klassen assoziiert sind. Interessanterweise war DAF am ehesten in der Lage, GGAA-Mikrosatelliten-aktivierte Gene zu retten, aber nicht in der Lage, aktivierte Gene in der Nähe einer HA-Stelle zu retten, wie in Abbildung 7 zu sehen ist. Wie beim hierarchischen Clustering zu sehen ist, gelingt es DAF nicht, die EWS/FLI-vermittelte Repression über Motivklassen hinweg zu retten. Diese Daten deuten darauf hin, dass DAF genügend strukturelle Merkmale von EWS beibehält, um an GGAA-Mikrosatelliten zu binden und von ihnen zu aktivieren, sowohl proximal als auch distal zu TSS. Dies ergibt sich wahrscheinlich aus der intakten SYGQ-Domäne, die als wichtig für die EWS /FLI-Aktivität bei GGAA-Wiederholungen angesehen wird11. Diese Daten deuten auch darauf hin, dass die spezifischen Tyrosine, die in DAF mutiert sind, eine wichtige, aber wenig verstandene Rolle bei der EWS/FLI-vermittelten Genregulation von HA-Standorten sowie bei der Genrepression spielen, was einen wichtigen Bereich weiterer Untersuchungen hervorhebt.

Abbildung 1: Workflow. Darstellung des schrittweisen Vorgehens zur Durchführung eines Struktur-Funktions-Mappings durch Transkriptomics. Zellen wurden zuerst vorbereitet, um die Reihe von Konstrukten auszudrücken, die für die Struktur-Funktions-Abbildung erforderlich sind. Nach der Expression wurden Zellen für RNA und Protein geerntet und auf korrelative Phänotypen untersucht. Die Expression der Konstrukte wurde validiert, und dieser Prozess wurde 3-4 Mal wiederholt, um unabhängige biologische Replikate zu sammeln. RNA wurde dann für die Next-Generation-Sequenzierung (NGS) eingereicht. Wenn Daten empfangen wurden, wurden die Daten auf Qualität getrimmt, ausgerichtet und die Anzahl pro Transkript berechnet. Batch-Effekte wurden kontrolliert und transkriptomische Signaturen und differentielle Expression wurden mit DESeq2 bestimmt. Hierarchisches Clustering und Downstream-Analyse, die andere -omics-Datensätze und verschiedene Pathway- oder Funktionsanalysen integrieren, können integriert werden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 2: Validierung von Konstruktexpression und korrelativen Assays. (A) Schematische Darstellung der in diesem Beispiel getesteten Konstrukte. (B) Validierung des Knockdowns von endogenem EWS/FLI und Expression von 3X-FLAG-markierten Konstrukten durch Immunoblot. (C,D) Validierung der Konstruktaktivität an einem EWS/FLI (C) aktivierten Zielgen, NR0B1, und (D) unterdrücktem Zielgen, TGFBR2, durch qRT-PCR. Die Daten werden als mittlere +/- Standardabweichung dargestellt. P-Werte wurden mit einem tukey's honest significance test berechnet. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Koloniezählungen aus Soft-Agar-Assays, die zur Beurteilung der Transformationsaktivität von Konstrukten durchgeführt wurden. P-Werte wurden mit einem tukey's honest significance test berechnet. * S. < 0,05, ** S. < 0,01, *** S. < 0,005. Diese Abbildung stammt aus Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 3: Endgültige zusammengestellte Zähldaten für die Analyse. Screenshot der ersten 6 Zeilen der Zähldatei mit Genzählungen für alle Proben, die batch normalisiert und analysiert werden sollen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 4: Heatmaps der Sample-to-Sample-Entfernung. (A) Stichproben-zu-Stichproben-Entfernungsdiagramm, das die Stichproben-Clusterung der Rohzählungsdaten zeigt. Proben, die sowohl nach Batch als auch nach Stichprobe gruppiert sind, sind mit roten Pfeilen gekennzeichnet. (B) Stichproben-zu-Stichproben-Abstandsdiagramm nach Batch-Normalisierung mit ComBat. Hier gruppieren sich Samples aus allen Replikaten, unabhängig vom Batch. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 5: Ergebnisse der Differentialexpressionsanalyse. (A) Das Diagramm der Prinzipkomponentenanalyse (PCA) der transkriptomischen Signaturen, die für alle Proben generiert wurden, zeigt eine starke Intra-Stichproben-Clusterbildung und zeigt, dass DAF zwischen den positiven (wtEF) und negativen (Δ22) Kontrollen intermediär ist. (B) Vulkandiagramme, die den -log(p-Wert) zeigen, der gegen den log2FoldChange für Gene in jedem Konstrukt aufgetragen wird. Gene mit einem angepassten p-Wert < 0,05 und einem |log2(FoldChange)| > 1 gelten als signifikant und sind rot dargestellt. Panel 5B ist adaptiert von Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Abbildung 6: Hierarchisches Clustering zur Identifizierung von Genklassen. (A) Hierarchische Clusterbildung der 1000 am meisten variablen Gene über alle Konstrukte hinweg und die Baseline, iEF, zeigt, dass DAF die EWS/FLI-vermittelte Genaktivierung teilweise rettet. (B) Genontologie (molekulare Funktion) resultiert aus ToppGene, die die funktionelle Anreicherung von EWS/FLI-aktivierten Genen zeigen, die entweder durch DAF gerettet oder nicht gerettet werden. Panel 6B ist adaptiert von Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Abbildung 7: Detaillierte Analyse verschiedener Transkriptionsfaktor-Antwortelemente auf verschiedene Konstrukte: (A) Schematische Darstellung der Datenverarbeitung, die zur Generierung von Panels (B) und (C) verwendet wird, indem andere verfügbare Datensätze mit den transkriptomischen Profilen hier integriert werden. (B,C) Zusammenstellung, die die Rettung verschiedener Klassen von direkten EWS/FLI- (B) aktivierten und (C) unterdrückten Zielen zeigt. Eingeschlossen waren nur gene mit nachweisbarer differentieller Expression durch endogenes EWS/FLI. In jedem Kreisdiagramm zeigt Grau den Teil der Gene an, die nicht durch das Konstrukt gerettet werden. Rot stellt den Anteil der Gene dar, die differentiell aktiviert sind, und Blau stellt den Anteil der Gene dar, die differentiell unterdrückt werden. Diese Abbildung stammt aus Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung S1: Laden der fastq.gz-Dateien in die HPC-Umgebung, Trimmen und Ausrichten. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S2: Sortieren von Lesezahlen über Stichproben hinweg und Ausführen der Batchnormalisierung mit ComBat. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S3: Ausführen von DESeq2 und Extrahieren der Ergebnisse der Differentialexpressionsanalyse. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S4: Analyse der Ausgabe. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S5: Hierarchisches Clustering zur Identifizierung von Genklassen: Hierarchisches Clustering der Top 1000 der meisten variablen Gene über alle Konstrukte hinweg und die Baseline, iEF, sortiert in k Cluster. In diesem Fall ist k=7, aber dieser Parameter wird vom Benutzer festgelegt, wie in Abbildung S4Dgezeigt. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Tabelle S1: Liste der Gene (Ensembl-Gen-ID) mit Clusterannotation. Bitte klicken Sie hier, um diese Tabelle herunterzuladen.