$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Wstępne dane qRT-PCR sugerowały, że mutant EWS/FLI o nazwie DAF, ze specyficznymi mutacjami tyrozyny do alaniny w powtarzalnym i nieuporządkowanym regionie EWS, zachował zdolność do aktywacji genów docelowych EWS/FLI, ale nie zdołał stłumić krytycznych genów docelowych23. W celu lepszego zrozumienia związku między tymi pozostałościami w domenie EWS a funkcją EWS/FLI zastosowano protokół opisany powyżej i opisany w Rysunek 1. Komórki mięsaka Ewinga A673 zostały transdukowane wirusowo za pomocą shRNA ukierunkowanego na 3'UTR FLI1, co spowodowało zubożenie endogennego EWS / FLI. Po czterech dniach selekcji, funkcja EWS / FLI została uratowana dzięki transdukcji wirusa różnych zmutowanych konstruktów EWS / FLI oznaczonych 3XFLAG, z pustym wektorem jako kontrolą bez ratunku. Niefunkcjonalny mutant pozbawiony domeny EWS, zwany Δ22, został użyty jako kontrola negatywna, a EWS / FLI typu dzikiego, zwany wtEF, został użyty jako kontrola pozytywna (Rysunek 2A). DAF został użyty jako konstrukcja testowa, chociaż w razie potrzeby można użyć więcej niż jednej konstrukcji testowej. Komórki były selekcjonowane przez dodatkowe 10 dni, aby umożliwić ustabilizowanie ekspresji konstruktu, a następnie zebrano je do testów RNA (z etapem usuwania gDNA), białek i tworzenia kolonii. Zebrano cztery powtórzenia, a reprezentatywne qRT-PCR i western blot wykazujące skuteczne powalenie i ratunek pokazano w Rysunek 2B-D. Należy zauważyć, że komórki uratowane przez DAF nie zdołały utworzyć kolonii, jak pokazano w Rysunek 2E, co sugeruje upośledzoną transformację onkogenną.
Po zakończeniu walidacji replikacji i testów fenotypowych, RNA zostało przesłane do Instytutu Medycyny Genomowej w Nationwide Children's Hospital w celu przygotowania biblioteki i sekwencjonowania nowej generacji z ~50 milionami zebranych odczytów parowanych końców 150 bp. Dane zostały zwrócone jako pliki fastq.gz. Odczyty o niskiej jakości zostały wycięte z tych plików za pomocą TrimGalore, a STAR został użyty do wyrównania odczytów do ludzkiego genomu hg19 i zliczenia odczytów na gen. hg19 został użyty w celu zapewnienia kompatybilności z innymi wyselekcjonowanymi zestawami danych dla EWS/FLI używanymi w dalszej analizie. Te odczytane liczby zostały połączone w jedną macierz zliczania dla wszystkich próbek, z których pierwsze 6 wierszy pokazano w Rysunek 3.
Zliczenia były początkowo wykonywane przez DESeq2 bez normalizacji partii, jednak wizualna kontrola odległości między próbkami wykazała potencjalne mylące efekty partii, jak pokazano zaznaczone czerwonymi strzałkami w Rysunek 4A. Prawdopodobnie wynikało to ze zmienności biologicznej wynikającej z przechodzenia komórek w kulturze i różnic w przetwarzaniu każdej partii. Normalizacja efektów wsadowych została przeprowadzona za pomocą ComBat i jest ogólnie zalecana. Odległości między próbkami danych znormalizowanych wsadowo są pokazane w Rysunek 4B. Po normalizacji partii użyto DESeq2 do wygenerowania profili transkrypcyjnych dla trzech konstruktów (wtEF, Δ22 i DAF) w stosunku do wartości wyjściowej. Zauważ, że podczas gdy "rodzicielskie" komórki A673 (pozorowane knockdown i mock rescue, zwane tutaj "iLuc") zostały uwzględnione w analizie różnicowej, odniesieniem dla tego eksperymentu są komórki z EWS / FLI, zwane komórkami iEF. Profil transkrypcyjny można tutaj wygenerować dla endogennego białka, porównując próbkę iLuc z iEF, co może być interesujące dla zrozumienia, jak działa system ratunkowy, ale nie jest to celem tej konkretnej analizy. Profile transkrypcyjne wygenerowane dla mutantów obejmują kontrole dodatnie (wtEF) i ujemne (Δ22) w odniesieniu do iEF, tak że powinny one funkcjonować jako punkty odniesienia dla innych mutantów. Jest to ważne, ponieważ kontrola pozytywna w tym przykładzie nie podsumowała całkowicie funkcji endogennego EWS/FLI, jak omówiono w innym miejscu7,23.
Analiza głównych składowych (PCA) w Rysunek 5 sugeruje, że profil transkrypcyjny DAF jest pośredni między wtEF a Δ22, potwierdzając częściową funkcję. Co więcej, hierarchiczne grupowanie 1000 najbardziej zmiennych genów w próbkach wykazało, że DAF nie zdołał stłumić docelowych genów EWS / FLI i tylko częściowo zachował aktywność aktywacji genów, jak pokazano w Figura 6A i Figura S5. Analiza ToppGene sugerowała, że klasy genów aktywowanych przez DAF są funkcjonalnie różne od tych celów aktywowanych przez EWS/FLI, w których DAF jest niefunkcjonalny (Figura 6B). Co ciekawe, funkcja aktywowanych genów uratowanych przez wtEF, ale nie przez DAF, wydaje się być związana z kontrolą transkrypcji i regulacją chromatyny. Opierając się na wynikach testów tworzenia kolonii, geny z tej sygnatury genów rdzeniowych powinny być dalej analizowane pod kątem ich roli w onkogenezie za pośrednictwem EWS / FLI. Znaczenie represji genów za pośrednictwem EWS/FLI zostało już wcześniej opisane17.
Wiadomo, że EWS/FLI posiada unikalne powinowactwo do wiązania elementów powtarzalnych GGAA-mikrosatelitarnych19,22, i że wiązanie tych elementów napędza regulację genów w dół strumienia11,15,18,20,22. Te mikrosatelity zostały scharakteryzowane jako związane z aktywacją lub represją i albo proksymalne do (< 5 kb) TSS, albo dystalne do (> 5 kb) TSS25. Ponadto istnieją geny regulowane przez EWS/FLI z motywami ETS o wysokim powinowactwie (HA) proksymalnie do TSS23. W celu dalszej analizy charakterystyki funkcji DAF i typów genów aktywowanych przez EWS/FLI, które DAF był w stanie uratować, przeanalizowano różnicową ekspresję genów związanych z tymi różnymi klasami. Co ciekawe, DAF był najbardziej zdolny do uratowania genów aktywowanych przez mikrosatelitę GGAA, ale nie był w stanie uratować aktywowanych genów w pobliżu miejsca HA, jak widać na Rysunek 7. Jak widać w przypadku grupowania hierarchicznego, DAF nie jest w stanie uratować represji za pośrednictwem EWS/FLI w różnych klasach motywów. Dane te sugerują, że DAF zachowuje wystarczające cechy strukturalne EWS, aby wiązać się i aktywować z mikrosatelitów GGAA, zarówno proksymalnie, jak i dystalnie do TSS. Prawdopodobnie wynika to z nienaruszonej domeny SYGQ, która jest uważana za ważną dla aktywności EWS/FLI w GGAA repeats11. Dane te sugerują również, że specyficzne tyrozyny zmutowane w DAF odgrywają ważną, ale słabo poznaną rolę w regulacji genów za pośrednictwem EWS/FLI z miejsc HA, a także w represji genów, co podkreśla ważny obszar dalszych badań.

Rysunek 1: Przepływ pracy. Przedstawienie procedury krok po kroku w celu przeprowadzenia mapowania struktury i funkcji za pomocą transkryptomiki. Komórki zostały najpierw przygotowane do wyrażania zestawu konstrukcji wymaganych do mapowania struktura-funkcja. Po ekspresji komórki zebrano pod kątem RNA i białka oraz oznaczono pod kątem korelacyjnych fenotypów. Ekspresja konstruktów została zweryfikowana, a proces ten powtórzono 3-4 razy w celu zebrania niezależnych replik biologicznych. RNA zostało następnie przekazane do sekwencjonowania nowej generacji (NGS). Po odebraniu danych dane zostały przycięte pod kątem jakości, wyrównane i obliczono liczbę na transkrypcję. Efekty wsadowe były kontrolowane, a sygnatury transkryptomiczne i ekspresję różnicową określono za pomocą DESeq2. Można włączyć hierarchiczne grupowanie i analizę downstream integrującą inne zestawy danych -omicznych oraz różne ścieżki lub analizę funkcjonalną. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 2: Walidacja ekspresji konstruktu i testów korelacyjnych. (A) Schemat przedstawiający konstrukcje testowane w tym przykładzie. (B) Walidacja knockdown endogennego EWS / FLI i ekspresji konstruktów znakowanych 3X-FLAG przez immunoblot. (C,D) Walidacja aktywności konstruktu w genie docelowym aktywowanym EWS/FLI (C), NR0B1 i (D) stłumionym genie docelowym, TGFBR2, za pomocą qRT-PCR. Dane prezentowane są jako średnia +/- odchylenie standardowe. Wartości P zostały obliczone za pomocą testu uczciwej istotności Tukeya. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Liczba kolonii z testów miękkiego agaru przeprowadzonych w celu oceny aktywności transformacyjnej konstruktów. Wartości P zostały obliczone za pomocą testu uczciwej istotności Tukeya. * p < 0,05, ** p < 0,01, *** p < 0,005. Ten rysunek jest zaadaptowany z Theisen, et al.23 Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 3: Końcowe zestawienie danych zliczania do analizy. Zrzut ekranu przedstawiający pierwsze 6 wierszy pliku zliczania z liczbą genów dla wszystkich próbek, które mają być znormalizowane i przeanalizowane wsadowo. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 4: Mapy cieplne odległości między próbkami. (A) Wykres odległości między próbkami przedstawiający grupowanie próbek w surowych danych liczbowych. Próbki, które grupują się zarówno według partii, jak i próbki, są oznaczone czerwonymi strzałkami. (B) Wykres odległości między próbkami po normalizacji partii za pomocą ComBat. W tym przypadku próbki ze wszystkich kontrprób grupują się razem, niezależnie od partii. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 5: Wyniki analizy różnicowej wyrażeń. (A) Wykres analizy głównych składowych (PCA) sygnatur transkryptomicznych wygenerowanych dla wszystkich próbek wykazuje silne grupowanie wewnątrz próbki i pokazuje, że DAF jest pośrednikiem między kontrolami dodatnimi (wtEF) i ujemnymi (Δ22). (B) Wykresy wulkaniczne przedstawiające -log(p-wartość) wykreśloną w stosunku do log2FoldChange dla genów w każdym konstrukcie. Geny o skorygowanej wartości p < 0,05 i |log2(FoldChange)| > 1 są uważane za znaczące i są oznaczone kolorem czerwonym. Panel 5B jest adaptacją Theisen, et al.23 Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 6: Grupowanie hierarchiczne w celu identyfikacji klas genów. (A) Hierarchiczne grupowanie 1000 najbardziej zmiennych genów we wszystkich konstruktach i linii bazowej, iEF, pokazuje, że DAF częściowo ratuje aktywację genów za pośrednictwem EWS/FLI. (B) Ontologia genów (funkcja molekularna) wynika z ToppGene pokazując funkcjonalne wzbogacenie genów aktywowanych przez EWS/FLI, które są albo uratowane, albo nie są ratowane przez DAF. Panel 6B został zaadaptowany z Theisen, et al.23 Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 7: Szczegółowa analiza różnych elementów odpowiedzi czynnika transkrypcyjnego na różne konstrukty: (A) Schemat przedstawiający przetwarzanie danych wykorzystywane do generowania paneli (B) i (C) poprzez włączenie innych dostępnych zestawów danych do profili transkryptomicznych tutaj. (B,C) Zestawienie przedstawiające ratowanie różnych klas bezpośrednich celów aktywowanych i (C) stłumionych przez EWS/FLI- (B). Uwzględniono tylko te geny, które miały wykrywalną różnicową ekspresję przez endogenne EWS/FLI. Na każdym wykresie kołowym kolor szary przedstawia część genów, które nie zostały uratowane przez konstrukt. Kolor czerwony przedstawia część genów, które są aktywowane w różny sposób, a niebieski przedstawia część genów, które są w różny sposób tłumione. Ten rysunek jest adaptacją Theisen, et al.23 Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.
Rysunek S1: Wczytywanie plików fastq.gz do środowiska HPC, przycinanie i wyrównywanie. Kliknij tutaj, aby pobrać ten rysunek.
Rysunek S2: Zestawienie odczytów między próbkami i normalizacja partii za pomocą ComBat. Kliknij tutaj, aby pobrać ten rysunek.
Rysunek S3: Uruchamianie DESeq2 i pobieranie wyników analizy różnicowej wyrażeń. Kliknij tutaj, aby pobrać ten rysunek.
Rysunek S4: Analiza wyników. Kliknij tutaj, aby pobrać ten rysunek.
Rysunek S5: Hierarchiczne grupowanie w celu identyfikacji klas genów: Hierarchiczne grupowanie 1000 najbardziej zmiennych genów we wszystkich konstruktach i linii bazowej, iEF, posortowanych na k klastrów. W tym przypadku k=7, ale ten parametr jest ustawiany przez użytkownika, jak pokazano na rysunku S4D. Kliknij tutaj, aby pobrać ten rysunek.
Tabela S1: Lista genów (Ensembl gene ID) z adnotacją klastra. Kliknij tutaj, aby pobrać tę tabelę.