$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Dados preliminares de qRT-PCR sugeriram que um mutante EWS/FLI chamado DAF, com mutações específicas de tyrosina para alanina na região repetitiva e desordenada do EWS, manteve a capacidade de ativar genes de alvo EWS/FLI, mas não conseguiu reprimir genes-alvo críticos23. Para compreender melhor a relação entre esses resíduos no domínio EWS e na função EWS/FLI, utilizou-se o protocolo descrito acima e descrito na Figura 1. As células de sarcoma A673 Ewing foram viralmente transduzidas com um shRNA direcionado ao 3'UTR de FLI1, resultando no esgotamento do EWS/FLI endógeno. Após quatro dias de seleção, a função EWS/FLI foi resgatada com transdução viral de diferentes construções mutantes EWS/FLI marcadas por 3XFLAG, com vetor vazio como controle para nenhum resgate. Um mutante não funcional sem o domínio EWS, chamado Δ22, foi usado como controle negativo e o EWS/FLI do tipo selvagem, chamado wtEF, foi usado como um controle positivo(Figura 2A). O DAF foi usado como construção de teste, embora mais de uma construção de teste possa ser usada se desejar. As células foram selecionadas por mais 10 dias para permitir que a expressão de construção se estabilize e depois coletada para RNA (com uma etapa de remoção de gDNA), proteína e ensaios de formação de colônias. Quatro réplicas foram coletadas e as manchas representativas qRT-PCR e ocidentais que mostram knockdown e resgate eficazes são mostradas na Figura 2B-D. Deve-se notar que as células resgatadas pelo DAF não conseguiram formar colônias como mostrado na Figura 2E,sugerindo a transformação oncogênica prejudicada.
Após a conclusão da validação da réplica e ensaios fenotípicos, o RNA foi submetido ao Instituto de Medicina Genômica do Hospital Infantil Nacional para preparação da biblioteca e sequenciamento de próxima geração com ~50 milhões de leituras de fim de ano de 150 bp coletadas. Os dados foram devolvidos como arquivos .gz Fastq. Leituras de baixa qualidade foram aparadas desses arquivos com TrimGalore e STAR foi usada para alinhar leituras ao genoma humano hg19 e contar as leituras por gene. hg19 foi utilizado para fins de compatibilidade com os outros conjuntos de dados curados para EWS/FLI utilizados na análise a jusante. Estas contagens de leitura foram combinadas em uma matriz de contagem única para todas as amostras, as primeiras 6 linhas das quais são mostradas na Figura 3.
As contagens foram inicialmente executadas através do DESeq2 sem a normalização em lote, no entanto, a inspeção visual da distância amostra-a-amostra mostrou potenciais efeitos de lote de confusão, como mostrado destacado com setas vermelhas na Figura 4A. Isso provavelmente surgiu devido à variabilidade biológica introduzida pela passagem de células na cultura e diferenças no processamento de cada lote. A normalização dos efeitos em lote foi realizada com o ComBat e é geralmente recomendada. As distâncias amostra-a-amostra dos dados normalizados em lote são mostradas na Figura 4B. Após a normalização do lote, o DESeq2 foi usado para gerar perfis transcricionais para os três construtos (wtEF, Δ22 e DAF) relativos à linha de base. Note que enquanto as células A673 "parentais" (knockdown simulado e resgate simulado, chamado "iLuc" aqui) foram incluídas na análise diferencial, a referência para este experimento são as células com EWS/FLI-esgotado, chamados células iEF. O perfil transcricional pode ser gerado para a proteína endógena aqui, comparando a amostra iLuc com iEF, e isso pode interessar em entender como funciona o sistema de resgate, mas esse não é o objetivo desta análise em particular. Os perfis transcricionais gerados para os mutantes incluem controles positivos (wtEF) e negativos (Δ22), com relação ao iEF, de tal forma que estes devem funcionar como referência para outros mutantes. Isso é importante, pois o controle positivo neste exemplo não recapitulava completamente a função do Endógeno EWS/FLI como discutido em outros lugares7,23.
A análise dos componentes principais (PCA) na Figura 5 sugere que o perfil transcricional do DAF é intermediário entre wtEF e Δ22, confirmando a função parcial. Além disso, o agrupamento hierárquico dos 1000 genes mais variáveis entre as amostras mostrou que o DAF falhou em reprimir genes alvo EWS/FLI, e apenas reteve parcialmente a atividade de ativação genética, como mostrado na Figura 6A e Figura S5. A análise do ToppGene sugeriu que as classes de genes que o DAF ativa são funcionalmente distintas daqueles alvos ativados pelo EWS/FLI, onde o DAF não é funcional(Figura 6B). Curiosamente, a função de genes ativados resgatados pelo wtEF, mas não pelo DAF, parecem estar relacionadas ao controle transcricional e à regulação da cromatina. Com base nos resultados dos ensaios de formação da colônia, os genes desta assinatura genética central devem ser analisados por seu papel na oncogênese mediada pelo EWS/FLI. A importância da repressão genética mediada pelo EWS/FLI foi descrita anteriormente17.
Sabe-se que o EWS/FLI possui uma afinidade vinculante única para os elementos de repetição GGAA-microsatélite19,22, e que a vinculação a esses elementos impulsiona a regulação genética a jusante11,15,18,20,22. Esses microsatélites têm sido caracterizados como associados à ativação ou repressão, e ou proximal a (< 5 kb) TSS ou distal (> 5 kb) TSS25. Além disso, existem genes regulados por EWS/FLI com alto afinidade (HA) ETS, motivos proximais ao TSS23. A fim de analisar melhor as características da função DAF e quais tipos de genes ativados por EWS/FLI, o DAF foi capaz de resgatar, foi analisada a expressão diferencial dos genes associados a essas diferentes classes. Curiosamente, o DAF foi mais capaz de resgatar genes ativados ggaa-microsatélites, mas incapaz de resgatar genes ativados perto de um local ha como visto na Figura 7. Como visto com o agrupamento hierárquico, o DAF falha em resgatar a repressão mediada pelo EWS/FLI em todas as classes de motivos. Esses dados sugerem que o DAF retém características estruturais suficientes do EWS para se ligar e ativar a partir de microsatélites GGAA, tanto proximal quanto distal ao TSS. Isso provavelmente surge do domínio SYGQ intacto considerado importante para a atividade EWS/FLI na GGAA repete11. Esses dados também sugerem que as tyrosinas específicas mutadas no DAF desempenham papéis importantes, mas mal compreendidos, na regulação genética mediada pelo EWS/FLI a partir de sites ha, bem como na repressão genética, destacando uma área importante de investigação mais aprofundada.

Figura 1: Fluxo de trabalho. Representação do procedimento passo-a-passo para realizar o mapeamento de função estrutura por transcriômica. As células foram preparadas para expressar o conjunto de construções necessárias para o mapeamento estrutura-função. Seguindo a expressão, as células foram colhidas para RNA e proteína e avaliadas para fenótipos correlativos. A expressão dos construtos foi validada, e esse processo foi repetido 3-4 vezes para coletar réplicas biológicas independentes. O RNA foi então submetido ao sequenciamento de próxima geração (NGS). Quando os dados foram recebidos, os dados foram aparados para qualidade, alinhados e as contagens por transcrição foram calculadas. Os efeitos em lote foram controlados e as assinaturas transcriômicas e a expressão diferencial foram determinadas por meio do DESeq2. O clusteramento hierárquico e a análise a jusante integrando outros conjuntos de dados -omics e diferentes caminhos ou análises funcionais podem ser incorporados. Clique aqui para ver uma versão maior desta figura.

Figura 2: Validação da expressão de construção e ensaios correlativos. (A) Esquema representando os construtos testados neste exemplo. (B) Validação do knockdown do EWS/FLI endógeno e expressão de construções marcadas por 3X-FLAG por imunoblot. (C,D) Validação da atividade de construção em um gene alvo ativado EWS/FLI (C), NR0B1, e(D) gene alvo reprimido, TGFBR2, por qRT-PCR. Os dados são apresentados como desvio médio +/- padrão. Os valores P foram calculados com um teste de significância honesto de Tukey. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Colônia conta a partir de ensaios de ágar macio realizados para avaliar a atividade transformadora de construções. Os valores P foram calculados com um teste de significância honesto de Tukey. * p < 0,05, ** p < 0,01, *** p < 0,005. Esta figura é adaptada de Theisen, et al.23Clique aqui para ver uma versão maior desta figura.

Figura 3: Dados finais de contagem de colhidos para análise. Captura de tela das 6 primeiras linhas do arquivo de contagem com contagem de genes para que todas as amostras sejam normalizadas e analisadas em lote. Clique aqui para ver uma versão maior desta figura.

Figura 4: Mapas de distância de amostra para amostra. (A) Gráfico de distância amostra-a-amostra mostrando o agrupamento amostral dos dados de contagem bruta. As amostras que estão agrupando tanto por lote quanto por amostra são denotadas com setas vermelhas. (B) Parcela de distância amostra-a-amostra após a normalização do lote com o ComBat. Aqui, amostras de todas as réplicas agrupam-se, independente do lote. Clique aqui para ver uma versão maior desta figura.

Figura 5: Resultados da análise de expressão diferencial. (A) O gráfico de análise de componentes de princípio (PCA) das assinaturas transcriômicas geradas para todas as amostras mostra um forte agrupamento intra-amostra e demonstra que o DAF é intermediado entre os controles positivo (wtEF) e negativo (Δ22). (B) Gráficos vulcânis mostrando o -log(p-value) plotado contra o log2FoldChange para genes em cada construção. Genes com valor p ajustado < 0,05 e |log2(FoldChange)| > 1 são considerados significativos e são mostrados em vermelho. Painel 5B é adaptado de Theisen, et al.23Clique aqui para ver uma versão maior desta figura.

Figura 6: Agrupamento hierárquico para identificar classes genéticas. ( A )Oagrupamento hierárquico dos 1000 genes mais variáveis em todas as construções e a linha de base, iEF, mostra que o DAF resgata parcialmente a ativação genética mediada por EWS/FLI. (B) A ontologia genética (função molecular) resulta do ToppGene mostrando o enriquecimento funcional de genes ativados por EWS/FLI que são resgatados ou não pelo DAF. Painel 6B é adaptado de Theisen, et al.23Clique aqui para ver uma versão maior desta figura.

Figura 7: Análise detalhada de diferentes elementos de resposta ao fator de transcrição para diferentes construções: (A) Esquema que retrata o processamento de dados usado para gerar painéis (B) e (C) incorporando outros conjuntos de dados disponíveis com os perfis transcriômicos aqui. (B,C) Compilação mostrando o resgate de diferentes classes de alvos diretos EWS/FLI- (B) ativados e(C) alvos reprimidos. Os genes incluídos foram apenas aqueles genes com expressão diferencial detectável por EWS/FLI endógeno. Em cada gráfico de tortas, o cinza retrata a porção de genes que não são resgatados pela construção. O vermelho retrata a porção de genes que são ativados diferencialmente, e o azul retrata a porção de genes que são diferencialmente reprimidos. Esta figura é adaptada de Theisen, et al.23Clique aqui para ver uma versão maior desta figura.
Figura S1: Carregando os arquivos fastq.gz para o ambiente HPC, aparando e alinhamento. Clique aqui para baixar este número.
Figura S2: A leitura de collating conta entre amostras e a normalização do lote em execução com o ComBat. Clique aqui para baixar este número.
Figura S3: Executando o DESeq2 e extraindo resultados de análise de expressão diferencial. Clique aqui para baixar este número.
Figura S4: Analisando a saída. Clique aqui para baixar este número.
Figura S5: Agrupamento hierárquico para identificar classes genéticas: Agrupamento hierárquico dos 1000 genes mais variáveis em todos os construtos e na linha de base, iEF, classificados em aglomerados k. Neste caso k=7, mas este parâmetro é definido pelo usuário como mostrado na Figura S4D. Clique aqui para baixar este número.
Tabela S1: Lista de genes (Ensembl gene ID) com anotação de cluster. Clique aqui para baixar esta tabela.