June 27th, 2020
I domini intrinsecamente disordinati sono importanti per la funzione del fattore di trascrizione di fusione oncogenica. Per indirizzare terapeuticamente queste proteine, è necessaria una comprensione più dettagliata dei meccanismi di regolazione impiegati da questi domini. Qui, usiamo la trascrittomica per mappare importanti caratteristiche strutturali del dominio EWS intrinsecamente disordinato nel sarcoma di Ewing.
L'esecuzione dell'analisi struttura-funzione su fattori di trascrizione ripetitivi e disordinati è difficile. Accoppiando la trascrittomica con il giusto contesto cellulare, questo approccio scopre meglio importanti relazioni struttura-funzione. L'utilizzo del sequenziamento dell'RNA come output funzionale consente la valutazione efficace di tutti i geni regolati da una singola proteina in un esperimento, rendendo più probabile il rilevamento di funzioni parziali.
Il rilevamento della funzione parziale è particolarmente importante per i fattori di trascrizione della fusione oncogenica, poiché non sappiamo come funzionano queste proteine e il loro sequenziamento può portare a terapie migliori nei tumori guidati dalla fusione. Sebbene ci concentreremo sul dominio disordinato di EWS in EWS/FLI, EWS è coinvolto in altre fusioni che contengono domini disordinati con funzioni scarsamente definite. Per una prima trasduzione del costrutto di espressione del cDNA, scongelare rapidamente il virus congelato con i costrutti di cDNA in un bagno d'acqua a 37 gradi Celsius e mescolare delicatamente 2,5 microlitri di otto milligrammi per millilitro di polibrene in ogni fiala.
Quindi, rimuovere il terreno da una piastra di coltura cellulare confluente da 10 centimetri al 50-70% per costrutto di fiala e bypassare delicatamente l'intero volume di due millilitri di costrutto lungo il lato della piastra. Agitare la piastra per diffondere il virus in modo uniforme tra le cellule e posizionare la piastra in un incubatore per colture tissutali a 37 gradi Celsius per due ore, facendo oscillare la piastra ogni 30 minuti per evitare che le aree della piastra si secchino. Al termine dell'incubazione, aggiungere cinque millilitri di terreno integrato con siero fetale bovino, antibiotici, piruvato di sodio e polibrene.
Dopo l'incubazione notturna nell'incubatore per colture cellulari, sostituire il surnatante con il terreno di selezione e rimettere le cellule nell'incubatore per colture cellulari per altri sette-10 giorni per consentire la selezione e l'espressione del costrutto di cDNA. Al termine del periodo di selezione, raccogliere le cellule in una provetta conica da 15 millilitri per il conteggio e allocare da cinque a 10 volte 10 alla quinta cellula in una nuova provetta per il sequenziamento dell'RNA e due volte 10 alle sei cellule in un'altra nuova provetta per l'estrazione delle proteine. Sedimentare le celle mediante centrifugazione e risospendere i pellet in un millilitro di PBS freddo o in una centrifugazione di cinque minuti.
Quindi congelare sia i pellet che l'azoto liquido e conservare le celle a meno 80 gradi Celsius. Per validare il knockdown delle proteine di interesse e l'espressione del pannello di costrutti, tamponare i campioni di lisato proteico con gli anticorpi primari e secondari appropriati secondo i protocolli standard di analisi Western blot. Per valutare la qualità e la quantità dell'RNA, utilizzare il tampone di lisi di un kit di estrazione basato su colonna di centrifuga di silice per lisare i campioni di cellule di sequenziamento dell'RNA e applicare i lisati a una colonna di rimozione del DNA genomico a una velocità superiore a 13.000 giri al minuto per 30-60 secondi.
Successivamente, procedere con la purificazione della colonna di centrifuga di silice e lavare l'RNA sulla colonna secondo le istruzioni del kit. Quindi eluire l'RNA in 30 microlitri di tampone di eluizione e analizzare almeno 2,5 microgrammi di RNA su uno spettrofotometro a un rapporto da 260 a 280 nanometri per valutare la quantità di RNA e la qualità del campione. Per l'analisi dei file fastq, utilizzare Putty per aprire il terminale all'ambiente di calcolo ad alte prestazioni e creare una directory di analisi chiamata project.
Passa al percorso della directory del progetto e crea una directory per i file di fastq. gz raw compressi chiamata fastq e una seconda directory chiamata trimmed. Usa un programma di trasferimento file sicuro appropriato per trasferire il veloce grezzo compresso.
gz dall'archiviazione locale al percorso della directory fastq del progetto e verificare che siano presenti un file R1 e un file R2 per ogni campione. Passare al percorso del progetto fastq e utilizzare il comando in trim galore come indicato per tagliare le letture di bassa qualità dal fastq. gz.
Passare al percorso della directory del progetto e creare una nuova directory denominata output STAR. Passare al percorso della directory di ritaglio del progetto e utilizzare il comando come indicato per eseguire STAR per allineare la fastq tagliata. gz.
Individuare l'output richiesto per i passaggi successivi, che contengono i conteggi per trascrizione nella posizione indicata e utilizzare il comando per leggere ogni lettura per gene fuori scheda. Per la prima colonna, utilizzare solo i caratteri prima del punto nella colonna ENSEMBL gene ID per facilitare l'elaborazione a valle. Quindi utilizzare il comando per compilare i conteggi di tutti i campioni nel frame di dati chiamato totcts e salvare questa nuova tabella di dati di conteggio non elaborati come file di testo delimitato da tabulazioni.
Per definire il profilo di espressione differenziale per ogni costrutto utilizzando DESeq2, inserire il progetto sperimentale DESeq2 e utilizzare il set di dati DESeq dalla funzione matrice per costruire un set di dati DESeq per stimare i fattori di dimensione ed eseguire DESeq2. Per valutare la qualità dell'analisi, utilizzare DESeq2 per estrarre i conteggi di normalizzazione del log regolarizzato. Quando si estraggono i risultati per ciascun profilo trascrizionale dai risultati DESeq2, eseguire confronti a coppie in riferimento alla condizione di knockdown o al vettore vuoto di base.
Modificare ulteriormente questi risultati con i simboli del gene HGNC ed estrarre i dati dai dati DESeq2 come un unico file con l'ID del gene ENSEMBL, il simbolo HGNC, l'espressione baseMean e i dati di espressione differenziale per tutti i costrutti con variazione doppia logaritmica e valori P grezzi e aggiustati. Valutare la corretta normalizzazione del batch e la somiglianza del campione di interesse e utilizzare il codice per utilizzare i conteggi normalizzati del log regolarizzato per verificare il clustering del campione con l'analisi dei componenti principali e un tracciato della distanza da campione a campione. Utilizzare i conteggi normalizzati del log regolarizzato per estrarre i 1.000 geni più variabili in una matrice e utilizzare una mappa di calore per eseguire un raggruppamento gerarchico non supervisionato dei campioni in base a questi geni.
Per estrarre i cluster di interesse dal dendrogramma, decidere quale livello del dendrogramma appaiono i cluster di interessi e impostare K uguale al numero di cluster a quel livello. Per determinare quali cluster sono di interesse, ritracciare la mappa di calore ordinata per cluster ed esportare l'elenco dei geni associati a ciascun cluster in una tabella, quindi utilizzare uno strumento bioinformatico appropriato per identificare i ruoli biologici per i diversi cluster di geni identificati e confrontati tra le classi. In questa analisi rappresentativa si può osservare un efficace knockdown e salvataggio con i costrutti positivi e negativi.
Si noti che le cellule salvate da DAF non sono riuscite a formare colonie, suggerendo una trasformazione oncogenica compromessa. Dopo il completamento della convalida del replicante, è possibile ottenere saggi fenotipici e conteggi genici iniziali per l'elaborazione dei dati di sequenziamento dell'RNA per tutti i campioni per la normalizzazione e l'analisi dei lotti. DESeq2 senza normalizzazione del lotto può causare difetti di lotto confondenti, probabilmente a causa della variabilità biologica introdotta dal passaggio delle cellule in coltura e delle differenze nel trattamento di ciascun lotto.
Dopo la normalizzazione batch, DESeq2 può essere utilizzato per generare profili trascrizionali per i costrutti di interesse, rispetto alla linea di base. L'analisi delle componenti principali di questi dati suggerisce che il profilo trascrizionale di DAF è intermedio, tra EWS/FLI wild-type e Delta 22, confermando la funzione parziale. Inoltre, il raggruppamento gerarchico dei 1.000 geni più variabili tra i campioni mostra che il DAF non riesce a reprimere i geni bersaglio EWS/FLI e mantiene solo parzialmente l'attività di attivazione genica.
L'analisi dei principali geni suggerisce che le classi di geni attivate da DAF sono funzionalmente distinte da quei bersagli attivati da EWS/FLI in cui DAF non è funzionale. È interessante notare che DAF è più in grado di salvare i geni attivati dai microsatelliti GGAA, ma non è in grado di salvare i geni attivati vicino a un sito ad alta affinità. L'abbinamento dell'output trascrittomico con i saggi fenotipici pertinenti completa l'analisi della funzione strutturale.
I ricercatori possono anche utilizzare altre tecniche per studiare i driver meccanicistici di diverse funzioni trascrizionali.
Questo studio investiga il ruolo dei domini intrinsecamente disordinati nei fattori di trascrizione fusi oncogenici, concentrandosi sul dominio EWS nel sarcoma di Ewing. Utilizzando la trascrittomica, la ricerca mira a chiarire i meccanismi regolatori di queste regioni disordinate.