June 27th, 2020
Les domaines intrinsèquement désordonnés sont importants pour la fonction du facteur de transcription de fusion oncogène. Pour cibler thérapeutiquement ces protéines, une compréhension plus détaillée des mécanismes de régulation employés par ces domaines est nécessaire. Ici, nous utilisons la transcriptomique pour cartographier les caractéristiques structurelles importantes du domaine EWS intrinsèquement désordonné dans le sarcome d’Ewing.
Il est difficile d’effectuer une analyse structure-fonction sur des facteurs de transcription répétitifs et désordonnés. En couplant la transcriptomique avec le bon contexte cellulaire, cette approche permet de mieux découvrir d’importantes relations structure-fonction. L’utilisation du séquençage de l’ARN comme sortie fonctionnelle permet d’évaluer efficacement tous les gènes régulés par une seule protéine en une seule expérience, ce qui rend la détection de la fonction partielle plus probable.
La détection de la fonction partielle est particulièrement importante pour les facteurs de transcription de fusion oncogénique, car nous ne savons pas comment ces protéines fonctionnent et leur séquençage peut conduire à de meilleures thérapies dans les cancers induits par fusion. Bien que nous nous concentrions sur le domaine EWS désordonné, dans EWS/FLI, EWS est impliqué dans d’autres fusions qui contiennent des domaines de désordre avec des fonctions mal définies. Pour une transduction de construction d’expression d’ADNc, décongelez rapidement le virus congelé avec des constructions d’ADNc dans un bain d’eau à 37 degrés Celsius et mélangez doucement 2,5 microlitres de polybrène de huit milligrammes par millilitre dans chaque vile.
Ensuite, retirez le milieu d’une plaque de culture cellulaire de 10 centimètres confluents à 50 à 70 % par flacon et faites glisser doucement tout le volume de deux millilitres de construction sur le côté de la plaque. Basculez la plaque pour répartir uniformément le virus dans les cellules et placez la plaque dans un incubateur de culture tissulaire à 37 degrés Celsius pendant deux heures, en secouant la plaque toutes les 30 minutes pour éviter que certaines zones de la plaque ne se dessèchent. À la fin de l’incubation, ajoutez cinq millilitres de milieu complété par du sérum de veau fœtal, des antibiotiques, du pyruvate de sodium et du polybrène.
Après une nuit d’incubation dans l’incubateur de culture cellulaire, remplacez le surnageant par un milieu de sélection et retournez les cellules dans l’incubateur de culture cellulaire pendant sept à 10 jours supplémentaires pour permettre la sélection et l’expression de la construction de l’ADNc. À la fin de la période de sélection, rassemblez les cellules dans un tube conique de 15 millilitres pour le comptage et attribuez cinq à 10 fois 10 aux cinquièmes cellules dans un nouveau tube pour le séquençage de l’ARN et deux fois 10 aux six cellules dans un autre nouveau tube pour l’extraction des protéines. Sédimentez les cellules par centrifugation et remettez les granulés en suspension dans un millilitre de PBS froid ou une centrifugation de cinq minutes.
Ensuite, congelez les granulés et l’azote liquide et stockez les cellules à moins 80 degrés Celsius. Pour valider l’inactivation des protéines d’intérêt et l’expression du panel de constructions, épongez les échantillons de lysat de protéines avec les anticorps primaires et secondaires appropriés conformément aux protocoles d’analyse standard par transfert Western. Pour évaluer la qualité et la quantité d’ARN, utilisez le tampon de lyse d’un kit d’extraction basé sur une colonne de spin de silice pour lys les échantillons de cellules de séquençage de l’ARN et appliquez les lysats sur une colonne d’élimination d’ADN génomique à plus de 13 000 tours par minute pendant 30 à 60 secondes.
Ensuite, procédez à la purification de la colonne de spin de silice et lavez l’ARN sur la colonne selon les instructions du kit. Ensuite, éluez l’ARN dans 30 microlitres de tampon d’élution et analysez au moins 2,5 microgrammes d’ARN sur un spectrophotomètre à un rapport de 260 à 280 nanomètres pour évaluer la quantité d’ARN et la qualité de l’échantillon. Pour l’analyse de fichiers fastq, utilisez Putty pour ouvrir le terminal à l’environnement de calcul haute performance et créer un répertoire d’analyse appelé project.
Naviguez jusqu’au chemin d’accès au répertoire du projet et créez un répertoire pour les fichiers fastq. gz bruts compressés appelé fastq et un deuxième répertoire appelé trimmed. Utilisez un programme de transfert de fichiers sécurisé approprié pour transférer le fastq brut compressé.
gz du stockage local vers le chemin d’accès au répertoire FASTQ du projet et vérifiez qu’il existe un fichier R1 et un fichier R2 pour chaque échantillon. Naviguez jusqu’au chemin d’accès au projet fastq et utilisez la commande trim abondamment comme indiqué pour couper les lectures de faible qualité du fastq. GZ.
Naviguez jusqu’au chemin d’accès au répertoire du projet et créez un nouveau répertoire appelé STAR output. Naviguez jusqu’au chemin d’accès au répertoire de trim du projet et utilisez la commande indiquée pour exécuter STAR afin d’aligner le fastq tronqué. GZ.
Localisez la sortie requise pour les étapes suivantes, qui contiennent les comptes par transcrit à l’emplacement indiqué et utilisez la commande pour lire dans chaque fichier d’onglet lectures par gène sorti. Pour la première colonne, utilisez uniquement les caractères avant le point dans la colonne ID du gène ENSEMBL pour faciliter le traitement en aval. Ensuite, utilisez la commande pour compiler les comptages de tous les échantillons dans le cadre de données appelé totcts et enregistrez cette nouvelle table de données de comptage brutes sous forme de fichier texte délimité par des tabulations.
Pour définir le profil d’expression différentielle de chaque construction à l’aide de DESeq2, entrez le plan DESeq2 expérimental et utilisez le jeu de données DESeq à partir de la fonction matrix pour construire un jeu de données DESeq afin d’estimer les facteurs de taille et d’exécuter DESeq2. Pour évaluer la qualité de l’analyse, utilisez DESeq2 pour extraire le log normalisé des nombres. Lors de l’extraction des résultats de chaque profil transcriptionnel à partir des résultats DESeq2, effectuez des comparaisons par paires en référence à la condition de renversement ou au vecteur vide de base.
Modifiez davantage ces résultats avec les symboles du gène HGNC et extrayez les données des données DESeq2 dans un seul fichier avec l’ID du gène ENSEMBL, le symbole HGNC, l’expression baseMean et des données d’expression différentielle pour toutes les constructions avec une variation de log double et des valeurs P brutes et ajustées. Évaluez la normalisation réussie du lot et la similarité de l’échantillon d’intérêt, et utilisez le code pour utiliser les comptes normalisés du journal régularisés afin de vérifier le regroupement d’échantillons avec une analyse en composantes principales et des tracés de distance d’échantillon à échantillon. Utilisez le log normalisé pour extraire les 1 000 gènes les plus variables dans une matrice et utilisez une carte thermique pour effectuer un regroupement hiérarchique non supervisé des échantillons en fonction de ces gènes.
Pour extraire les groupes d’intérêt du dendrogramme, décidez à quel niveau du dendrogramme les groupes d’intérêts apparaissent et définissez K égal au nombre de groupes à ce niveau. Pour déterminer quels clusters sont intéressants, retracez la carte thermique ordonnée par cluster et exportez la liste des gènes associés à chaque cluster dans un tableau, puis utilisez un outil bioinformatique approprié pour identifier les rôles biologiques des différents clusters de gènes identifiés et comparés entre les classes. Dans cette analyse représentative, on peut observer un renversement et un sauvetage efficaces avec les constructions positives et négatives.
Notez que les cellules sauvées par DAF n’ont pas réussi à former de colonies, ce qui suggère une altération de la transformation oncogénique. Une fois la validation du réplicant terminée, des tests phénotypiques et des données de séquençage initial de l’ARN pour traiter le nombre de gènes peuvent être obtenus pour tous les échantillons à des fins de normalisation et d’analyse par lots. DESeq2 sans normalisation des lots peut entraîner des défauts de lot confondants, probablement dus à la variabilité biologique introduite par le passage des cellules en culture et aux différences dans le traitement de chaque lot.
Après la normalisation des lots, DESeq2 peut être utilisé pour générer des profils transcriptionnels pour les constructions d’intérêt, par rapport à la ligne de base. L’analyse en composantes principales de ces données suggère que le profil transcriptionnel de DAF est intermédiaire, entre EWS/FLI de type sauvage et Delta 22, confirmant la fonction partielle. De plus, le regroupement hiérarchique des 1 000 gènes les plus variables dans les échantillons montre que DAF ne parvient pas à réprimer les gènes cibles EWS/FLI et ne conserve que partiellement l’activité d’activation des gènes.
L’analyse des gènes supérieurs suggère que les classes de gènes activées par DAF sont fonctionnellement distinctes des cibles activées par EWS/FLI où DAF n’est pas fonctionnel. Il est intéressant de noter que DAF est le plus capable de sauver les gènes activés par les microsatellites GGAA, mais incapable de sauver les gènes activés à proximité d’un site de haute affinité. L’appariement de la sortie transcriptomique avec les tests phénotypiques pertinents complète l’analyse de la fonction de la structure.
Les chercheurs peuvent également utiliser d’autres techniques pour étudier les moteurs mécanistes de différentes fonctions transcriptionnelles.
Cette étude examine le rôle des domaines intrinsèquement désordonnés dans les facteurs de transcription de fusion oncogènes, en se concentrant sur le domaine EWS dans le sarcome d'Ewing. En utilisant la transcriptomique, la recherche vise à élucider les mécanismes de régulation de ces régions désordonnées.