3,308 Views
•
08:23 min
•
February 18, 2022
DOI:
L’interprétation des données de séquençage générées par l’expérience de profilage des ribosomes est essentielle pour mesurer quantitativement les activités translationnelles des ribosomes sur l’ARNm et pour étudier les mécanismes de régulation translationnelle. Dans ce protocole, nous décrirons la procédure de calcul pour utiliser les données de profilage des ribosomes et RiboCode, un outil en ligne de commande pour décoder la traduction de l’ARNm à l’échelle du génome et la résolution d’un seul nucléotide. Cette méthode permet de rechercher les nouveaux peptides provenant des régions génomiques en dehors des gènes codant pour les protéines annotées, et offre la possibilité de quantifier le taux de traduction de l’ARNm.
Pour commencer, ouvrez une fenêtre de terminal Linux et créez un environnement conda en exécutant la commande. Basculez vers l’environnement créé et installez RiboCode et les dépendances en exécutant la commande. Pour obtenir les fichiers de référence du génome pour la séquence de référence, rendez-vous sur le site Web d’Ensembl, puis cliquez sur télécharger, puis sur Téléchargement FTP.
Cliquez sur l’option FASTA dans la colonne ADN FASTA, puis sélectionnez la ligne où l’espèce est humaine, indiquée dans le tableau de la page du site Web. Sur la page du site Web d’Ensembl, copiez le lien tel que mentionné dans le texte, puis téléchargez et décompressez les fichiers dans le terminal en exécutant la commande. Pour l’annotation de référence, cliquez avec le bouton droit sur GTF dans les jeux de gènes de colonne de la dernière page Web ouverte.
Copiez le lien et téléchargez-le à l’aide de la commande. Pour obtenir des séquences d’ARNr, ouvrez le navigateur de génome UCSC, puis cliquez sur Outils et sélectionnez navigateur de tableau dans la liste déroulante. Sur la page du navigateur de génome UCSC, spécifiez mammifère pour le clade, humain pour le génome, toutes les tables pour le groupe, le masque R pour la table et le génome pour la région.
Pour filtrer, cliquez sur Créer pour accéder à une nouvelle page et définissez la classe rep comme correspondant à l’ARNr. Cliquez sur Envoyer, puis définissez le format de sortie sur séquence et le nom du fichier de sortie comme HG38_rRNA. FA. Enfin, cliquez sur obtenir la sortie, puis sélectionnez obtenir la séquence pour récupérer la séquence d’ARNr.
Pour obtenir des jeux de données de profilage de ribosomes à partir de l’archive de lecture de séquence, téléchargez les échantillons répliqués du groupe de traitement si-eIFe et renommez-les en exécutant la commande. Téléchargez ensuite les exemples de réplication du groupe de contrôle et renommez-les en exécutant la commande. Pour supprimer la contamination par l’ARNr, commencez à indexer les séquences de référence de l’ARNr en exécutant la commande.
Après l’indexation, alignez les lectures sur la référence de l’ARNr pour exclure les lectures provenant de l’ARNr en exécutant la commande. Commencez par créer un index de génome en exécutant la commande. Alignez ensuite les lectures propres sans contamination par ARN sur la référence créée en exécutant la commande, puis triez et indexez les fichiers d’alignement en exécutant la commande.
Préparez les annotations de transcription en exécutant la commande. Sélectionnez des fragments protégés par ribosome de longueurs spécifiques et identifiez leurs positions de site P en exécutant la commande. Modifiez les fichiers de configuration de chaque exemple et fusionnez-les.
Ensuite, exécutez RiboCode en exécutant la commande. La distribution en fréquence des longueurs des lectures a montré que la plupart des fragments protégés par les ribosomes correspondent à 25 à 35 nucléotides. Les emplacements du site P pour différentes longueurs de fragments protégés par les ribosomes ont été déterminés en examinant les distances entre leurs cinq extrémités premières et les codons de départ et d’arrêt annotés.
Les résultats de la cartographie montrent que 10 394 gènes codent pour des cadres de lecture ouverts annotés. En outre, 509 et 168 gènes codent pour les cadres de lecture ouverts en amont et en aval, tandis que 939 gènes codent pour les cadres de lecture ouverts en amont ou en aval, chevauchant des cadres de lecture ouverts annotés connus. De plus, 68 gènes codant pour des protéines et 2 601 gènes non codants codent pour de nouveaux cadres de lecture ouverts.
La distribution de longueur a montré que les cadres de lecture ouverts en amont, en aval, nouveaux et superposés étaient plus courts que les cadres de lecture ouverts annotés. Le nombre relatif de fragments protégés par ribosomes a été calculé pour chaque cadre de lecture ouvert, révélant que les densités de ribosomes des cadres de lecture ouverts en amont étaient significativement plus élevées dans les cellules déficientes en eIF3e que dans les cellules témoins. L’analyse du métagène a révélé qu’une masse de ribosomes a calé entre les codons 25 et 75 en aval du codon de départ, ce qui suggère que l’allongement de la traduction pourrait être bloqué tôt dans les cellules déficientes en eIF3e.
Les profils de densité des sites P pour les cadres de lecture ouverts en amont de PSMA6 et les cadres de lecture ouverts en aval du gène SENP3-EIF4A1 ont été examinés, démontrant les modèles de périodicité et les densités des fragments protégés par les ribosomes. La vérification de l’emplacement des lectures autour des codons de départ et d’arrêt des régions codantes de protéines connues est nécessaire pour évaluer les propriétés périodiques des lectures pour chaque longueur. RiboCode, avec un autre outil de ligne de commande, RiboMiner peut également effectuer un contrôle qualité et de multiples analyses telles que la quantification et la visualisation de l’occupation des ribosomes sur les cadres de lecture ouverts prévus.
Cet outil de calcul fournit un moyen à haut débit d’identifier les événements de traduction non canoniques avec des données de profilage des ribosomes dans des contextes physiologiques spécifiques, et comment la traduction se module en réponse au stimulus.
La traduction des ribosomes décode trois nucléotides par codon en peptides. Leur mouvement le long de l’ARNm, capturé par profilage des ribosomes, produit les empreintes présentant une périodicité caractéristique du triplet. Ce protocole décrit comment utiliser RiboCode pour déchiffrer cette caractéristique importante à partir des données de profilage des ribosomes afin d’identifier les cadres de lecture ouverts activement traduits au niveau du transcriptome entier.
Read Article
Cite this Article
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).
Copy