Qui, presentiamo un protocollo che dimostra l’installazione e l’uso di una pipeline bioinformatica per analizzare i dati di sequenziamento dell’RNA chimerico utilizzati nello studio delle interazioni RNA:RNA in vivo .
La comprensione delle interazioni regolatorie genetiche in vivo di piccoli RNA non codificanti (sncRNA), come i microRNA (miRNA), con i loro RNA bersaglio è stata avanzata negli ultimi anni da approcci biochimici che utilizzano il cross-linking seguito dalla legatura per catturare le interazioni sncRNA:RNA bersaglio attraverso la formazione di RNA chimerici e successive librerie di sequenziamento. Mentre i set di dati provenienti dal sequenziamento dell’RNA chimerico forniscono input a livello di genoma e sostanzialmente meno ambigui rispetto al software di previsione dei miRNA, la distillazione di questi dati in informazioni significative e fruibili richiede ulteriori analisi e può dissuadere i ricercatori che non hanno un background computazionale. Questo report fornisce un’esercitazione per supportare i biologi computazionali entry-level nell’installazione e nell’applicazione di un recente strumento software open source: Small Chimeric RNA Analysis Pipeline (SCRAP). Vengono forniti i requisiti della piattaforma, gli aggiornamenti e una spiegazione dei passaggi della pipeline e della manipolazione delle variabili chiave di input dell’utente. Ridurre una barriera per i biologi nell’ottenere informazioni dagli approcci di sequenziamento dell’RNA chimerico ha il potenziale per lanciare indagini basate sulla scoperta delle interazioni regolatorie sncRNA:RNA bersaglio in più contesti biologici.
I piccoli RNA non codificanti sono altamente studiati per il loro ruolo post-trascrizionale nel coordinare l’espressione di gruppi di geni in diversi processi come la differenziazione e lo sviluppo, l’elaborazione dei segnali e la malattia 1,2,3. La capacità di determinare con precisione i trascritti bersaglio di piccoli RNA non codificanti (sncRNA) regolatori genici, inclusi i microRNA (miRNA), è importante per gli studi di biologia dell’RNA sia a livello di base che di traduzione. Algoritmi bioinformatici che sfruttano la complementarità anticipata tra la sequenza seme di miRNA e i suoi potenziali bersagli sono stati frequentemente utilizzati per la predizione delle interazioni miRNA:RNA bersaglio. Sebbene questi algoritmi bioinformatici abbiano avuto successo, possono anche ospitare risultati sia falsi positivi che falsi negativi, come è stato esaminato altrove 4,5,6. Recentemente, sono stati progettati e implementati diversi approcci biochimici che consentono la determinazione univoca e semiquantitativa delle interazioni in vivo sncRNA:RNA bersaglio mediante reticolazione in vivo e conseguente incorporazione di una fase di legatura per legare fisicamente l’sncRNA al suo bersaglio per formare un singolo RNA chimerico 4,5,7,8,9,10 . La successiva preparazione di librerie di sequenziamento a partire dagli RNA chimerici consente di valutare le interazioni sncRNA:RNA bersaglio mediante elaborazione computazionale dei dati di sequenziamento. Questo video fornisce un tutorial per l’installazione e l’utilizzo di una pipeline computazionale denominata small chimeric RNA analysis pipeline (SCRAP), progettata per consentire un’analisi robusta e riproducibile delle interazioni sncRNA:target RNA da librerie di sequenziamento dell’RNA chimerico6.
Uno degli obiettivi di questo tutorial è quello di aiutare i ricercatori ad evitare un’eccessiva dipendenza da algoritmi bioinformatici puramente predittivi, abbassando le barriere all’analisi dei dati generati attraverso approcci biochimici, fornendo letture molecolari chimeriche delle interazioni sncRNA:RNA bersaglio. Questo tutorial fornisce passaggi pratici e suggerimenti per guidare gli scienziati computazionali entry-level attraverso l’uso di una pipeline, SCRAP, sviluppata per analizzare i dati di sequenziamento dell’RNA chimerico, che possono essere generati da diversi protocolli biochimici esistenti, tra cui crosslinking, legatura e sequenziamento di ibridi (CLASH) e legatura covalente di RNA endogeni legati ad Argonaute – reticolazione e immunoprecipitazione (CLEAR-CLIP)7,9.
L’utilizzo di SCRAP offre diversi vantaggi per l’analisi dei dati di sequenziamento dell’RNA chimerico, rispetto ad altre pipeline computazionali6. Un vantaggio saliente è la sua ampia annotazione e l’incorporazione di call-out a script bioinformatici ben supportati e regolarmente aggiornati all’interno della pipeline, rispetto a pipeline alternative che spesso si basano su script personalizzati e/o non supportati per i passaggi della pipeline. Questa caratteristica conferisce stabilità a SCRAP, rendendo più utile per i ricercatori familiarizzare con la pipeline e incorporarne l’uso nel loro flusso di lavoro. È stato anche dimostrato che SCRAP supera le pipeline alternative nel chiamare i picchi di interazioni sncRNA:target RNA e che ha funzionalità multipiattaforma, come dettagliato in una precedente pubblicazione6.
Al termine di questa esercitazione, gli utenti saranno in grado di (i) conoscere i requisiti della piattaforma per SCRAP e installare le pipeline SCRAP, (ii) installare genomi di riferimento e impostare i parametri della riga di comando per SCRAP e (iii) comprendere i criteri di chiamata di picco ed eseguire le chiamate di picco e l’annotazione di picco.
Questo video descriverà in dettaglio come i ricercatori che studiano la biologia dell’RNA possono installare e utilizzare in modo ottimale la pipeline computazionale, SCRAP, per analizzare le interazioni di sncRNA con gli RNA bersaglio, come gli RNA messaggeri, nei dati di sequenziamento dell’RNA chimerico ottenuti attraverso uno degli approcci biochimici discussi alla preparazione della libreria di sequenziamento.
SCRAP è un’utilità della riga di comando. Generalmente, seguendo la guida riportata di seguito, l’utente dovrà (i) scaricare e installare SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) installare genomi di riferimento ed eseguire SCRAP e (iii) eseguire le chiamate e le annotazioni dei picchi.
Ulteriori dettagli sulle fasi computazionali di questa procedura sono disponibili all’https://github.com/Meffert-Lab/SCRAP. Questo articolo fornirà la configurazione e le informazioni di base per consentire ai ricercatori con competenze computazionali di livello base di installare, ottimizzare e utilizzare SCRAP su set di dati di librerie di sequenziamento dell’RNA chimerico.
Questo protocollo sull’uso della pipeline SCRAP per l’analisi delle interazioni sncRNA:target RNA è progettato per assistere i ricercatori che stanno entrando nell’analisi computazionale. Ci si aspetta che il completamento dell’esercitazione guidi i ricercatori con esperienza computazionale entry-level o superiore attraverso i passaggi necessari per l’installazione e l’uso di questa pipeline e della sua applicazione per analizzare i dati ottenuti dalle librerie di sequenziamento dell’RNA chimerico. I passaggi critici pe…
The authors have nothing to disclose.
Ringraziamo i membri del laboratorio Meffert per le utili discussioni, tra cui BH Powell e WT Mills IV, per il feedback critico sulla descrizione dell’installazione e dell’implementazione del gasdotto. Questo lavoro è stato sostenuto da un premio della Fondazione Braude, dal programma di lancio del Maryland Stem Cell Research Fund, dal premio Blaustein Endowment for Pain Research and Education e dal NINDS RO1NS103974 e NIMH RO1MH129292 a M.K.M.
Genomes | UCSC Genome browser | N/A | https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/ |
Linux | Linux | Ubuntu 20.04 or 22.04 LTS recommended | |
Mac | Apple | Mac OSX (>11) | |
Platform setup | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] |
SCRAP pipeline | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP |
Unix shell | Unix operating system | bash >=5.0 | |
Unix shell | Unix operating system | zsh (5.9 recommended) | |
Windows | Windows | WSL Ubuntu 20.04 or 22.04 LTS |