Journal
/
/
Una pipeline di bioinformatica per analizzare in modo accurato ed efficiente i trascrittomi di microRNA nelle piante
JoVE Journal
Genetics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Journal Genetics
A Bioinformatics Pipeline to Accurately and Efficiently Analyze the MicroRNA Transcriptomes in Plants

Una pipeline di bioinformatica per analizzare in modo accurato ed efficiente i trascrittomi di microRNA nelle piante

8,096 Views

06:34 min

January 21, 2020

DOI:

06:34 min
January 21, 2020

8 Views
, , ,

Transcript

Automatically generated

miRDeep2 può essere utilizzato per identificare con precisione i microRNA degli impianti che sono importanti regolatori trascrittivi nello sviluppo dell’impianto e sono cruciali per rispondere alle sfide ambientali. miRDeep2 richiede un tempo di esecuzione marcatamente breve e mostra un’eccellente prestazione sia nella sensibilità che nella precisione, specialmente per la previsione del microRNA nelle piante con un genoma di grandi dimensioni. I falsi positivi e i lunghi tempi di elaborazione sono sfide nell’annotazione del microRNA dell’impianto.

Aggiungendo una nuova strategia di fielding, revisionando l’algoritmo di punteggio e integrando criteri rigorosi, miRDeep2 può superare questi problemi. L’annotazione del microRNA ad alta confidenza è fondamentale per scoprire il ruolo del microRNA nella regolazione della diversa funzione del genoma. Una guida passo-passo può essere utile per gli annotatori di microRNA per la prima volta.

Per i ricercatori esperti, il metodo è utile per comprendere i vantaggi e i vantaggi dell’utilizzo di miRDeep2 rispetto ad altri strumenti. Per installare il pacchetto miRDeep2, passare alla pagina Web miRDeep2 e recuperare i file tarball. Quindi estrarre tutto il contenuto del file scaricato in un’unica cartella e impostare il percorso della cartella sul percorso.

Per testare la pipeline miRDeep2, scaricare i dati di test e l’output previsto contenente un file di sequenziamento GSM formattato e un file genoma arabidopsis thaliana e spostare tutti i file scaricati nella directory di lavoro corrente. Dopo aver estratto i file di tarball compressi, costruire l’indice di riferimento del genoma arabidopsis e l’indice di riferimento dell’RNA non dicodifica. Una cartella verrà generata automaticamente nel user_selected_folder contenente tutti i file e i risultati intermedi.

La pipeline miRDeep2 può quindi essere eseguita utilizzando i dati di test. Per controllare gli output di test, visualizzare il file di output delimitato da tabulazioni. L’output finale dei microRNA previsti conterrà colonne che indicano l’ID cromosomico, la direzione del filamento, l’ID delle letture rappresentative, l’ID precursore, la posizione del miRNA maturo, la posizione del precursore, la sequenza matura e la sequenza precursore.

Controllare quindi il file progress_log che fornisce informazioni sui passaggi completati e sui file script_log e script_err che contengono output e avvisi del programma. Prima di eseguire la pipeline, per assicurarsi che le letture di input vengano preelaborate nel formato corretto, rimuovere gli adattatori dalle cinque e tre estremità principali delle letture di sequenziamento profondo e assicurarsi che tutti gli identificatori FAST A siano univoci. Ogni identificatore di sequenza deve terminare con un carattere di sottolineatura x e un numero intero che indica il numero di copia della sequenza esatta recuperata nei set di dati di sequenziamento profondo.

Per garantire un identificatore FAST A univoco, includere un numero in esecuzione nel ID.To creare un indice di riferimento, se le sequenze genomiche delle specie di interesse sono state indicizzate, scaricare i file di indice Bowtie 2 dal sito Web iGenomes. Successivamente, costruire un indice di RNA non di noncodifica non-microRNA contenente le principali sequenze di noncoding dalla fam dell’RNA tra cui RNA ribosomiale, RNA di trasferimento, piccolo RNA nucleare e piccolo RNA nucleolare per filtrare sequenze rumorose da altri frammenti di RNA non co-inginocchiato. Per utilizzare miRDeep2 per rilevare nuovi microRNA da dati di sequenziamento profondo, eseguire lo script bash nel pacchetto per avviare la pipeline di analisi.

Il numero di posizioni diverse a cui è possibile mappare una lettura, il numero di mancata corrispondenza per l’esecuzione di Bowtie 2 e la soglia delle letture per milione possono essere modificati in base alle esigenze. Per controllare gli output di miRDeep2, visualizzare i dati nella finestra di output_folder. In questa analisi rappresentativa, la pipeline di annotazione del microRNA miRDeep2 è stata applicata a 10 librerie pubbliche di sequenze di sRNA di cinque specie vegetali con una dimensione del genoma gradualmente aumentata come indicato.

Per ogni specie, due piccole librerie rappresentative di RNA di tessuti diversi e le loro sequenze di genoma indice vengono elaborate come due input. Usando metodi precedenti, l’elaborazione del genoma potrebbe richiedere più di 100 ore o a volte si arresterebbe nel mezzo dell’analisi a causa della lunghezza del genoma. miRDeep2, tuttavia, completa questi processi di previsione in un periodo di tempo notevolmente più breve da minuti a ore.

Per i due piccoli RNA arabidopsis sequenziati utilizzati in questo test, miRDeep2 ha funzionato meglio sia nella sensibilità che nella precisione rispetto ad altri strumenti. Assicurarsi che l’indice di input per il programma sia corretto. Ad esempio, usate Bowtie solo con un indice bowtie e usate un’opzione di indice di grandi dimensioni per genomi di grandi dimensioni.

Gli obiettivi del microRNA risultante possono essere previsti utilizzando dati di sequenziamento che possono fornire informazioni dettagliate sulla funzione del microRNA. Poiché miRDeep2 può essere utilizzato per identificare in modo accurato e sensibile la maggior parte dei microRNA in una specifica specie vegetale, è possibile studiare il ruolo della funzione di microRNA nel suo complesso.

Summary

Automatically generated

Una pipeline bioinformatica, vale a dire miRDeep-P2 (miRDP2 in breve), con criteri di miRNA vegetale aggiornati e un algoritmo revisionato, potrebbe analizzare in modo accurato ed efficiente i trascrittimi di microRNA nelle piante, in particolare per le specie con genomi complessi e di grandi dimensioni.

Read Article