RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
Spanish
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
Aquí, presentamos un protocolo que demuestra la instalación y el uso de una tubería bioinformática para analizar los datos de secuenciación de ARN quimérico utilizados en el estudio de las interacciones ARN:ARN in vivo .
En los últimos años se ha avanzado en la comprensión de las interacciones reguladoras génicas in vivo de los pequeños ARN no codificantes (sncRNA), como los microARN (miARN), con sus ARN diana mediante enfoques bioquímicos que utilizan la reticulación seguida de la ligadura para capturar interacciones entre el ARN y el ARN diana a través de la formación de ARN quiméricos y las bibliotecas de secuenciación posteriores. Si bien los conjuntos de datos de secuenciación de ARN quimérico proporcionan información de todo el genoma y sustancialmente menos ambigua que el software de predicción de miARN, destilar estos datos en información significativa y procesable requiere análisis adicionales y puede disuadir a los investigadores que carecen de una formación computacional. Este informe proporciona un tutorial para ayudar a los biólogos computacionales de nivel básico a instalar y aplicar una herramienta de software de código abierto reciente: Small Chimeric RNA Analysis Pipeline (SCRAP). Se proporcionan los requisitos de la plataforma, las actualizaciones y una explicación de los pasos de la canalización y la manipulación de las variables clave de entrada del usuario. Reducir una barrera para que los biólogos obtengan información de los enfoques de secuenciación de ARN quimérico tiene el potencial de impulsar investigaciones basadas en el descubrimiento de interacciones reguladoras entre el ARNnc y el ARN objetivo en múltiples contextos biológicos.
Los pequeños ARN no codificantes están muy estudiados por sus funciones postranscripcionales en la coordinación de la expresión de conjuntos de genes en diversos procesos como la diferenciación y el desarrollo, el procesamiento de señales y la enfermedad 1,2,3. La capacidad de determinar con precisión las transcripciones diana de los pequeños ARN no codificantes (sncRNA) reguladores de genes, incluidos los microARN (miARN), es importante para los estudios de la biología del ARN tanto a nivel básico como traslacional. Los algoritmos bioinformáticos que explotan la complementariedad anticipada entre la secuencia de semillas de miARN y sus posibles dianas se han utilizado con frecuencia para la predicción de las interacciones entre el ARN y el ARN diana. Si bien estos algoritmos bioinformáticos han tenido éxito, también pueden albergar resultados falsos positivos y falsos negativos, como se ha revisado en otros lugares 4,5,6. Recientemente, se han diseñado e implementado varios enfoques bioquímicos que permiten la determinación inequívoca y semicuantitativa de las interacciones in vivo entre el ARNnc y el ARN diana mediante reticulación in vivo y la consiguiente incorporación de un paso de ligadura para unir físicamente el ARNnc a su diana para formar un único ARN quimérico 4,5,7,8,9,10 . La preparación posterior de bibliotecas de secuenciación a partir de los ARN quiméricos permite la evaluación de las interacciones entre el ARN snc y el ARN diana mediante el procesamiento computacional de los datos de secuenciación. Este vídeo proporciona un tutorial para instalar y utilizar una canalización computacional denominada canalización de análisis de ARN quimérico pequeño (SCRAP), que está diseñada para permitir un análisis robusto y reproducible de las interacciones entre el ARNnc y el ARN diana a partir de bibliotecas de secuenciación de ARN quimérico6.
Uno de los objetivos de este tutorial es ayudar a los investigadores a evitar la dependencia excesiva de algoritmos bioinformáticos puramente predictivos mediante la reducción de las barreras para el análisis de los datos generados a través de enfoques bioquímicos que proporcionan lecturas moleculares quiméricas de las interacciones entre el ARN y el ARN objetivo. Este tutorial proporciona pasos prácticos y consejos para guiar a los científicos computacionales de nivel básico a través del uso de una tubería, SCRAP, desarrollada para analizar datos de secuenciación de ARN quimérico, que pueden ser generados por varios protocolos bioquímicos existentes, incluida la reticulación, ligadura y secuenciación de híbridos (CLASH) y la ligadura covalente de ARN endógenos unidos a argonauta, reticulación e inmunoprecipitación (CLEAR-CLIP)7,9.
El uso de SCRAP ofrece varias ventajas para el análisis de datos de secuenciación de ARN quimérico, en comparación con otras tuberías computacionales6. Una ventaja destacada es su amplia anotación y la incorporación de llamadas a scripts bioinformáticos bien soportados y actualizados rutinariamente dentro de la canalización, en comparación con las canalizaciones alternativas que a menudo se basan en scripts personalizados y/o no admitidos para los pasos de la canalización. Esta característica le da estabilidad a SCRAP, lo que hace que valga más la pena que los investigadores se familiaricen con la canalización e incorporen su uso en su flujo de trabajo. También se ha demostrado que SCRAP supera a las canalizaciones alternativas en la llamada a los picos de las interacciones entre el ARNnc y el ARN diana y que tiene funcionalidad multiplataforma, como se detalla en una publicación anterior6.
Al final de este tutorial, los usuarios podrán (i) conocer los requisitos de la plataforma para SCRAP e instalar canalizaciones de SCRAP, (ii) instalar genomas de referencia y configurar parámetros de línea de comandos para SCRAP, y (iii) comprender los criterios de llamada de picos y realizar llamadas de picos y anotaciones de picos.
Este vídeo describirá en detalle práctico cómo los investigadores que estudian la biología del ARN pueden instalar y utilizar de forma óptima la tubería computacional, SCRAP, para analizar las interacciones del sncRNA con los ARN diana, como los ARN mensajeros, en los datos de secuenciación de ARN quimérico obtenidos a través de uno de los enfoques bioquímicos discutidos para la preparación de la biblioteca de secuenciación.
SCRAP es una utilidad de línea de comandos. Por lo general, siguiendo la guía que se indica a continuación, el usuario deberá (i) descargar e instalar SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) instalar genomas de referencia y ejecutar SCRAP, y (iii) realizar llamadas y anotaciones máximas.
Se pueden encontrar más detalles de los pasos computacionales de este procedimiento en https://github.com/Meffert-Lab/SCRAP. Este artículo proporcionará la configuración y la información básica para permitir a los investigadores con habilidades computacionales de nivel básico instalar, optimizar y usar SCRAP en conjuntos de datos de bibliotecas de secuenciación de ARN quimérico.
NOTA: El protocolo comenzará con la descarga e instalación del software necesario para analizar las bibliotecas de secuenciación de ARN quimérico utilizando SCRAP.
1. Instalación
2. Ejecución de SCRAP
3. Llamada de picos y anotación
4. Visualización de los datos
NOTA: Todos los pasos para el análisis con SCRAP ya se han completado. Para visualizar los datos, se recomiendan varios enfoques:
En la Figura 2 y en la Tabla 1 se muestran los resultados de sncRNA:ARN diana detectados por una versión modificada de SCRAP (versión 2.0 de SCRAP, que implementa modificaciones para el filtrado de ARNr) en conjuntos de datos de secuenciación publicados previamente preparados con CLEAR-CLIP9. Los usuarios pueden apreciar la disminución de las interacciones relativas de miARN de fracción con las regiones de intrones que se produce tras el aislamiento de las interacciones de alta confianza mediante la llamada máxima en SCRAP. También se dispone de datos adicionales de los análisis que utilizan SCRAP en la publicación inicial de este pipeline6. Dependiendo del enfoque experimental, podría ser necesario filtrar los datos de secuenciación de las bibliotecas de ARN quimérico preparadas para reducir los artefactos en los resultados. La preparación bioquímica subóptima de la biblioteca de secuenciación y/o el filtrado subóptimo de los datos de secuenciación tienen el potencial de dar lugar a la inclusión incorrecta de lecturas que no surgieron de la ligadura de sncRNAs y RNAs diana unidos por Argonaute. Estas lecturas artifactuales pueden incluir dímeros de cebadores o dímeros adaptadores, ARNr y pre-miARN. En la Tabla 2 se describen los posibles artefactos que pueden detectarse en los resultados y las posibles soluciones.

Figura 1: Formato de directorios de datos. Los archivos que contienen lecturas sin procesar para cada biblioteca de secuenciación deben proporcionarse en el formato .fastq.gz. (A) Si las bibliotecas no están emparejadas, se utilizará un único archivo .fastq.gz en el análisis. Este archivo debe denominarse "SAMPLE.fastq.gz", donde SAMPLE es el nombre exacto de la muestra proporcionado por el usuario en el archivo del adaptador. El archivo debe estar contenido dentro de una carpeta que coincida exactamente con el nombre de la muestra. (B) Para las bibliotecas de secuenciación de extremos emparejados, se utilizarán dos archivos .fastq.gz. Estos archivos deben llamarse 'SAMPLE-R1.fastq.gz' y 'SAMPLE-R2.fastq.gz' y deben estar ubicados dentro de una carpeta que coincida exactamente con el nombre de la muestra. Todos estos directorios denominados SAMPLE deben estar ubicados dentro del mismo directorio principal, que el usuario proporcionará a SCRAP como el "directorio de muestra". Haga clic aquí para ver una versión más grande de esta figura.

Figura 2: Proporción de interacciones miARN:ARN diana por tipo de diana y métodos de llamada de picos. Los datos publicados de secuenciación quimérica de sncRNA:ARN diana de bibliotecas preparadas con CLEAR-CLIP (SRR2413277 - SRR2413295)9 se analizaron utilizando una versión modificada de SCRAP (SCRAP release 2.0) con filtrado de ARNr implementado. Se filtraron los pre-miARN, los ARNt y los ARNr, y se utilizaron distintos ajustes de llamada máxima para "alta confianza" (mínimo 3 lecturas y 2 bibliotecas) y "todas las interacciones" (mínimo 1 lectura y 1 biblioteca). Las interacciones se agruparon por familia de miARN o no se agruparon. Se calcularon y graficaron las fracciones relativas de las lecturas de ARN quimérico para las categorías (CDS, 5' UTR, intergénico, intrón, 3'UTR). Haga clic aquí para ver una versión más grande de esta figura.
| Todas las interacciones | Interacciones de alta confianza | |||
| MiRNAs individuales | Familias de miARN | MiRNAs individuales | Familias de miARN | |
| CDS | 8675 | 8679 | 925 | 1046 |
| 5' UTR | 338 | 338 | 38 | 43 |
| Intergénico | 2230 | 2230 | 320 | 339 |
| Intrón | 9522 | 9519 | 382 | 406 |
| 3' UTR | 6814 | 6813 | 548 | 644 |
| Total de interacciones: | 31033 | 31034 | 4219 | 4597 |
Tabla 1: Recuentos de lectura quimérica de interacciones miARN:ARN diana por tipo de diana y método de llamada de picos. Los datos de secuenciación quimérica de sncRNA:ARN diana publicados en bibliotecas preparadas con CLEAR-CLIP (SRR2413277 - SRR2413295)9 se analizaron utilizando una versión modificada de SCRAP (SCRAP release 2.0) con filtrado de ARNr implementado. Se filtraron los pre-miRNAs, los tRNAs y los rRNAs, y se utilizaron distintas configuraciones de llamada de pico para las interacciones de alta confianza (mínimo 3 lecturas y 2 bibliotecas) y todas (mínimo 1 lectura y 1 biblioteca), agrupadas por familia de miRNA o no agrupadas. Para cada condición, se enumeran los recuentos del total detectado de interacciones miARN:ARN diana en las que la interacción del ARN diana se asignó a la categoría de secuencia codificante (CDS), región no traducida 5' (UTR 5'), región intergénica, intrón o región no traducida 3' (UTR 3').
| Contaminante potencial | Detectado como | Causas | Posibles soluciones |
| Dímeros de cebadores | Interacciones detectadas entre miRNAs cuya secuencia coincide con el extremo 5' de un cebador de amplificación y un ARN diana cuya secuencia coincide con el resto del cebador. | Separación incorrecta del tamaño (es decir, extracción en gel) del producto de PCR después de la amplificación. | La mayoría de los dímeros de cebador serán ignorados por SCRAP después de retirar el adaptador debido a su pequeña longitud. Si persisten, considere la posibilidad de agregar secuencias de cebadores a un filtro. |
| ARNr | Interacciones entre miRNAs arbitrarios y rRNAs conocidos o lncRNAs Gm26917 y Gm42418 | Aislamiento ineficaz (es decir, inmunoprecipitación y separación en gel) de complejos Argonaute. | El filtrado del ARNr suele ser necesario cuando la contaminación por ARNr es abundante. |
| ARNt y pre-miARN | Interacciones entre fragmentos de ARNt que son productos de degradación del mismo ARNt o miARN 5p y 3p producidos a partir del mismo pre-miARN. | Baja abundancia de sncRNA verdadero: quimeras de ARN diana o baja expresión de Argonaute tisular. | Filtrado de ARNt y filtrado de pre-miARN. |
Tabla 2: Lecturas y soluciones de secuenciación de posibles contaminantes.
Los autores no tienen nada que revelar.
Aquí, presentamos un protocolo que demuestra la instalación y el uso de una tubería bioinformática para analizar los datos de secuenciación de ARN quimérico utilizados en el estudio de las interacciones ARN:ARN in vivo .
Agradecemos a los miembros del laboratorio Meffert por sus útiles discusiones, incluidos BH Powell y WT Mills IV, por sus comentarios críticos sobre la descripción de la instalación e implementación del gasoducto. Este trabajo fue apoyado por un premio de la Fundación Braude, el Programa de Lanzamiento del Fondo de Investigación de Células Madre de Maryland, el premio Blaustein Endowment for Pain Research and Education, y el RO1NS103974 del NINDS y el RO1MH129292 del NIMH a M.K.M.
| Genomas | UCSC Genome browser | N/A https://genome.ucsc.edu/ | o https://www.ncbi.nlm.nih.gov/data-hub/genome/ |
| Linux | Linux | Ubuntu 20.04 o 22.04 LTS recomendado | |
| Mac | Apple | Mac OS (>11) | |
| Configuración de la plataforma | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] |
| Pipeline de SCRAP | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP |
| shell de Unix | Sistemaoperativo Unix | bash >=5.0 | |
| Shell de Unix | Sistema operativo Unix | zsh (recomendado 5.9) | |
| Windows | Windows WSL Ubuntu 20.04 o 22.04 LTS |