RNA-Seq

Genetics

Your institution must subscribe to JoVE's Advanced Biology collection to access this content.

Fill out the form below to receive a free trial or learn more about access:

Welcome!

Enter your email below to get your free 1 hour trial to JoVE!





By clicking "Submit", you agree to our policies.

 

Summary

Entre los diferentes métodos para evaluar la expresión génica, la secuenciación de alto rendimiento del ARN o RNA-SEQ es particularmente atractiva, como puede ser realizado y analizado sin depender de la información genómica disponible previa. Durante RNA-seq, el ARN aislado de muestras de interés se utiliza para generar una biblioteca de ADN, que luego es amplificada y secuenciada. En última instancia, RNA-seq puede determinar qué genes se expresan, los niveles de su expresión y la presencia de cualquier transcritos anteriormente desconocidos.

Aquí, Zeus presenta los principios básicos detrás de RNA-seq. Luego discutimos los pasos experimentales y análisis de un protocolo general de RNA-seq. Por último, veremos cómo los investigadores actualmente están utilizando RNA-seq, por ejemplo, para comparar la expresión génica entre diferentes muestras biológicas, o para caracterizar las interacciones proteína-RNA.

Cite this Video

JoVE Science Education Database. Fundamentos de la genética. RNA-Seq. JoVE, Cambridge, MA, (2017).

La secuencia de RNA y RNA-seq, es una técnica que puede proporcionar información sobre la secuencia y la cantidad de cada ARN expresado, conocido como el "transcriptoma," en una población celular. A diferencia de otros expresión perfilado métodos tales como microarrays, que sondeo conocido secuencias de RNA, RNA-seq puede Perfil de expresión génica de los organismos con genomas secuenciados sin. Además, RNA-seq con precisión puede medir una gama más grande de niveles de expresión de la transcripción de microarrays, especialmente a niveles muy altos o muy bajos.

Este video cubre los principios de la RNA-seq, un protocolo para preparar una biblioteca de RNA-seq y analizar los datos y algunas aplicaciones de esta técnica.

En primer lugar, vamos a repasar algunos de los principios detrás de RNA-SEQ transcriptoma secuenciación requiere aislar una población de transcripciones cuyos niveles deben medirse. Mayoría RNA en las células es ARN ribosomal o ARNr, el componente central de maquinaria de producción de proteínas de la célula. Para facilitar la recuperación de otros tipos de transcripciones, rRNA es normalmente eliminado antes de su secuenciación por hibridación la muestra de granos adheridos a magnético oligonucleótidos complementarios y utilizando un imán para separar los rRNA del resto de la muestra.

Como alternativa, puede seleccionarse una población específica de ARN para la secuencia. Por ejemplo, la proteína-codificación mensajero RNAs y mRNAs, pueden ser capturados con "oligo-dT", corta tramos de nucleótidos desoxi-T que se unen a la secuencia de una base conocida como una cola poly-al final de estas transcripciones. Luego se retira el rRNA contaminantes. MicroRNAs, que son RNAs reguladoras 22-nucleótido, puede aislarse selectivamente para secuenciación basada en su tamaño. Porque el ARN es intrínsecamente propenso a la degradación, es primer ADN transcrito a doble cadena inversa.

Secuencias de oligonucleótidos conocidas como adaptadores entonces se unen a los fragmentos de ADN. Los adaptadores contienen regiones constantes que sirven como sitios de unión de cartilla para posterior amplificación por PCR, y son generalmente asimétricas para que se conserve el "strandedness" de la plantilla. Los adaptadores también contienen secuencias únicas, conocidas como "código de barras," que identificar todos los fragmentos procedentes de una sola muestra. La biblioteca es entonces amplificada por PCR.

Un chip de la secuencia, en el cual son oligonucleótidos complementarios a los adaptadores, se utiliza para inmovilizar la muestra de la biblioteca, que se diluye en tal forma que las moléculas de ADN se recuecen en el chip a baja densidad. El ADN es amplificado en el chip mediante un proceso llamado "amplificación de puente" para formar "clusters clonales". Luego se sintetizan fragmentos cortos, cada 30-150 bases de longitud, de uno o ambos extremos de estas plantillas de ADN, generando cientos de millones de productos conocidos como Lee la secuencia.

Luego se analizan los resultados de la secuenciación para calidad y se procesan los datos. Análisis de las secuencias pueden revelar una amplia variedad de información, incluyendo las diferencias en los niveles de expresión de ARN entre muestras y transcripciones anteriormente desconocidas o formas de las transcripciones.

Ahora que hemos visto cómo funciona RNA-seq, vamos a ir a través de un protocolo para preparar una biblioteca de RNA-seq y analizar los datos de la secuencia. RNA se obtiene primer lugar de la muestra de interés, y su calidad es comprobada por electroforesis, por ejemplo mediante el uso de un dispositivo de microfluidos llamado un equipo bioanalyzer. El RNA debe ser de alta calidad para obtener resultados exactos de la secuencia. Para asegurar la ausencia de contaminación de ADN, RT-PCR para un gen expresado se lleva a cabo con o sin la transcriptasa reversa. No debe haber ningún producto en ausencia de la transcriptasa reversa.

Para seleccionar el RNA poli-A, las muestras van a sondas de oligo-dT Unidas a bolas magnéticas. El ARN seleccionado está fragmentado a 200 nucleótidos piezas a alta temperatura en presencia de iones de magnesio, reduciendo sesgos dependientes de la longitud en reacciones posteriores y análisis. Los fragmentos se convierten entonces en ADN de doble hebra, y adaptadores se unen. La biblioteca es amplificada por PCR, y su calidad se comprueba en un equipo bioanalyzer y realizando qPCR. Los resultados del equipo bioanalyzer deben revelar un pico de productos en el tamaño esperado basado en el tamaño medio del fragmento y la longitud de los adaptadores.

Bibliotecas de diferentes muestras, que contiene código de barras diferentes adaptadores, pueden ser mezcladas, junto con una muestra de referencia en baja concentración como un control de calidad para los pasos posteriores del proceso, tales como generación clonal del racimo y las reacciones de secuenciación de ADN. La mezcla se añade a un chip de secuenciación y cargada en la máquina.

Durante la reacción de secuenciación se controla la densidad de ADN de los racimos: no debe ser demasiado alto, que puede conducir a la contaminación cruzada, o demasiado baja, que puede conducir a insuficiencia de datos. La calidad de la secuencia está dada por la puntuación Q, que indica la probabilidad de una base incorrecta de ser identificada. Las puntuaciones de Q para las bases de la mayoría deben ser mayores de 30, que corresponde a una probabilidad de menos de 1 en 1000 para una lectura incorrecta. Recuperación de las secuencias de ADN de referencia en la tasa esperada indica que todas las secuencias de biblioteca están uniformemente representadas.

Lee generado por la secuencia entonces se superponen unos con otros para deducir el RNA que se secuenció. Para los organismos con la información del genoma disponible, Lee puede alinear con el genoma de referencia. Para medir la abundancia de cada ARN se cuenta el número de lecturas por transcripción.

Después de ver cómo funciona la RNA-seq, echemos un vistazo a algunas formas se está utilizando.

Transcriptoma secuenciación puede identificar genes que se expresan diferencialmente en condiciones diferentes. Por ejemplo, en este experimento se compararon transcriptomas de larvas de mosquitos producidas bajo diferentes condiciones de crecimiento. A pesar de que esta especie de mosquitos portadores de enfermedades no tiene un genoma secuenciado, los investigadores fueron capaces de comparar la información obtenida del transcriptoma a otras especies secuenciadas e identificar genes con niveles de aumento o disminución de la expresión.

RNA-seq puede utilizarse también en "ensayos reportero masivamente paralelo" para el estudio de mecanismos de regulación génica. Esto se hace por transferencia de células de mamífero con una biblioteca de miles de plásmidos, conteniendo cada uno una variante mutada de un sitio de regulación gen "conducir" la transcripción de una secuencia de reportero que se acopla a las etiquetas únicas. Tras aislamiento de RNA y secuenciación de alto rendimiento, se evalúan los niveles de cada etiqueta evaluar expresión reportero de cada construcción, que da conocer la importancia funcional de los nucleótidos mutados en cada variante de sitio reglamentario.

Finalmente, la secuencia de RNA puede adaptarse para estudiar las interacciones RNA-proteína, particularmente para identificar las transcripciones que una proteína de interés se une a. La proteína es immunoprecipitated con anticuerpos y los RNAs consolidados están definidos por la secuencia. Si los complejos ARN-proteína están reticulado al principio, análisis de la secuencia pueden mapa del sitio de la reticulación e identificar el sitio de unión a proteínas en el RNA hasta el nivel del nucleótido.

Sólo has visto video de Zeus en RNA-seq. En este video, hemos visto cómo las muestras de RNA se convierten en bibliotecas, secuenciadas y los datos analizados, así como los tipos de información que pueden proporcionar el análisis de la secuencia. Gracias a su sensibilidad, potencial para ser utilizado en cualquier organismo y el costo reducido de secuenciación, RNA-seq cada vez más está siendo utilizado en múltiples áreas de la investigación genética y proporciona la penetración en muchas preguntas que rodean el desarrollo y función de la célula. ¡Gracias por ver!

A subscription to JoVE is required to view this article.
You will only be able to see the first 20 seconds.

RECOMMEND JoVE

Applications