Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove

A subscription to JoVE is required to view this content.

 

Overview

Entre diferentes métodos para avaliar a expressão genética, o sequenciamento de alto rendimento do RNA, ou RNA-seq. é particularmente atraente, pois pode ser realizada e analisada sem depender de informações genômicas disponíveis prévias. Durante o RNA-seq, o RNA isolado de amostras de interesse é usado para gerar uma biblioteca de DNA, que é então amplificada e sequenciada. Em última análise, o RNA-seq pode determinar quais genes são expressos, os níveis de sua expressão e a presença de quaisquer transcrições até então desconhecidas.

Aqui, a JoVE apresenta os princípios básicos por trás do RNA-seq. Em seguida, discutimos as etapas experimentais e analíticas de um protocolo geral de RNA-seq. Finalmente, examinamos como os pesquisadores estão usando RNA-seq, por exemplo, para comparar a expressão genética entre diferentes amostras biológicas, ou para caracterizar interações proteína-RNA.

Procedure

Sequenciamento de RNA, ou RNA-seq, é uma técnica que pode fornecer informações sobre a sequência e quantidade de cada RNA expresso, conhecido como "transcriptome", em uma população celular. Ao contrário de outros métodos de perfil de expressão, como microarrays, que envolvem sondagem de sequências conhecidas de RNA, o RNA-seq pode traçar a expressão genética de organismos com genomas não sequenciados. Além disso, o RNA-seq pode medir com precisão uma gama maior de níveis de expressão de transcrição do que microarrays, especialmente em níveis muito baixos ou muito altos.

Este vídeo abordará os princípios do RNA-seq, um protocolo para preparar uma biblioteca RNA-seq e analisar os dados, e algumas aplicações dessa técnica.

Primeiro, vamos rever alguns princípios por trás do RNA-seq. O sequenciamento de transcriptome requer isolar uma população de transcrições cujos níveis devem ser medidos. A maioria do RNA nas células é RNA ribossômico, ou rRNA, o componente central da máquina de produção de proteínas da célula. Para facilitar a recuperação de outros tipos de transcrições, o rRNA é normalmente removido antes do sequenciamento hibridizando a amostra para oligonucleotídeos complementares ligados a contas magnéticas, e usando um ímã para separar o rRNA do resto da amostra.

Alternativamente, uma população específica de RNA pode ser selecionada para sequenciamento. Por exemplo, rnas mensageiros codificadores de proteínas, ou mRNAs, podem ser capturados com "oligo-dT"— pequenos trechos de nucleotídeos desoxi-T que se ligam à sequência de bases A conhecidas como cauda poli-A no final dessas transcrições. O rRNA contaminante é então removido. MicroRNAs, que são RNAs reguladoras de 22 nucleotídeos, podem ser seletivamente isoladas para sequenciamento com base em seu tamanho. Como o RNA é inerentemente propenso à degradação, é primeiro transcrito invertido para DNA de dupla fita.

Sequências de oligonucleotídeos conhecidas como adaptadores são então ligadas aos fragmentos de DNA. Os adaptadores contêm regiões constantes que servem como locais de ligação de primer para amplificação pcr subsequente, e estes geralmente são assimétricos para que a "encalhe" do modelo seja preservada. Os adaptadores também contêm sequências únicas, conhecidas como "códigos de barras", que identificam todos os fragmentos originários de uma única amostra. A biblioteca é então amplificada por PCR.

Um chip de sequenciamento, no qual há oligonucleotídeos complementares aos adaptadores, é usado para imobilizar a amostra da biblioteca, que é diluída de tal forma que as moléculas de DNA se acoram ao chip em baixa densidade. O DNA é amplificado no chip através de um processo chamado "amplificação da ponte" para formar "clusters clonais". Fragmentos curtos, cada 30-150 bases de comprimento, são então sintetizados a partir de uma ou ambas as extremidades desses modelos de DNA, gerando centenas de milhões de produtos conhecidos como leituras de sequenciamento.

Os resultados de sequenciamento são então analisados para qualidade e os dados são processados. A análise das sequências pode revelar uma grande variedade de informações, incluindo diferenças nos níveis de expressão das RNAs entre amostras e transcrições ou formas de transcrições até então desconhecidas.

Agora que vimos como o RNA-seq funciona, vamos passar por um protocolo para preparar uma biblioteca RNA-seq e analisar os dados de sequência. O RNA é obtido pela primeira vez a partir da amostra de interesse, e sua qualidade é verificada por eletroforese, por exemplo, usando um dispositivo de microfluido chamado bioanalzer. O RNA deve ser de alta qualidade para resultados precisos de sequenciamento. Para garantir a ausência de contaminação de DNA, o RT-PCR para um gene expresso é conduzido com ou sem transcriptase reversa. Não deve haver produtos na ausência de transcriptase reversa.

Para selecionar o RNA poli-A, as amostras são vinculadas a sondas oligo-dT anexadas a contas magnéticas. O RNA selecionado é fragmentado para 200 peças de nucleotídeos em alta temperatura na presença de íons de magnésio, reduzindo vieses dependentes de comprimento em reações e análises subsequentes. Os fragmentos são então convertidos em DNA de dupla cadeia, e os adaptadores são ligados. A biblioteca é amplificada por PCR, e sua qualidade é verificada em um bioanalílise e pela realização de qPCR. Os resultados do bioanalizer devem revelar um pico de produtos no tamanho esperado com base no tamanho médio do fragmento e comprimento dos adaptadores.

Bibliotecas de diferentes amostras, contendo diferentes adaptadores com código de barras, podem ser misturadas, juntamente com uma amostra de DNA de referência adicionada em baixa concentração como controle de qualidade para etapas subsequentes do processo, como a geração de cluster clonal e as reações de sequenciamento. A mistura é adicionada a um chip de sequenciamento e carregada na máquina.

Durante a reação de sequenciamento, a densidade de agrupamentos de DNA é monitorada: não deve ser muito alta, o que pode levar à contaminação cruzada, ou muito baixa, o que pode levar a dados insuficientes. A qualidade do sequenciamento é dada pelo escore Q, o que indica a probabilidade de uma base incorreta ser identificada. Os escores Q para a maioria das bases devem ser maiores que 30, o que corresponde a uma chance de menos de 1 em 1000 para uma leitura incorreta. A recuperação das sequências de DNA de referência na taxa esperada indica que todas as sequências de biblioteca estão representadas uniformemente.

As leituras geradas pelo sequenciamento são então sobrepostas umas com as outras para deduzir o RNA que foi sequenciado. Para organismos com informações de genoma disponíveis, as leituras podem ser alinhadas ao genoma de referência. O número de leituras por transcrição é contado para medir a abundância de cada RNA.

Depois de ver como o RNA-seq funciona, vamos olhar para algumas maneiras que está sendo usado.

O sequenciamento de transcriptome pode identificar genes que são expressos diferencialmente em diferentes condições. Por exemplo, neste experimento, foram comparados os transcritos de larvas de mosquitos produzidas em diferentes condições de crescimento. Embora esta espécie particular de mosquito portador de doenças não tenha um genoma sequenciado, os pesquisadores foram capazes de comparar as informações de transcriptome obtidas com outras espécies sequenciadas, e identificar genes com níveis de expressão aumentados ou reduzidos.

O RNA-seq também pode ser usado em "ensaios de repórteres massivamente paralelos" para estudar mecanismos de regulação genética. Isso é feito pela transfecção de células de mamíferos com uma biblioteca de milhares de plasmídeos, cada um contendo uma variante mutante de um site de regulação genética "conduzindo" a transcrição de uma sequência de repórteres que é acoplada a tags únicas. Após o isolamento do RNA e o sequenciamento de alto rendimento, os níveis de cada tag são avaliados para avaliar a expressão do repórter a partir de cada construção, o que dá uma visão da importância funcional dos nucleotídeos mutados em cada variante do site regulatório.

Finalmente, o sequenciamento do RNA pode ser adaptado para estudar interações RNA-proteína, particularmente para identificar transcrições que uma proteína de interesse se liga. A proteína é imunoprecipitada com anticorpos e as RNAs vinculadas são definidas por sequenciamento. Se os complexos de proteína RNA forem interligados no início, a análise de sequenciamento pode mapear o local do crosslink e identificar o local de ligação de proteínas no RNA até o nível de nucleotídeo.

Você acabou de assistir o vídeo de JoVE no RNA-seq. Neste vídeo, vimos como as amostras de RNA são convertidas em bibliotecas, sequenciadas e os dados resultantes analisados, bem como os tipos de informações que a análise de sequenciamento pode fornecer. Graças à sua sensibilidade, potencial para ser usado em qualquer organismo, e o menor custo de sequenciamento, o RNA-seq está sendo cada vez mais usado em múltiplas áreas de pesquisa genética, e fornecerá insights sobre muitas questões em torno da função e desenvolvimento celular. Obrigado por assistir!

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Nenhum conflito de interesses declarado.

Tags

Valor vazio emissão

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter