Summary

RNA Secundária Previsão Estrutura Usando SHAPE de alta capacidade

Published: May 31, 2013
doi:

Summary

Alta capacidade seletiva 2 'acilação hidroxila analisados ​​por extensão primer (SHAPE) utiliza um romance químico sondagem tecnologia, transcrição reversa, eletroforese capilar e software de predição de estrutura secundária para determinar as estruturas de RNAs de várias centenas a vários milhares de nucleotídeos em única resolução de nucleotídeos.

Abstract

Compreender a função do RNA envolvido em processos biológicos requer um conhecimento profundo da estrutura do RNA. Para este fim, o método denominado "2 selectiva high-throughput" acilação hidroxilo analisados ​​por extensão de iniciador ", ou forma, permite a previsão da estrutura secundária de ARN com um único nucleótido resolução. Esta abordagem utiliza agentes químicos que preferencialmente sondagem acilato de regiões de cadeia simples de RNA ou flexível, em solução aquosa. Os locais de modificação química são detectados através de transcrição reversa do RNA modificada, e os produtos desta reacção são fraccionados por electroforese capilar automatizada (CE). Uma vez que a transcriptase reversa pausas naqueles nucleótidos de RNA modificados pelos reagentes de forma, a biblioteca de ADNc resultante indirectamente mapeia os ribonucleótidos que são de cadeia simples, no contexto do ARN dobrado. Usando o software ShapeFinder, os produzidos por electrofogramas automatizado CE são processados ​​e convertidos em nutabelas reactividade cleotide que são eles próprios convertidos em constrangimentos pseudo-A energia utilizada no RNAStructure (v5.3) algoritmo de predição. As estruturas de RNA bidimensionais obtidas pela combinação de sondagem com FORMA na previsão da estrutura secundária de RNA in silico foram encontrados para ser muito mais precisas do que as estruturas obtidas usando qualquer um dos métodos sozinho.

Introduction

Para entender as funções dos RNAs catalíticos e não-codificantes envolvidos na regulação do splicing, tradução, replicação do vírus e câncer, um conhecimento detalhado da estrutura do RNA é necessária 1,2. Infelizmente, a previsão precisa de RNA dobrável apresenta um desafio formidável. Agentes de sondagem clássicas sofrem de muitas desvantagens, tais como a toxicidade, a cobertura incompleta de nucleótidos e / ou uma produção limitada de 100-150 nucleótidos por experimentação. Secundárias algoritmos de predição de estrutura nu são igualmente desvantajoso, devido a imprecisões resultantes da sua incapacidade de distinguir de forma eficaz entre as estruturas energeticamente semelhantes. Grande ARN, em particular, são também muitas vezes refractária aos métodos de determinação da estrutura 3D, tais como cristalografia de raios X e ressonância magnética nuclear (RMN), devido a sua flexibilidade conformacional e grandes quantidades de amostras altamente puros necessários para estas técnicas.

HSHAPE igh throughput resolve muitos desses problemas, fornecendo uma abordagem simples e eficaz para investigar as estruturas de grandes RNAs em resolução de nucleotídeo único. Além disso, os reagentes utilizados para a forma são seguras, fáceis de manusear e, em contraste com a maioria dos outros reagentes químicos de sondagem, reagir com todos os quatro ribonucleótidos. Estes reagentes também podem penetrar as membranas celulares, o que torna possível para sondar ARN na sua no contexto in vivo (s) 3. Desenvolvido originalmente nas semanas de laboratório 4, a forma tem sido usado para analisar uma grande variedade de RNAs, o exemplo mais notável sendo a determinação da estrutura secundária completa do ~ 9 kb de ARN do genoma do HIV-1 5. Outras realizações notáveis ​​utilizando FORMA incluem elucidação das estruturas dos viróides infecciosas 6, RNAs humanos longos não codificantes 7, ribossomas de levedura Riboswitches 8 e 9, bem como para identificar os locais de ligação de proteína no virião associada ao HIV-1 RNA 3. While as variações originais e de alto rendimento do protocolo FORMA ter sido publicado anteriormente 10-12, o presente trabalho fornece uma descrição detalhada de determinação da estrutura secundária de RNA pela forma de alto rendimento, utilizando os oligonucleótidos fluorescentes, a Beckman Coulter CEQ 8000 Genetic Analyzer e (v5.3) software SHAPEfinder e RNAStructure. Detalhes técnicos inéditos e conselhos de resolução de problemas também estão incluídos.

Variações de SHAPE

A essência da SHAPE e suas variações, é a exposição de ARN, em solução aquosa em anidridos electrofílicos que acilar selectivamente 2'-2'-hidroxilo (OH) grupos ribose, produzindo adutos volumosos nos locais de modificação. Esta reacção química serve como um meio de interrogar a dinâmica estruturais do local de ARN, tal como os nucleótidos de cadeia simples são mais propensas a adoptar conformações propícios ao ataque electrof por estes reagentes, enquanto a base emparelhada ou arquitectura constrnucleótidos ained são menos reactivos ou 10. Os locais de formação de aduto são detectados por transcrição reversa a partir de primers iniciando fluorescente ou radiomarcado hibridizaram para um local específico no ARN modificado (a "(+)" reacção de extensão de iniciador). Quando a transcriptase reversa (RT) não atravessam os ribonucleótidos acilados, um conjunto de produtos de cDNA é produzida cujos comprimentos coincidem com os locais de modificação. Um controle, "(-)" iniciador de reacção de extensão, utilizando o RNA que não foram expostas ao reagente é também efectuada de modo que a terminação prematura da síntese de ADN (isto é, "stops"), devido à estrutura do RNA, RNA de cadeia inespecífica quebra, etc, podem. ser distinguidos pausando produzido por modificação química. Finalmente, duas reacções de sequenciação didesoxi-iniciadores a partir dos mesmos iniciadores são usados ​​como marcadores para correlacionar nucleótidos reactivos com a sequência primária de ARN após electroforese.

Na aplicação original do SHAPE, o mesmo P-32 marcado na extremidade iniciador é utilizado para o (+), (-), e duas reacções de sequenciação. Os produtos destas reacções são carregadas em poços adjacentes de uma placa de gel de poliacrilamida a 5-8%, e fraccionados por electroforese em gel desnaturante de poliacrilamida (PAGE; Figura 1). A análise quantitativa de imagens de gel produzidas pela forma convencional, pode ser realizada utilizando SAFA, um software de análise de pegadas semi-automático 13.

Em contraste, a forma high-throughput utiliza primers marcados com fluorescência e eletroforese capilar automatizada. Especificamente, para cada região de ARN sob investigação, um conjunto de quatro iniciadores de ADN contendo uma sequência comum mas diferente 5 'marcadores fluorescentes deve ser sintetizado ou adquirido. Estes oligonucleotídeos diferente com rótulos servem para duas principais reações forma e duas reações de sequenciamento, os produtos de que são agrupados e fracionado / detectado por eletroforese capilar automatizada (CE). Whereas do perfil de reactividade de 100-150 nt de ARN pode ser obtida a partir de um conjunto de quatro reacções, usando a abordagem inicial, a forma de alta-resolução, de caudal permite 300-600 nt a partir de uma única amostra combinada 3. Até 8 conjuntos de reacções podem ser fraccionados em simultâneo, enquanto que até 96 amostras podem preparado para fraccionamento ao longo de 12 ensaios consecutivos, CE (Figura 2). Além disso, o software SHAPEfinder, desenvolvido para processar e analisar dados resultantes do CEQ e outros analisadores genéticos, é mais automatizado e requerem muito menos do que a intervenção do utilizador SAFA 13 ou outros pacotes de gel de análise.

Mais avançadas metodologias de alto rendimento surgiram recentemente, como PARS (análise paralela da estrutura RNA) 14 e Frag-seq (fragmento de seqüenciamento) 15, que utilizam enzimas específicas-estrutura, em vez de reagentes de alquilação em conjunto com a próxima geração de técnicas de sequenciamento para obter information sobre a estrutura do RNA. Apesar da atratividade dessas técnicas, as muitas limitações inerentes à nuclease sondagem ainda permanecem 16. Estes problemas podem ser contornados na sequenciação FORMA (FORMA-Seq) 17 de protocolo, em que a geração seguinte de sequenciação é precedido por modificação química e transcrição inversa do ARN de um modo semelhante ao realizado em forma convencional. Embora estes métodos podem representar o futuro da determinação da estrutura de RNA, é importante lembrar que a próxima geração de sequenciação é muito caro, e permanece disponível para muitos laboratórios.

SHAPE Análise de Dados

Os dados produzidos no analisador genético é apresentado sob a forma de um electroferograma, em que a intensidade de fluorescência da amostra (s) que flui através do detector capilar é representada em função de um índice de tempo de migração. Este lote converte a forma de vestígios de sobreposição correspondente a quatro canais de fluorescências usados ​​para detectar os fluoróforos diferentes, e onde cada um dos traços é constituído por picos correspondentes aos produtos de cDNA ou de sequenciação individuais. Dados electroferograma é exportado a partir do analisador genético como um arquivo de texto delimitado por tabulação e importados para transformação ShapeFinder e software de análise 18.

ShapeFinder é inicialmente utilizada para realizar uma série de transformações matemáticas sobre os dados, para assegurar que os tempos de migração de pico e volumes refletem com precisão as identidades e as quantidades dos produtos de reacção, respectivamente. Os picos são então alinhados e integrados, e os resultados tabulados, juntamente com a sequência de ARN primário. Um "perfil de reactividade" para o segmento relevante de ARN é obtido por subtracção de valores de controlo a partir da (+) valores associados com cada ARN de nucleótidos, e normalizar os dados, conforme descrito abaixo. Este perfil é importado para RNAstructure (v5.3) 19,20 software, que converte o val reatividade normalizadaues em restrições pseudo-energia, que são incorporados ao algoritmo dobrável estrutura secundária do RNA. Combinando sondagem química e dobrando algoritmos desta forma melhora de forma significativa a precisão de previsão de estrutura em comparação com qualquer dos métodos isoladamente 12,21. A saída do RNAstructure (v5.3) inclui imagens de menor energia estruturas secundárias de ARN codificado por cores com o perfil de reactividade FORMA (s), bem como as mesmas estruturas em notação de ponto de colchete textual. Este último pode ser posteriormente transportados para o software dedicado à visualização gráfica da estrutura secundária de RNA tais como Varna PseudoViewer 22 e 23.

Figura 1
Figura 1. Fluxograma de RNA determinação da estrutura via SHAPE 4,10. (A) RNA may ser obtidas a partir de amostras biológicas ou por transcrição in vitro. (B) Dependendo da fonte, o RNA é dobrada ou de outra forma processados ​​e modificado com o reagente FORMA. (C) A transcrição reversa utilizando iniciadores marcados com fluorescência ou radioactivamente. (D) são produtos de cDNA fracionado, quer através de eletroforese capilar à base de gel ou laje. (E) análise de fragmentos. (F) predição de estrutura de RNA. Clique aqui para ver a figura maior.

Figura 2
Figura 2. O carácter de elevado rendimento de SHAPE-Based permite a análise rápida de múltiplos ARN, e / ou múltiplos dos mesmos segmentos de RNA. (A) </stRong> Representa como um RNA pode ser dividido em seções 300-600 NT (código de cores em verde, azul e vermelho) (B) Seções do RNA são detectados de forma independente usando diferentes conjuntos de primers fluorescentes (setas pretas) (C) conjuntos de As reacções foram reunidas e carregadas em poços A1, B1, C1, etc, respectivamente, proporcionando uma cobertura completa para a ~ 3 kb RNA1. Produtos de reacção de RNAs 2, 3, 4, etc, podem ser igualmente preparado para fracionamento em corridas eletroforéticas consecutivos. Clique aqui para ver a figura maior.

Protocol

Desenho de primers e extensão do terminal do RNA 3 ' Para analisar longos RNAs pela forma de alto rendimento, uma série de sítios de hibridação do iniciador deve ser seleccionada de tal modo que (i) são separados por 300 nt ~, (ii) são de 20-30 nt de comprimento, e (iii) que o RNA / híbridos de DNA produzidos por tratamento térmico de ADN para estes locais têm uma temperatura de fusão esperada de> 50 ° C. Além disso, os segmentos de RNA que estão previstos para serem altame…

Representative Results

RNA contendo o HIV-1 elemento de resposta rev (RRE) e uma extremidade 3 'da cassete estrutura do terminal 4 foi preparado a partir de um plasmídeo linearizado por transcrição in vitro, depois do que foi dobrado por meio de aquecimento, arrefecimento, e incubação a 37 ° C, na presença de MgCl 2. O ARN foi exposto a NMIA e depois a transcrição reversa a partir de um iniciador de ADN 5 '-fim-marcadas hibridadas com cassete de estrutura do terminal 3'. A bibliotec…

Discussion

Apresentamos aqui um protocolo detalhado para SHAPE high-throughput, uma técnica que permite a determinação da estrutura secundária a resolução de nucleotídeo único para RNAs de qualquer tamanho. Além disso, o acoplamento de dados experimentais com SHAPE secundárias algoritmos de previsão de estrutura facilita a geração de modelos de RNA 2D com um maior grau de precisão do que é possível com qualquer um dos métodos sozinho. A combinação de iniciadores marcados com fluorescência e automatizado CE prop…

Disclosures

The authors have nothing to disclose.

Acknowledgements

S. Lusvarghi, J. Sztuba-Solinska, KJ Purzycka, JW Rausch e SFJ Le Grice são apoiados pelo Programa do National Cancer Institute, National Institutes of Health, EUA Research intramuros.

Materials

      REAGENTS
N-methylisatoic anhydride (NMIA) Life technologies M25 Dissolve in anhydrous DMSO
1-methyl-t-nitroisatoic anhydride (1M7) see ref. 22    
Superscript III Reverse Transcriptase Life technologies 18080044 10,000 units
Thermo sequenase cycle sequencing kit Affymetrix 78500  
      Materials provided by the user
RNA of interest     6 pmol per reaction (the limit of detection will be determined by the instrument)
Sets of four 5′ labeled primers (Cy5, Cy5.5, WellRed D2 and WellRed D1/Licor IR800)     Primers are complementary to the RNA and are used in reverse transcription and sequencing reactions. The listed fluorophores are optimal for the Beckman Coulter 8000 CEQ. Primers may be purchased or synthesized in house.
DNA template     DNA is used for sequencing reactions, and must contain the sequence of the RNA being studied – including any 3’terminal extension, if present. Where applicable, it is often convenient to use the RNA transcription template.
      Buffers
10x RNA renaturation buffer     100 mM Tris-HCl pH 8.0, 1 M KCl, 1 mM EDTA
5X RNA folding buffer     200 mM Tris-HCl pH 8.0, 25 mM MgCl2, 2.5 mM EDTA, 650 mM KCl. (This buffer might be changed depending on the case (e.g. pH, EDTA, Mg, RNase inhibitor)
2.5X RT mix     4 μl 5X buffer, 1 μl 100 mM DTT, 1.5 μl water,1 μl 10 mM dNTPs, 0.5 μl SuperScript III. Note that the 5X buffer and 100 mM DTT are provided with purchase of SuperScript III (Invitrogen).
GenomeLab Sample Loading Solution (Beckman Coulter)     Attention: Avoid multiple freeze-thaw cycles
      EQUIPMENT
Capillary electrophoresis Beckman CEQ8000  
Thermocycler varies    

References

  1. Scott, W. G., Martick, M., Chi, Y. I. Structure and function of regulatory RNA elements: ribozymes that regulate gene expression. Biochim. Biophys. Acta. 1789, 634-641 (2009).
  2. Moore, P. B., Steitz, T. A. The roles of RNA in the synthesis of protein. Cold Spring Harb. Perspect. Biol. 3, a003780 (2011).
  3. Wilkinson, K. A., et al. High-throughput SHAPE analysis reveals structures in HIV-1 genomic RNA strongly conserved across distinct biological states. Plos Biol. 6, 883-899 (2008).
  4. Merino, E. J., Wilkinson, K. A., Coughlan, J. L., Weeks, K. M. RNA structure analysis at single nucleotide resolution by selective 2 ‘-hydroxyl acylation and primer extension (SHAPE). J. Am. Chem. Soc. 127, 4223-4231 (2005).
  5. Watts, J. M., et al. Architecture and secondary structure of an entire HIV-1 RNA genome. Nature. 460, 711-716 (2009).
  6. Xu, W., Bolduc, F., Hong, N., Perreault, J. P. The use of a combination of computer-assisted structure prediction and SHAPE probing to elucidate the secondary structures of five viroids. Mol. Plant Pathol. , (2012).
  7. Novikova, I. V., Hennelly, S. P., Sanbonmatsu, K. Y. Structural architecture of the human long non-coding RNA, steroid receptor RNA activator. Nucleic Acids Res. 40, 5034-5051 (2012).
  8. Leshin, J. A., Heselpoth, R., Belew, A. T., Dinman, J. High-throughput structural analysis of yeast ribosomes using hSHAPE. RNA Biol. 8, 478-487 (2011).
  9. Souliere, M. F., Haller, A., Rieder, R., Micura, R. A powerful approach for the selection of 2-aminopurine substitution sites to investigate RNA folding. J. Am. Chem. Soc. 133, 16161-16167 (2011).
  10. Wilkinson, K. A., Merino, E. J., Weeks, K. M. Selective 2 ‘-hydroxyl acylation analyzed by primer extension (SHAPE): quantitative RNA structure analysis at single nucleotide resolution. Nat. Protoc. 1, 1610-1616 (2006).
  11. McGinnis, J. L., Duncan, C. D. S., Weeks, K. M. High-Throughput Shape and Hydroxyl Radical Analysis of Rna Structure and Ribonucleoprotein Assembly. Method Enzymol. 468, 67-89 (2009).
  12. Low, J. T., Weeks, K. M. SHAPE-directed RNA secondary structure prediction. Methods. 52, 150-158 (2010).
  13. Das, R., Laederach, A., Pearlman, S. M., Herschlag, D., Altman, R. B. S. A. F. A. Semi-automated footprinting analysis software for high-throughput quantification of nucleic acid footprinting experiments. Rna-a Publication of the Rna Society. 11, 344-354 (2005).
  14. Kertesz, M., et al. Genome-wide measurement of RNA secondary structure in yeast. Nature. 467, 103-107 (2010).
  15. Underwood, J. G., et al. FragSeq: transcriptome-wide RNA structure probing using high-throughput sequencing. Nat. Methods. 7, 995-1001 (2010).
  16. Mauger, D. M., Weeks, K. M. Toward global RNA structure analysis. Nat. Biotechnol. 28, 1178-1179 (2010).
  17. Lucks, J. B., et al. Multiplexed RNA structure characterization with selective 2′-hydroxyl acylation analyzed by primer extension sequencing (SHAPE-Seq). Proc. Natl. Acad. Sci. USA. 108, 11063-11068 (2011).
  18. Vasa, S. M., Guex, N., Wilkinson, K. A., Weeks, K. M., Giddings, M. C. ShapeFinder: a software system for high-throughput quantitative analysis of nucleic acid reactivity information resolved by capillary electrophoresis. RNA. 14, 1979-1990 (2008).
  19. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11, 129 (2010).
  20. Pang, P. S., Elazar, M., Pham, E. A., Glenn, J. S. Simplified RNA secondary structure mapping by automation of SHAPE data analysis. Nucleic Acids Res. 39, e151 (2011).
  21. Deigan, K. E., Li, T. W., Mathews, D. H., Weeks, K. M. Accurate SHAPE-directed RNA structure determination. Proc. Natl. Acad. Sci. USA. 106, 97-102 (2009).
  22. Darty, K., Denise, A., Ponty, Y. VARNA: Interactive drawing and editing of the RNA secondary structure. Bioinformatics. 25, 1974-1975 (2009).
  23. Byun, Y., Han, K. PseudoViewer: web application and web service for visualizing RNA pseudoknots and secondary structures. Nucleic Acids Res. 34, 416-422 (2006).
  24. Brown, T., Brown, D. J. S., Eckstein, F. . Oligonucleotides and Analogues – A Practical Approach. , 20 (1990).
  25. Legiewicz, M., et al. The RNA Transport Element of the Murine musD Retrotransposon Requires Long-range Intramolecular Interactions for Function. J. Biol. Chem. 285, 42097-42104 (2010).
  26. Steen, K., Siegfried, N. A., Weeks, K. M. Syntheis of 1-methyl-8-nitroisatoic anhydride (1M7). Protocol Exchange. , (2011).
  27. Mortimer, S. A., Weeks, K. M. A fast-acting reagent for accurate analysis of RNA secondary and tertiary structure by SHAPE chemistry. J. Am. Chem. Soc. 129, 4144-4145 (2007).
  28. Mitra, S., Shcherbakova, I. V., Altman, R. B., Brenowitz, M., Laederach, A. High-throughput single-nucleotide structural mapping by capillary automated footprinting analysis. Nucleic Acids Res. 36, e63 (2008).
  29. Giddings, M. C., Severin, J., Westphall, M., Wu, J., Smith, L. M. A software system for data analysis in automated DNA sequencing. Genome Res. 8, 644-665 (1998).
  30. Aviran, S., et al. Modeling and automation of sequencing-based characterization of RNA structure. Proc. Natl. Acad. Sci. USA. 108, 11069-11074 (2011).

Play Video

Cite This Article
Lusvarghi, S., Sztuba-Solinska, J., Purzycka, K. J., Rausch, J. W., Le Grice, S. F. RNA Secondary Structure Prediction Using High-throughput SHAPE. J. Vis. Exp. (75), e50243, doi:10.3791/50243 (2013).

View Video