Biology

Tutorial de Análise Computacional para RNA Não-Codificante Pequeno Quimérico: Bibliotecas de Sequenciamento de RNA Alvo

Published: December 1, 2023 doi: 10.3791/65779

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert^1,2

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Summary

Aqui, apresentamos um protocolo demonstrando a instalação e o uso de um pipeline de bioinformática para analisar dados de sequenciamento de RNA quimérico usados no estudo de interações RNA:RNA in vivo .

Abstract

A compreensão das interações regulatórias gênicas in vivo de pequenos RNAs não codificadores (sncRNAs), tais como microRNAs (miRNAs), com seus RNAs-alvo, tem sido avançada nos últimos anos por abordagens bioquímicas que usam ligações cruzadas seguidas de ligadura para capturar interações sncRNA:RNA-alvo através da formação de RNAs quiméricos e bibliotecas de sequenciamento subsequentes. Embora os conjuntos de dados do sequenciamento de RNA quimérico forneçam entrada genômica ampla e substancialmente menos ambígua do que o software de previsão de miRNA, destilar esses dados em informações significativas e acionáveis requer análises adicionais e pode dissuadir os investigadores que não têm conhecimento computacional. Este relatório fornece um tutorial para apoiar biólogos computacionais de nível básico na instalação e aplicação de uma ferramenta de software de código aberto recente: Small Chimeric RNA Analysis Pipeline (SCRAP). Requisitos da plataforma, atualizações e uma explicação das etapas do pipeline e manipulação das principais variáveis de entrada do usuário são fornecidas. Reduzir uma barreira para os biólogos obterem insights de abordagens de sequenciamento de RNA quimérico tem o potencial de impulsionar investigações baseadas em descobertas de interações regulatórias de RNA-alvo em múltiplos contextos biológicos.

Introduction

Pequenos RNAs não-codificantes são altamente estudados por seu papel pós-transcricional na coordenação da expressão de conjuntos de genes em diversos processos, como diferenciação e desenvolvimento, processamento de sinais e^{doenças1,2,3}. A capacidade de determinar com precisão os transcritos alvo de pequenos RNAs não codificadores (sncRNAs) reguladores de genes, incluindo microRNAs (miRNAs), é de importância para estudos de biologia de RNA em níveis básicos e translacionais. Algoritmos de bioinformática que exploram a complementaridade antecipada entre a sequência de sementes de miRNA e seus alvos potenciais têm sido frequentemente usados para a predição de interações miRNA:RNA-alvo. Embora esses algoritmos de bioinformática tenham sido bem-sucedidos, eles também podem abrigar resultados falsos positivos e falsos negativos, como já foi revisado em outros^estudos4,5,6. Recentemente, várias abordagens bioquímicas têm sido projetadas e implementadas que permitem a determinação inequívoca e semiquantitativa de interações in vivo sncRNA:RNA-alvo por meio de reticulação in vivo e subsequente incorporação de uma etapa de ligadura para fixar fisicamente o sncRNA ao seu alvo para formar um único RNA quimérico 4,5,7,8,9,10 . A preparação subsequente de bibliotecas de sequenciamento a partir dos RNAs quiméricos permite a avaliação das interações sncRNA:RNA-alvo por processamento computacional dos dados de sequenciamento. Este vídeo fornece um tutorial para instalar e usar um pipeline computacional denominado pipeline de análise de RNA quimérico pequeno (SCRAP), que é projetado para permitir a análise robusta e reprodutível de interações sncRNA:RNA alvo a partir de bibliotecas de sequenciamento de RNA quimérico⁶.

Um objetivo deste tutorial é ajudar os investigadores a evitar a dependência excessiva de algoritmos de bioinformática puramente preditivos, reduzindo as barreiras para a análise de dados gerados através de abordagens bioquímicas fornecendo leituras moleculares quiméricas de interações sncRNA:RNA-alvo. Este tutorial fornece passos práticos e dicas para orientar cientistas computacionais de nível básico através do uso de um pipeline, o SCRAP, desenvolvido para analisar dados de sequenciamento de RNA quimérico, que podem ser gerados por vários protocolos bioquímicos existentes, incluindo reticulação, ligadura e sequenciamento de híbridos (CLASH) e ligadura covalente de RNAs endógenos ligados a Argonauta- crosslinking e imunoprecipitação (CLEAR-CLIP)^7,9.

O uso do SCRAP oferece diversas vantagens para a análise de dados de sequenciamento de RNA quimérico, comparado a outros pipelines^{computacionais6}. Uma vantagem importante é sua extensa anotação e a incorporação de chamadas a scripts de bioinformática bem suportados e atualizados rotineiramente dentro do pipeline, em comparação com pipelines alternativos que geralmente dependem de scripts personalizados e/ou não suportados para etapas no pipeline. Esse recurso confere estabilidade ao SCRAP, tornando mais valioso para os pesquisadores se familiarizarem com o pipeline e incorporarem seu uso em seu fluxo de trabalho. O SCRAP também demonstrou superar pipelines alternativos na chamada de picos de interações sncRNA:target RNA e ter funcionalidade de plataforma cruzada, conforme detalhado em uma publicação anterior⁶.

Ao final deste tutorial, os usuários serão capazes de (i) conhecer os requisitos da plataforma para SCRAP e instalar pipelines SCRAP, (ii) instalar genomas de referência e configurar parâmetros de linha de comando para SCRAP, e (iii) entender os critérios de chamada de pico e executar chamadas de pico e anotação de pico.

Este vídeo descreverá em detalhes práticos como os pesquisadores que estudam a biologia do RNA podem instalar e usar de forma otimizada o pipeline computacional, SCRAP, para analisar as interações do sncRNA com RNAs alvo, tais como RNAs mensageiros, em dados de sequenciamento de RNA quiméricos obtidos através de uma das abordagens bioquímicas discutidas para a preparação da biblioteca de sequenciamento.

SCRAP é um utilitário de linha de comando. Geralmente, seguindo o guia abaixo, o usuário precisará (i) baixar e instalar o SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) instalar genomas de referência e executar o SCRAP, e (iii) realizar chamadas e anotações de pico.

Mais detalhes das etapas computacionais deste procedimento podem ser encontrados em https://github.com/Meffert-Lab/SCRAP. Este artigo fornecerá a configuração e as informações básicas para permitir que investigadores com habilidades computacionais de nível básico instalem, otimizem e usem o SCRAP em conjuntos de dados de bibliotecas de sequenciamento de RNA quimérico.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOTA: O protocolo começará com o download e a instalação do software necessário para analisar bibliotecas de sequenciamento de RNA quimérico usando SCRAP.

1. Instalação

Antes de instalar o SCRAP, instale as dependências Git e Miniconda na máquina a ser utilizada para as análises. O Git provavelmente já está instalado. Na plataforma Mac OSX, por exemplo, verifique isso usando qual git para ver se o utilitário " git " está presente e instalado neste diretório. Verifique se o Miniconda está instalado usando qual conda. Se nada for devolvido, instale o Miniconda. O Miniconda requer 400 MB de espaço em disco para ser instalado.
1. Existem alguns métodos para instalar o Miniconda, e eles diferem por plataforma. Consulte o arquivo de markdown PLATFORM-SETUP no repositório GitHub do Meffert Lab [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md], onde há mais instruções para instalação no Windows, MacOS e Ubuntu. Para usuários Linux, o Linux tem seu próprio gerenciador de pacotes padrão (apt). No caso específico deste estudo, use o comando brew install Miniconda para instalar o Miniconda usando um gerenciador de pacotes existente, brew.
  NOTA: 'Homebrew', denominado 'brew' é um sistema de gerenciamento de pacotes de software de código aberto que simplifica a instalação de software no sistema operacional da Apple, o macOS.
2. Se o conda estiver sendo instalado pela primeira vez, execute o conda init para o shell específico que está em uso. No exemplo aqui, esse shell em uso é zsh. Em seguida, feche e reabra o shell. Se o conda foi instalado com sucesso, o ambiente base ativado dentro da sessão de terminal será visto.
Baixe o código-fonte SCRAP e instale suas dependências.
1. O método preferido para obter a fonte SCRAP é usando o Git. Acesse isso executando o https://github.com/Meffert-Lab/SCRAP de clone do git para obter a cópia mais recente do código-fonte.
2. Instale o mamba, um solucionador de pacotes aprimorado para conda, e instale todas as dependências para SCRAP do SCRAP_environment.yml para seu próprio ambiente conda usando os seguintes comandos:
  conda instalar -n base conda-forge::mamba
  mamba env create -f SCRAP/SCRAP_environment.yml -n SCRAP
Em seguida, execute a instalação de referência para SCRAP. Os argumentos utilizados na instalação de referência serão específicos para o organismo cujas interações sncRNA-mRNA estão sendo analisadas.
bash SCRAP/bin/Reference_Installation.sh -r full/path/to/SCRAP/ -m tem -g hg38 -s humano
1. Forneça o diretório da pasta de origem SCRAP para instalação de referência. As etapas de instalação serão executadas usando os arquivos dentro das pastas fasta e anotação . Liste o caminho completo sem qualquer taquigrafia. Termine com uma barra.
2. Consulte as tabelas em README.md para obter as abreviaturas corretas das espécies miRbase. Os genomas de referência atualizados podem ser encontrados em https://genome.ucsc.edu/ ou https://www.ncbi.nlm.nih.gov/data-hub/genome/. Neste exemplo, hg38 será usado para o genoma GRCm38 do camundongo.
3. As espécies atualmente incluídas para anotação são humanos, camundongos e vermes. Exiba os arquivos species.annotation.bed correspondentes no diretório de anotação na pasta de origem SCRAP. Se o uso de uma espécie diferente para análise for desejado, forneça um arquivo annotation.bed que siga o mesmo esquema de nomenclatura species.annotation.bed.

2. Execução de SUCATA

Agora que as dependências e o SCRAP estão instalados, - execute o script SCRAP.sh
bash SCRAP/bin/SCRAP.sh -d full/path/to/CLASH_Human/ -a full/path/to/CLASH_Human/CLASH_Human_Adapters.txt -p no -f yes -r full/path/to/SCRAP/ -m has -g hg38
1. Liste todo o caminho para os diretórios de exemplo sem qualquer atalho. Formate os diretórios de exemplo com o nome da pasta correspondente exatamente ao nome do exemplo, como mostra a Figura 1.
2. Observe que o caminho listado é o caminho para o diretório que contém todas as pastas de exemplo, não o caminho para qualquer pasta de exemplo individual ou um arquivo de exemplo (consulte a linha de comando na etapa 2.1).
3. Em seguida, liste o caminho inteiro para o arquivo do adaptador. Verifique se os nomes de exemplo no arquivo do adaptador correspondem aos nomes de pasta e nomes de arquivo mencionados anteriormente (consulte a linha de comando na etapa 2.1).
4. Indicar se as amostras são pareadas e se será ou não realizada filtragem para pré-miRNAs e/ou tRNAs. Adicione um filtro para limpeza de rRNA, se desejado (consulte a linha de comando na etapa 2.1).
  Observação : os usuários podem ou não decidir usar esses filtros dependendo dos tipos de amostra e objetivos experimentais. Dependendo do desenho experimental, pré-miRNAs, tRNAs e rRNAs podem consumir a profundidade de sequenciamento disponível para quimeras reais de sncRNA:RNA alvo e os usuários podem empregar filtros para excluí-las. No entanto, os usuários podem querer evitar essa filtragem em determinadas circunstâncias (por exemplo, mapeando alvos de sncRNA para o genoma mitocondrial, que contém rRNAs mitocondriais).
5. Em seguida, liste todo o caminho para o diretório de referência, a abreviação miRbase e a abreviação do genoma de referência (consulte a linha de comando na etapa 2.1).
  Observação : o script pode levar algumas horas para concluir, dependendo do tamanho do conjunto de dados e da CPU do computador que está sendo usado.

3. Pico de chamada e anotação

Quando o SCRAP terminar de ser executado, verifique se a saída inclui, entre outros arquivos, um arquivo SAMPLE.aligned.unique.bam. Este é um arquivo binário contendo alinhamentos de RNAs alvo no genoma de referência fornecido pelo usuário.
Agora execute chamadas de pico executando Peak_Calling.sh.
bash SCRAP/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m tem -g hg38
NOTA: A chamada de pico é um recurso do SCRAP, que é projetado para permitir que os pesquisadores avaliem prontamente as interações de RNA:RNA alvo não codificantes mais robustas e reprodutíveis dentro de suas bibliotecas de RNA quimérico. Esse recurso, por exemplo, pode ajudar os pesquisadores a identificar interações que eles podem querer selecionar para uma investigação mais aprofundada. A etapa 3.2.2 abaixo descreve como o usuário define os critérios que deseja usar para definir o rigor com o qual um pico é chamado - isso inclui o número de interações exclusivas, ou leituras de sequenciamento, que devem ter ocorrido para que o pico seja chamado, bem como o número de bibliotecas nas quais essa interação específica deve ter ocorrido.
1. Novamente, liste os caminhos completos para o diretório que contém as pastas de exemplo e o arquivo do adaptador (consulte a linha de comando na etapa 3.2).
2. Em seguida, defina o número mínimo de leituras de sequenciamento necessárias para que um pico seja chamado (consulte a linha de comando na etapa 3.2).
3. Defina o número mínimo de bibliotecas de sequenciamento distintas que devem conter um pico para que ele seja chamado (consulte a linha de comando na etapa 3.2).
  NOTA: A escolha dos valores para os pontos 3.2.2 e 3.2.3 dependerá da natureza das amostras sequenciadas e do número de amostras ou tipos de amostras. Aqui, pelo menos 3 leituras de sequenciamento quimérico em uma amostra são necessárias para chamar um pico, e o pico deve ser suportado por pelo menos 2 amostras. Um investigador avaliando um conjunto de dados no qual há muitas réplicas de bibliotecas de sequenciamento para uma determinada condição, por exemplo, pode decidir exigir a presença das leituras em um número maior de bibliotecas de sequenciamento de amostras.
4. Indique se os sncRNAs da mesma família devem contribuir para o mesmo pico. Por exemplo, como os miRNAs da mesma família compartilham sequências de sementes, esses miRNAs podem se ligar a conjuntos compartilhados e sobrepostos de alvos gênicos; Um usuário pode querer identificar o impacto total de uma família nesses alvos avaliando seus picos coletivos (consulte a linha de comando na etapa 3.2).
5. Em seguida, indique o caminho completo para o diretório de referência, a abreviação miRBase e a abreviação do genoma de referência (consulte a linha de comando na etapa 3.2).
Quando a chamada de pico estiver concluída, execute a anotação de pico.
bash SCRAP/bin/Peak_Annotation.sh -p CLASH_Human/peaks.bed -r SCRAP/ -s humano
1. Liste o caminho completo para o arquivo peaks.bed (ou peaks.family.bed) resultante da chamada de pico, o caminho completo para o diretório de referência e as espécies desejadas para anotação.

4. Visualizando os dados

NOTA: Todas as etapas para análise usando SCRAP agora estão concluídas. Para visualizar os dados, várias abordagens são recomendadas:

Mescle todos os arquivos .bam (arquivo SAM binário) que serão desejados para visualizar juntos (samtools merge).
Classifique o arquivo .bam mesclado resultante (samtools sort). O conteúdo do arquivo é classificado linha por linha para que samtools possa indexar.
Indexe o arquivo .bam classificado (índice samtools). Um arquivo BAI (binary samtools format index) é gerado para permitir a visualização no visualizador de genômica integrativa (IGV).
Finalmente, abra o arquivo .bam classificado e .bai indexado resultante no IGV.
NOTA: SncRNA:As interações de RNA-alvo de interesse podem ser priorizadas para acompanhamento de várias maneiras específicas da investigação. Uma abordagem inicial genérica é avaliar as interações para as quais os picos são suportados pelas leituras de sequenciamento mais quiméricas. Interações de interesse também podem ser visualizadas usando o DuplexFold Web Server do pacote RNAstructure, inserindo a sequência para o sncRNA e o RNA alvo a partir da interação detectada¹¹. Para cada pico, as coordenadas cromossômicas (primeira coluna) e genômicas (início: 1ª coluna: 2ª coluna) podem ser encontradas dentro do arquivo peaks.bed.species.annotation.txt gerado na anotação de pico. Para miRNAs em particular, enquanto interações reprodutíveis e funcionais podem carecer de extensa ligação pareada por sementes (por exemplo, interações podem usar ligação compensatória de 3'), a presença de sítios pareados por sementes em um motivo de ligação cognato do RNA alvo pode, no entanto, ser avaliada como uma característica validadora de interações detectadas funcionalmente importantes ^4,12. O processamento de dados auxiliares poderia incluir comparações de cobertura de leitura diferencial entre picos em condições biológicas distintas e potencialmente avaliação do agrupamento de genes regulados em vias usando uma ferramenta de análise de vias.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Os resultados para sncRNA:RNA alvo detectado por uma versão modificada do SCRAP (SCRAP release 2.0, que implementa modificações para filtragem de rRNA) em conjuntos de dados de sequenciamento publicados anteriormente preparados usando CLEAR-CLIP⁹ são mostrados na Figura 2 e na Tabela 1. Os usuários podem apreciar a diminuição nas interações de miRNA de fração relativa com regiões de íntrons que ocorre após o isolamento de interações de alta confiança por chamadas de pico em SCRAP. Dados adicionais de análises usando SCRAP também estão disponíveis na publicação inicial deste pipeline⁶. Dependendo da abordagem experimental, a filtragem de dados de sequenciamento de bibliotecas de RNA quiméricas preparadas pode ser necessária para reduzir artefatos nos resultados. A preparação bioquímica subótima da biblioteca de sequenciamento e/ou a filtragem subótima dos dados de sequenciamento têm o potencial de resultar na inclusão incorreta de leituras que não surgiram da ligadura de sncRNAs e RNAs-alvo ligados por Argonaute. Essas leituras artefactuais podem incluir dímeros de primer ou dímeros adaptadores, rRNAs e pré-miRNAs. A Tabela 2 descreve possíveis artefatos que podem ser detectados nos resultados e possíveis soluções.

Figura 1: Formatação para diretórios de dados. Os arquivos que contêm leituras brutas para cada biblioteca de sequenciamento devem ser fornecidos no formato .fastq.gz. (A) Se as bibliotecas não forem emparelhadas, um único arquivo .fastq.gz será usado na análise. Esse arquivo deve ser chamado de 'SAMPLE.fastq.gz' onde SAMPLE é o nome exato do exemplo fornecido pelo usuário no arquivo do adaptador. O arquivo deve estar contido em uma pasta que corresponda exatamente ao nome do exemplo. (B) Para bibliotecas de sequenciamento de extremidade emparelhada, dois arquivos .fastq.gz serão usados. Esses arquivos devem ser nomeados 'SAMPLE-R1.fastq.gz' e 'SAMPLE-R2.fastq.gz' e devem estar localizados dentro de uma pasta que corresponda exatamente ao nome do exemplo. Todos esses diretórios chamados SAMPLE devem estar localizados dentro do mesmo diretório pai, que o usuário fornecerá ao SCRAP como o "diretório de exemplo". Clique aqui para ver uma versão maior desta figura.

Figura 2: Proporção de interações miRNA:RNA-alvo pelos métodos Target Type e Peak Calling. SncRNA quimérico:sequenciamento de RNA-alvo Dados publicados de bibliotecas preparadas usando CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ foram analisados usando uma versão modificada do SCRAP (SCRAP release 2.0) com filtragem de rRNA implementada. Pré-miRNAs, tRNAs e rRNAs foram filtrados, e configurações distintas de chamada de pico foram usadas para "alta confiança" (mínimo de 3 leituras e 2 bibliotecas) e "todas as interações" (mínimo de 1 leitura e 1 biblioteca). As interações foram agrupadas por família de miRNA ou não agrupadas. Frações relativas de leituras de RNA quimérico para as categorias (CDS, 5' UTR, intergênico, intron, 3'UTR) foram calculadas e grafadas. Clique aqui para ver uma versão maior desta figura.

	Todas as interações		Interações de alta confiança
	MiRNAs individuais	Famílias de miRNA	MiRNAs individuais	Famílias de miRNA
CDS	8675	8679	925	1046
5' UTR	338	338	38	43
Intergênico	2230	2230	320	339
Íntron	9522	9519	382	406
3' UTR	6814	6813	548	644
Total de Interações:	31033	31034	4219	4597

Tabela 1: Contagens de leitura quimérica de miRNA:interações de RNA-alvo por tipo de alvo e método de chamada de pico. SncRNA quimérico:dados de sequenciamento de RNA-alvo publicados em bibliotecas preparadas usando CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ foram analisados usando uma versão modificada do SCRAP (SCRAP release 2.0) com filtragem de rRNA implementada. Pré-miRNAs, tRNAs e rRNAs foram filtrados, e configurações distintas de chamada de pico foram usadas para interações de alta confiança (mínimo de 3 leituras e 2 bibliotecas) e todas (mínimo de 1 leitura e 1 biblioteca), agrupadas por família de miRNA ou não agrupadas. Para cada condição, são listadas contagens do total de interações miRNA:RNA-alvo detectadas nas quais a interação RNA-alvo foi mapeada para a categoria de sequência codificadora (CDS), região 5' não traduzida (5' UTR), região intergênica, intrão ou região 3' não traduzida (3'UTR).

Potencial Contaminante	Detectado como	Causas	Soluções Potenciais
Dímeros de Primer	Interações detectadas entre miRNAs cuja sequência corresponde à extremidade 5' de um primer de amplificação e um RNA alvo cuja sequência corresponde ao restante do primer.	Separação inadequada do tamanho (ou seja, extração em gel) do produto de PCR após amplificação.	A maioria dos dímeros de primer será desconsiderada pelo SCRAP após a remoção do adaptador devido ao seu pequeno comprimento. Se eles persistirem, considere adicionar sequências de primers a um filtro.
RNAr	Interações entre miRNAs arbitrários e rRNAs conhecidos ou lncRNAs Gm26917 e Gm42418	Isolamento ineficaz (isto é, imunoprecipitação e separação em gel) de complexos de Argonauta.	A filtragem de rRNA é frequentemente necessária quando a contaminação por rRNA é abundante.
tRNAs e pré-miRNAs	Interações entre fragmentos de RNAt que são produtos de degradação do mesmo RNAt ou miRNAs 5p e 3p produzidos a partir do mesmo pré-miRNA.	Baixa abundância de quimeras verdadeiras de sncRNA:RNA-alvo ou baixa expressão tecidual de Argonauta.	filtragem de RNAt e filtragem de pré-miRNA.

Tabela 2: Leituras e soluções de sequenciamento de potenciais contaminantes.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Este protocolo sobre o uso de pipeline SCRAP para análise de interações sncRNA:RNA alvo é projetado para auxiliar os investigadores que estão entrando em análise computacional. Espera-se que a conclusão do tutorial oriente os investigadores com experiência computacional de nível básico ou superior através das etapas necessárias para a instalação e uso deste pipeline e sua aplicação para analisar dados obtidos de bibliotecas de sequenciamento de RNA quimérico. As etapas críticas para a conclusão deste protocolo incluem a instalação de referência correta e a execução do SCRAP, que pode ser demorado e pode ser a fonte de erros, particularmente se não foi tomado cuidado durante a instalação de dependências usando o Anaconda ou a digitação de argumentos de linha de comando.

Aqui, o foco particular tem sido em dicas e passos para o uso prático do pipeline SCRAP para análise de bibliotecas quiméricas de sequenciamento de sncRNA:RNA alvo. Descobriu-se que o SCRAP supera outras plataformas de análise de RNA quimérico na detecção de interações sncRNA:RNA-alvo ^6,13. Isso pode ser devido à característica de chamada de pico do SCRAP, que foi desenvolvido especificamente para detectar as características (por exemplo, ombro de 3') que são observadas como resultado de etapas bioquímicas envolvidas na formação dos RNAs quiméricos. Outros métodos de chamada de pico para abordagens bioquímicas distintas, como aplicações de sequenciamento de imunoprecipitação de cromatina a jusante (CHIP-seq), foram desenvolvidos para detectar picos em dados que são simetricamente distribuídos em torno de uma média e tipicamente não funcionam tão bem na detecção das características de pico de bibliotecas de RNA-alvo quiméricas de sncRNA:alvo. Os usuários podem, no entanto, desejar testar o uso de outros pipelines computacionais que poderiam funcionar melhor para suas necessidades, particularmente se seus dados não se encaixarem nessa descrição.

Embora o SCRAP tenha requisitos mínimos de hardware, o tempo de execução do SCRAP é dimensionado mal com o tamanho do conjunto de dados. Investigadores que estão além do nível iniciante, ou que têm um grande número de conjuntos de dados ou conjuntos de dados com alta cobertura de sequenciamento, podem desejar usar o SCRAP de uma maneira que possa acelerar as etapas de análise. Como grandes conjuntos de dados (geralmente, > de 1 bilhão de leituras) exigem recursos aprimorados de armazenamento de arquivos e velocidades de leitura/gravação de dados, a execução de SCRAP em um cluster de computação de alto desempenho (HPC) pode ser desejada para análise de conjuntos de dados maiores. Uma otimização SCRAP, que deve fornecer paralelização e melhor desempenho, será disponibilizada no GitHub (https://github.com/Meffert-Lab/). Esta versão atualizada do SCRAP (versão 2.0) também tem filtros melhorados para rRNA e outros contaminantes.

Como acontece com qualquer interface, os usuários podem inevitavelmente encontrar dificuldades ao usar a interface de linha de comando. O mais comum deles inclui erros ortográficos, caminhos incorretos e instalação/controle de versão de pacotes. Os investigadores são aconselhados a ter cautela e evitar erros de digitação ao escrever argumentos de linha de comando e reproduzir caminhos para arquivos ou pastas exatamente (o uso de um preenchimento automático de 'guia' pode ajudar com isso). As dependências do SCRAP são gerenciadas via Anaconda para que os investigadores tenham menos probabilidade de encontrar problemas com a instalação do pacote ou atualizações de versão.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm nada a revelar.

Acknowledgments

Agradecemos aos membros do laboratório Meffert pelas discussões úteis, incluindo BH Powell e WT Mills IV, pelo feedback crítico sobre a descrição da instalação e implementação do gasoduto. Este trabalho foi apoiado por um prêmio da Fundação Braude, o Maryland Stem Cell Research Fund Launch Program, o prêmio Blaustein Endowment for Pain Research and Education e o NINDS RO1NS103974 e NIMH RO1MH129292 para M.K.M.

Materials

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Biology

Tutorial de Análise Computacional para RNA Não-Codificante Pequeno Quimérico: Bibliotecas de Sequenciamento de RNA Alvo

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.