May 22nd, 2018
Aqui apresentamos a ferramenta proteogenomic PoGo e protocolos para rápido, quantitativa, borne-translational modificação e variante habilitado para mapeamento de peptídeos identificados através de espectrometria de massa em genomas de referência. Esta ferramenta é útil para integrar e Visualizar proteogenomic e estudos pessoais proteomic interfaceando com dados de genómica ortogonais.
O objetivo geral deste protocolo de software é demonstrar o uso do PoGo para mapear peptídeos com modificações pós-traducionais associadas e informações quantitativas de experimentos de espectrometria de massa para genomas de referência e permitir a integração e visualização com dados genômicos ortogonais. Essa ferramenta pode ajudar a adicionar informações genômicas às listas de peptídeos geradas por pesquisas proteômicas de espectrometria de massa, para que a integração com dados de sequenciamento de RNA possa ser facilitada. A principal vantagem desta ferramenta é que ela é simples de usar, rápida e suporta informações adicionais, como modificações pós-tradução, quantificação e variação de aminoácidos.
Para começar, baixe e instale o software demonstrado neste vídeo, conforme descrito no protocolo de texto que acompanha. Uma vez instalado, navegue até a pasta de executáveis da GUI do PoGo e inicie o programa clicando duas vezes no ícone da GUI do PoGo. Use o botão de seleção ao lado do executável PoGo.
Em seguida, navegue na pasta executáveis até a subpasta do sistema operacional relevante e selecione o arquivo executável PoGo. Confirme sua seleção clicando no botão abrir. Em seguida, selecione o arquivo de entrada de referência para sequências de proteínas clicando em selecionar.
Navegue até a pasta de dados e selecione o arquivo de dia rápido de tradução. Confirme sua seleção clicando em abrir. Selecione o arquivo de anotação de transcrição usando o botão de seleção.
Em seguida, navegue até a pasta de dados, selecione o arquivo GTF de anotação e clique em abrir. Adicione o arquivo de identificação de peptídeos usando o botão adicionar ao lado dos arquivos de peptídeos. Aqui, selecione o arquivo no formato suportado MZ Tab, MZ Ident ML ou MZ ID, ou no formato de quatro colunas separado por guias.
Além disso, desmarque as caixas de seleção ao lado de BED NGTF na seleção do formato de saída. Deixe apenas PTM BED e GCT marcados. Em seguida, selecione as espécies apropriadas para os dados na seleção suspensa e comece a mapear clicando em iniciar.
Primeiro, carregue o arquivo de saída PoGo terminando em _ptm. cama no visualizador de genômica integrativa. Repita para carregar também o arquivo que termina em _noptm.bed.
Este arquivo contém todos os peptídeos encontrados sem qualquer modificação. Reordene as faixas arrastando e soltando-as na posição desejada na lista. Cada arquivo será mostrado como faixas separadas com o nome do arquivo identificando a faixa.
Cada faixa é inicialmente mostrada de maneira recolhida. Para expandi-los, clique com o botão direito do mouse no nome da trilha e selecione expandido para uma visão completa dos peptídeos, incluindo as sequências. Agora carregue o arquivo que termina em gct.
Este arquivo contém as informações de quantificação de peptídeos. Ao contrário dos arquivos carregados anteriormente, cada amostra anotada será carregada como uma faixa separada. Reorganize as amostras conforme desejado usando operações de arrastar e soltar.
Navegue dentro do genoma selecionando um cromossomo no menu suspenso clicando e segurando uma seção de um cromossomo para ampliar ou digitando as coordenadas genômicas. O mapeamento PoGo pode ser realizado usando a interface gráfica do usuário ou através da interface de linha de comando. Nesta parte do protocolo, a interface de linha de comando é usada para destacar a intercambialidade.
Para mapear os peptídeos variantes obtidos por meio das etapas anteriores do protocolo de texto para o genoma de referência, abra um prompt de comando e navegue até a pasta executáveis do PoGo. Em seguida, digite o comando mostrado aqui. Confirme a execução pressionando a tecla Enter e aguarde até que a execução seja concluída antes de prosseguir.
Visualize os peptídeos mapeados sem incompatibilidade e com incompatibilidade no visualizador de genômica integrativa. No software de interface gráfica do usuário PoGo, adicione os arquivos de identificação de peptídeos usando o botão adicionar ao lado dos arquivos de peptídeos e selecione um ou vários arquivos, bem como arraste e solte no campo em branco abaixo dos arquivos de peptídeos. Em seguida, desmarque as caixas de seleção ao lado de PTM BED, GTF e GCT na seção de formato de saída e deixe apenas BED marcado.
Além disso, selecione a opção mesclar vários arquivos de entrada em uma única saída. Isso resultará em um único arquivo de saída combinando todos os peptídeos dos arquivos de entrada. Deixar esta opção desmarcada resultará em uma execução sequencial do programa para cada arquivo de entrada separadamente.
Em seguida, selecione as espécies apropriadas para os dados do menu suspenso que são consistentes com os arquivos NGTF de dia rápido. Uma vez selecionado, inicie o mapeamento clicando no botão Iniciar. Para gerar um hub de rastreamento a partir de peptídeos mapeados, abra uma janela de terminal e digite o seguinte comando no prompt de comando.
Confirme a execução pressionando a tecla Enter. A execução levará pouco tempo para ser concluída. Quando terminar, transfira o hub de rastreamento gerado com todo o seu conteúdo para um servidor FTP acessível pela web ou GitHub.
Em um navegador da Web, navegue até o navegador UCSC Genome e selecione My Data Track Hubs. Em seguida, clique na guia Meus Hubs. Copie a URL do hub de rastreamento para o campo de texto e carregue o hub de rastreamento clicando em adicionar hub.
Por fim, selecione o navegador do genoma para entrar na visualização do navegador. O hub de trilha personalizado será mostrado no topo da lista. Se vários arquivos BED construíram a base para o hub de rastreamento, cada um dos arquivos será representado como uma faixa separada dentro do hub.
O PoGo e duas outras ferramentas de mapeamento proteogenômico são comparados aqui quanto ao uso geral de memória e tempo de execução analítico. O PoGo supera significativamente as outras ferramentas em velocidade e memória e é capaz de mapear modificações pós-traducionais e informações quantitativas associadas a peptídeos no genoma. O PoGo utiliza a opção de coloração para fornecer auxílio visual fácil em relação à singularidade do mapeamento de peptídeos dentro do genoma.
Os mapeamentos em vermelho indicam exclusividade para um único transcrito, enquanto o bloco destaca o mapeamento para um único gene. Os mapeamentos de cinza mostram peptídeos compartilhados entre vários genes. A opção PTM BED do PoGo redefine o código de cores para acomodar diferentes tipos de modificações pós-traducionais, indicando a localização da modificação com um bloco espesso no resíduo de aminoácido modificado.
Nos dados do proteoma mostrados aqui, representando os do câncer colorretal, apenas dois peptídeos foram identificados, cada um mostrando uma única fosforilação. As informações no arquivo GCT de saída fornecem valores quantitativos para regiões genômicas cobertas por peptídeos. Os peptídeos que atravessam as junções de emenda são divididos em suas partes sem conexão.
Para obter informações mais abrangentes sobre splicing, o arquivo GTF de saída também é necessário. Uma vez que as sequências de proteínas de referência e a anotação são baixadas e configuradas, milhares de peptídeos podem ser mapeados em coordenadas genômicas em menos de cinco minutos, quando não permitem incompatibilidades de sequência. Ao tentar mapear peptídeos em genomas de referência usando PoGo, é importante lembrar de usar sequências traduzidas de transcritos codificadores de proteínas e anotações de transcrição associadas.
Depois de assistir a este vídeo, você deve ter uma boa compreensão de como usar o PoGo e a GUI do PoGo para mapear peptídeos de experimentos de espectrometria de massa proteômica com informações associadas em genomas referenciados e visualizá-los.
Este artigo apresenta PoGo, uma ferramenta proteogenômica projetada para o mapeamento rápido e quantitativo de peptídeos identificados por espectrometria de massa em genomas de referência. Ela facilita a integração e visualização de dados proteogenômicos juntamente com dados genômicos ortogonais.