Genetics

Um método rápido e quantitativo para a modificação pós-traducional e variante habilitado para mapeamento de peptídeos de genomas

Published: May 22, 2018 doi: 10.3791/57633

Christoph N. Schlaffner^1,2,3, Georg J. Pirklbauer², Andreas Bender³, Judith A.J. Steen¹, Jyoti S. Choudhary^2,4

¹Department of Neurobiology, F. M. Kirby Neurobiology Center, Boston Children's Hospital, Harvard Medical School, ²Proteomic Mass Spectrometry, Wellcome Trust Sanger Institute, Wellcome Genome Campus, ³Centre for Molecular Informatics, Department of Chemistry, University of Cambridge, ⁴Functional Proteomics Group, Chester Beatty Laboratories, Institute of Cancer Research

Summary

Aqui apresentamos a ferramenta proteogenomic PoGo e protocolos para rápido, quantitativa, borne-translational modificação e variante habilitado para mapeamento de peptídeos identificados através de espectrometria de massa em genomas de referência. Esta ferramenta é útil para integrar e Visualizar proteogenomic e estudos pessoais proteomic interfaceando com dados de genómica ortogonais.

Abstract

Cross-talk entre os genes transcritos e proteínas é a chave para a resposta celular; daí, a análise dos níveis moleculares como entidades distintas lentamente está sendo estendido para estudos integrativo para melhorar a compreensão da dinâmica molecular dentro das células. Atuais ferramentas para a visualização e integração de proteômica com outros conjuntos de dados omics são insuficientes para estudos em grande escala. Além disso, eles apenas capturar a sequência básica identificar, descartando modificações borne-translational e quantificação. Para solucionar esses problemas, nós desenvolvemos PoGo para mapear peptídeos com modificações borne-translational associadas e quantificação de anotação do genoma de referência. Além disso, a ferramenta foi desenvolvida para permitir o mapeamento de peptídeos, identificadas a partir de bancos de dados de sequência personalizada incorporando único aminoácido variantes. Enquanto PoGo é uma ferramenta de linha de comando, a interface gráfica PoGoGUI permite que os pesquisadores não-bioinformática facilmente mapear peptídeos para 25 espécies suportados pela anotação do genoma de Ensembl. A saída gerada empresta formatos de arquivo do campo genómica e, portanto, a visualização é suportada na maioria dos navegadores do genoma. Para estudos em grande escala, PoGo é suportado pelo TrackHubGenerator para criar web-acessível repositórios de dados mapeados para genomas que também permitem um fácil compartilhamento de dados proteogenomics. Com pouco esforço, esta ferramenta pode mapear milhões de peptídeos de genomas de referência dentro de poucos minutos, superando outras ferramentas disponíveis sequência-identidade baseada. Este protocolo demonstra as melhores abordagens para o mapeamento de proteogenomics através de PoGo com conjuntos de dados publicamente disponíveis de quantitativos e phosphoproteomics, bem como estudos em grande escala.

Introduction

Nas células, genoma, transcriptoma e proteoma afetam uns aos outros para modular a resposta a estímulos internos e externos e interagir uns com os outros para realizar funções específicas, levando a saúde e a doença. Portanto, caracterizar e quantificar os genes transcritos e proteínas são crucial para compreender plenamente os processos celulares. Sequenciamento de próxima geração (NGS) é uma das estratégias mais comumente aplicadas para identificar e quantificar a expressão de gene e transcrição. No entanto, expressão da proteína é comumente avaliada por espectrometria de massa (MS). Significativos avanços na tecnologia de MS ao longo da última década permitiu mais uma completa identificação e quantificação de proteomes, tornar os dados comparáveis com transcriptomics¹. Proteogenomics e multi-omics como formas de integrar dados NGS e MS tornaram-se poderosos abordagens para avaliar processos celulares através de vários níveis moleculares, identificar subtipos de câncer e levando a novos potenciais alvos de drogas em câncer² ^, ³. é importante notar que proteogenomics foi inicialmente usado para fornecer evidência de proteomic para gene e transcrição de anotações⁴. Vários genes previamente pensados para ser não-codificante têm submetido recentemente a reavaliação Considerando o tecido humano em grande escala de conjuntos de dados⁵^,⁶^,⁷. Além disso, dados de proteomic com êxito são usados para apoiar os esforços de anotação em organismos não-modelo⁸^,⁹. No entanto, a integração de dados de proteogenomic pode ser explorada na sequência da expressão da proteína de destaque em relação às características genômicas e elucidar conversas cruzadas entre proteínas e transcrições, fornecendo um sistema combinado de referência e métodos para visualização de co.

A fim de fornecer uma referência comum para proteômica e genômica dados transcriptomics, inúmeras ferramentas foram implementadas para peptídeos de mapeamento, identificados através de MS no genoma coordenadas¹⁰^,¹¹^,¹² ^,¹³^,¹⁴^,¹⁵^,¹⁶^,¹⁷. Abordagens diferem em aspectos como referência de mapeamento, suporte de navegadores do genoma e o grau de integração com outras ferramentas de proteômica, conforme mostrado na Figura 1. Enquanto algumas ferramentas mapeiam reversos peptídeos traduzidos em um genoma¹⁶, outros usam uma posição do search engine anotado dentro de uma anotação de gene e proteína para reconstruir a sequência de nucleotídeos do peptídeo¹⁵. Ainda outros usam uma tradução de 3 ou 6-quadro do genoma para mapear peptídeos contra¹¹^,¹³. Por último, várias ferramentas ignorar as sequências de nucleótidos e usam traduções de sequência de aminoácidos de transcrições de sequenciação do ARN-mapeada como um intermediário para mapear o genoma associado coordenadas¹⁰^,¹²^{, peptídeos} ¹⁴^,¹⁷. No entanto, a tradução de sequências nucleotídicas é um processo lento e bancos de dados personalizados são propensos a erros que se propague para o mapeamento de peptídeo. Para o mapeamento rápido e de alta produtividade, uma referência abrangente e pequena é crucial. Portanto, uma referência de proteína padronizada com coordenadas de genoma associado é essencial para peptídeo preciso para o mapeamento do genoma. Novos aspectos em proteogenomics, tais como a incorporação de variantes e modificações borne-translational (PTMs)²^,³, estão ganhando impulso através de estudos recentes. No entanto, estas geralmente não são suportadas pelo atual proteogenomic ferramentas de mapeamento, conforme mostrado na Figura 1. Para melhorar a velocidade e a qualidade de mapeamento, PoGo foi desenvolvido, uma ferramenta que permite o mapeamento rápido e quantitativo de peptídeos de genomas¹⁸. Além disso, PoGo permite o mapeamento de peptídeos com até duas variantes de sequência e modificações borne-translational anotadas.

PoGo foi desenvolvido para lidar com o rápido aumento de conjuntos de dados quantitativos de alta resolução captura proteomes e modificações globais e fornece um utilitário central para análise em larga escala como a variação de pessoal e medicina de precisão. Este artigo descreve a aplicação desta ferramenta para visualizar a presença de modificação pós-traducional em relação às características genômicas. Além disso, este artigo destaca a identificação de eventos splicing alternativos através de peptídeos mapeados e o mapeamento de peptídeos identificados através de bancos de dados personalizados variantes de um genoma de referência. Este protocolo utiliza conjuntos de dados publicamente disponíveis, baixados o arquivo PRIDE¹⁹ para demonstrar estas funcionalidades do PoGo. Além disso, este protocolo descreve a aplicação de TrackHubGenerator para a criação de cubos acessíveis on-line de peptídeos mapeados para genomas para estudos de proteogenomics em grande escala.

Protocol

1. preparação, Download e instalação

Nota: Os exemplos de caminho de arquivo e pasta são mostrados em um formato Windows para a facilidade de acesso para usuários padrão. PoGo e PoGoGUI também estão disponíveis para macOS e sistemas operacionais Linux.

Baixar PoGo e PoGoGUI do GitHub
1. Abra um navegador da web e navegue para PoGo no GitHub (http://github.com/cschlaffner/PoGo/). Selecionar lançamentos e baixar o mais recente lançamento compactado zip. Extraia o arquivo compactado para a pasta de arquivos executáveis (por exemplo, C:\PoGo\executables\).
2. Navegue no navegador da web para PoGoGUI no GitHub (http://github.com/cschlaffner/PoGoGUI/). Selecionar lançamentos e baixar o mais recente lançamento de arquivo jar (por exemplo, "PoGoGUI-v1.0.2.jar"). Armazene o arquivo jar na pasta de arquivos executáveis.
Download a anotação do genoma e sequências codificantes de proteínas traduzidas
Nota: Baixar a anotação do genoma e traduzidas sequências codificantes de proteínas para espécies com suporte de GENCODE⁷ (www.gencodegenes.org) ou Ensembl²⁰ (www.ensembl.org) o formato geral de transferência (GTF) e as sequências de proteínas em Formato FASTA.
1. No navegador da web, navegue até www.gencodegenes.org e selecione dados | Humano | Versão atual. Baixar a anotação de gene abrangente através do link GTF e extraia o arquivo gz compactado para a pasta de dados (por exemplo, C:\PoGo\Data\) usando um programa de descompactação (por exemplo, 7-Zip).
2. Baixe as sequências de tradução de transcrição codificantes de proteínas através da ligação FASTA e extraia o ficheiro gz compactado para a pasta de dados gerados na etapa anterior.
  1. Como alternativa, navegue no navegador da web para www.ensembl.org e selecione Downloads seguido de Download de dados via FTP. Encontre uma espécie suportada (por exemplo, humanos). Baixe o arquivo da versão mais recente para anotação de transcrição usando o link GTF na coluna Gene definido . Escolha o arquivo com o nome de estrutura "species.release.gtf.gz" e extraia o arquivo gz compactado para a pasta de dados.
3. Baixe a versão mais recente-codificação da proteína transcrição tradução sequências usando a FASTA link na coluna da sequência da proteína (FASTA) . Escolha o arquivo com o nome de estrutura "species.release.pep.all.fa.gz" e extraia o arquivo gz compactado para a pasta de dados.
Preparar o peptídeo arquivos de identificação
Nota: PoGo só oferece suporte a um formato de 4 colunas contendo amostra identificador, sequência do peptide, número de peptídeo-espectro-correspondências (PSMs) e o valor quantitativo. No entanto, PoGoGUI suporta identificação padronizada arquivo formatos mzIdentML, mzid e mzTab e converte-os em formato de coluna 4 do PoGo usando o ms-dados-núcleo-api de publicamente disponíveis quadro²¹. Arquivos no formato de mzTab, mzid ou mzIdentML podem ser baixados o orgulho arquivo¹⁹. Alternativamente, podem ser fornecidos dados em um formato de arquivo separado por tabulação com a extensão TSV ou .pogo. O formato contém 4 colunas com os seguintes cabeçalhos de coluna: identificador de amostra (Sample), sequências peptídicas (peptídeo), número de peptídeo-espectro-correspondências (PSMs) e quantificação de peptídeo (Quant). Um exemplo é mostrado na Figura 2.
1. Baixe um arquivo de exemplo em formato de mzTab de um estudo da proteômica no testículo humano de arquivo o orgulho,¹⁹ (https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files²²).
2. Salvar e extrair o arquivo gz compactado para a pasta de dados criada na etapa 1.2.1.
  Nota: Alternativamente, transferência de dados de exemplo para o phosphoproteomics humano pesquisado com MaxQuant do orgulho arquivo (arquivo "Traktman_2013_MaxQuantOutput-full.zip" de https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files,²³).
3. Salve e extraia o arquivo zip compactado na pasta de dados que foi criado na etapa 1.2.1.
4. Abra uma planilha em branco e importar o arquivo de peptides.txt da pasta c: / PoGo/dados/Traktman_2013_MaxQuantOutput-cheia/combinada/txt/usando a opção dados | De Text/CSV. Na janela de abertura, clique em Editar.
5. Remova todas as colunas, com exceção de "Sequência", "Experimento BR1", "Experimento BR2", "Experimento BR3", "relação H/L normalizada BR1", "Relação H/L normalizado BR2", e "Relação H/L normalizada BR3".
6. Selecione as colunas "Relação H/L normalizado BR1", "Relação H/L normalizado BR2" e "Relação H/L normalizado BR3" e clique em Transform | Não dinâmica colunas. Selecione as colunas "Experimento BR1", "Experimento BR2" e "Experimento BR3" e repita a operação de transformação não dinâmica.
7. Selecione a coluna resultante "Atributo" e dividir o conteúdo usando Transform | Dividir coluna | Por delimitador. Selecione o espaço como delimitador no menu drop-down. Repita a operação para a coluna "Attribute.1".
8. Remova as colunas resultantes de "Attribute.1.1", "Attribute.2", "Attribute.3" e "Attribute.1.1.1".
9. Adicionar uma coluna usando o adicionar coluna | Coluna personalizada opção. Adaptar-se a fórmula de coluna personalizados para representar o seguinte: "= [Attribute.4]=[Attribute.1.2]".
10. Aplicar um filtro à coluna gerada personalizada para filtrar todas as linhas que contêm "Falsas"; permanecerão apenas linhas que contêm "TRUE".
11. Remover as colunas "Attribute.1.2" e "Custom" e alterar a ordem das colunas restantes para o seguinte: "Attribute.4", "Sequência", "Value.1" e "Valor".
12. Altere os nomes de coluna para "Experimento", "Peptídeo", "PSMs" e "Quant", respectivamente. Carregar o arquivo usando o Home | Fechar & carregar.
13. Salve o arquivo como um arquivo delimitado por tabulação usando arquivo | Salvar como e selecione o tipo "Texto (delimitado por tabulação) (*. txt)". Altere o nome para "peptides_pogo.txt" e salve-o na pasta c: / dados/PoGo.

2. mapeamento de peptídeos com modificações borne-translational anotadas e visualização, incluindo a quantificação

Nota: O arquivo de saída resultante pode ser carregado em qualquer navegador de genoma, suportando o formato de dados extensível navegador (cama). Uma seleção dos navegadores é o navegador de genoma Integrativa (IGV)²⁴ (que é usado no seguinte), do UCSC Genome Browser²⁵e o navegador do genoma de Ensembl²⁰. É importante notar que a anotação GTF e proteína FASTA versões utilizados para mapeamento de PoGo correspondem à versão do genoma no navegador do genoma. Para os lançamentos de Ensembl humanos 57-75 e versões GENCODE 3d-19, usar GRCh37/hg19; para as versões de Ensembl 76 ou superiores e GENCODE 20 ou superior, use GRCh38/hg38. Para as versões de Ensembl do rato 74 ou superiores e GENCODE M2 ou superior, use GRCm38.

Mapa de peptídeos usando PoGoGUI (ver Figura 3).
1. Navegue até a pasta de arquivos executáveis. Inicie o programa clicando duas vezes no ícone PoGoGUI-vX.X.X.jar.
  Nota: A interface gráfica do usuário será start up e permitem fácil e visual de seleção de opções.
2. Use o botão selecionar ao lado o executável"PoGo". Em seguida, navegue na pasta de arquivos executáveis para a subpasta relevantes sistemas operacionais (por exemplo, C:\PoGo\Executables\Windows\). Selecione o executável do PoGo (por exemplo, PoGo.exe) e confirmar a sua escolha, clicando no botão abrir .
3. Selecione o arquivo de entrada de referência para sequências de proteínas, clicando em seleccionar. Navegue até a pasta de dados e selecione o arquivo FASTA de tradução. Confirme a sua selecção clicando no botão abrir .
4. Selecione o arquivo de anotação de transcrição usando o botão Select . Navegue até a pasta de dados e selecione o arquivo GTF anotação. Confirme a seleção clicando no botão abrir .
5. Adicionar o arquivo de identificação de peptídeo — seleção múltipla de arquivo está habilitada — usando o botão Adicionar ao lado de "Arquivos do Peptide". Selecione um arquivo no formato suportado mzTab, mzIdentML ou mzid, ou o formato separado por tab 4-coluna baixado e preparado na etapa 1.3.
6. Desmarque as caixas de seleção ao lado da cama e GTF da seleção de formatos de saída. Só deixe a cama PTM e GCT marcada.
7. Selecione a espécie adequada para os dados da seleção suspensa. É essencial que o arquivo FASTA, o arquivo GTF e a seleção de soltar-para baixo são para a mesma espécie.
8. Inicie o mapeamento clicando no botão Iniciar .
  Nota: Se necessário, PoGoGUI converter o arquivo de entrada em formato de pogo, fornecerá os pogo arquivos na mesma pasta para conveniência futura e iniciar o processo de mapeamento. A conversão de um único mzTab arquivo baixado no passo 1.3.1 durará entre 10 a 20 min antes do início do mapeamento.
Visualizando no Visualizador de genômica Integrativa
Nota: Consulte a Figura 4.
1. Carregar o arquivo de saída de PoGo terminados em "_ptm.bed" no IGV através de arquivo | Carga do arquivo e selecione o arquivo.
  Nota: Devido ao tamanho, alguns arquivos podem exigir a geração de um índice para permitir uma recarga rápida das regiões genômicas. O IGV solicitará que o usuário automaticamente para a geração. Siga as instruções indicadas.
2. Repeti a etapa de carregamento para o arquivo que termina em "_noptm.bed". Este arquivo contém todos os peptídeos encontrados sem nenhuma modificação.
3. Observe que cada arquivo carregado será mostrado como faixas separadas com o nome de arquivo, identificando a faixa. Reordene faixas arrastando e soltando-os para a posição desejada na lista.
4. Observe que cada faixa é mostrada inicialmente de forma colapsada. Para expandi-los, clique com o botão direito sobre o nome da faixa e selecione expandido para uma visão completa dos peptides incluindo as sequências ou squished para exibição empilhada.
5. Repeti a etapa de carregamento para o arquivo que termina em ".gct". Este arquivo contém a quantificação de peptídeo por amostra anotada.
6. Ao contrário dos arquivos carregados acima, cada amostra anotada será carregada como uma faixa separada. Reorganizar as amostras através de arrastar e soltar as operações.
7. Navegar dentro do genoma, selecionando um cromossoma no menu drop-down, digite em coordenadas de genômicas, busca um símbolo do gene, ou clique e segure para selecionar uma seção de um cromossoma para ampliar.

3. mapeamento de peptídeos, identificados através de um banco de dados variante personalizado para um genoma de referência

Nota: PoGo mapeamento pode ser realizado usando a interface gráfica do usuário (GUI) ou através da interface de linha de comando. Eles são intercambiáveis. Nesta parte do protocolo, a interface de linha de comando é usada para realçar a intercambialidade. A segunda parte desta seção protocolo requer o software ferramenta R²⁶. Por favor, certifique-se de que o pacote é instalado.

Mapear os peptídeos de referência para o genoma de referência.
1. Abra um prompt de comando (cmd) e navegue até a pasta de arquivos executáveis de PoGo (por exemplo, C:\PoGo\Executables\).
2. Digite o comando abaixo:
  PoGo.exe - gtf \PATH\TO\GTF fasta - \PATH\TO\FASTA-em \PATH\TO\IN-formato cama-espécies MYSPECIES
  1. Substitua o \PATH\TO\GTF, \PATH\TO\FASTA e \PATH\TO\IN com caminhos para a anotação GTF, sequência da proteína FASTA e arquivo de identificação de peptídeos (no formato 4-coluna com arquivo terminando "TSV" ou ".pogo") respectivamente. Também substitua MYSPECIES com as espécies consistentes com os dados (por exemplo, humanos).
3. Confirme a execução pressionando a tecla "Enter". Espere até que a execução seja concluída antes de avançar para qualquer ainda mais.
  Nota: Isto pode levar alguns minutos. O arquivo resultante será armazenado na mesma pasta que o arquivo de entrada do peptide e será considerado como \PATH\TO\OUT.pogo.bed a seguir.
Extrai somente a variantes peptides do arquivo de entrada.
1. Aberto R e carga a entrada do arquivo \PATH\TO\IN usando o seguinte comando:
  inputdata <-read.table("PATH/TO/IN",header=TRUE,sep="\t")
2. Carrega os peptídeos já mapeados usando o comando:
  mappedpeptides <-read.table("PATH/TO/OUT.pogo.bed",sep="\t",header=FALSE)
3. Remova o inputdata peptídeos que já foram mapeados:
  peptidesnotmapped <-inputdata [! ( inputdata$ peptídeo % em % mappedpeptides$ V4)]
4. Imprima os peptídeos não mapeados em um novo arquivo de entrada:
  Write.Table (peptidesnotmapped, "PATH\TO\IN.notmapped.pogo", cabeçalho = FALSE, sep = "\t", col.names=TRUE,row.names=FALSE,quote=FALSE)
Mapear os peptídeos restantes para o genoma de referência, permitindo que as incompatibilidades.
1. Como no passo 3.1, abra o prompt de comando e navegue para a pasta de arquivos executáveis do PoGo.
2. Digite o comando abaixo permitindo 1 aminoácido incompatibilidade e substituir o \PATH\TO\GTF, \PATH\TO\FASTA e \PATH\TO\IN.notmapped.pogo com caminhos para a anotação GTF, sequência da proteína FASTA e arquivo de identificação de peptídeo criado no passo 3.2. Também substitua MYSPECIES com as espécies consistentes com os dados (por exemplo, humanos).
  1. PoGo.exe - gtf \PATH\TO\GTF fasta - \PATH\TO\FASTA-em \PATH\TO\IN-formato cama-espécie MYSPECIES -mm 1
3. Confirme a execução do comando, pressionando a tecla "Enter". Espere até que a execução seja concluída antes de avançar para qualquer ainda mais.
  Nota: Isto pode levar alguns minutos. O arquivo resultante será armazenado na mesma pasta que o arquivo de entrada do peptide e será considerado como \PATH\TO\OUT.pogo_1MM.bed a seguir.
Visualize os peptídeos mapeados sem e com incompatibilidade no IGV conforme descrito no passo 2.2.

4. mapeamento usando vários arquivos e gerando faixa Hubs para grandes conjuntos de dados

Mapeamento de peptídeos de vários arquivos usando PoGoGUI
1. Navegue até a pasta de arquivos executáveis e inicie o programa GUI executando PoGoGUI-vX.X.X.jar.
2. Selecione o arquivo executável do PoGo para o sistema operacional em uso (Linux aqui), bem como o arquivo FASTA referência sequências de proteína de entrada e o arquivo GTF de anotação como descrito nos passos de protocolo 2.1.2 - 2.1.4.
3. Adicione os arquivos de identificação do peptídeo usando o botão Adicionar ao lado de "Arquivos de peptídeo"; seleção múltipla de arquivo está habilitada, bem como arrastar-e-soltar para o campo em branco por baixo "Arquivos do Peptide".
4. Desmarque as caixas de seleção ao lado da cama do PTM, GTF e GCT na seção de formatos de saída e só deixar a cama verificada.
5. Selecione a opção mesclar vários arquivos de entrada em uma única saída.
  Nota: Isto irá resultar em um arquivo de saída única, combinando todos os peptídeos dos arquivos de entrada. Deixar esta opção desmarcada resultará em uma execução sequencial do programa para cada arquivo de entrada separadamente.
6. Selecione a espécie adequada para os dados da seleção suspensa consistente com os arquivos FASTA e GTF.
7. Inicie o mapeamento clicando no botão Iniciar . Se necessário, o programa irá converter os arquivos de entrada em formato de pogo. Isto pode levar algum tempo para executar. Entretanto, baixe os scripts e ferramentas necessárias para a geração de cubo de pista.
Preparando-se para a geração de cubo de pista
1. Abra um navegador da web, navegue até https://github.com/cschlaffner/TrackHubGenerator e baixe o arquivo "TrackHubGenerator.pl". Salve o arquivo para a pasta de arquivos executáveis.
2. No navegador da web, navegue até www.hgdownload.soe.ucsc.edu/admin/exe/ e selecione a pasta para o sistema operacional em uso (Linux aqui). Baixe a ferramenta bedToBigBed e o script fetchChromSizes para a pasta de arquivos executáveis²⁷.
Gerando um hub de faixa de peptídeos mapeados
Nota: Após PoGoGUI terminou os peptídeos de mapeamento, um hub de pista pode ser gerado automaticamente para todos os arquivos resultantes em formato de cama armazenados na mesma pasta.
1. Abra uma janela de terminal e digite o seguinte comando:
  Perl TrackHubGenerator.pl caminho/para/nome ASSEMBLY FBED UCSC E-mail
  1. Substituir o PATH/TO/nome com um caminho de arquivo e o nome para o hub de faixa (por exemplo, ~/PoGo/Data/Mytrackhub), montagem a montagem do genoma em que a anotação é baseado (por exemplo, hg38 para humanos), FBED com o caminho para a pasta que contém o Limas de cama em que o cubo de pista será baseado (por exemplo, ~/PoGo/Data/), UCSC com a pasta onde as ferramentas baixadas UCSC são armazenadas (por exemplo, ~/PoGo/Executables/) e E-mail com um endereço de e-mail para a pessoa responsável para a faixa cubo.
2. Confirmar a execução pressionando a tecla "Enter"; a execução só terá pouco tempo para terminar.
3. Transferi o hub gerado faixa (ou seja, ~/PoGo/Data/Mytrackhub/ a pasta criada) com todo o seu conteúdo para um servidor FTP acessível pela web.
  Nota: Um servidor FTP com um servidor web associado, permitindo o acesso ao centro da pista através dos protocolos ftp e http é preferencial. O github repositórios (github.com) e figshare (figshare.com) suportam este tipo de acesso e podem ser usados em vez de um servidor FTP.
Visualizar um cubo de pista no navegador UCSC genome
1. Em um navegador da web, navegue até https://genome.ucsc.edu/ e selecione MyData | Hubs de faixa. Clique na guia My Hubs.
2. Copie a URL para o hub de pista no campo de texto.
  Nota: O URL consiste o endereço do servidor, a rastrear a localização de hub e o nome e o arquivo hub.txt (por exemplo, http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt).
3. Carrega o hub faixa clicando em Adicionar Hub.
  Nota: O cubo será carregado e uma curta mensagem aparecerá, dizendo detalhes da faixa central tais como seu nome, as informações de contato da pessoa responsável para o centro da pista, e a montagem do genoma usado. O site irá retornar para a página principal.
4. Selecione GenomeBrowser para introduzir o modo de exibição do navegador.
  Nota: O cubo de pista personalizada será mostrado no topo da lista. Se vários arquivos de cama construíram a base para o centro da pista, cada um dos arquivos será representado como uma faixa separada dentro do hub.

Representative Results

Uma representação gráfica, destacando em que palco de um fluxo de trabalho regular proteomic PoGo¹⁸ é aplicado, bem como a jusante opções de visualização, é mostrado na Figura 5. Proteomics espingarda (ou seja, a digestão proteolítica das proteínas seguido por cromatografia líquida acoplada com espectrometria de massa em tandem) é uma etapa precursora de mapeamento proteogenomic. Os espectros de massa em tandem resultante são comumente comparados com espectros teóricos derivados de bancos de dados de sequência de proteínas. Estudos Proteogenomics introduzir sequências de tradução do romance transcrições com codificação variantes possíveis e não-sinônimo de nucleotídeo único (SNVs) na base de dados, tornando-se difícil relacionar facilmente essas costas com o genoma de referência⁸. A interface gráfica do usuário do PoGo (PoGoGUI) oferece suporte a formatos de arquivo para os relatórios padronizados de identificações de peptídeo de experimentos de espectrometria de massa e converte-los em um formato simplificado de 4 colunas de pogo. PoGoGUI ajusta a ferramenta de linha de comando PoGo e, portanto, permite o mapeamento de peptídeos, nas coordenadas do genoma, utilizando a anotação da referência de genes codificantes de proteínas comumente previstas o GTF e as sequências de transcrição traduzida em formato FASTA. Diferentes formatos de saída são gerados por PoGo para permitir a visualização dos diferentes aspectos dos peptides identificados através de espectrometria de massa, incluindo modificações borne-translational e quantificação de nível do peptide. Arquivos de saída na cama ainda mais podem ser convertidos e combinados em diretórios acessíveis online chamados hubs de pista. Arquivos de saída único, bem como hubs de pista, então podem ser visualizados em navegadores como o UCSC Genome Browser²⁵Ensembl Genome Browser²⁰, IGV²⁴e Biodalliance²⁸ (ver Figura 5 inferior).

PoGo foi aplicado para a reanálise do projecto humano proteome mapas filtrado na grande significado, como descrito em Wright et al ⁷ e comparou-a com duas outras ferramentas para mapeamento de proteogenomic, ou seja, o iPiG¹⁴ e PGx¹⁰. O conjunto de dados composto 233.055 peptídeos exclusivos através de 59 tecidos adultos e fetais, resultando em um total de sequências mais 3 milhões. PoGo superou essas ferramentas em tempo de execução (6,9 x e 96,4 x mais rápido, respectivamente) e uso de memória (20% e 60% menos memória, respectivamente) como mostrado na Figura 6¹⁸. Um exemplo de um peptídeo mapeado com êxito é mostrado na Figura 7.

Enquanto PoGo superou significativamente as outras ferramentas em velocidade e memória, também é capaz de modificações borne-translational de mapeamento e informações quantitativas associadas com peptídeos no genoma. Figura 8A esquematicamente retrata a visualização do formato de cama em um navegador de genoma para peptídeos mapeamento para um exão e do outro lado da tala entroncamentos. PoGo utiliza a opção de coloração para proporcionar fácil ajuda visual no que diz respeito a singularidade do mapeamento de peptídeo dentro do genoma. Mapeamentos em vermelho indicam a exclusividade de uma única transcrição, enquanto o preta destaca o mapeamento para um único gene. No entanto, o peptídeo é compartilhado entre diferentes transcrições. Mapeamentos de cinza mostram um peptídeo compartilhado entre múltiplos genes. Estas são, por exemplo, menos confiável para a quantificação de um gene ou não confiável para chamar a expressão de um gene. A opção de cama de PTM de PoGo redefine o código de cor para acomodar diferentes tipos de modificações borne-translational, como mostrado na Figura 8B. Além disso, PTMs são indicadas por grossos blocos (ver Figura 8B). Um único PTM de um tipo é realçado por um bloco grosso na posição do resíduo de aminoácido modificado, enquanto PTMs múltiplos do mesmo tipo são medidos por um grosso bloco do primeiro aminoácido modificado para o último.

Nós aplicamos PoGo e, posteriormente, TrackHubGenerator para um conjunto de dados de 50 linhas de células de câncer colorretal incluindo proteome toda e phosphoproteome²⁹. Enquanto o cubo de pista carregado no UCSC Genome Browser mostra os peptídeos mapeados para o genoma e destaca a singularidade dos mapeamentos e os sítios de fosforilação (ver Figura 9), dados adicionais são fornecidos na pasta suplementar. Os arquivos do GCT, em seguida, habilitar a visualização da quantificação do peptide e Fosfopeptida em um contexto genômico. No entanto, arquivos de GCT não fornecem uma visualização fácil de peptídeos abrangendo todo entroncamentos da tala (ver Figura 10 parte superior). Os peptídeos através da tala junções dividem-se em suas respectivas partes mapeamento para os exões. Enquanto é possível identificar peptídeos da tala através os mesmos valores quantitativos de mapeamentos de exon, mapeamento baseado em sequência a carregar arquivos como cama ou GTF que conectam os exões por um intrão fina, abrangendo a linha de sustentação a interpretação (veja a Figura 10 parte inferior).

Para destacar a utilidade da variante habilitado mapeamento, aplicamos PoGo em duas configurações para um dataset de testículo humano proteome procurado contra neXtProt para caçar falta proteínas usando uma enzima multi estratégia²². O neXtProt compreende além de sequências de proteínas de referência mais 5 milhões de variantes único aminoácido³⁰. Não há suporte para mapeamento de peptídeos, identificados com uma único aminoácido variante por outras ferramentas de mapeamento. Um total de 177.012 exclusivos peptídeos foram identificados. Destes, peptídeos de 99,8% (176.694) primeiro foram mapeados com sucesso sem permitir que as incompatibilidades. Remoção da lista do peptide identificados resultou em peptídeos de 0,2% (318) que posteriormente foram mapeadas permitindo uma substituição de aminoácido. Isto resultou em 3.446 mapeamentos de 162 peptídeos que não iria ter sido mapeados para o genoma de referência com qualquer outra ferramenta disponível. Enquanto o número médio de mapeamentos, incluindo uma incompatibilidade é alto, 62 peptídeos foram mapeados para apenas um único locus, indicando sequências variantes verdadeiras. Um exemplo de um peptídeo mapeado com a substituição de um único aminoácido é destaque com sua sequência e a sequência genómica traduzida na Figura 11.

Figura 1. Comparação visual das ferramentas de mapeamento de peptídeo-para-genoma diferente. A comparação é mostrada com relação a vários aspectos. Estes aspectos incluem uma referência de mapeamento, o nível de integração nas estruturas e o suporte dos navegadores online e offline. Além disso, novos aspectos do proteogenomics e seu suporte para o recurso é realçada separadamente. PoGo, só falta a capacidade para mapear diretamente para uma sequência do genoma em comparação com outras ferramentas. No entanto, suporta todas as características inovadoras que não oferecem suporte a maioria das outras ferramentas. Clique aqui para ver uma versão maior desta figura.

Figura 2. Arquivo de entrada de exemplo para peptídeos mapeamento. PoGo aceita entrada de dados em um formato separado por tabulações com 4 colunas. Cabeçalhos de coluna na primeira linha são «Experiência», «Peptídicas», 'PSMs' e 'Quant», indicando-se nas seguintes linhas o experimento ou identificador de amostra, a sequência do peptídeo, o número de correspondências de peptídeo-espectro e um valor quantitativo para o peptídeo, respectivamente. Extensões de nome de arquivo com suporte são *. txt, *.tsv e *.pogo. Clique aqui para ver uma versão maior desta figura.

Figura 3. PoGoGUI interface com etapas destacadas para seleções de arquivo e opções de parâmetro. A figura mostra as etapas para selecionar e carregar arquivos necessários e a seleção de opções de peptídeos de mapeamento com modificações borne-translational sobre o genoma humano de referência. Clique aqui para ver uma versão maior desta figura.

Figura 4. Upload de imagem dos dados do Visualizador de genômica Integrativa (IGV) procedimento. A figura destaca os passos para fazer upload de arquivos de saída PoGo no navegador IGV. Além disso, ele mostra a opção de expandir a faixa de peptídeos mapeados para destacar o mapeamento e a sequência. Clique aqui para ver uma versão maior desta figura.

Figura 5. Simplificado de fluxo de trabalho de etapas de LC-MS/MS para visualização nos navegadores genoma. Mapeamento de PoGo segue a identificação de peptídeos de espectros de massa em tandem. Para realizar o mapeamento para o genoma, PoGo utiliza anotação de referência fornecida como anotação do genoma (GTF) e sequências de tradução de transcrição (FASTA). Saída de diferente formatos são gerados que pode ser carregada separadamente em navegadores do genoma. Além disso, arquivos no formato de cama podem ser combinados em cubos faixa apoio visualização de conjuntos de dados em larga escala. Clique aqui para ver uma versão maior desta figura.

Figura 6. Análise comparativa de PoGo contra PGx e iPiG. PoGo supera as outras ferramentas na análise comparativa. Mapeamento 233.055 exclusivos peptídeos através de 59 tecidos adultos e fetais, resultando em sequências mais 3 milhões, PoGo foi 6,9 x e 96,4 x mais rápido do que o PGx e iPiG, respectivamente. Além disso, PoGo exigido 20% e 60% menos memória em comparação com PGx e iPiG, respectivamente. Enquanto PoGo e PGx foi concluído com êxito, o iPiG resultou em um erro de memória de 16 GB. Clique aqui para ver uma versão maior desta figura.

Figura 7. UCSC Genome browser exemplo veja de peptídeos mapeadas. A figura mostra peptídeos mapeados para o mTOR do gene. Enquanto a faixa combinada mostra os peptídeos abrangendo todo entroncamentos da tala e mapeando apenas para um exão com as sequências de associado, as faixas de tecido-específica apenas destacam o mapeamento em um formato condensado. Clique aqui para ver uma versão maior desta figura.

Figura 8. Esquema de mapeamento de visualização e codificação de cores. (A) no arquivo de saída padrão de cama, peptídeos de mapeamento para um exon são mostrados como único blocos (à esquerda), enquanto os peptídeos mapeamento entre vários exões destaque o exon cobrindo as partes como blocos (à direita). Os intrões são mostrados tão finos linhas de concatenação. PoGo color-codes a singularidade do mapeamento ou peptídeos de genes e transcrições usando um sistema de 3 camadas. (B) Além da estrutura de bloco do formato de cama, cama de PTM saída destaca a posição de modificações borne-translational como blocos de espessura. A presença de um único PTM de um tipo destaca o resíduo de aminoácido modificado com um bloco de espesso, enquanto vários sites da mesma PTM são combinados em blocos longos, abrangendo desde o primeiro até o último local de modificação. Mapeamentos de peptídeo estão divididos pelo codec de tipo e cor PTM baseado a modificação. Clique aqui para ver uma versão maior desta figura.

Figura 9. Controlar hub exibir no navegador do genoma do câncer colorretal proteome e phosphoproteome dados UCSC. O hub de faixa compreende toda proteome dados, bem como phosphoproteome. Enquanto a cor vermelha em faixas de proteoma e phosphoproteome indicam a singularidade do mapeamento para a simples transcrição do SFN, faixas terminam em _ptm mostram os sites de fosforilação em peptídeos. Aqui, a cor vermelha indica o tipo de modificação como fosforilação. Apenas dois peptídeos foram identificados com cada mostrando uma única fosforilação (blocos de espessura). Clique aqui para ver uma versão maior desta figura.

Figura 10. Vista de phosphopeptides de câncer colorretal e quantificação associada no IGV. A figura mostra um subconjunto das linhas de células de 50 câncer. Além disso mostra quatro colunas de blocos em diferentes tons de luz vermelha. A cor indica a abundância relativa de baixo (branco) para alto (vermelho). Enquanto as quatro colunas inicialmente podem levar a crer que existem 4 peptídeos, torna-se claro com associado com base em sequência GTF arquivo de saída que na verdade são dois peptídeos, cada abrangendo uma tala de junção. Clique aqui para ver uma versão maior desta figura.

Figura 11. Vista do peptídeo com variante de aminoácido em IGV. A figura mostra um peptídeo com uma variante de único aminoácido mapeada para o genoma de referência no início tradução do gene GPSM1. A variante é posicionada no resíduo de aminoácido 8 e resultados na substituição de alanina, a valina (A→V). As sequências de tradução das transcrições anotadas (azuis) destacam-se a variante em comparação com a sequência do peptide. Clique aqui para ver uma versão maior desta figura.

Discussion

Este protocolo descreve como a ferramenta de software PoGo e sua interface gráfica do usuário PoGoGUI permitem um mapeamento rápido dos peptides nas coordenadas do genoma. A ferramenta oferece recursos exclusivos, tais como modificação pós-traducional, quantitativa e mapeamento variante habilitado para referência a anotação de genomas. Este artigo demonstra o método em um estudo de proteogenomic em grande escala e destaca sua eficiência de velocidade e memória em comparação com outras ferramentas disponíveis¹⁸. Em combinação com a ferramenta TrackHubGenerator, que cria cubos acessíveis on-line de genômica e genoma ligados a dados, PoGo, com sua interface gráfica do usuário, estudos de proteogenomics em grande escala permite rapidamente visualizar seus dados em contexto genômico. Além disso, demonstramos as características únicas do PoGo com conjuntos de dados pesquisados contra bancos de dados variantes e quantitativos phosphoproteomics²²^,²⁹.

Arquivos individuais, tais como o arquivo GCT, fornecem visualização valiosa e ligações entre características do peptide e loci genômicos. No entanto, é importante notar que uma interpretação com base nestes sozinho pode ser difícil ou enganosa devido a sua limitação aos aspectos único do proteogenomics como singularidade, modificações borne-translational e valores quantitativos. Portanto, é importante escolher cuidadosamente quais arquivos de saída, opções e combinações são apropriadas para a questão de proteogenomic à mão e modificar as combinações. Por exemplo, informações sobre a singularidade do mapeamento para um locus genômico específico podem ser de grande valor para a anotação de uma característica genômica⁷, enquanto a quantificação através de amostras diferentes pode ser mais apropriada para estudos relativos características genômicas para mudanças na abundância de proteína²⁹. A saída deve ser gerada por PoGo para cada configuração. No caso de sem saída é gerada, ou arquivos vazios são mostrados na pasta de saída, é aconselhável verificar os arquivos de entrada para o conteúdo desejado e o formato de arquivo necessário. Em casos onde o formato de arquivo ou conteúdo não segue as expectativas de PoGo (por exemplo, o arquivo FASTA supostamente contendo sequências de tradução de transcrição contém as sequências de nucleotídeos de transcrições), mensagens de erro pedirá ao usuário para Verifique os arquivos de entrada.

Restrições do protocolo e a ferramenta baseiam-se principalmente a reutilização dos formatos de arquivo, comumente usado em genômica. Formatos de arquivo usados na genômica para proteogenomic aplicações de redefinição de objetivos é acompanhada por limitações específicas. Estes são devido os diferentes conjuntos de requisitos para visualização de genoma centrado de genômica e proteogenomic de dados, tais como a necessidade de Visualizar modificações borne-translational da proteômica dados. Isto é restrito nos formatos de arquivo de genómica por uso de recurso único. Muitas abordagens e ferramentas foram desenvolvidas para proteômica confiàvel localizar modificações borne-translational dentro de sequências peptídicas³¹^,³²^,³³^,de³⁴. No entanto, a visualização de múltiplas modificações de forma única e perceptível no genoma é dificultada pela estrutura dos formatos de arquivo de genômica. Portanto, a visualização de bloco único de PTMs múltiplos do mesmo tipo não constitui qualquer ambiguidade dos sites modificação... mas é a consequência da exigência diferente da comunidade de genômica para apenas Visualizar características única de cada vez. Não obstante, PoGo tem a vantagem de modificações borne-translational mapeamento nas coordenadas genômicas para permitir estudos focados sobre o efeito das características genômicas como variantes de nucleotídeo único em modificações borne-translational. Usando o PoGo, variante mapeamento aumenta o número de mapeamentos totais. No entanto, a codificação de cor única dos peptídeos mapeados destaca confiança mapeamentos de queridos não confiáveis. O mapeamento de peptídeos variantes identificado de variantes de nucleotídeo único conhecido pode ser acompanhado por visualizando os peptídeos mapeados juntamente com as variantes no formato VCF. Desta forma, o código de cor indicando um mapeamento não confiável de um variante do peptide é negada pela presença da variante nucleotídeo conhecido.

Um passo crítico para o uso de PoGo é o uso dos arquivos corretos e formatos. O uso de sequências de transcrição traduzida como sequências de proteínas para acompanhar a anotação no formato GTF é o principal critério. Outro elemento crítico quando considerando o uso PoGo para mapear peptídeos com incompatibilidades de aminoácido é memória. Enquanto altamente eficiente para a memória de um aplicativo padrão, significativamente e exponencialmente crescente número de mapeamentos possíveis com um ou dois incompatibilidades leva a um aumento exponencial da mesma forma de uso de memória¹⁸. Propomos um mapeamento em etapas, conforme descrito neste protocolo primeiro mapear os peptídeos sem incompatibilidades e removê-los do conjunto. Os peptídeos anteriormente desmapeados subsequentes então podem ser mapeados usando uma incompatibilidade e o procedimento pode ser repetido com duas incompatibilidades para os peptídeos restantes não mapeados.

Desde que aumentou significativamente a taxa de transferência de espectrometria de massa e estudos interfaceando genômica e proteômica dados estão se tornando mais frequentes nos últimos anos, ferramentas para permitir facilmente interfaceando esses tipos de dados no mesmo sistema de coordenadas são cada vez mais indispensável. A ferramenta aqui apresentada ajudará a necessidade de combinar genomic e proteomic dados para realçar uma melhor compreensão dos estudos integrativo através de pequenos e grandes conjuntos de dados através do mapeamento de peptídeos em uma anotação de referência. De forma encorajadora, PoGo foi aplicada para mapear peptídeos para candidatos gene fornecidos no mesmo formato que a anotação de referência para apoiar os esforços de anotação de novos genes expressados no testículo humano³⁵. A abordagem apresentada aqui é independente de bancos de dados usados para identificação de peptídeo. O protocolo pode auxiliar na identificação e visualização dos produtos romance tradução usando adaptado arquivos de entrada de sequências de tradução e GTF arquivos de RNA-seq experimentos associados.

Várias abordagens e ferramentas com uma ampla gama de cenários de aplicação especial para mapear peptídeos para coordenadas genômicas, que vão desde o mapeamento de peptídeos diretamente para a sequência do genoma para o mapeamento de sequenciação do ARN-guiada, foram introduzidas¹⁰^, ¹¹ ^, ¹² ^, ¹³ ^, ¹⁴ ^, ¹⁵ ^, ¹⁶ ^, ¹⁷. no entanto, isto podem resultar em uma falha para mapear corretamente peptídeos quando modificações borne-translational estão presentes e erros no mapeamento subjacente de leituras a sequenciação do ARN podem ser propagados para o nível de peptídeo. PoGo foi desenvolvido especificamente superar esses obstáculos e para lidar com o rápido aumento de conjuntos de dados quantitativos proteomic high-resolution de integração com plataformas genômica ortogonais. A ferramenta aqui descrita pode ser integrada em fluxos de trabalho de alto rendimento. Através da interface gráfica, PoGoGUI, a ferramenta é simples de usar e requer sem formação de bioinformática do especialista.

Disclosures

Os autores não têm nada para divulgar.

Acknowledgments

Este trabalho foi financiado pela Wellcome Trust (WT098051) e a concessão de NIH (U41HG007234) para o projeto GENCODE.

Materials

Name	Company	Catalog Number	Comments
PoGo (software)	NA	NA	https://github.com/cschlaffner/PoGo
PoGoGUI (software)	NA	NA	https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software)	NA	NA	https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software)	NA	NA	http://software.broadinstitute.org/software/igv/
UCSC genome browser (website)	NA	NA	https://genome.ucsc.edu/
GENCODE (website)	NA	NA	http://gencodegenes.org
Ensembl (website)	NA	NA	http://ensembl.org
bedToBigBed (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/

DOWNLOAD MATERIALS LIST

References

Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. Bioinformatics. 33 (8), 1218-1220 (2017).
Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. Bioinformatics. 31 (17), 2903-2905 (2015).
Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
The R Development Core Team. R: A Language and Environment for Statistical Computing. , R Foundation for Statistical Computing. Vienna, Austria. (2008).
Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. Bioinformatics. 26 (17), 2204-2207 (2010).
Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. Bioinformatics. 27 (6), 889-890 (2011).
Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. Bioinformatics. 31 (7), 1141-1143 (2015).
Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Genetics

Um método rápido e quantitativo para a modificação pós-traducional e variante habilitado para mapeamento de peptídeos de genomas

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.