Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Identificação de Proteínas de Imunidade Antibacteriana em Escherichia coli usando MALDI-TOF-TOF-MS/MS e Análise Proteômica De Cima Para Baixo

Published: May 23, 2021 doi: 10.3791/62577

Summary

Aqui apresentamos um protocolo para a identificação rápida de proteínas produzidas por bactérias patogênicas genomicamente sequenciadas usando espectrometria de massa maldi-TOF-TOF e análise proteômica de cima para baixo com software desenvolvido internamente. Íons proteicos metastáveis fragmentom por causa do efeito ácido aspartic e essa especificidade é explorada para identificação de proteínas.

Abstract

Este protocolo identifica as proteínas de imunidade das enzimas bactericidas: colicina E3 e bacteriocina, produzidas por uma cepa patogênica de Escherichia coli usando indução de antibiótico, e identificada por espectrometria de massa maldi-TOF-TOF e análise proteômica de cima para baixo com software desenvolvido internamente. A proteína de imunidade da colicina E3 (Im3) e a proteína de imunidade da bacteriocina (Im-Bac) foram identificadas a partir de íons de fragmentos proeminentes do tipo b e/ou y gerados pelo decote da coluna vertebral (PBC) no lado terminal C do ácido aspartíaco, ácido glutamico e resíduos de asparagine pelo mecanismo de efeito de fragmento de ácido aspartílico. O software escaneia rapidamente em sequências proteicas sílicos derivadas de todo o sequenciamento do genoma da cepa bacteriana. O software também remove iterativamente resíduos de aminoácidos de uma sequência proteica no caso de a sequência proteica madura ser truncada. Uma única sequência proteica possuía massa e íons fragmentados consistentes com os detectados para cada proteína de imunidade. A sequência do candidato foi então inspecionada manualmente para confirmar que todos os íons de fragmento detectados poderiam ser atribuídos. A methionina n-terminal de Im3 foi removida pós-tradução, enquanto Im-Bac teve a sequência completa. Além disso, descobrimos que apenas dois ou três íons de fragmento não complementares formados pelo PBC são necessários para identificar a sequência proteica correta. Finalmente, um promotor (caixa SOS) foi identificado a montante dos genes antibacterianos e de imunidade em um genoma plasmídeo da cepa bacteriana.

Introduction

A análise e identificação de proteínas não digeridas por espectrometria de massa é referida como a análise proteômica de cima para baixo1,2,3,4. É agora uma técnica estabelecida que utiliza a ionização eletrospray (ESI)5 e analisadores de massa de alta resolução6, e técnicas sofisticadas de dissociação, por exemplo, dissociação de transferência de elétrons (ETD), dissociação de captura de elétrons (ECD)7,foto-dissociação ultravioleta (UV-PD)8, etc.

A outra técnica de ionização suave é a desorção/ionização a laser assistida por matriz (MALDI)9,10,11 que tem sido menos utilizada para a análise de cima para baixo, em parte porque está principalmente acoplada aos analisadores de massa tempo de voo (TOF), que têm resolução limitada em comparação com outros analisadores de massa. Apesar dessas limitações, os instrumentos MALDI-TOF e MALDI-TOF-TOF têm sido explorados para a rápida análise de cima para baixo de proteínas puras e misturas fracionadas e não fracionadas de proteínas. Para a identificação de proteínas puras, a decadência na fonte (ISD) é uma técnica particularmente útil porque permite a análise da espectrometria de massa (MS) de íons de fragmentos de ISD, bem como espectrometria de massa tandem (MS/MS) de fragmentos de íons proteicos que fornecem fragmentos específicos de sequência muitas vezes do N- e C-termini da proteína alvo, análogo ao sequenciamento de Edman12,13 . Uma desvantagem para a abordagem isd é que, como no sequenciamento de Edman, a amostra deve conter apenas uma proteína. A única exigência de proteína é devido à necessidade de atribuição inequívoca de íons fragmentários a um íon precursor. Se duas ou mais proteínas estiverem presentes em uma amostra, pode ser difícil atribuir quais íons fragmentários pertencem aos íons precursores.

A atribuição de íon/íon precursor pode ser tratada usando MALDI-TOF-TOF-MS/MS. Como em qualquer experimento clássico de MS/MS, os íons precursores são selecionados em massa/isolados antes da fragmentação, e os íons de fragmento detectados podem ser atribuídos a um íon precursor específico. No entanto, as técnicas de dissociação disponíveis para esta abordagem estão restritas principalmente à dissociação induzida por colisão de alta energia (HE-CID)14 ou à decadência pós-fonte (PSD)15,16. HE-CID e PSD são mais eficazes na fragmentação de peptídeos e pequenas proteínas, e a cobertura de sequência pode, em alguns casos, ser limitada. Além disso, o PSD resulta em decote backbone polipeptídeo (PBC) principalmente no lado terminal C de resíduos de ácido aspônico e glutamico por um fenômeno chamado efeito ácido aspartílico17,18,19,20.

O MALDI-TOF-MS também encontrou uma aplicação de nicho na identificação taxonômica de microrganismos: bactérias21,fungos22e vírus23. Por exemplo, os espectros de MS são usados para identificar bactérias desconhecidas em comparação com uma biblioteca de referência de espectros de MS de bactérias conhecidas usando algoritmos de reconhecimento de padrões para comparação. Esta abordagem tem se mostrado altamente bem sucedida devido à sua velocidade e simplicidade, embora exija uma colheita noturna do isolado. Os íons proteicos detectados por esta abordagem (geralmente abaixo de 20 kDa) compreendem uma impressão digital em MS que permite a resolução taxonômica no nível do gênero e da espécie e, em alguns casos, na subespécie24 e no nível da cepa25,26. No entanto, ainda há a necessidade de classificar não apenas os microrganismos potencialmente patogênicos, mas também identificar fatores específicos de virulência, toxinas e fatores de resistência antimicrobiana (AMR). Para isso, a massa de peptídeos, proteínas ou pequenas moléculas são medidas por ESM e, posteriormente, isoladas e fragmentadas por MS/MS.

Bactérias patogênicas geralmente carregam pedaços circulares de DNA chamados plasmídeos. Plasmídeos, juntamente com prophagens, são um grande vetor de transferência de genes horizontais entre bactérias e são responsáveis pela rápida disseminação da resistência antimicrobiana e outros fatores de virulência entre as bactérias. Plasmídeos também podem transportar genes antibacterianos (AB), por exemplo, colicina e bacteriocina. Quando esses genes são expressos e as proteínas secretadas, eles agem para desativar a máquina de tradução de proteínas de bactérias vizinhas que ocupam o mesmo nicho ambiental27. No entanto, essas enzimas bactericida também podem representar um risco para o hospedeiro que as produziu. Em consequência, um gene é co-expresso pelo hospedeiro que inibe especificamente a função de uma enzima AB e é referido como sua proteína de imunidade (Im).

Antibióticos prejudiciais ao DNA, como mitomicina-C e ciprofloxacina, são frequentemente usados para induzir a resposta sos na E. coli (STEC) produtora de toxinas Shiga (STEC) cujo gene de toxina Shiga(stx) é encontrado dentro de um genoma de prophagem presente no genoma bacteriano28. Utilizamos indução de antibióticos, maldi-TOF-TOF-MS/MS e análise proteômica de cima para baixo anteriormente para detectar e identificar tipos e subtipos stx produzidos pelas cepas STEC29,30,31,32. No trabalho anterior, a cepa STEC O113:H21 RM7788 foi cultivada durante a noite na mídia ágar complementada com mitomicina-C. No entanto, em vez de detectar a subunidade B antecipada de Stx2a em m/z ~7816, um íon proteico diferente foi detectado em m/z ~7839 e identificado como uma proteína hipotética codificada por plasmídeos da função desconhecida33. No trabalho atual, identificamos duas proteínas AB-Im codificadas por plasmídeos produzidas por esta cepa usando indução de antibiótico, MALDI-TOF-TOF-MS/MS, e análise proteômica de cima para baixo usando software autônomo desenvolvido para processar e digitalizar em sequências de proteína silico derivadas de sequenciamento de genoma inteiro (WGS). Além disso, a possibilidade de modificações pós-tradução (PTM) envolvendo truncação de sequência foram incorporadas ao software. As proteínas de imunidade foram identificadas utilizando-se este software a partir da massa medida do íon proteico maduro e íons de fragmentos específicos de sequência de PBC causados pelo efeito ácido aspartic e detectados por MS/MS-PSD. Finalmente, um promotor foi identificado a montante dos genes AB/Im em um genoma plasmídeo que pode explicar a expressão desses genes quando esta cepa é exposta a um antibiótico prejudicial ao DNA. Partes deste trabalho foram apresentadas na National American Chemical Society Fall 2020 Virtual Meeting & Expo (17 a 20 de agosto de 2020)34.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Preparação da amostra microbiológica

  1. Inocular 25 mL de caldo de Luria (LB) em um tubo cônico de 50 mL com estruoso O113:H21 cepa RM7788 (ou outra cepa bacteriana) de um estoque de glicerol usando um laço estéril de 1 μL. Tampe o tubo e a pré-cultura a 37 °C com agitação (200 rpm) por 4h.
  2. Aliquot 100 μL de caldo pré-cultivado e espalhe-se em uma placa de ágar LB suplementada com 400 ou 800 ng/mL de mitomicina-C. Placas de ágar de cultura estaticamente durante a noite em uma incubadora a 37 °C.
    ATENÇÃO: As cepas STEC são microrganismos patogênicos. Realize todas as manipulações microbiológicas, além de culminar, em um armário de biossegurança BSL-2.
  3. Colher células bacterianas de colônias visíveis únicas usando um laço estéril de 1 μL e transferir para um tubo de microcentrifus de tampa de parafuso forrado de 2,0 mL de o anel de parafuso contendo 300 μL de água de grau HPLC. Tampe o tubo, vórtice brevemente, e centrífuga a 11.337 x g por 2 min para pelotar as células.

2. Espectrometria de massa

  1. Ponto 0,75 μL aliquot da amostra sobrenatante sobre o alvo MALDI de aço inoxidável e permitir que ele seque. Sobreponha o ponto de amostra seca com alíquota de 0,75 μL de uma solução saturada de ácido sinapúrico em acetonitrilo de 33%, 67% de água e 0,2% ácido trifluoráctico. Deixe o local secar.
  2. Analise os pontos de amostra seca usando um espectrômetro de massa MALDI-TOF-TOF.
    1. Depois de carregar o alvo MALDI no espectrômetro de massa, clique no botão para aquisição do modo linear MS no software de aquisição. Digite a faixa m/z a ser analisada inserindo o m/z dos limites inferior e superior (por exemplo, 2 kDa a 20 kDa) em seus respectivos campos no software de método de aquisição.
    2. Clique no local de amostra para ser analisado no modelo de destino MALDI no software. Em seguida, pressione o botão esquerdo do mouse e arraste o cursor do mouse sobre o local da amostra para especificar a região retangular a ser amostrada para ablação/ionização a laser. Solte o botão do mouse e a aquisição será iniciada. Colete 1.000 tiros laser para cada ponto de amostra.
      NOTA: A aquisição de dados é exibida em tempo real na janela de aquisição de software.
    3. Se não forem detectados íons, aumente a intensidade do laser ajustando a Barra de Escala Deslizante sob intensidade laser no software até que o sinal de íon proteico seja detectado. Isso é referido como limiar.
      NOTA: Antes da análise da mancha amostral, calibrar externamente o instrumento no modo linear ms com calibrantes proteicos cujos m/z abrangem a faixa que está sendo analisada, por exemplo, os estados de carga +1 e +2 de calibrantes proteicos: citocromo-C, lysozyme e mioglobina cobrem uma faixa de massa de 2 kDa a 20 kDa. Uma massa intermediária dentro da faixa de massa especificada é usada como uma massa de foco, por exemplo, 9 kDa. A massa de foco é o íon cujo m/z é idealmente focado para detecção pelo detector de modo linear.
    4. Quando a aquisição do modo linear MS estiver concluída, clique no botão para aquisição do modo refletiron MS/MS no software de aquisição. Insira a massa precursora para ser analisada no campo de massa precursora. Em seguida, insira uma largura de isolamento (em Da) na Janela de Massa Precursora para o lado de massa baixa e alta da massa precursora, por exemplo, ±100 Da.
    5. Clique no botão CID Off. Clique no botão Supressor Metastable ON. Ajuste a intensidade do laser para pelo menos 90% de seu valor máximo ajustando a barra de escala deslizante sob a Intensidade laser no software.
    6. Clique no local de amostra para ser analisado no modelo de destino MALDI no software. Em seguida, pressione o botão esquerdo do mouse e arraste o cursor do mouse sobre o local da amostra para especificar a região retangular a ser amostrada para ablação/ionização a laser. Solte o botão do mouse e a aquisição será iniciada. Colete 10.000 tiros laser para cada ponto de amostra.
      NOTA: Antes da análise da mancha amostral, o instrumento deve ser calibrado externamente no modo MS/MS-reflectron utilizando os íons de fragmento da decadência pós-fonte (PSD) do estado de carga +1 da tiatoedoxina alquilada35.
  3. Não processe dados de MS brutos. Processo MS/MS-PSD dados brutos utilizando a seguinte sequência de etapas na ordem especificada: correção avançada da linha de base (32, 0.5, 0.0) seguido de remoção de ruído (dois desvios padrão) seguidos de suavização gaussiana (31 pontos).
  4. Inspecione manualmente os dados ms/MS-PSD para a presença de íons de fragmentos proeminentes gerados pelo PBC19,20.
  5. Avalie os dados de MS/MS em relação à abundância absoluta e relativa de íons fragmentado e seu sinal-para-ruído (S/N). Utilize apenas os íons de fragmento mais abundantes para identificação de proteínas, especialmente se os dados MS/MS-PSD forem barulhentos.

3. Na construção do banco de dados de proteína silico

  1. Gere um arquivo de texto contendo sequências de proteína silico da cepa bacteriana, que será escaneado pelo software Protein Biomarker Seeker para a identificação de proteínas. As sequências proteicas são derivadas do sequenciamento do genoma inteiro (WGS) da cepa que está sendo analisada (ou uma cepa intimamente relacionada).
  2. Acesse o site NCBI/PubMed (https://www.ncbi.nlm.nih.gov/protein/) para baixar aproximadamente 5.000 sequências proteicas da cepa bacteriana específica (por exemplo, Escherichia coli O113:H21 strain RM7788) sendo analisada. O tamanho máximo do download é de 200 sequências.
    1. Em consequência, copie e cole os 25 downloads em um único arquivo de texto. Selecione o formato FASTA (texto) para cada download.

4. Software de Busca de Biomarcadores de Proteína Operacional

  1. Clique duas vezes no arquivo executável Protein Biomarker Seeker. Uma janela de interface de usuário gráfica (GUI) aparecerá(Figura 1, painel superior).
  2. Digite a massa do biomarcador de proteínas (medida no modo MS-linear) no campo de massa de proteína madura. Em seguida, digite o erro de medição de massa no campo de tolerância em massa. O erro padrão de medição de massa é ±10 Da para uma proteína Da de 10.000.
  3. Opcionalmente, clique no botão Complementary b/y ion Protein Mass Calculator para calcular a massa proteica a partir de um par de íons de fragmento complementar putativo (CFIP ou b/y). Uma janela pop-up, Protein Mass Calculator Tool, aparecerá(Figura 1, painel inferior).
    1. Digite o m/z do CFIP putativo e clique no botão Adicionar par. A massa proteica calculada aparecerá.
    2. Copie e cole esse número no campo de massa de proteínas maduras e feche a janela da ferramenta de calculadora de massa de proteína.
  4. Selecione um comprimento de peptídeo de sinal n-terminal clicando na caixa de restrição de resíduo definido. Um pop-up com uma escala deslizante e cursor aparecerá. Mova o cursor para o comprimento do peptídeo de sinal desejado (máximo 50). Se nenhum comprimento de peptídeo de sinal for selecionado, uma truncação de sequência irrestrita será realizada pelo software.
  5. Sob a Condição de Íon fragmento na GUI, selecione resíduos para decote backbone de polipeptídeo (PBC). Clique nas caixas de um ou mais resíduos: D, E, N e/ou P.
    1. Clique no botão Enter Fragment Ions (+1) Para ser pesquisado. Uma página de fragmentos pop-up aparecerá. Em seguida, clique no botão Adicionar íon fragmento, que corresponde ao número de íons de fragmento a serem inseridos, ou seja, um clique para cada íon de fragmento. Um campo suspenso aparecerá para cada íon de fragmento a ser introduzido.
    2. Digite o m/z dos íons de fragmento e sua tolerância m/z associada. Quando for concluído, clique no botão Salvar e Fechar.
      NOTA: Uma tolerância razoável de m/z é ±1,5.
    3. Selecione o número mínimo de íons de fragmento que devem ser combinados para uma identificação, rolando para o número desejado na caixa à direita de Quantos íons de fragmento precisam ser correspondidos.
      NOTA: Três partidas devem ser adequadas.
    4. Selecione resíduos de cisteína para estar em seu estado oxidado clicando no círculo correspondente. Se não forem encontradas identificações proteicas após a busca, repita a busca com cisteínas em seu estado reduzido. Se não forem encontradas identificações após a busca, amplie a tolerância ao íon fragmento para ±3 e repita a busca.
  6. Na configuração de arquivo,clique no botão Selecionar ARQUIVO FASTA para navegar e selecione o arquivo FASTA (texto) contendo as sequências de proteína silico in da cepa bacteriana anteriormente construída nas etapas do protocolo 3.1 a 3.2. Em seguida, selecione uma pasta de saída e crie um nome de arquivo de saída.
  7. Clique no botão Executar pesquisar em entradas de arquivos. Uma janela pop-up aparecerá intitulada Confirmar parâmetros de pesquisa (Figura 1, painel inferior), exibindo os parâmetros de pesquisa antes que a pesquisa seja iniciada.
  8. Se os parâmetros de pesquisa estiverem corretos, clique no botão Iniciar pesquisa. Se os parâmetros de pesquisa não estiverem corretos, clique no botão Cancelar e reinsira os parâmetros corretos. Uma vez iniciada a pesquisa, a janela do parâmetro fecha, e uma nova janela pop-up com uma barra de progresso aparece(Figura 1, painel inferior) mostrando o progresso da pesquisa e uma contagem de execução do número de identificações encontradas.
  9. Após a conclusão da pesquisa (alguns segundos), a barra de progresso fecha automaticamente, e um resumo da pesquisa é exibido no campo Log da GUI (Figura 2, painel superior). Além disso, uma nova janela pop-up também aparecerá exibindo a identificação de proteínas se houver(Figura 2, painel inferior).
    NOTA: Em sequências de proteína silico que tenham resíduos não reconhecidos, por exemplo, U ou X, são automaticamente ignoradas da análise e essas sequências são posteriormente relatadas com uma janela pop-up separada para alertar o operador sobre quais (se houver) sequências foram ignoradas após a conclusão da pesquisa.

5. Confirmação pós-pesquisa da sequência proteica

  1. Confirme a correção de uma sequência de candidatos por análise manual.
    NOTA: O objetivo do software Protein Biomarker Seeker é identificar uma sequência de proteínas com alta precisão, eliminando muitas sequências proteicas obviamente incorretas da consideração e incorporando truncação sequencial como um possível PTM na proteína madura. Como o número de possíveis sequências de candidatos retornadas são poucos, a confirmação manual é gerenciável.
  2. Gere uma tabela de íons de fragmentos m/z médios do tipo b e y da sequência do candidato usando qualquer espectrometria de massa ou software proteômico com tal funcionalidade. Compare a média m/z de íons de fragmentos de sílico no lado terminal C de resíduos D-, E-, e N (e no lado N-terminal de resíduos P) com o m/z de íons de fragmento proeminentes dos dados MS/MS-PSD.
    NOTA: Os íons de fragmentos MS/MS-PSD mais proeminentes devem ser facilmente combinados com os íons de fragmentos de D-, E-e N associados em íons de fragmento silico. No entanto, o mecanismo de fragmentação do efeito ácido aspartílico é menos eficiente perto do N ou C-termini de uma sequência proteica36.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

A Figura 3 (painel superior) mostra o MS da cepa STEC O113:H21 RM7788 cultivada durante a noite na LBA suplementada com 400 ng/mL mitomicina-C. Picos em m/z 7276, 7337 e 7841 foram identificados anteriormente como proteína de choque frio C (CspC), proteína de choque frio E (CspE) e uma proteína transmitida por plasmídeos de função desconhecida,respectivamente 33. O íon proteico em m/z 9780 [M+H]+ foi analisado por MS/MS-PSD, conforme mostrado na Figura 3 (painel inferior). O íon precursor foi isolado com uma janela de ion cronometrado (TIS) ±100 Da. Íons fragmentais são identificados por seu m/z e tipo/número. O íon fragmento em m/z 2675,9 (destacado com uma estrela) é derramado a partir da dissociação do íon proteico metastável em m/z 9655 mostrado na Figura 3 (painel superior). A média teórica m/z de cada íon fragmento é mostrada entre parênteses com base no PBC da sequência de proteína de imunidade colicina E3 (Im3) mostrada acima. Os locais de PBC são destacados com um asterisco vermelho com o fragmento correspondente produzido. A methionina n-terminal é sublinhada significando que é removida pós-tradução na proteína madura. A sequência tem um único resíduo de cisteína (encaixotado) e, portanto, é considerada em seu estado reduzido.

Utilizando a massa do biomarcador de proteínas e alguns íons de fragmento não complementares proeminentes: m/z 1813.8, 2128,9, e 4293,7 (tolerância ± 1,5) (Figura 1, painel inferior) e restringindo o PBC ao lado do terminal C de resíduos D e E, apenas uma sequência de candidatos foi relatada pelo software: Sequência de proteína Im3 (sem sua methionina n-terminal) (Figura 2 , painel inferior). Ao selecionar íons fragmentários para uma pesquisa, deve-se enfatizar que qualquer grupo de íons de fragmento não complementares assume que a soma do m/z de quaisquer dois íons fragmentários no grupo (e subtraindo dois prótons) resulta em uma soma de massa que não se enquadra na massa biomarcadora e na tolerância de massa associada (±10 Da). O rascunho WGS de RM7788 revelou 5008 sequências proteicas (quadros de leitura abertos)37. Dessas ~5.000 sequências completas de proteína, 189.490 sequências completas e parciais (truncação irrestrita) atenderam aos critérios de massa biomarcadores(Figura 2, painel superior). Essas sequências que passam pelos critérios de massa passam então no silico PBC no lado terminal C de resíduos D e/ou E. Os íons fragmentos resultantes gerados são então comparados com os íons fragmentos observados inseridos. A sequência de candidatos relatada pelo software foi baseada apenas em sua massa e três sites PBC específicos em D e/ou E. A especificidade alcançada por uma quantidade tão pequena de informações será discutida na próxima seção.

Como mostrado na Figura 3 (painel inferior), os íons de fragmento mais abundantes são o resultado do PBC no lado terminal C dos resíduos D e E através do mecanismo de fragmentação do efeito ácido aspartílico19,20. Dois CFIP são observados: b67/y17 (m/z 7645.1 / m/z 2128,9) e b70/y14 (m/z 7959,4 / m/z 1813.8). Estes CFIP podem ser usados para calcular com mais precisão a massa do íon precursor da proteína usando a fórmula simples: b (m/z) + y (m/z) - 2H+ = massa proteica (Da)33. Utilizando o DOIS CFIP, obtemos uma massa média da proteína: 9771,6 Da, que está mais próxima de seu valor teórico de 9772,5 Da do que a massa medida do íon proteico no modo MS-linear: 9779 Da(Figura 3, painel superior). Apenas alguns CFIP foram detectados porque a maioria dos íons precursores tendo o próton ionizante sequestrado no único resíduo de arginina: R80. A maior basicidade da fase gasosa da arginina (237,0 kcal/mol38) em comparação com um resíduo de lisina (K) (221,8 kcal/mol38) é provavelmente responsável pelo sequestro preferencial do próton ionizante no único resíduo R.

A Figura 4 (painel superior) mostra o MS da cepa STEC O113:H21 RM7788 cultivada durante a noite na LBA suplementada com 800 ng/mL mitomicina-C. A Figura 4 (painel superior) é bastante semelhante à Figura 3 (painel superior), embora existam diferenças na abundância relativa de alguns íons proteicos devido às diferenças nas concentrações de antibióticos utilizadas. Há também pequenas mudanças no biomarcador de proteínas m/z que refletem diferenças na calibração externa do instrumento em dias diferentes. Mais uma vez, os íons proteicos em m/z 7272, 7335 e 7838 são CspC, CspE e uma proteína transmitida por plasmídeos, respectivamente. Além disso, detectamos o íon proteico Im3 em m/z 9778 (embora com menos abundância do que na Figura 3), bem como um íon proteico em m/z 9651 [M+H]+. A Figura 4 (painel inferior) mostra MS/MS-PSD do íon precursor da proteína em m/z 9651. O íon precursor foi isolado utilizando uma janela TIS mais estreita e assimétrica de -75/+60 Da para eliminar contribuições de íons proteicos adjacentes em m/z 9539 e 9778. Íons fragmentados são identificados por seu m/z e tipo/número. A sequência da proteína de imunidade da bacteriocina (Im-Bac) é mostrada acima. Os locais de PBC são destacados com um asterisco vermelho com seus íons de fragmento correspondentes. A média teórica m/z de cada íon fragmento também é mostrada entre parênteses no espectro. A sequência Im-Bac também tem um único resíduo de cisteína (encaixotado) e, portanto, é considerada em seu estado reduzido.

Usando a massa biomarcadora de proteínas, três íons de fragmento não complementares proeminentes: m/z 2675,4, 3853,5 e 5772,8 (tolerância ± 1,50) da Figura 4 e restringindo o PBC apenas ao lado terminal C dos resíduos de D e/ou E e/ou asparagine (N)-, apenas uma sequência de candidatos foi relatada pelo software: Im-Bac protein. A sequência de candidatos foi recuperada após a varredura de 191.375 sequências completas ou parciais que atenderam aos critérios de massa e tolerância biomarcadores (±10 Da). A sequência do candidato foi identificada pelo software baseado apenas em sua massa e três sites PBC específicos em D e/ou E e/ou N.

Os íons fragmentos mais proeminentes na Figura 4 (painel inferior) foram, mais uma vez, o resultado do PBC no lado terminal C de resíduos D e/ou E e também no lado N-terminal de um dos resíduos P20. Observamos também o PBC no lado terminal C de um N-resíduos que também é provável que ocorra por um mecanismo de fragmentação semelhante ao efeito ácido aspartc39,40. A fraqueza do sinal de íon precursor da proteína resulta em um número limitado de íons de fragmento interpretatáveis. A precisão do fragmento ion m/z diminui com abundância de íons fragmentos. Nenhum CFIP foi detectado devido, presumivelmente, ao próton ionizante que está sendo sequestrado no único resíduo de arginina (R74) da sequência de íons proteicos. Todos os íons fragmentários contêm o resíduo R74, consistente com esta hipótese.

O promotor de genes de imunidade antibacteriana
A Figura 5 mostra uma parte do 6482 bp contig00100 da cepa E. coli RM7788 (GenBank: NWVS0100096.1) do sequenciamento de espingarda de genoma inteiro37. As regiões de codificação da colicina E3, sua proteína de imunidade (Im3), a proteína de imunidade da bacteriocina (Im-Bac) e uma proteína de lise são destacadas em amarelo. A montante da região de codificação do gene colicina E3 estão a região -35, a caixa Pribnow (PB), a repetição invertida da caixa SOS, o local de ligação Shine-Dalgarno/ribossômico (SD/RBS)27. Há uma região intergênica de nove pares de base entre colicina E3 e Im3. LexA (uma proteína repressora e uma autopeptidase) se liga à caixa SOS bloqueando a expressão de genes rio abaixo. Após danos no DNA (por exemplo, radiação UV ou antibióticos prejudiciais ao DNA), a LexA sofre auto-decote permitindo a expressão de genes a jusante27,28. Assim, a expressão dessas duas proteínas de imunidade é consistente com a exposição desta cepa a um antibiótico prejudicial ao DNA.

Figure 1
Figura 1: Capturas de tela do software Protein Biomarker Seeker. Painel superior: Interface gráfica do usuário (GUI) do software Protein Biomarker Seeker. Painéis inferiores: Janelas pop-up da ferramenta calculadora de massa de proteína, página de fragmento, confirmar parâmetros de pesquisa e barra de progresso de pesquisa. Clique aqui para ver uma versão maior desta figura.

Figure 2
Figura 2: Pesquisar resultados de uma identificação de proteínas usando o software Protein Biomarker Seeker. Painel superior: Resumo dos resultados de pesquisa exibidos no Campo de Registro do gui do software. Painel inferior: Uma janela pop-up exibindo uma identificação de proteína usando o software. Clique aqui para ver uma versão maior desta figura.

Figure 3
Figura 3: Análise da espectrometria de massa da cepa STEC O113:H21 RM7788. Painel superior: MS da cepa STEC O113:H21 RM7788 cultivada durante a noite na LBA suplementada com 400 ng/mL mitomicina-C. Painel inferior: MS/MS-PSD do íon precursor de proteínas em m/z 9780 (painel superior). O íon precursor foi isolado com uma janela TIS ±100 Da. Íons fragmentais são identificados pelo seu tipo m/z e íon. A sequência da proteína de imunidade para colicina E3 (Im3) é mostrada. Os resíduos básicos (locais de possível sequestro de carga) são destacados em azul. O PBC é destacado com um asterisco vermelho com o fragmento correspondente gerado. A média teórica m/z de cada íon de fragmento é mostrada entre parênteses. Clique aqui para ver uma versão maior desta figura.

Figure 4
Figura 4: Análise de espectrometria de massa da cepa STEC O113:H21 RM7788. Painel superior: MS da cepa STEC O113:H21 RM7788 cultivada durante a noite na LBA suplementada com 800 ng/mL mitomicina-C. Painel inferior: MS/MS-PSD do íon precursor de proteínas em m/z 9651 (painel superior). O íon precursor foi isolado com uma janela TIS assimétrica de -75 no lado baixo m/z do íon precursor e +60 no lado m/z alto do íon precursor. Íons fragmentado são identificados pelo tipo m/z e íon. A sequência da proteína de imunidade da bacteriocina (Im-Bac) é mostrada. Os resíduos básicos (locais de possível sequestro de carga) são destacados em azul. O PBC é destacado com um asterisco vermelho com o fragmento correspondente gerado. A média teórica m/z de cada íon fragmento é mostrada entre parênteses. Clique aqui para ver uma versão maior desta figura.

Figure 5
Figura 5: Análise de uma seção do genoma plasmídeo transportado por E. coli O113:H21 cep RM7788. Uma parte da cepa 6482 bp contig00100 de E. coli O113:H21 rM7788 (GenBank: NWVS0100096.1) de toda a espingarda genoma sequenciando37. Clique aqui para ver uma versão maior desta figura.

Arquivo suplementar 1 (S1 Im3): Resultados da análise de benchmarking de software utilizando íons de fragmento seletos de Im3 (da Figura 3, painel inferior). Clique aqui para baixar este Arquivo.

Arquivo Suplementar 2 (S2 ImBac): Resultados da análise de benchmarking de software utilizando íons de fragmento seletos de Im-Bac (da Figura 4, painel inferior). Clique aqui para baixar este Arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Considerações protocolares
Os principais pontos fortes do protocolo atual são sua velocidade, simplicidade da preparação da amostra e uso de um instrumento relativamente fácil de operar, ser treinado e manter. Embora a análise proteômica de baixo para cima e de cima para baixo por cromatografia líquida-ESI-HR-MS seja onipresente e muito superior em muitos aspectos para de cima para baixo pelo MALDI-TOF-TOF, eles exigem mais tempo, trabalho e experiência. A complexidade do instrumento pode afetar muitas vezes se determinadas plataformas de instrumentos provavelmente serão adotadas por cientistas não formalmente treinados em espectrometria de massa. A abordagem de cima para baixo com MALDI-TOF-TOF destina-se a estender a análise do MALDI-TOF-MS para além do seu uso atual para identificação taxonômica de bactérias em laboratórios de microbiologia clínica, ao mesmo tempo em que não aumenta drasticamente o trabalho, complexidade ou experiência necessários para análise.

O protocolo não emprega qualquer etapa de lise celular mecânica (ou elétrica). Embora proteínas secretadas ou extracelulares possam ser detectadas usando o protocolo, uma versão anterior deste método foi desenvolvida pela primeira vez para detecção de toxina Shiga (Stx) a partir de cepas STEC em que a indução de antibióticos desencadeia a resposta do SOS bacteriano resultando na expressão de genes de phage, incluindo stx, bem como genes ph de lateage responsáveis pela lise celular bacteriana41 . Descobrimos que a lise celular induzida por antibióticos tem certas vantagens para a detecção de Stx, bem como proteínas plasmidas que têm promotores de SOS (trabalho atual). Certamente, a lise celular mecânica (por exemplo, batida de contas) também pode ser usada (embora não seja usada no trabalho atual). No entanto, a lise mecânica resulta em todas as células bacterianas sendo lístidas (não simplesmente células induzidas) resultando na amostra sendo enriquecida com proteínas hospedeiras abundantes e altamente conservadas que podem tornar a detecção de phage e proteínas plasmidas de uma amostra não fracionada mais desafiadora.

As concentrações de antibióticos para uma cepa bacteriana foram geralmente reprodutíveis em relação às proteínas induzidas por antibióticos detectadas. Notamos variações na abundância relativa de proteínas em relação às proteínas induzidas por antibióticos detectadas. Uma vez que nossa análise é qualitativa (não quantitativa), a abundância de biomarcadores proteicos só precisa ser suficiente para uma análise adequada de MS/MS. Uma cepa STEC putativa é cultivada pela primeira vez com uma gama de concentrações de antibióticos (por exemplo, 300 ng/mL a 2.000 ng/mL de mitomicina-C) para determinar a concentração ideal de tal forma que desencadeia a resposta bacteriana sos enquanto ainda fornece células bacterianas suficientes para a colheita. Para a cepa STEC RM7788, descobrimos que a concentração de antibióticos ideal para detecção dos biomarcadores identificados foi de 400 a 800 ng/mL de mitomicina-C.

Além da truncação de sequência proteica, as proteínas E. coli podem ter PTMs que envolvem adição de massa, por exemplo, fosforilação, glicosilação, etc. Como o MS/MS utiliza o PSD para dissociação de íons proteicos metastíveis carregados (menos de 20 kDa em massa) gerados pelo MALDI, tais PTMs ligados a cadeias laterais de resíduos provavelmente sofreriam perda dissociativa fácil porque o PSD é uma técnica de dissociação ergodic. A presença desses PTMs poderia ser inferida a partir do aparecimento de um íon fragmentado próximo em massa ao íon precursor original (menos a massa do PTM) nos dados de MS/MS. No entanto, nem o PSD nem o software seriam capazes de identificar onde tais PTMs estão anexados. Além disso, o software só pode identificar proteínas a partir de íons fragmentados de PBC e não perda dissociativa de pequenas moléculas (por exemplo, água ou amônia) ou PTMs ligados às cadeias laterais de resíduos. No entanto, se forem detectados íons fragmentados do PBC, a proteína ainda poderá ser identificada usando o software, ampliando a janela de tolerância à massa proteica para incluir a massa do PTM ou simplesmente entrando na massa do íon fragmento de proteína correspondente à perda dissociativa do ptm suspeito. Qualquer identificação pelo software seria da sequência proteica sem o PTM. Curiosamente, não detectamos proteínas com fosforilação, glicosilação, etc. em nosso trabalho bacteriano até agora. No entanto, isso pode ser devido a: sua abundância relativa pelo MALDI, a faixa de massa que está sendo usada: 2-20 kDa, que tais PTMs podem ser extraordinariamente labile e podem não sobreviver à aplicação da matriz MALDI, ou que tais PTMs podem sofrer perda dissociativa muito rápida na fonte antes que os íons sejam acelerados a partir da fonte.

Atualmente, o software não inclui a alquilação de cisteína, e nosso protocolo de amostra não inclui uma etapa de redução de dissulfeto para resíduos de cisteína. O protocolo foi esclarecido para indicar que a busca deve ser operada com resíduos de cisteína em seu estado oxidado, e se nenhuma identificação for obtida, então para executar a busca novamente com resíduos de cisteína em seu estado reduzido. Se nenhuma identificação for encontrada novamente, a ampliação da tolerância ao íon fragmento para ±2 ou ±3 reduz o limiar para correspondência de íons de fragmento permitindo que sequências com cisteínas sejam combinadas se estiverem presentes em seus estados oxidados e/ou reduzidos.

Análise proteômica de cima para baixo por espectrometria de massa MALDI-TOF-TOF
A maioria das análises proteômicas de cima para baixo foi obtida usando plataformas de espectrometria de massa e ESI e de alta resolução. Em contrapartida, menos análises proteômicas de cima para baixo foram realizadas usando plataformas MALDI-TOF-TOF. Em consequência, há muito pouco software proteômico de cima para baixo para análise de íons proteicos metastíveis carregados gerados e analisados por MALDI-TOF-TOF-MS/MS-PSD que exploram o efeito ácido aspartic para fragmentação15,42. Há uma série de razões para isso. Em primeiro lugar, a eficiência de ionização do MALDI é tendenciosa em relação a peptídeos e proteínas de menor peso molecular, e esse viés é particularmente aparente com uma mistura de proteínas como seria encontrado em um lise celular bacteriano não fratificado. Em segundo lugar, o MALDI gera estados de baixa carga, e há pouca ou nenhuma repulsa de Coulomb para facilitar a dissociação de íons proteicos. Em terceiro lugar, a cobertura de sequência do PSD é bastante limitada ao contrário de outras técnicas ECD7, ETD7,UV-PD8, etc. Em quarto lugar, a eficiência de fragmentação do PSD diminui com o aumento da massa do íon proteico. Em quinto lugar, técnicas de dissociação ergodica, como o PSD, tendem a resultar em perda dissociativa fácil de PTMs ligados a resíduos, por exemplo, fosforilação, glicosilação, etc., tornando desafiador determinar o local de apego do PTM. Apesar dessas severas limitações, a análise de cima para baixo utilizando MALDI-TOF-TOF-MS/MS-PSD tem claras vantagens, por exemplo, simplicidade da preparação da amostra, ausência de separação de LC, isolamento de íons proteicos metastáveis por MS/MS permitindo atribuição de íons fragmentantes a íons precursores, identificação de PTMs envolvendo truncação sequencial e ligações de dissulfeto intramolecular e, mais importante, a análise de velocidade. Quando combinada com sequências de proteína silico derivadas de dados WGS, essa técnica pode fornecer informações rápidas antes que outras análises mais demoradas e intensivas em mão-de-obra sejam concluídas.

O software Protein Biomarker Seeker foi desenvolvido usando IntelliJ e escrito em Java para processar e pesquisar eficientemente sequências de aminoácidos proteicos derivados de WGS de uma cepa bacteriana. O software foi modificado a partir de um algoritmo anterior que operava como uma macro dentro do Excel33. Decidimos desenvolver uma versão autônoma do software com uma interface gui para torná-lo mais fácil de usar, bem como fornecer melhorias adicionais.

No caso de PTMs envolvendo truncação de sequência proteica, o software remove sequencialmente um resíduo de aminoácido do N-terminus enquanto adiciona iterativamente resíduos da sequência até que a soma de massa se encontre ou exceda a massa medida do biomarcador de proteína detectado. Embora este processo possa resultar em um número muito grande de fragmentos de massa proteica (~200.000 de ~5000 sequências completas de proteína), ele tem a vantagem de não excluir quaisquer fragmentos potenciais de proteínas da truncação no N-terminus ou C-terminus (ou ambos) por mais improvável que tal truncação possa ser de uma perspectiva biológica. Esta abordagem é referida como truncação irrestrita. No entanto, os PTMs bacterianos mais comuns envolvendo truncação são a remoção do peptídeo de sinal n-terminal ou n-terminal. Em consequência, o software também permite que o operador selecione um limite superior (50 resíduos) para truncação de resíduos do N-terminus, o que resulta em muito menos fragmentos de proteína que atendem aos critérios de massa do biomarcador de proteínas.

O PBC no lado terminal C dos resíduos D e E, bem como no lado terminal N dos resíduos P são consistentes com o mecanismo de efeito ácido aspartílico, que tem sido estudado extensivamente tanto experimentalmente quanto teoricamente17,18,19,20. A inclusão de PBC no lado terminal C de resíduos N foi incluída no software devido a um mecanismo semelhante ao efeito ácido aspartc que tem sido observado para uma série de íons proteicos metastíveis em nosso laboratório39,40. Os íons fragmentários mais abundantes da dissociação de íons proteicos metastíveis carregados singly analisados por MS/MS-PSD são devido ao mecanismo de fragmentação do efeito ácido aspartílico. O operador seleciona os íons de fragmento mais proeminentes dos dados MS/MS-PSD e insere seu m/z no software, bem como uma tolerância de íon de fragmento associada (±m/z). A tolerância ao íon fragmento pode ser ajustada para cada íon fragmento para refletir sua abundância relativa. Uma tolerância de íon de fragmento apropriada pode variar entre ±1,0 a ±2,5 m/z, dependendo da abundância absoluta do íon fragmento, bem como sua abundância relativa em comparação com o ruído químico de fundo. Tipicamente, quanto mais abundante um íon de fragmento, melhor sua precisão de massa, o que permite que uma tolerância de íon de fragmento mais estreita seja usada.

Os dados MS/MS-PSD de íons proteicos metastáveis podem variar drasticamente em termos de sua complexidade. Alguns espectros MS/MS-PSD são mais facilmente interpretáveis do que outros. Há várias razões para este fenômeno. Em primeiro lugar, o íon proteico pode não se fragmentar eficientemente na escala de tempo da análise (~10-30 μs) talvez porque permanece dobrado ou parcialmente dobrado mesmo após a solubilização na solução matricial MALDI. Em segundo lugar, além do PBC, íons proteicos metastáveis podem sofrer perda dissociativa de pequenas moléculas, ou seja, amônia (-17 Da) ou água (-18 Da)15. Um contribuinte significativo para a complexidade espectral parece ser a perda dissociativa da amônia da cadeia lateral de resíduos R33. Observamos um aumento da complexidade espectral dos dados ms/MS-PSD com o número de resíduos de R na sequência proteica. Proteínas sem resíduos R (proteína YahO36 e proteína de choque frio CspC33,43), com um resíduo de R (proteína de choque frio CspE33 e subunidade B de Stx241),com dois resíduos de R (proteína hipotética33),produzem espectros MS/MS-PSD que são relativamente descomplicados e fáceis de interpretar. No entanto, quando o número de resíduos R aumenta para três (proteína HU44), ou quatro (ubiquitina35e proteína de choque decold CsbD33,43), a complexidade espectral aumenta significativamente. O software compara íons fragmentados de PBC em resíduos específicos do mecanismo de efeito ácido aspartic apenas por se este for o canal de dissociação mais acessível de íons proteicos metastíveis carregados singly analisados por MS/MS-PSD. O software não inclui íons fragmentado resultantes de perda dissociativa (ou perdas) de pequenas moléculas neutras( s). Em consequência, é importante que o operador não selecione íons fragmentado que incluam pequenas perdas dissociativas neutras. Íons fragmentados do PBC são tipicamente os íons fragmentais mais proeminentes; no entanto, quando o número de resíduos R em uma proteína aumenta para três ou quatro, o íon fragmento mais abundante em um local pbc pode ser aquele que inclui uma pequena perda dissociativa (ou perdas). Se esse conjunto de íons fragmentado (separado por múltiplos de 17 ou 18 m/z) for detectado, o íon fragmento com o m/z mais alto dentro de um cluster deve ser o inserido nos parâmetros de busca de íons de fragmento.

Deve-se ressaltar que o software não foi projetado para identificação proteômica livre de operadores. O operador deve selecionar quais íons de fragmentos de dados MS/MS-PSD devem ser incluídos na pesquisa. No entanto, com base em numerosos experimentos que confirmaram o efeito ácido aspartic por MS/MS-PSD, os íons fragmentários mais proeminentes são sempre o resultado de PBC no lado terminal C dos resíduos D- ou E ou N. A utilidade do software é que ele elimina muitas sequências obviamente incorretas e recupera apenas alguns candidatos prováveis. Algumas sequências de candidatos podem ser eliminadas com base na ausência de um íon fragmentado onde um resíduo D em uma sequência seria esperado para gerar um íon de fragmento proeminente. Invariavelmente, os resíduos D resultam em íons de fragmento proeminentes em toda a espinha dorsal do polipeptídeo, exceto quando estão localizados dentro de alguns resíduos do N ou C-termini, onde a eficiência do efeito ácido aspúrico diminui36.

Número mínimo de locais PBC necessários para identificação de proteínas provisórias
Um CFIP é formado a partir de dois íons precursores de proteínas idênticos que se dissociam no mesmo local pbc, mas têm seu próton ionizante em lados opostos do local do decote. Embora um CFIP possa ser usado para calcular a massa do biomarcador de proteínas com mais precisão (permitindo um estreitamento da tolerância à massa proteica durante uma pesquisa), sua utilidade para identificação específica de sequência é menos útil do que a de dois íons de fragmento não complementares formados a partir de dois locais diferentes de decote, que fornecem maior especificidade de identificação. A facilidade com que as duas proteínas AB-Im foram identificadas nos levou a especular quanto ao número mínimo de íons fragmentado necessários para identificar provisoriamente a sequência proteica correta de milhares de proteínas ou sequências de fragmentos de proteínas. Determinamos rapidamente que não era o número de íons fragmentado em si, mas o número de íons de fragmento não complementares que é importante porque cada fragmento não complementar representa um local pbc, enquanto um CFIP representa o mesmo local de decote. Assim, a especificidade de identificação é derivada do número de locais pbc detectados não o número de íons fragmentos.

É possível que o sucesso na identificação com apenas três íons fragmentado possa ter sido simplesmente fortuito. Para testar essa hipótese e eliminar o viés na seleção de íons fragmentado, criamos um módulo de benchmarking dentro do software que seleciona aleatoriamente íons fragmentado de um conjunto maior de íons de fragmentos complementares e/ou não complementares. A maior piscina de íons de fragmento foi selecionada entre os 14 íons de fragmento proeminentes identificados na Figura 3 (painel inferior) com base em sua abundância relativa.

O protocolo de teste foi o seguinte. Usando uma pesquisa binária, três íons de fragmento foram selecionados aleatoriamente da piscina de 14 íons de fragmento proeminentes na Figura 3 (painel inferior) (m/z 1813.8, 2128,9, 3881.3, 4293,7, 5158,0, 6505,0, 6619,9, 6939,4, 7645,1, 7959,4, 8022,7, 8136,2, 8583,3 e 8961,5). Uma coorte de íons de três fragmentos foi comparada com íons de fragmentos de silico do PBC no lado terminal C de resíduos D- ou E- ou N, bem como uma combinação de D & E e D & E & N. Esta comparação foi realizada para cada íon fragmento individual de uma coorte, para os três pares de íons fragmentado de uma coorte e para a combinação de íons de três fragmentos de uma coorte. Para uma comparação a ser contada como uma correspondência, ambos os íons fragmentados de um par e todos os três íons fragmentados de uma combinação devem coincidir com íons de fragmento silico. Após a conclusão da análise, outra coorte de íons de três fragmentos é selecionada aleatoriamente, e a análise é repetida. A repetição na seleção de íons de fragmentos foi permitida. Como existem 364 combinações possíveis [(n!/r!). n-r)!] de uma coorte de íons de três fragmentos (r) de um pool de 14 íons fragmentado (n), apenas 10 análises foram realizadas conforme mostrado no S1Im3 (Informações Complementares).

O requisito de identificação de íons de três fragmentos parece ser um fenômeno geral, como mostrado na coluna 3_ABC das Tabelas 2-7, 9-10 (S1Im3). Todas as contagens de 1 na coluna 3_ABC correspondem à sequência Im3 (sem methionina terminal N). A única falha na identificação ocorreu porque o íon fragmento em m/z 8136.2 (mostrado na Figura 3, painel inferior e destacado em cinza nas Tabelas 1 e 8) excedeu a tolerância de íon fragmento (±1,5 m/z) inserida para a análise. Uma vez que o algoritmo de teste exige que todos os íons fragmentados de uma coorte de íons de três fragmentos sejam combinados, qualquer grupo que incluísse o fragmento m/z 8136.2 não identificaria/contabilizaria a sequência proteica correta.

A Tabela 6 em S1Im3 mostra que quando dois dos três íons de fragmento são complementares (destacados em amarelo), sequências mais incorretas corresponderam aos critérios observados quando os três íons fragmentados não eram complementares. Como observado anteriormente, isso ocorre porque um CFIP corresponde a um único local pbc, um limiar que é atingível por muitos mais incorretos em sequências de silico em comparação com o uso de dois íons de fragmento não complementares que correspondem a dois locais pbc, um critério mais rigoroso.

Análise semelhante foi realizada em seis íons de fragmento proeminentes (m/z 2675,4, 2904,5, 3076,2, 3853,5, 5657,5 e 5772,8) de Im-Bac mostrado na Figura 4 (painel inferior). Ao contrário do Im3, o Im-Bac não possui CFIP discernível, portanto os seis íons fragmentado correspondem presumivelmente a seis locais pbc. Como há 20 combinações possíveis de uma coorte de íons de três fragmentos selecionadas a partir de um pool de seis íons fragmentado, apenas 10 análises foram realizadas como mostrado nas tabelas de S2 Im-Bac (Informações Complementares). A sequência Im-Bac foi corretamente identificada/contada para todos os grupos de íons de três fragmentos em 3_ABC de coluna em todas as análises. Em quatro análises, uma ou duas sequências incorretas também foram combinadas. No entanto, este pequeno número de sequências incorretas é um número gerenciável para confirmação manual.

No geral, íons de fragmentos complementares e/ou não complementares que correspondem a dois ou três locais pbc parecem fornecer especificidade suficiente para recuperar uma ou duas sequências de candidatos. É claro que os íons de fragmento selecionados pelo operador devem ser relativamente abundantes e ter bom S/N. Um ou dois íons de fragmento de um único local PBC não fornecem especificidade suficiente para evitar recuperar um número inviável de sequências incorretas que devem ser confirmadas pelo operador. Não está claro por que dois ou três locais PBC são adequados, mas um único site pbc aparentemente não é específico o suficiente. Embora a truncação irrestrita resulte em ~200.000 proteínas e sequências de fragmentos de proteína que atendem aos critérios de massa proteica, é provável que a natureza local/resíduo específico dos locais de decote, ou seja, lado terminal C de D-, E-, e N-resíduos, contribua para o estreitamento acentuado de possíveis sequências durante a comparação de íons de fragmento. Isso pode ser devido, em parte, à frequência de resíduos D,E-e N em sequências de proteínas bacterianas, bem como seus locais únicos em sequências proteicas através do proteome de bactérias. Os resíduos ácidos desempenham papéis críticos na estrutura proteica e nas interações de solventes. Em consequência, sua frequência e localizações na sequência primária são críticas se não únicas para a função proteica e podem explicar por que apenas alguns locais pbc são necessários para identificar provisoriamente a sequência proteica correta entre centenas de milhares de sequências incorretas.

Do ponto de vista da química da fase gasosa, a importância dos resíduos D, E-e N decorre de sua participação em um canal de dissociação acessível a baixas energias internas de íons proteicos metastíveis carregados de singly gerados pelo MALDI e decadência pelo PSD20. A escala de tempo relativamente longa (~10-30 μs) da fragmentação de íons moleculares pelo PSD significa que a energia interna do íon proteico é randomizada entre todos os graus vibracionais e rotacionais de liberdade do íon molecular de modo que a dissociação é ergodica e estatística. Deve-se ressaltar também que o mecanismo do efeito ácido aspílico envolve um rearranjo de íon molecular que ocorre por uma sequência de passos ou uma única etapa concertada envolvendo múltiplos átomos até que uma geometria favorável seja alcançada que reduza a barreira de ativação do PBC17,18,19.

Duas proteínas de imunidade antibacteriana codificadas por plasmídeos produzidas por uma cepa STEC foram identificadas usando um protocolo envolvendo indução de antibióticos, MALDI-TOF-TOF-MS/MS-PSD e análise proteômica de cima para baixo. Essas proteínas foram identificadas por meio de um software desenvolvido internamente que incorpora a massa medida da proteína e um número relativamente pequeno de íons de fragmento específicos de sequência formados como resultado do efeito ácido aspícico. O software compara os dados de MS e MS/MS com sequências de fragmentos de proteínas e proteínas derivadas dos dados do WGS. Embora o software não forneça métricas de identificação ou pontuação, elimina uma porcentagem muito alta de sequências incorretas resultando em um número muito pequeno de sequências de candidatos (uma ou duas) que podem ser facilmente confirmadas por inspeção manual. Finalmente, a inspeção manual dos dados do WGS desta cepa bacteriana revelou um promotor (caixa SOS) a montante dos genes AB e Im em um genoma plasmídeo, o que racionaliza a expressão desses genes devido à exposição de antibióticos prejudiciais ao DNA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm conflitos de interesse.

Acknowledgments

O software Protein Biomarker Seeker está livremente disponível (sem custo) entrando em contato com Clifton K. Fagerquist em clifton.fagerquist@usda.gov. Queremos reconhecer o apoio desta pesquisa por ARS, USDA, BOLSA CRIS: 2030-42000-051-00-D.

Materials

Name Company Catalog Number Comments
4000 Series Explorer software AB Sciex Version 3.5.3
4800 Plus MALDI TOF/TOF Analyzer AB Sciex
Acetonitrile Optima LC/MS grade Fisher Chemical A996-1
BSL-2 biohazard cabinet The Baker Company SG403A-HE
Cytochrome-C Sigma C2867-10MG
Data Explorer software AB Sciex Version 4.9
Focus Protein Reduction-Alkylation kit G-Biosciences 786-231
GPMAW software Lighthouse Data Version 10.0
Incubator VWR 9120973
LB Agar Invitrogen 22700-025
Luria Broth Invitrogen 12795-027
Lysozyme Sigma L4919-1G
Microcentrifuge Tubes, 2 mL, screw-cap, O-ring Fisher Scientific 02-681-343
MiniSpin Plus Centrifuge Eppendorf 22620207
Mitomycin-C (from streptomyces) Sigma-Aldrich M0440-5MG
Myoglobin Sigma M5696-100MG
Shaker MaxQ 420HP Model 420 Thermo Scientific Model 420
Sinapinic acid Thermo Scientific 1861580
Sterile 1 uL loops Fisher Scientific 22-363-595
Thioredoxin (E. coli, recombinant) Sigma T0910-1MG
Trifluoroacetic acid Sigma-Aldrich 299537-100G
Water Optima LC/MS grade Fisher Chemical W6-4

DOWNLOAD MATERIALS LIST

References

  1. Fornelli, L., et al. Accurate sequence analysis of a monoclonal antibody by top-down and middle-down orbitrap mass spectrometry applying multiple ion activation techniques. Analytical Chemistry. 90 (14), 8421-8429 (2018).
  2. Fornelli, L., et al. Top-down proteomics: Where we are, where we are going. Journal of Proteomics. 175, 3-4 (2018).
  3. He, L., et al. Top-down proteomics-a near-future technique for clinical diagnosis. Annals of Translational Medicine. 8 (4), 136 (2020).
  4. Wu, Z., et al. MASH explorer: A universal software environment for top-down proteomics. Journal of Proteome Research. 19 (9), 3867-3876 (2020).
  5. Konermann, L., Metwally, H., Duez, Q., Peters, I. Charging and supercharging of proteins for mass spectrometry: recent insights into the mechanisms of electrospray ionization. Analyst. 144 (21), 6157-6171 (2019).
  6. Bourmaud, A., Gallien, S., Domon, B. Parallel reaction monitoring using quadrupole-Orbitrap mass spectrometer: Principle and applications. Proteomics. 16 (15-16), 2146-2159 (2016).
  7. Hart-Smith, G. A review of electron-capture and electron-transfer dissociation tandem mass spectrometry in polymer chemistry. Analitica Chimica Acta. 808, 44-55 (2014).
  8. Brodbelt, J. S., Morrison, L. J., Santos, I. Ultraviolet photodissociation mass spectrometry for analysis of biological molecules. Chemical Reviews. 120 (7), 3328-3380 (2020).
  9. Karas, M., Bachmann, D., Bahr, U., Hillenkamp, F. Matrix-assisted ultraviolet-laser desorption of nonvolatile compounds. International Journal of Mass Spectrometry and Ion Processes. 78, 53-68 (1987).
  10. Karas, M., Bachmann, D., Hillenkamp, F. Influence of the wavelength in high-irradiance ultraviolet-laser desorption mass-spectrometry of organic-molecules. Analytical Chemistry. 57 (14), 2935-2939 (1985).
  11. Tanaka, K., et al. Protein and polymer analyses up to m/z 100 000 by laser ionization time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 2 (8), 151-153 (1988).
  12. Resemann, A., et al. Top-down de Novo protein sequencing of a 13.6 kDa camelid single heavy chain antibody by matrix-assisted laser desorption ionization-time-of-flight/time-of-flight mass spectrometry. Analytical Chemistry. 82 (8), 3283-3292 (2010).
  13. Suckau, D., Resemann, A. T3-sequencing: targeted characterization of the N- and C-termini of undigested proteins by mass spectrometry. Analytical Chemistry. 75 (21), 5817-5824 (2003).
  14. Mikhael, A., Jurcic, K., Fridgen, T. D., Delmas, M., Banoub, J. Matrix-assisted laser desorption/ionization time-of-flight/time-of-flight tandem mass spectrometry (negative ion mode) of French Oak Lignin: A Novel Series of Lignin and Tricin Derivatives attached to Carbohydrate and Shikimic acid Moieties. Rapid Communications in Mass Spectrometry. 34 (18), 8841 (2020).
  15. Demirev, P. A., Feldman, A. B., Kowalski, P., Lin, J. S. Top-down proteomics for rapid identification of intact microorganisms. Analytical Chemistry. 77 (22), 7455-7461 (2005).
  16. Fagerquist, C. K. Unlocking the proteomic information encoded in MALDI-TOF-MS data used for microbial identification and characterization. Expert Review of Proteomics. 14 (1), 97-107 (2017).
  17. Gu, C., Tsaprailis, G., Breci, L., Wysocki, V. H. Selective gas-phase cleavage at the peptide bond C-terminal to aspartic acid in fixed-charge derivatives of Asp-containing peptides. Analytical Chemistry. 72 (23), 5804-5813 (2000).
  18. Herrmann, K. A., Wysocki, V. H., Vorpagel, E. R. Computational investigation and hydrogen/deuterium exchange of the fixed charge derivative tris(2,4,6-trimethoxyphenyl) phosphonium: implications for the aspartic acid cleavage mechanism. Journal of the American Society for Mass Spectrometry. 16 (7), 1067-1080 (2005).
  19. Rozman, M. Aspartic acid side chain effect-experimental and theoretical insight. Journal of the American Society for Mass Spectrometry. 18 (1), 121-127 (2007).
  20. Yu, W., Vath, J. E., Huberty, M. C., Martin, S. A. Identification of the facile gas-phase cleavage of the Asp-Pro and Asp-Xxx peptide bonds in matrix-assisted laser desorption time-of-flight mass spectrometry. Analytical Chemistry. 65 (21), 3015-3023 (1993).
  21. Luethy, P. M., Johnson, J. K. The use of Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry (MALDI-TOF MS) for the identification of pathogens causing sepsis. The Journal of Applied Laboratory Medicine. 3 (4), 675-685 (2019).
  22. Knabl, L., Lass-Florl, C. Antifungal susceptibility testing in Candida species: current methods and promising new tools for shortening the turnaround time. Expert Review of Anti-Infective Therapy. 18 (8), 779-787 (2020).
  23. Gould, O., Ratcliffe, N., Krol, E., de Lacy Costello, B. Breath analysis for detection of viral infection, the current position of the field. Journal of Breath Research. 14 (4), 041001 (2020).
  24. Fagerquist, C. K., et al. Sub-speciating Campylobacter jejuni by proteomic analysis of its protein biomarkers and their post-translational modifications. Journal of Proteome Research. 5 (10), 2527-2538 (2006).
  25. Sandrin, T. R., Goldstein, J. E., Schumaker, S. MALDI TOF MS profiling of bacteria at the strain level: a review. Mass Spectrometry Reviews. 32 (3), 188-217 (2013).
  26. Christner, M., et al. Rapid MALDI-TOF mass spectrometry strain typing during a large outbreak of Shiga-Toxigenic Escherichia coli. PLoS One. 9 (7), 101924 (2014).
  27. Masaki, H., Ohta, T. Colicin E3 and its immunity genes. Journal of Molecular Biology. 182 (2), 217-227 (1985).
  28. Michel, B. After 30 years of study, the bacterial SOS response still surprises us. PLoS Biology. 3 (7), 255 (2005).
  29. Fagerquist, C. K., Sultan, O. Induction and identification of disulfide-intact and disulfide-reduced beta-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS and top-down proteomics. Analyst. 136 (8), 1739-1746 (2011).
  30. Fagerquist, C. K., Sultan, O. Top-down proteomic identification of furin-cleaved alpha-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS. Journal of Biomedicine & Biotechnology. 2010, 123460 (2010).
  31. Fagerquist, C. K., et al. Top-down proteomic identification of Shiga toxin 2 subtypes from Shiga toxin-producing Escherichia coli by matrix-assisted laser desorption ionization-tandem time of flight mass spectrometry. Applied and Environmental Microbiology. 80 (9), 2928-2940 (2014).
  32. Fagerquist, C. K., Zaragoza, W. J., Lee, B. G., Yambao, J. C., Quiñones, B. Clinically-relevant Shiga toxin 2 subtypes from environmental Shiga toxin-producing Escherichia coli identified by top-down/middle-down proteomics and DNA sequencing. Clinical Mass Spectrometry. 11, 27-36 (2019).
  33. Fagerquist, C. K., Lee, B. G., Zaragoza, W. J., Yambao, J. C., Quiñones, B. Software for top-down proteomic identification of a plasmid-borne factor (and other proteins) from genomically sequenced pathogenic bacteria using MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 438, 1-12 (2019).
  34. Fagerquist, C. K., Rojas, E. ACS Fall 2020 Virtual Meeting & Expo. American Chemical Society, Virtual. , (2020).
  35. Fagerquist, C. K., Sultan, O. A new calibrant for matrix-assisted laser desorption/ionization time-of-flight-time-of-flight post-source decay tandem mass spectrometry of non-digested proteins for top-down proteomic analysis. Rapid Communications in Mass Spectrometry. 26 (10), 1241-1248 (2012).
  36. Fagerquist, C. K., Zaragoza, W. J. Complementary b/y fragment ion pairs from post-source decay of metastable YahO for calibration of MALDI-TOF-TOF-MS/MS. International Journal of Mass Spectrometry. 415, 29-37 (2017).
  37. Quinones, B., Yambao, J. C., Lee, B. G. Draft genome sequences of Escherichia coli O113:H21 strains recovered from a major produce production region in California. Genome Announcements. 5 (44), 01203-01217 (2017).
  38. Harrison, A. G. The gas-phase basicities and proton affinities of amino acids and peptides. Mass Spectrometry Reviews. 16 (4), 201-217 (1997).
  39. Fagerquist, C. K. Polypeptide backbone cleavage on the C-terminal side of asparagine residues of metastable protein ions analyzed by MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 457, (2020).
  40. Fagerquist, C. K., Zaragoza, W. J. Mass Spectrometry: Application to the Clinical Lab 2019 (MSACL 2019). , Palm Springs, CA. (2019).
  41. Fagerquist, C. K., Zaragoza, W. J. Bacteriophage cell lysis of Shiga toxin-producing Escherichia coli for top-down proteomic identification of Shiga toxins 1 & 2 using matrix-assisted laser desorption/ionization tandem time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 30 (6), 671-680 (2016).
  42. Fagerquist, C. K., et al. Web-based software for rapid top-down proteomic identification of protein biomarkers, with implications for bacterial identification. Applied and Environmental Microbiology. 75 (13), 4341-4353 (2009).
  43. Fagerquist, C. K., et al. Rapid identification of protein biomarkers of Escherichia coli O157:H7 by matrix-assisted laser desorption ionization-time-of-flight-time-of-flight mass spectrometry and top-down proteomics. Analytical Chemistry. 82 (7), 2717-2725 (2010).
  44. Maus, A., Bisha, B., Fagerquist, C., Basile, F. Detection and identification of a protein biomarker in antibiotic-resistant Escherichia coli using intact protein LC offline MALDI-MS and MS/MS. Journal of Applied Microbiology. 128 (3), 697-709 (2020).

Tags

Química Edição 171
Identificação de Proteínas de Imunidade Antibacteriana em <em>Escherichia coli</em> usando MALDI-TOF-TOF-MS/MS e Análise Proteômica De Cima Para Baixo
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Fagerquist, C. K., Rojas, E.More

Fagerquist, C. K., Rojas, E. Identification of Antibacterial Immunity Proteins in Escherichia coli using MALDI-TOF-TOF-MS/MS and Top-Down Proteomic Analysis. J. Vis. Exp. (171), e62577, doi:10.3791/62577 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter