Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Identificación de proteínas de inmunidad antibacteriana en Escherichia coli utilizando MALDI-TOF-TOF-MS/MS y análisis proteómico de arriba hacia abajo

Published: May 23, 2021 doi: 10.3791/62577

Summary

Aquí presentamos un protocolo para la identificación rápida de proteínas producidas por bacterias patógenas secuenciadas genómicamente utilizando espectrometría de masas en tándem MALDI-TOF-TOF y análisis proteómico de arriba hacia abajo con software desarrollado internamente. Los iones proteicos metaestables se fragmentan debido al efecto del ácido aspártico y esta especificidad se explota para la identificación de proteínas.

Abstract

Este protocolo identifica las proteínas de inmunidad de las enzimas bactericidas: colicina E3 y bacteriocina, producidas por una cepa patógena de Escherichia coli mediante inducción antibiótica, e identificadas por espectrometría de masas en tándem MALDI-TOF-TOF y análisis proteómico de arriba hacia abajo con software desarrollado internamente. La proteína de inmunidad de la colicina E3 (Im3) y la proteína de inmunidad de la bacteriocina (Im-Bac) se identificaron a partir de iones prominentes de fragmentos de tipo b y / o y generados por la escisión de la columna vertebral polipeptídica (PBC) en el lado C-terminal del ácido aspártico, el ácido glutámico y los residuos de asparagina por el mecanismo de fragmentación del efecto del ácido aspártico. El software escanea rápidamente secuencias de proteínas in silico derivadas de la secuenciación del genoma completo de la cepa bacteriana. El software también elimina iterativamente los residuos de aminoácidos de una secuencia de proteínas en caso de que la secuencia de proteínas maduras se trunca. Una sola secuencia de proteínas poseía iones de masa y fragmento consistentes con los detectados para cada proteína de inmunidad. La secuencia candidata se inspeccionó manualmente para confirmar que se podían asignar todos los iones de fragmento detectados. La metionina N-terminal de Im3 fue eliminada post-traslacionalmente, mientras que Im-Bac tenía la secuencia completa. Además, encontramos que solo dos o tres iones de fragmentos no complementarios formados por PBC son necesarios para identificar la secuencia de proteínas correcta. Finalmente, se identificó un promotor (caja SOS) aguas arriba de los genes antibacterianos y de inmunidad en un genoma plásmido de la cepa bacteriana.

Introduction

El análisis e identificación de proteínas no digeridas por espectrometría de masas se conoce como el análisis proteómico de arribahacia abajo 1,2,3,4. Ahora es una técnica establecida que utiliza ionización por electrospray (ESI)5 y analizadores de masa de alta resolución6,y técnicas sofisticadas de disociación, por ejemplo, disociación por transferencia de electrones (ETD), disociación por captura de electrones (ECD)7,fotodesociación ultravioleta (UV-PD)8,etc.

La otra técnica de ionización suave es la desorción/ionización láser asistida por matriz (MALDI)9,10,11 que se ha utilizado menos ampliamente para el análisis de arriba hacia abajo, en parte porque está acoplada principalmente a analizadores de masa de tiempo de vuelo (TOF), que tienen una resolución limitada en comparación con otros analizadores de masas. A pesar de estas limitaciones, los instrumentos MALDI-TOF y MALDI-TOF-TOF han sido explotados para el análisis rápido de arriba hacia abajo de proteínas puras y mezclas fraccionadas y no fraccionadas de proteínas. Para la identificación de proteínas puras, la desintegración en la fuente (ISD) es una técnica particularmente útil porque permite el análisis de espectrometría de masas (MS) de iones de fragmentos de ISD, así como la espectrometría de masas en tándem (MS / MS) de fragmentos de iones de proteínas que proporcionan fragmentos específicos de secuencia a menudo de los N- y C-termini de la proteína objetivo, análogo a la secuenciación de Edman12,13 . Un inconveniente del enfoque ISD es que, como en la secuenciación de Edman, la muestra debe contener solo una proteína. El único requerimiento de proteína se debe a la necesidad de una atribución inequívoca de iones fragmento a un ion precursor. Si dos o más proteínas están presentes en una muestra, puede ser difícil asignar qué iones fragmento pertenecen a qué iones precursores.

La atribución de iones de fragmentos/iones precursores se puede abordar utilizando MALDI-TOF-TOF-MS/MS. Al igual que con cualquier experimento clásico de MS / MS, los iones precursores se seleccionan en masa / se aíslan antes de la fragmentación, y los iones de fragmento detectados se pueden atribuir a un ion precursor específico. Sin embargo, las técnicas de disociación disponibles para este enfoque se limitan principalmente a la disociación inducida por colisión de alta energía (HE-CID)14 o a la desintegración posterior a la fuente (PSD)15,16. HE-CID y PSD son más eficaces en la fragmentación de péptidos y proteínas pequeñas, y la cobertura de la secuencia puede, en algunos casos, ser limitada. Además, la DSP da como resultado una escisión de la columna vertebral polipeptídica (PBC) principalmente en el lado C-terminal de los residuos de ácido aspártico y glutámico por un fenómeno llamado efecto del ácido aspártico17,18,19,20.

MALDI-TOF-MS también ha encontrado una aplicación de nicho en la identificación taxonómica de microorganismos: bacterias21,hongos22y virus23. Por ejemplo, los espectros de EM se utilizan para identificar bacterias desconocidas en comparación con una biblioteca de referencia de espectros de EM de bacterias conocidas utilizando algoritmos de reconocimiento de patrones para la comparación. Este enfoque ha demostrado ser muy exitoso debido a su velocidad y simplicidad, aunque requiere un cultivo nocturno del aislado. Los iones proteicos detectados por este enfoque (generalmente por debajo de 20 kDa) comprenden una huella dactilar MS que permite la resolución taxonómica a nivel de género y especie y, en algunos casos, en la subespecie24 y el nivel de cepa25,26. Sin embargo, sigue siendo necesario no solo clasificar taxonómicamente los microorganismos potencialmente patógenos, sino también identificar factores específicos de virulencia, toxinas y factores de resistencia a los antimicrobianos (AMR). Para lograr esto, la masa de péptidos, proteínas o moléculas pequeñas se mide por EM y posteriormente se aísla y fragmenta por EM / EM.

Las bacterias patógenas a menudo transportan piezas circulares de ADN llamadas plásmidos. Los plásmidos, junto con los profagos, son un vector importante de transferencia horizontal de genes entre bacterias y son responsables de la rápida propagación de la resistencia a los antimicrobianos y otros factores de virulencia a través de las bacterias. Los plásmidos también pueden portar genes antibacterianos (AB), por ejemplo, colicina y bacteriocina. Cuando estos genes se expresan y las proteínas se secretan, actúan para desactivar la maquinaria de traducción de proteínas de las bacterias vecinas que ocupan el mismo nicho ambiental27. Sin embargo, estas enzimas bactericidas también pueden representar un riesgo para el huésped que las produjo. En consecuencia, un gen es co-expresado por el huésped que inhibe específicamente la función de una enzima AB y se conoce como su proteína de inmunidad (Im).

Los antibióticos dañinos para el ADN como la mitomicina-C y la ciprofloxacina se utilizan a menudo para inducir la respuesta SOS en la E. coli productora de toxina Shiga (STEC) cuyo gen de la toxina Shiga(stx) se encuentra dentro de un genoma de profagos presente en el genoma bacteriano28. Hemos utilizado previamente la inducción antibiótica, MALDI-TOF-TOF-MS/MS, y el análisis proteómico de arriba hacia abajo para detectar e identificar tipos y subtipos stx producidos por las cepas STEC29,30,31,32. En el trabajo anterior, la cepa RM7788 de STEC O113:H21 se cultizó durante la noche en medios de agar suplementados con mitomicina-C. Sin embargo, en lugar de detectar la subunidad B anticipada de Stx2a en m/z ~7816, se detectó un ion proteico diferente en m/z ~7839 y se identificó como una proteína hipotética codificada por plásmidos de función desconocida33. En el trabajo actual, identificamos dos proteínas AB-Im codificadas en plásmidos producidas por esta cepa utilizando inducción de antibióticos, MALDI-TOF-TOF-MS / MS, y análisis proteómico de arriba hacia abajo utilizando un software independiente desarrollado para procesar y escanear secuencias de proteínas in silico derivadas de la secuenciación del genoma completo (WGS). Además, se incorporó al software la posibilidad de modificaciones posteriores a la traducción (PTM) que impliquen truncamiento de secuencia. Las proteínas de inmunidad se identificaron utilizando este software a partir de la masa medida del ion proteína madura y los iones de fragmento específicos de secuencia de PBC causados por el efecto del ácido aspártico y detectados por MS / MS-PSD. Finalmente, se identificó un promotor aguas arriba de los genes AB/Im en un genoma de plásmido que puede explicar la expresión de estos genes cuando esta cepa está expuesta a un antibiótico dañino para el ADN. Partes de este trabajo se presentaron en la Reunión y Exposición Virtual de otoño de 2020 de la National American Chemical Society (17-20 de agosto de 2020)34.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Preparación microbiológica de muestras

  1. Inocular 25 ml de caldo de Luria (LB) en un tubo cónico de 50 ml con E. coli O113:H21 cepa RM7788 (u otra cepa bacteriana) de una cepa de glicerol utilizando un asa estéril de 1 μL. Tapar el tubo y preculterr a 37 °C con agitación (200 rpm) durante 4 h.
  2. Alícuota de 100 μL de caldo preculto y untar sobre una placa de agar LB suplementada con 400 u 800 ng/mL de mitomicina-C. Cultivar placas de agar estáticamente durante la noche en una incubadora a 37 °C.
    PRECAUCIÓN: Las cepas STEC son microorganismos patógenos. Realizar todas las manipulaciones microbiológicas, más allá del cultivo, en un gabinete de bioseguridad BSL-2.
  3. Recolecte células bacterianas de colonias visibles individuales utilizando un bucle estéril de 1 μL y transfiéralo a un tubo de microcentrífuga de tapa de rosca revestido de anillo tórica de 2,0 ml que contenga 300 μL de agua de grado HPLC. Tapa el tubo, el vórtice brevemente y centrifuga a 11.337 x g durante 2 min para peletizar las células.

2. Espectrometría de masas

  1. Apunte la alícuota de 0,75 μL del sobrenadante de muestra sobre el objetivo MALDI de acero inoxidable y deje que se seque. Superponga el punto de muestra seca con alícuota de a0,75 μL de una solución saturada de ácido sinapínico en acetonitrilo al 33%, 67% de agua y ácido trifluoracético al 0,2%. Deje que la mancha se seque.
  2. Analice las manchas de muestra seca utilizando un espectrómetro de masas MALDI-TOF-TOF.
    1. Después de cargar el objetivo MALDI en el espectrómetro de masas, haga clic en el botón para la adquisición del modo lineal MS en el software de adquisición. Ingrese el rango m / z a analizar ingresando el m / z de los límites inferior y superior (por ejemplo, 2 kDa a 20 kDa) en sus respectivos campos en el software del método de adquisición.
    2. Haga clic en el lugar de muestra para ser analizado en la plantilla de destino MALDI en el software. Luego, deprima el botón izquierdo del mouse y arrastre el cursor del mouse sobre el punto de muestra para especificar la región rectangular que se muestreará para la ablación / ionización con láser. Suelte el botón del mouse y se iniciará la adquisición. Recolecte 1,000 disparos láser para cada punto de muestra.
      NOTA: La adquisición de datos se muestra en tiempo real en la ventana de adquisición de software.
    3. Si no se detectan iones, aumente la intensidad del láser ajustando la barra de escala móvil bajo Intensidad del láser en el software hasta que se detecte la señal de iones de proteína. Esto se conoce como umbral.
      NOTA: Antes del análisis del punto de muestra, calibre externamente el instrumento en modo lineal MS con calibrantes de proteínas cuyo m/z abarque el rango que se está analizando, por ejemplo, los estados de carga +1 y +2 de los calibrantes de proteínas: citocromo-C, lisozima y mioglobina cubren un rango de masa de 2 kDa a 20 kDa. Una masa intermedia dentro del rango de masa especificado se utiliza como masa de enfoque, por ejemplo, 9 kDa. La masa de enfoque es el ion cuyo m/z está enfocado de manera óptima para su detección por el detector de modo lineal.
    4. Cuando se complete la adquisición del modo lineal de MS, haga clic en el botón para la adquisición del modo de reflectrón de MS/MS en el software de adquisición. Introduzca la masa precursora que se analizará en el campo Masa precursora. A continuación, introduzca un ancho de aislamiento (en Da) en la ventana de masa precursora para el lado de masa baja y alta de la masa precursora, por ejemplo, ±100 Da.
    5. Haga clic en el botón CID Off. Haga clic en el botón Metastable Suppressor ON. Ajuste la intensidad del láser al menos al 90% de su valor máximo ajustando la barra de escala deslizante debajo de la intensidad del láser en el software.
    6. Haga clic en el lugar de muestra para ser analizado en la plantilla de destino MALDI en el software. A continuación, deprima el botón izquierdo del ratón y arrastre el cursor del ratón sobre el punto de muestra para especificar la región rectangular que se muestreará para la ablación/ionización con láser. Suelte el botón del mouse y se iniciará la adquisición. Recolecte 10,000 disparos láser para cada punto de muestra.
      NOTA: Antes del análisis puntual de la muestra, el instrumento debe calibrarse externamente en modo MS/MS-reflectrón utilizando los iones fragmentos de la desintegración posterior a la fuente (PSD) del estado de carga +1 de la tiorredoxina alquilada35.
  3. No procese datos de MS sin procesar. Procese los datos brutos de MS/MS-PSD utilizando la siguiente secuencia de pasos en el orden especificado: corrección basal avanzada (32, 0,5, 0,0) seguida de eliminación de ruido (dos desviaciones estándar) seguida de suavizado gaussiano (31 puntos).
  4. Inspeccione manualmente los datos de MS/MS-PSD para detectar la presencia de iones fragmentos prominentes generados por PBC19,20.
  5. Evaluar los datos de MS/MS con respecto a la abundancia absoluta y relativa de iones fragmentos y su señal a ruido (S/N). Utilice solo los iones de fragmento más abundantes para la identificación de proteínas, especialmente si los datos de MS / MS-PSD son ruidosos.

3. Construcción de bases de datos de proteínas in silico

  1. Genere un archivo de texto que contenga secuencias de proteínas in silico de la cepa bacteriana, que será escaneado por el software Protein Biomarker Seeker para la identificación de proteínas. Las secuencias de proteínas se derivan de la secuenciación del genoma completo (WGS) de la cepa que se está analizando (o una cepa estrechamente relacionada).
  2. Acceda al sitio web de NCBI/PubMed (https://www.ncbi.nlm.nih.gov/protein/) para descargar aproximadamente 5,000 secuencias de proteínas de la cepa bacteriana específica (por ejemplo, Escherichia coli O113: H21 cepa RM7788) que se está analizando. El tamaño máximo de descarga es de 200 secuencias.
    1. En consecuencia, copie y pegue las 25 descargas en un solo archivo de texto. Seleccione el formato FASTA (texto) para cada descarga.

4. Funcionamiento del software Protein Biomarker Seeker

  1. Haga doble clic en el archivo ejecutable Protein Biomarker Seeker. Aparecerá una ventana de interfaz gráfica de usuario (GUI)(Figura 1,panel superior).
  2. Ingrese la masa del biomarcador de proteína (medido en modo MS-lineal) en el campo Masa de proteína madura. A continuación, introduzca el error de medición de masa en el campo Tolerancia de masas. El error de medición de masa estándar es ±10 Da para una proteína de 10.000 Da.
  3. Opcionalmente, haga clic en el botón Calculadora de masa de proteína de iones b/a complementarios para calcular la masa de proteínas a partir de un supuesto par de iones de fragmentos complementarios (CFIP o b/y). Aparecerá una ventana emergente, Protein Mass Calculator Tool,(Figura 1,panel inferior).
    1. Ingrese el m / z del supuesto CFIP y haga clic en el botón Agregar par. Aparecerá la masa proteica calculada.
    2. Copie y pegue este número en el campo Masa de proteína madura y cierre la ventana de la herramienta Calculadora de masa de proteína.
  4. Seleccione una longitud de péptido de señal N-terminal haciendo clic en el cuadro Establecer restricción de residuos. Aparecerá una ventana emergente con una escala móvil y un cursor. Mueva el cursor a la longitud deseada del péptido de señal (máximo 50). Si no se selecciona la longitud del péptido de señal, el software realizará un truncamiento de secuencia sin restricciones.
  5. En la condición de iones de fragmento en la GUI, seleccione residuos para la escisión de la columna vertebral polipeptídica (PBC). Haga clic en las casillas de uno o más residuos: D, E, N y/o P.
    1. Haga clic en el botón Introducir iones de fragmento (+1) para buscar. Aparecerá una página de fragmento emergente. A continuación, haga clic en el botón Agregar ion de fragmento, que corresponde al número de iones de fragmento que se ingresará, es decir, un clic para cada ion de fragmento. Aparecerá un campo desplegable para cada fragmento de ion que se introduzca.
    2. Introduzca la m/z de los iones fragmento y su tolerancia m/z asociada. Cuando haya terminado, haga clic en el botón Guardar y cerrar.
      NOTA: Una tolerancia m/z razonable es ±1.5.
    3. Seleccione el número mínimo de iones de fragmento que deben coincidir para una identificación desplazándose hasta el número deseado en el cuadro a la derecha de Cuántos iones de fragmento deben coincidir.
      NOTA: Tres partidos deben ser adecuados.
    4. Seleccione los residuos de cisteína para que estén en su estado oxidado haciendo clic en el círculo correspondiente. Si no se encuentran identificaciones de proteínas después de la búsqueda, repita la búsqueda con cisteínas en su estado reducido. Si no se encuentran identificaciones después de la búsqueda, amplíe la tolerancia de iones del fragmento a ±3 y repita la búsqueda.
  6. En Configuración de archivos,haga clic en el botón Seleccionar archivo FASTA para examinar y seleccionar el archivo FASTA (texto) que contiene las secuencias de proteínas in silico de la cepa bacteriana previamente construida en los pasos 3.1 a 3.2 del protocolo. A continuación, seleccione una carpeta de salida y cree un nombre de archivo de salida.
  7. Haga clic en el botón Ejecutar búsqueda en entradas de archivo. Aparecerá una ventana emergente titulada Confirmar parámetros de búsqueda (Figura 1,panel inferior), que muestra los parámetros de búsqueda antes de que se inicie la búsqueda.
  8. Si los parámetros de búsqueda son correctos, haga clic en el botón Comenzar búsqueda. Si los parámetros de búsqueda no son correctos, haga clic en el botón Cancelar y vuelva a introducir los parámetros correctos. Una vez iniciada la búsqueda, la ventana de parámetros se cierra y aparece una nueva ventana emergente con una barra de progreso(Figura 1,panel inferior) que muestra el progreso de la búsqueda y un recuento en ejecución del número de identificaciones encontradas.
  9. Al finalizar la búsqueda (unos segundos), la barra de progreso se cierra automáticamente y se muestra un resumen de la búsqueda en el campo Registro de la GUI(Figura 2,panel superior). Además, también aparecerá una nueva ventana emergente que muestra la(s) identificación(es) de proteínas, si las hay(Figura 2,panel inferior).
    NOTA: Las secuencias de proteínas in silico que tienen residuos no reconocidos, por ejemplo, U o X, se omiten automáticamente del análisis y estas secuencias se informan posteriormente con una ventana emergente separada para alertar al operador sobre qué secuencias (si las hay) se omitieron al completar la búsqueda.

5. Confirmación posterior a la búsqueda de la secuencia de proteínas

  1. Confirmar la exactitud de una secuencia candidata mediante análisis manual.
    NOTA: El propósito del software Protein Biomarker Seeker es identificar una secuencia de proteínas con alta precisión eliminando muchas secuencias de proteínas obviamente incorrectas de la consideración e incorporando truncamiento de secuencia como un posible PTM en la proteína madura. Como el número de posibles secuencias candidatas devueltas es escaso, la confirmación manual es manejable.
  2. Genere una tabla del promedio de m/z de iones fragmentos de tipo b e y de la secuencia candidata utilizando cualquier software de espectrometría de masas o proteómico que tenga dicha funcionalidad. Compare el promedio de m/z de los iones de fragmentos in silico en el lado C-terminal de los residuos D-, E-, y N (y en el lado N-terminal de los residuos P) con el m/z de los iones fragmentos prominentes de los datos MS/MS-PSD.
    NOTA: Los iones de fragmento MS/MS-PSD más prominentes deben coincidir fácilmente con los iones de fragmento in silico asociados a D, E y N. Sin embargo, el mecanismo de fragmentación del efecto del ácido aspártico es menos eficiente cerca del N- o C-termini de una secuencia deproteínas 36.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

La Figura 3 (panel superior) muestra el MS de la cepa STEC O113:H21 RM7788 cultivada durante la noche en LBA suplementada con 400 ng/mL de mitomicina-C. Los picos en m/z 7276, 7337 y 7841 se habían identificado previamente como proteína C de choque frío (CspC), proteína de choque frío E (CspE) y una proteína transmitida por plásmidos de función desconocida, respectivamente33. El ion proteína en m/z 9780 [M+H]+ fue analizado por MS/MS-PSD como se muestra en la Figura 3 (panel inferior). El ion precursor se aisló con una ventana selectora de iones cronometrados (TIS) ±100 Da. Los iones fragmento se identifican por su m/z y tipo/número. El fragmento ion en m/z 2675.9 (resaltado con una estrella) se derrama de la disociación del ion proteína metaestable en m/z 9655 que se muestra en la Figura 3 (panel superior). El promedio teórico m/z de cada fragmento de ion se muestra entre paréntesis basado en el PBC de la secuencia de la proteína de inmunidad A la colicina E3 (Im3) mostrada anteriormente. Los sitios de PBC se resaltan con un asterisco rojo con el (los) fragmento (s) correspondiente (s) ion (s) producidos. La metionina N-terminal se subraya, lo que significa que se elimina post-traslacionalmente en la proteína madura. La secuencia tiene un solo residuo de cisteína (en caja) y, por lo tanto, se considera en su estado reducido.

Utilizando la masa del biomarcador de proteína y algunos iones de fragmentos no complementarios prominentes: m / z 1813.8, 2128.9 y 4293.7 (tolerancia ±1.5)(Figura 1,panel inferior) y restringiendo PBC al lado C-terminal de los residuos D y E, solo una secuencia candidata fue reportada por el software: secuencia de proteína Im3 (sin su metionina N-terminal) (Figura 2 , panel inferior). Al seleccionar iones de fragmento para una búsqueda, se debe enfatizar que cualquier grupo de iones de fragmentos no complementarios asume que sumar el m / z de dos iones de fragmentos cualesquiera en el grupo (y restar dos protones) da como resultado una suma de masa que no cae dentro de la masa del biomarcador y la tolerancia de masa asociada (±10 Da). El borrador de WGS de RM7788 reveló 5008 secuencias de proteínas (marcos de lectura abiertos)37. De estas ~ 5,000 secuencias de proteínas completas, 189,490 secuencias completas y parciales (truncamiento sin restricciones) cumplieron con los criterios de masa de biomarcadores(Figura 2,panel superior). Aquellas secuencias que pasan los criterios de masa luego se someten a PBC in silico en el lado C-terminal de los residuos D y / o E. Los iones de fragmento resultantes generados se comparan con los iones de fragmento observados introducidos. La secuencia candidata reportada por el software se basó únicamente en su masa y tres sitios PBC específicos de D y / o E. La especificidad lograda por una cantidad tan pequeña de información se discutirá en la siguiente sección.

Como se muestra en la Figura 3 (panel inferior), los iones de fragmento más abundantes son el resultado de PBC en el lado C-terminal de los residuos D y E a través del mecanismo de fragmentación del efecto del ácido aspártico19,20. Se observan dos CFIP: b67/y17 (m/z 7645.1 / m/z 2128.9) y b70/y14 (m/z 7959.4 / m/z 1813.8). Estos CFIP se pueden utilizar para calcular con mayor precisión la masa del ion precursor de proteínas utilizando la fórmula simple: b (m / z) + y (m / z) - 2H+ = masa proteica (Da)33. Usando los dos CFIP, obtenemos una masa promedio de la proteína: 9771.6 Da, que está más cerca de su valor teórico de 9772.5 Da que la masa medida del ion proteína en modo MS-lineal: 9779 Da(Figura 3,panel superior). Solo se detectaron unos pocos CFIP porque la mayoría de los iones precursores tienen el protón ionizante secuestrado en el único residuo de arginina: R80. La mayor basicidad en fase gaseosa de la arginina (237,0 kcal/mol38)en comparación con un residuo de lisina (K) (221,8 kcal/mol38)es probablemente responsable del secuestro preferencial del protón ionizante en el único residuo R.

La Figura 4 (panel superior) muestra el MS de la cepa STEC O113:H21 RM7788 cultivada durante la noche en LBA suplementado con 800 ng/mL de mitomicina-C. La Figura 4 (panel superior) es bastante similar a la Figura 3 (panel superior), aunque hay diferencias en la abundancia relativa de algunos iones proteicos debido a las diferencias en las concentraciones de antibióticos utilizados. También hay ligeros cambios en el biomarcador de proteína m / z que reflejan diferencias en la calibración externa del instrumento en diferentes días. Una vez más, los iones proteicos en m/z 7272, 7335 y 7838 son CspC, CspE y una proteína transmitida por plásmidos, respectivamente. Además, detectamos el ion proteína Im3 en m/z 9778 (aunque con menor abundancia que en la Figura 3)así como un ion proteína en m/z 9651 [M+H]+. La Figura 4 (panel inferior) muestra MS/MS-PSD del ion precursor de proteínas en m/z 9651. El ion precursor se aisló utilizando una ventana TIS más estrecha y asimétrica de -75/+60 Da para eliminar las contribuciones de iones proteicos adyacentes a m/z 9539 y 9778. Los iones fragmento se identifican por su m/z y tipo/número. La secuencia de la proteína de inmunidad de la bacteriocina (Im-Bac) se muestra arriba. Los sitios de PBC se resaltan con un asterisco rojo con sus correspondientes fragmentos de iones. El promedio teórico m/z de cada fragmento ion también se muestra entre paréntesis en el espectro. La secuencia Im-Bac también tiene un solo residuo de cisteína (en caja) y, por lo tanto, se considera en su estado reducido.

Utilizando la masa de biomarcadores de proteínas, tres iones de fragmentos no complementarios prominentes: m / z 2675.4, 3853.5 y 5772.8 (tolerancia ±1.50) de la Figura 4 y restringiendo el PBC a solo el lado C-terminal de los residuos de D- y / o E- y / o asparagina (N), solo una secuencia candidata fue reportada por el software: la proteína Im-Bac. La secuencia candidata se recuperó después de escanear 191.375 secuencias completas o parciales que cumplían con los criterios de masa y tolerancia del biomarcador (±10 Da). La secuencia candidata fue identificada por el software basado únicamente en su masa y tres sitios PBC específicos de D y / o E y / o N.

Los iones fragmentos más prominentes de la Figura 4 (panel inferior) fueron, una vez más, el resultado de PBC en el lado C-terminal de los residuos D y/o E y también en el lado N-terminal de uno de los residuos P20. También observamos PBC en el lado C-terminal de un residuo N que también es probable que ocurra por un mecanismo de fragmentación similar al efecto del ácido aspártico39,40. La debilidad de la señal de iones precursores de proteínas da como resultado un número limitado de iones fragmentos interpretables. La precisión del ion fragmento m/z disminuye con la abundancia de iones de fragmento. No se detectó CFIP debido presumiblemente a que el protón ionizante estaba secuestrado en el único residuo de arginina (R74) de la secuencia de iones de proteína. Todos los iones fragmentos contienen el residuo R74, consistente con esta hipótesis.

El promotor de los genes de inmunidad antibacteriana
La Figura 5 muestra una porción de los 6482 pb contig00100 de la cepa rm7788 de E. coli (GenBank: NWVS01000096.1) de la secuenciación de escopeta de genoma completo37. Las regiones codificantes de la colicina E3, su proteína de inmunidad (Im3), la proteína de inmunidad de la bacteriocina (Im-Bac) y una proteína de lisis se resaltan en amarillo. Aguas arriba de la región codificante para el gen de la colicina E3 se encuentran la región -35, la caja de Pribnow (PB), la repetición invertida de la caja SOS, el sitio de unión Shine-Dalgarno/ribosomal (SD/RBS)27. Hay una región intergénica de nueve pares de bases entre la colicina E3 y la Im3. LexA (una proteína represora y una autopeptidasa) se une a la caja SOS bloqueando la expresión de genes aguas abajo. Tras el daño en el ADN (por ejemplo, radiación UV o antibióticos que dañan el ADN), LexA se somete a una autoescisión que permite la expresión de genes aguasabajo 27,28. Por lo tanto, la expresión de estas dos proteínas de inmunidad es consistente con la exposición de esta cepa a un antibiótico dañino para el ADN.

Figure 1
Figura 1:Capturas de pantalla del software Protein Biomarker Seeker. Panel superior: Interfaz gráfica de usuario (GUI) del software Protein Biomarker Seeker. Paneles inferiores: ventanas emergentes de Protein Mass Calculator Tool, Página de fragmentos, Confirmar parámetros de búsqueda y Barra de progreso de búsqueda. Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2: Resultados de búsqueda de una identificación de proteínas utilizando el software Protein Biomarker Seeker. Panel superior: Resumen de los resultados de búsqueda que se muestran en el campo de registro de la GUI del software. Panel inferior: Una ventana emergente que muestra una identificación de proteínas utilizando el software. Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3: Análisis de espectrometría de masas de la cepa STEC O113:H21 RM7788. Panel superior: MS de STEC O113:H21 cepa RM7788 cultivada durante la noche en LBA suplementado con 400 ng/mL de mitomicina-C. Panel inferior: MS/MS-PSD del ion precursor de la proteína en m/z 9780 (panel superior). El ion precursor se aisló con una ventana TIS ±100 Da. Los iones fragmento se identifican por su tipo de m/z e ion. Se muestra la secuencia de la proteína de inmunidad para la colicina E3 (Im3). Los residuos básicos (sitios de posible secuestro de carga) están resaltados en azul. Los PBC se resaltan con un asterisco rojo con los correspondientes fragmentos de iones generados. El promedio teórico m/z de cada fragmento de iones se muestra entre paréntesis. Haga clic aquí para ver una versión más grande de esta figura.

Figure 4
Figura 4: Análisis de espectrometría de masas de STEC O113:H21 cepa RM7788. Panel superior: MS de STEC O113:H21 cepa RM7788 cultivada durante la noche en LBA suplementado con 800 ng/mL de mitomicina-C. Panel inferior: MS/MS-PSD del ion precursor de la proteína en m/z 9651 (panel superior). El ion precursor se aisló con una ventana TIS asimétrica de -75 en el lado bajo m/z del ion precursor y +60 en el lado alto m/z del ion precursor. Los iones fragmento se identifican por su tipo de m/z e ion. Se muestra la secuencia de la proteína de inmunidad de la bacteriocina (Im-Bac). Los residuos básicos (sitios de posible secuestro de carga) están resaltados en azul. Los PBC se resaltan con un asterisco rojo con los correspondientes fragmentos de iones generados. El promedio teórico m/z de cada fragmento ion se muestra entre paréntesis. Haga clic aquí para ver una versión más grande de esta figura.

Figure 5
Figura 5: Análisis de una sección del genoma del plásmido transportada por E. coli O113:H21 cepa RM7788. Una porción de los 6482 pb contig00100 de E. coli O113:H21 cepa RM7788 (GenBank: NWVS01000096.1) de la secuenciación de escopeta del genoma completo37. Haga clic aquí para ver una versión más grande de esta figura.

Expediente complementario 1 (S1 Im3): Resultados del análisis de benchmarking de software utilizando iones de fragmentos seleccionados de Im3 (de la Figura 3,panel inferior). Haga clic aquí para descargar este archivo.

Expediente complementario 2 (S2 ImBac): Resultados del análisis de benchmarking de software utilizando fragmentos seleccionados de Im-Bac (de la Figura 4,panel inferior). Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Consideraciones sobre el protocolo
Las principales fortalezas del protocolo actual son su velocidad, simplicidad de preparación de muestras y uso de un instrumento que es relativamente fácil de operar, entrenar y mantener. Aunque el análisis proteómico de abajo hacia arriba y de arriba hacia abajo por cromatografía líquida-ESI-HR-MS es omnipresente y muy superior en muchos aspectos al de arriba hacia abajo por MALDI-TOF-TOF, requieren más tiempo, mano de obra y experiencia. La complejidad de los instrumentos a menudo puede afectar si es probable que ciertas plataformas de instrumentos sean adoptadas por científicos no capacitados formalmente en espectrometría de masas. El enfoque de arriba hacia abajo con MALDI-TOF-TOF está destinado a extender el análisis de MALDI-TOF-MS más allá de su uso actual para la identificación taxonómica de bacterias en laboratorios de microbiología clínica, sin aumentar drásticamente el trabajo, la complejidad o la experiencia requerida para el análisis.

El protocolo no emplea ningún paso de lisis de células mecánicas (o eléctricas). Aunque las proteínas secretadas o extracelulares pueden detectarse utilizando el protocolo, una versión anterior de este método se desarrolló por primera vez para la detección de la toxina Shiga (Stx) de cepas STEC en las que la inducción de antibióticos desencadena la respuesta bacteriana SOS que resulta en la expresión de genes de fagos, incluidos los genes stx y de fagos tardíos responsables de la lisis celular bacteriana41 . Encontramos que la lisis celular inducida por antibióticos tiene ciertas ventajas para la detección de Stx, así como proteínas plásmidas que tienen promotores SOS (trabajo actual). Ciertamente, la lisis celular mecánica (por ejemplo, lanza de cuentas) también se puede usar (aunque no se usa en el trabajo actual). Sin embargo, la lisis mecánica da como resultado que todas las células bacterianas se lisen (no simplemente células inducidas), lo que resulta en que la muestra se enriquezca con abundantes proteínas huésped altamente conservadas que pueden hacer que la detección de fagos y proteínas plásmidos de una muestra no fructada sea más desafiante.

Se encontró que las concentraciones de antibióticos para una cepa bacteriana eran generalmente reproducibles con respecto a las proteínas inducidas por antibióticos detectadas. Observamos variaciones en la abundancia relativa de proteínas con respecto a las proteínas inducidas por antibióticos detectadas. Dado que nuestro análisis es cualitativo (no cuantitativo), la abundancia de biomarcadores de proteínas solo debe ser suficiente para un análisis adecuado de EM / EM. Una cepa STEC putativa se cultiva primero con un rango de concentraciones de antibióticos (por ejemplo, 300 ng / ml a 2,000 ng / ml de mitomicina-C) para determinar la concentración óptima de tal manera que desencadene la respuesta SOS bacteriana al tiempo que proporciona suficientes células bacterianas para la recolección. Para la cepa STEC RM7788, encontramos que la concentración óptima de antibióticos para la detección de los biomarcadores identificados fue de 400 a 800 ng/mL de mitomicina-C.

Además del truncamiento de la secuencia de proteínas, las proteínas de E. coli pueden tener PTM que implican la adición de masa, por ejemplo, fosforilación, glicosilación, etc. Como MS/MS utiliza PSD para la disociación de iones proteicos metaestables cargados de forma simple (menos de 20 kDa de masa) generados por MALDI, tales PTM unidos a cadenas laterales de residuos probablemente sufrirían una pérdida disociativa fácil porque PSD es una técnica de disociación ergódica. La presencia de tales PTM podría inferirse de la aparición de un fragmento de iones cercano en masa al ion precursor original (menos la masa del PTM) en los datos de MS/MS. Sin embargo, ni la PSD ni el programa informático podrían identificar dónde se adjuntan esos PTM. Además, el software solo puede identificar proteínas a partir de fragmentos de iones de PBC y no la pérdida disociativa de moléculas pequeñas (por ejemplo, agua o amoníaco) o PTM unidos a las cadenas laterales de residuos. Sin embargo, si se detectan iones fragmentos de PBC, la proteína aún podría identificarse utilizando el software ampliando la ventana de tolerancia a la masa de la proteína para incluir la masa del PTM o simplemente ingresando la masa del ion del fragmento de proteína correspondiente a la pérdida disociativa del PTM sospechoso. Cualquier identificación por el software sería de la secuencia de proteínas sin el PTM. Curiosamente, no hemos detectado proteínas que tengan fosforilación, glicosilación, etc. en nuestro trabajo bacteriano hasta ahora. Sin embargo, eso puede deberse a: su abundancia relativa por MALDI, el rango de masa que se utiliza: 2-20 kDa, que tales PTM pueden ser inusualmente lábiles y pueden no sobrevivir a la aplicación de la matriz MALDI, o que tales PTM pueden sufrir una pérdida disociativa muy rápida en la fuente antes de que los iones se aceleren desde la fuente.

Actualmente, el software no incluye alquilación de cisteína, y nuestro protocolo de muestra no incluye un paso de reducción de disulfuro para residuos de cisteína. El protocolo se ha aclarado para indicar que la búsqueda debe ser operada con residuos de cisteína en su estado oxidado, y si no se obtiene identificación, entonces ejecutar la búsqueda nuevamente con residuos de cisteína en su estado reducido. Si no se vuelven a encontrar identificaciones, ampliar la tolerancia de iones del fragmento a ±2 o ±3 reduce el umbral para la coincidencia de iones de fragmentos, lo que permite que las secuencias con cisteínas coincidan si están presentes en sus estados oxidados y / o reducidos.

Análisis proteómico de arriba hacia abajo mediante espectrometría de masas MALDI-TOF-TOF
La mayoría de los análisis proteómicos de arriba hacia abajo se han logrado utilizando ESI y plataformas de espectrometría de masas de alta resolución. Por el contrario, se ha realizado menos análisis proteómicos de arriba hacia abajo utilizando plataformas MALDI-TOF-TOF. En consecuencia, existe muy poco software proteómico de arriba hacia abajo para el análisis de iones proteicos metaestables cargados por sí solos generados y analizados por MALDI-TOF-TOF-MS/MS-PSD que exploten el efecto del ácido aspártico para la fragmentación15,42. Hay una serie de razones para esto. En primer lugar, la eficiencia de ionización de MALDI está sesgada hacia péptidos y proteínas de menor peso molecular, y este sesgo es particularmente evidente con una mezcla de proteínas como se encontraría en un lisato celular bacteriano no fraccionado. En segundo lugar, MALDI genera estados de carga bajos, y hay poca o ninguna repulsión de Coulomb para facilitar la disociación de iones de proteína. En tercer lugar, la cobertura de la secuencia PSD es bastante limitada a diferencia de otras técnicas ECD7, ETD7, UV-PD8, etc. Cuarto, la eficiencia de fragmentación de la PSD disminuye con el aumento de la masa del ion proteína. En quinto lugar, las técnicas de disociación ergódica, como la DSC, tienden a dar lugar a una pérdida disociativa fácil de ptM adheridos a residuos, por ejemplo, fosforilación, glicosilación, etc., lo que dificulta la determinación del sitio de unión de PTM. A pesar de estas severas limitaciones, el análisis de arriba hacia abajo utilizando MALDI-TOF-TOF-MS/MS-PSD tiene claras ventajas, por ejemplo, simplicidad de preparación de muestras, ausencia de separación LC, aislamiento de iones de proteína metaestables por MS/MS que permite la atribución de iones fragmentos a iones precursores, identificación de PTM que involucran truncamiento de secuencia y enlaces disulfuro intramoleculares y, lo que es más importante, la velocidad del análisis. Cuando se combina con secuencias de proteínas in silico derivadas de datos de WGS, esta técnica puede proporcionar información rápida antes de que se completen otros análisis más lentos y laboriosos.

El software Protein Biomarker Seeker fue desarrollado utilizando IntelliJ y escrito en Java para procesar y buscar eficientemente secuencias de aminoácidos de proteínas derivadas de WGS de una cepa bacteriana. El software fue modificado a partir de un algoritmo anterior que operaba como una macro dentro de Excel33. Decidimos desarrollar una versión independiente del software con una interfaz GUI para que sea más fácil de usar y proporcionar más mejoras.

En el caso de PTM que involucren truncamiento de secuencia de proteínas, el software elimina secuencialmente un residuo de aminoácidos del N-terminal mientras agrega iterativamente residuos de la secuencia hasta que la suma de masa cumple o excede la masa medida del biomarcador de proteína detectado. Aunque este proceso puede resultar en un gran número de fragmentos de masa de proteínas (~ 200,000 de ~ 5000 secuencias completas de proteínas), tiene la ventaja de no excluir ningún fragmento de proteína potencial del truncamiento en el extremo N o C (o ambos), por improbable que sea dicho truncamiento desde una perspectiva biológica. Este enfoque se conoce como truncamiento sin restricciones. Sin embargo, los PTM bacterianos más comunes que implican truncamiento son la eliminación de la metionina N-terminal o el péptido señal N-terminal. En consecuencia, el software también permite al operador seleccionar un límite superior (50 residuos) para el truncamiento de residuos del N-terminal, lo que resulta en muchos menos fragmentos de proteínas que cumplen con los criterios de masa del biomarcador de proteínas.

El PBC en el lado C-terminal de los residuos D- y E, así como en el lado N-terminal de los residuos P son consistentes con el mecanismo del efecto del ácido aspártico, que ha sido ampliamente estudiado tanto experimental como teóricamente17,18,19,20. La inclusión de PBC en el lado C-terminal de los residuos de N se incluyó en el software debido a un mecanismo similar al efecto del ácido aspártico que se ha observado para una serie de iones de proteínas metaestables en nuestro laboratorio39,40. Los iones fragmentos más abundantes de la disociación de iones proteicos metaestables cargados por sí solos analizados por MS/MS-PSD se deben al mecanismo de fragmentación del efecto ácido aspártico. El operador selecciona los iones de fragmento más prominentes de los datos MS/MS-PSD e introduce su m/z en el software, así como una tolerancia de iones de fragmento asociada (±m/z). La tolerancia de iones de fragmento se puede ajustar para cada ion de fragmento para reflejar su abundancia relativa. Una tolerancia adecuada de iones de fragmento puede variar entre ±1,0 a ±2,5 m/z dependiendo de la abundancia absoluta del ion fragmento, así como de su abundancia relativa en comparación con el ruido químico de fondo. Por lo general, cuanto más abundante es un ion fragmento, mejor es su precisión de masa, lo que permite utilizar una tolerancia de iones de fragmento más estrecha.

Los datos de MS/MS-PSD de iones proteicos metaestables pueden variar drásticamente en términos de su complejidad. Algunos espectros MS/MS-PSD son más fácilmente interpretables que otros. Hay varias razones para este fenómeno. En primer lugar, el ion proteína puede no fragmentarse eficientemente en la escala de tiempo del análisis (~ 10-30 μs) tal vez porque permanece plegado o parcialmente plegado incluso después de la solubilización en la solución de matriz MALDI. En segundo lugar, además del PBC, los iones proteicos metaestables pueden sufrir pérdida disociativa de moléculas pequeñas, es decir, amoníaco (-17 Da) o agua (-18 Da)15. Un contribuyente significativo a la complejidad espectral parece ser la pérdida disociativa de amoníaco de la cadena lateral de los residuos R33. Hemos observado un aumento en la complejidad espectral de los datos de MS/MS-PSD con el número de residuos R en la secuencia de proteínas. Las proteínas sin residuos R (proteína YahO36 y proteína de choque frío CspC33,43), con un residuo R (proteína de choque frío CspE33 y subunidad B de Stx241),con dos residuos R (proteína hipotética33),producen espectros MS / MS-PSD que son relativamente sencillos y fáciles de interpretar. Sin embargo, cuando el número de residuos R aumenta a tres (proteína HU44),o cuatro (ubiquitina35y proteína de choque en seco CsbD33,43), la complejidad espectral aumenta significativamente. El software compara iones fragmentos de PBC en residuos específicos del mecanismo de efecto del ácido aspártico solo porque este es el canal de disociación más accesible de iones de proteínas metaestables cargados por sí mismos analizados por MS / MS-PSD. El software no incluye iones de fragmentos resultantes de la pérdida disociativa (o pérdidas) de pequeñas moléculas neutras. En consecuencia, es importante que el operador no seleccione iones de fragmento que incluyan pequeñas pérdidas disociativas neutras. Los iones de fragmento de PBC suelen ser los iones de fragmento más prominentes; sin embargo, cuando el número de residuos R en una proteína aumenta a tres o cuatro, el ion fragmento más abundante en un sitio PBC puede ser uno que incluya una pequeña pérdida disociativa (o pérdidas). Si se detecta un grupo de iones de fragmento (separados por múltiplos de 17 o 18 m/z), el ion fragmento con el m/z más alto dentro de un clúster debe ser el que se introduzca en los parámetros de búsqueda de iones de fragmentos.

Cabe destacar que el programa informático no fue diseñado para la identificación proteómica sin operador. El operador debe seleccionar qué iones de fragmento de los datos MS/MS-PSD deben incluirse en la búsqueda. Sin embargo, sobre la base de numerosos experimentos que han confirmado el efecto del ácido aspártico por MS / MS-PSD, los iones de fragmento más prominentes son siempre el resultado de PBC en el lado C-terminal de los residuos D- o E- o N. La utilidad del software es que elimina muchas secuencias obviamente incorrectas y recupera solo unos pocos candidatos probables. Algunas secuencias candidatas pueden eliminarse en función de la ausencia de un ion fragmento donde se esperaría que un residuo D en una secuencia genere un ion fragmento prominente. Invariablemente, los residuos D dan lugar a iones fragmentos prominentes en toda la columna vertebral polipeptídica, excepto cuando se encuentran dentro de unos pocos residuos del N- o C-termini donde la eficiencia del efecto del ácido aspártico disminuye36.

Número mínimo de sitios de PBC necesarios para la identificación tentativa de proteínas
Un CFIP se forma a partir de dos iones precursores de proteínas idénticos que se disocian en el mismo sitio PBC pero tienen su protón ionizante en lados opuestos del sitio de escisión. Aunque un CFIP se puede utilizar para calcular la masa del biomarcador de proteína con mayor precisión (lo que permite un estrechamiento de la tolerancia a la masa de la proteína durante una búsqueda), su utilidad para la identificación específica de la secuencia es menos útil que la de dos iones de fragmento no complementarios formados a partir de dos sitios de escisión diferentes, que proporcionan una mayor especificidad de identificación. La facilidad con la que se identificaron las dos proteínas AB-Im nos llevó a especular sobre el número mínimo de iones fragmentos necesarios para identificar tentativamente la secuencia de proteínas correcta de miles de proteínas o secuencias de fragmentos de proteínas. Rápidamente determinamos que no era el número de iones de fragmento per se, sino el número de iones de fragmento no complementarios lo que es importante porque cada ion de fragmento no complementario representa un sitio PBC, mientras que un CFIP representa el mismo sitio de escisión. Por lo tanto, la especificidad de identificación se deriva del número de sitios PBC detectados, no del número de iones de fragmento.

Es posible que el éxito en la identificación con sólo tres fragmentos de iones haya sido simplemente fortuito. Para probar esta hipótesis y eliminar el sesgo en la selección de iones de fragmento, creamos un módulo de evaluación comparativa dentro del software que selecciona aleatoriamente iones de fragmentos de un grupo más grande de iones de fragmentos complementarios y / o no complementarios. El grupo de iones de fragmentos más grande se seleccionó de los 14 iones de fragmentos prominentes identificados en la Figura 3 (panel inferior) en función de su abundancia relativa.

El protocolo de prueba fue el siguiente. Mediante una búsqueda binaria, se seleccionaron aleatoriamente tres iones de fragmento del grupo de 14 iones de fragmentos prominentes de la Figura 3 (panel inferior) (m/z 1813.8, 2128.9, 3881.3, 4293.7, 5158.0, 6505.0, 6619.9, 6939.4, 7645.1, 7959.4, 8022.7, 8136.2, 8583.3 y 8961.5). Se comparó una cohorte de iones de tres fragmentos con iones de fragmentos in silico de PBC en el lado C-terminal de los residuos D- o E- o N, así como una combinación de D & E y D & E & N. Esta comparación se realizó para cada ion fragmento individual de una cohorte, para los tres pares de iones fragmentos de una cohorte y para la combinación de iones de tres fragmentos de una cohorte. Para que una comparación se cuente como una coincidencia, tanto los iones de fragmento de un par como los tres iones de fragmento de una combinación deben coincidir con iones de fragmento in silico. Después de completar el análisis, se selecciona aleatoriamente otra cohorte de iones de tres fragmentos y se repite el análisis. Se permitió la repetición en la selección de iones de fragmentos. Como hay 364 combinaciones posibles [(n!/r!( n-r)!] de una cohorte de iones de tres fragmentos (r) de un grupo de 14 iones de fragmento (n), solo se realizaron 10 análisis como se muestra en el S1Im3 (Información complementaria).

El requisito de identificación iónica de tres fragmentos parece ser un fenómeno general como se muestra en la columna 3_ABC de las Tablas 2-7, 9-10 (S1Im3). Todos los recuentos de 1 en la columna 3_ABC corresponden a la secuencia Im3 (sin metionina N-terminal). El único fallo en la identificación se produjo porque el ion fragmento en m/z 8136.2 (mostrado en la Figura 3,panel inferior y resaltado en gris en las Tablas 1 y 8)excedió la tolerancia de iones del fragmento (±1.5 m/z) ingresada para el análisis. Dado que el algoritmo de prueba requiere que todos los iones de fragmento de una cohorte de iones de tres fragmentos sean coincidentes, cualquier grupo que incluya el ion de fragmento m/z 8136.2 no podría identificar/contar la secuencia de proteínas correcta.

La Tabla 6 en S1Im3 muestra que cuando dos de los tres iones fragmento son complementarios (resaltados en amarillo), más secuencias incorrectas coincidían con los criterios que las observadas cuando los tres iones fragmento no eran complementarios. Como se señaló anteriormente, esto se debe a que un CFIP corresponde a un solo sitio PBC, un umbral que es alcanzable por muchas más secuencias in silico incorrectas en comparación con el uso de dos iones fragmentos no complementarios que corresponden a dos sitios PBC, un criterio más estricto.

Se realizó un análisis similar en seis iones fragmentos prominentes (m/z 2675.4, 2904.5, 3076.2, 3853.5, 5657.5 y 5772.8) de Im-Bac que se muestra en la Figura 4 (panel inferior). A diferencia de Im3, Im-Bac no tiene CFIP discernible, por lo tanto, los seis iones de fragmento corresponden presumiblemente a seis sitios PBC. Como hay 20 combinaciones posibles de una cohorte de iones de tres fragmentos seleccionadas de un grupo de seis iones de fragmento, solo se realizaron 10 análisis como se muestra en las tablas de S2 Im-Bac (Información suplementaria). La secuencia Im-Bac se identificó/contó correctamente para todos los grupos de iones de tres fragmentos en columna 3_ABC en todos los análisis. En cuatro análisis, también se emparejaron una o dos secuencias incorrectas. Sin embargo, este pequeño número de secuencias incorrectas es un número manejable para la confirmación manual.

En general, los iones fragmentos complementarios y/o no complementarios que corresponden a dos o tres sitios PBC parecen proporcionar suficiente especificidad para recuperar una o dos secuencias candidatas. Por supuesto, los iones fragmento seleccionados por el operador deben ser relativamente abundantes y tener un buen S/N. Uno o dos iones de fragmento de un solo sitio PBC no proporcionan suficiente especificidad para evitar recuperar un número inviable de secuencias incorrectas que deben ser confirmadas por el operador. No está claro por qué dos o tres sitios PBC son adecuados, pero un solo sitio PBC aparentemente no es lo suficientemente específico. Aunque el truncamiento sin restricciones da como resultado ~ 200,000 proteínas y secuencias de fragmentos de proteínas que cumplen con los criterios de masa de proteínas, es probable que la naturaleza específica del sitio / residuo de los sitios de escisión, es decir, el lado C-terminal de los residuos D-, E- y N, contribuya al estrechamiento agudo de posibles secuencias durante la comparación de iones de fragmentos. Esto puede deberse, en parte, a la frecuencia de residuos D, E y N en secuencias de proteínas bacterianas, así como a sus ubicaciones únicas en secuencias de proteínas a través del proteoma de las bacterias. Los residuos ácidos desempeñan un papel crítico en la estructura de las proteínas y las interacciones con los disolventes. En consecuencia, su frecuencia y ubicaciones en la secuencia primaria son críticas, si no únicas, para la función de la proteína y pueden explicar por qué solo unos pocos sitios PBC son necesarios para identificar tentativamente la secuencia de proteínas correcta entre cientos de miles de secuencias incorrectas.

Desde una perspectiva química de fase gaseosa, la importancia de los residuos D-, E- y N se deriva de su participación en un canal de disociación que es accesible a bajas energías internas de iones proteicos metaestables cargados por sí mismos generados por MALDI y desintegración por PSD20. La escala de tiempo relativamente larga (~ 10-30 μs) de la fragmentación de iones moleculares por PSD significa que la energía interna del ion proteína se aleatoriza entre todos los grados de libertad vibracionales y rotacionales del ion molecular, de modo que la disociación es ergódica y estadística. También debe señalarse que el mecanismo del efecto del ácido aspártico implica un reordenamiento iónico molecular que se produce por una secuencia de pasos o un solo paso concertado que involucra múltiples átomos hasta lograr una geometría favorable que disminuya la barrera de activación de PBC17,18,19.

Dos proteínas de inmunidad antibacteriana codificadas por plásmidos producidas por una cepa STEC se identificaron utilizando un protocolo que involucra la inducción de antibióticos, MALDI-TOF-TOF-MS / MS-PSD y análisis proteómico de arriba hacia abajo. Estas proteínas se identificaron utilizando un software desarrollado internamente que incorpora la masa medida de la proteína y un número relativamente pequeño de iones de fragmentos específicos de la secuencia formados como resultado del efecto del ácido aspártico. El software compara los datos de EM y MS / MS con secuencias de proteínas in silico y fragmentos de proteínas derivadas de datos de WGS. Aunque el software no proporciona métricas de identificación o puntuación, elimina un porcentaje muy alto de secuencias incorrectas que resultan en un número muy pequeño de secuencias candidatas (una o dos) que pueden confirmarse fácilmente mediante inspección manual. Finalmente, la inspección manual de los datos WGS de esta cepa bacteriana reveló un promotor (caja SOS) aguas arriba de los genes AB e Im en un genoma de plásmido, que racionaliza la expresión de estos genes debido a la exposición de antibióticos dañinos para el ADN.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen conflictos de intereses.

Acknowledgments

El software Protein Biomarker Seeker está disponible gratuitamente (sin costo) poniéndose en contacto con Clifton K. Fagerquist en clifton.fagerquist@usda.gov. Deseamos agradecer el apoyo a esta investigación por parte de ARS, USDA, cris grant: 2030-42000-051-00-D.

Materials

Name Company Catalog Number Comments
4000 Series Explorer software AB Sciex Version 3.5.3
4800 Plus MALDI TOF/TOF Analyzer AB Sciex
Acetonitrile Optima LC/MS grade Fisher Chemical A996-1
BSL-2 biohazard cabinet The Baker Company SG403A-HE
Cytochrome-C Sigma C2867-10MG
Data Explorer software AB Sciex Version 4.9
Focus Protein Reduction-Alkylation kit G-Biosciences 786-231
GPMAW software Lighthouse Data Version 10.0
Incubator VWR 9120973
LB Agar Invitrogen 22700-025
Luria Broth Invitrogen 12795-027
Lysozyme Sigma L4919-1G
Microcentrifuge Tubes, 2 mL, screw-cap, O-ring Fisher Scientific 02-681-343
MiniSpin Plus Centrifuge Eppendorf 22620207
Mitomycin-C (from streptomyces) Sigma-Aldrich M0440-5MG
Myoglobin Sigma M5696-100MG
Shaker MaxQ 420HP Model 420 Thermo Scientific Model 420
Sinapinic acid Thermo Scientific 1861580
Sterile 1 uL loops Fisher Scientific 22-363-595
Thioredoxin (E. coli, recombinant) Sigma T0910-1MG
Trifluoroacetic acid Sigma-Aldrich 299537-100G
Water Optima LC/MS grade Fisher Chemical W6-4

DOWNLOAD MATERIALS LIST

References

  1. Fornelli, L., et al. Accurate sequence analysis of a monoclonal antibody by top-down and middle-down orbitrap mass spectrometry applying multiple ion activation techniques. Analytical Chemistry. 90 (14), 8421-8429 (2018).
  2. Fornelli, L., et al. Top-down proteomics: Where we are, where we are going. Journal of Proteomics. 175, 3-4 (2018).
  3. He, L., et al. Top-down proteomics-a near-future technique for clinical diagnosis. Annals of Translational Medicine. 8 (4), 136 (2020).
  4. Wu, Z., et al. MASH explorer: A universal software environment for top-down proteomics. Journal of Proteome Research. 19 (9), 3867-3876 (2020).
  5. Konermann, L., Metwally, H., Duez, Q., Peters, I. Charging and supercharging of proteins for mass spectrometry: recent insights into the mechanisms of electrospray ionization. Analyst. 144 (21), 6157-6171 (2019).
  6. Bourmaud, A., Gallien, S., Domon, B. Parallel reaction monitoring using quadrupole-Orbitrap mass spectrometer: Principle and applications. Proteomics. 16 (15-16), 2146-2159 (2016).
  7. Hart-Smith, G. A review of electron-capture and electron-transfer dissociation tandem mass spectrometry in polymer chemistry. Analitica Chimica Acta. 808, 44-55 (2014).
  8. Brodbelt, J. S., Morrison, L. J., Santos, I. Ultraviolet photodissociation mass spectrometry for analysis of biological molecules. Chemical Reviews. 120 (7), 3328-3380 (2020).
  9. Karas, M., Bachmann, D., Bahr, U., Hillenkamp, F. Matrix-assisted ultraviolet-laser desorption of nonvolatile compounds. International Journal of Mass Spectrometry and Ion Processes. 78, 53-68 (1987).
  10. Karas, M., Bachmann, D., Hillenkamp, F. Influence of the wavelength in high-irradiance ultraviolet-laser desorption mass-spectrometry of organic-molecules. Analytical Chemistry. 57 (14), 2935-2939 (1985).
  11. Tanaka, K., et al. Protein and polymer analyses up to m/z 100 000 by laser ionization time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 2 (8), 151-153 (1988).
  12. Resemann, A., et al. Top-down de Novo protein sequencing of a 13.6 kDa camelid single heavy chain antibody by matrix-assisted laser desorption ionization-time-of-flight/time-of-flight mass spectrometry. Analytical Chemistry. 82 (8), 3283-3292 (2010).
  13. Suckau, D., Resemann, A. T3-sequencing: targeted characterization of the N- and C-termini of undigested proteins by mass spectrometry. Analytical Chemistry. 75 (21), 5817-5824 (2003).
  14. Mikhael, A., Jurcic, K., Fridgen, T. D., Delmas, M., Banoub, J. Matrix-assisted laser desorption/ionization time-of-flight/time-of-flight tandem mass spectrometry (negative ion mode) of French Oak Lignin: A Novel Series of Lignin and Tricin Derivatives attached to Carbohydrate and Shikimic acid Moieties. Rapid Communications in Mass Spectrometry. 34 (18), 8841 (2020).
  15. Demirev, P. A., Feldman, A. B., Kowalski, P., Lin, J. S. Top-down proteomics for rapid identification of intact microorganisms. Analytical Chemistry. 77 (22), 7455-7461 (2005).
  16. Fagerquist, C. K. Unlocking the proteomic information encoded in MALDI-TOF-MS data used for microbial identification and characterization. Expert Review of Proteomics. 14 (1), 97-107 (2017).
  17. Gu, C., Tsaprailis, G., Breci, L., Wysocki, V. H. Selective gas-phase cleavage at the peptide bond C-terminal to aspartic acid in fixed-charge derivatives of Asp-containing peptides. Analytical Chemistry. 72 (23), 5804-5813 (2000).
  18. Herrmann, K. A., Wysocki, V. H., Vorpagel, E. R. Computational investigation and hydrogen/deuterium exchange of the fixed charge derivative tris(2,4,6-trimethoxyphenyl) phosphonium: implications for the aspartic acid cleavage mechanism. Journal of the American Society for Mass Spectrometry. 16 (7), 1067-1080 (2005).
  19. Rozman, M. Aspartic acid side chain effect-experimental and theoretical insight. Journal of the American Society for Mass Spectrometry. 18 (1), 121-127 (2007).
  20. Yu, W., Vath, J. E., Huberty, M. C., Martin, S. A. Identification of the facile gas-phase cleavage of the Asp-Pro and Asp-Xxx peptide bonds in matrix-assisted laser desorption time-of-flight mass spectrometry. Analytical Chemistry. 65 (21), 3015-3023 (1993).
  21. Luethy, P. M., Johnson, J. K. The use of Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry (MALDI-TOF MS) for the identification of pathogens causing sepsis. The Journal of Applied Laboratory Medicine. 3 (4), 675-685 (2019).
  22. Knabl, L., Lass-Florl, C. Antifungal susceptibility testing in Candida species: current methods and promising new tools for shortening the turnaround time. Expert Review of Anti-Infective Therapy. 18 (8), 779-787 (2020).
  23. Gould, O., Ratcliffe, N., Krol, E., de Lacy Costello, B. Breath analysis for detection of viral infection, the current position of the field. Journal of Breath Research. 14 (4), 041001 (2020).
  24. Fagerquist, C. K., et al. Sub-speciating Campylobacter jejuni by proteomic analysis of its protein biomarkers and their post-translational modifications. Journal of Proteome Research. 5 (10), 2527-2538 (2006).
  25. Sandrin, T. R., Goldstein, J. E., Schumaker, S. MALDI TOF MS profiling of bacteria at the strain level: a review. Mass Spectrometry Reviews. 32 (3), 188-217 (2013).
  26. Christner, M., et al. Rapid MALDI-TOF mass spectrometry strain typing during a large outbreak of Shiga-Toxigenic Escherichia coli. PLoS One. 9 (7), 101924 (2014).
  27. Masaki, H., Ohta, T. Colicin E3 and its immunity genes. Journal of Molecular Biology. 182 (2), 217-227 (1985).
  28. Michel, B. After 30 years of study, the bacterial SOS response still surprises us. PLoS Biology. 3 (7), 255 (2005).
  29. Fagerquist, C. K., Sultan, O. Induction and identification of disulfide-intact and disulfide-reduced beta-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS and top-down proteomics. Analyst. 136 (8), 1739-1746 (2011).
  30. Fagerquist, C. K., Sultan, O. Top-down proteomic identification of furin-cleaved alpha-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS. Journal of Biomedicine & Biotechnology. 2010, 123460 (2010).
  31. Fagerquist, C. K., et al. Top-down proteomic identification of Shiga toxin 2 subtypes from Shiga toxin-producing Escherichia coli by matrix-assisted laser desorption ionization-tandem time of flight mass spectrometry. Applied and Environmental Microbiology. 80 (9), 2928-2940 (2014).
  32. Fagerquist, C. K., Zaragoza, W. J., Lee, B. G., Yambao, J. C., Quiñones, B. Clinically-relevant Shiga toxin 2 subtypes from environmental Shiga toxin-producing Escherichia coli identified by top-down/middle-down proteomics and DNA sequencing. Clinical Mass Spectrometry. 11, 27-36 (2019).
  33. Fagerquist, C. K., Lee, B. G., Zaragoza, W. J., Yambao, J. C., Quiñones, B. Software for top-down proteomic identification of a plasmid-borne factor (and other proteins) from genomically sequenced pathogenic bacteria using MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 438, 1-12 (2019).
  34. Fagerquist, C. K., Rojas, E. ACS Fall 2020 Virtual Meeting & Expo. American Chemical Society, Virtual. , (2020).
  35. Fagerquist, C. K., Sultan, O. A new calibrant for matrix-assisted laser desorption/ionization time-of-flight-time-of-flight post-source decay tandem mass spectrometry of non-digested proteins for top-down proteomic analysis. Rapid Communications in Mass Spectrometry. 26 (10), 1241-1248 (2012).
  36. Fagerquist, C. K., Zaragoza, W. J. Complementary b/y fragment ion pairs from post-source decay of metastable YahO for calibration of MALDI-TOF-TOF-MS/MS. International Journal of Mass Spectrometry. 415, 29-37 (2017).
  37. Quinones, B., Yambao, J. C., Lee, B. G. Draft genome sequences of Escherichia coli O113:H21 strains recovered from a major produce production region in California. Genome Announcements. 5 (44), 01203-01217 (2017).
  38. Harrison, A. G. The gas-phase basicities and proton affinities of amino acids and peptides. Mass Spectrometry Reviews. 16 (4), 201-217 (1997).
  39. Fagerquist, C. K. Polypeptide backbone cleavage on the C-terminal side of asparagine residues of metastable protein ions analyzed by MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 457, (2020).
  40. Fagerquist, C. K., Zaragoza, W. J. Mass Spectrometry: Application to the Clinical Lab 2019 (MSACL 2019). , Palm Springs, CA. (2019).
  41. Fagerquist, C. K., Zaragoza, W. J. Bacteriophage cell lysis of Shiga toxin-producing Escherichia coli for top-down proteomic identification of Shiga toxins 1 & 2 using matrix-assisted laser desorption/ionization tandem time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 30 (6), 671-680 (2016).
  42. Fagerquist, C. K., et al. Web-based software for rapid top-down proteomic identification of protein biomarkers, with implications for bacterial identification. Applied and Environmental Microbiology. 75 (13), 4341-4353 (2009).
  43. Fagerquist, C. K., et al. Rapid identification of protein biomarkers of Escherichia coli O157:H7 by matrix-assisted laser desorption ionization-time-of-flight-time-of-flight mass spectrometry and top-down proteomics. Analytical Chemistry. 82 (7), 2717-2725 (2010).
  44. Maus, A., Bisha, B., Fagerquist, C., Basile, F. Detection and identification of a protein biomarker in antibiotic-resistant Escherichia coli using intact protein LC offline MALDI-MS and MS/MS. Journal of Applied Microbiology. 128 (3), 697-709 (2020).

Tags

Química Número 171
Identificación de proteínas de inmunidad antibacteriana en <em>Escherichia coli</em> utilizando MALDI-TOF-TOF-MS/MS y análisis proteómico de arriba hacia abajo
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Fagerquist, C. K., Rojas, E.More

Fagerquist, C. K., Rojas, E. Identification of Antibacterial Immunity Proteins in Escherichia coli using MALDI-TOF-TOF-MS/MS and Top-Down Proteomic Analysis. J. Vis. Exp. (171), e62577, doi:10.3791/62577 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter