Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Identificatie van antibacteriële immuniteitseiwitten in Escherichia coli met behulp van MALDI-TOF-TOF-MS/MS en top-down proteomische analyse

Published: May 23, 2021 doi: 10.3791/62577

Summary

Hier presenteren we een protocol voor de snelle identificatie van eiwitten geproduceerd door genomisch gesequencede pathogene bacteriën met behulp van MALDI-TOF-TOF tandem massaspectrometrie en top-down proteomische analyse met in eigen huis ontwikkelde software. Metastabieuze eiwitionen fragmenteren vanwege het asparaginezuureffect en deze specificiteit wordt gebruikt voor eiwitidentificatie.

Abstract

Dit protocol identificeert de immuniteitseiwitten van de bacteriedodende enzymen: colicine E3 en bacteriocine, geproduceerd door een pathogene Escherichia coli-stam met behulp van antibiotica-inductie, en geïdentificeerd door MALDI-TOF-TOF tandem massaspectrometrie en top-down proteomische analyse met software die intern is ontwikkeld. Het immuniteitseiwit colicine E3 (Im3) en het immuniteitseiwit van bacteriocine (Im-Bac) werden geïdentificeerd uit prominente b- en/of y-type fragmentionen gegenereerd door de polypeptide backbone cleavage (PBC) aan de C-terminale kant van asparaginezuur, glutaminezuur en asparagineresiduen door het fragmentatiemechanisme van het asparaginezuureffect. De software scant snel in silico-eiwitsequenties die zijn afgeleid van de hele genoomsequencing van de bacteriestam. De software verwijdert ook iteratief aminozuurresiduen van een eiwitsequentie in het geval dat de volwassen eiwitsequentie wordt afgekapt. Een enkele eiwitsequentie bezat massa- en fragmentionen die consistent waren met die gedetecteerd voor elk immuniteitseiwit. De kandidaatsequentie werd vervolgens handmatig geïnspecteerd om te bevestigen dat alle gedetecteerde fragmentionen konden worden toegewezen. De N-terminale methionine van Im3 werd post-translationeel verwijderd, terwijl Im-Bac de volledige sequentie had. Bovendien ontdekten we dat slechts twee of drie niet-complementaire fragmentionen gevormd door PBC nodig zijn om de juiste eiwitsequentie te identificeren. Ten slotte werd een promotor (SOS-box) geïdentificeerd vóór de antibacteriële en immuniteitsgenen in een plasmidegenoom van de bacteriestam.

Introduction

Analyse en identificatie van onverteerde eiwitten door massaspectrometrie wordt de top-down proteomische analyse1,2,3, 4genoemd. Het is nu een gevestigde techniek die gebruik maakt van elektrospray ionisatie (ESI)5 en hoge resolutie massaanalysatoren6, en geavanceerde dissociatie technieken, bijvoorbeeld elektron overdracht dissociatie (ETD), elektronenvangst dissociatie (ECD)7, ultraviolette foto-dissociatie (UV-PD)8, enz.

De andere zachte ionisatietechniek is matrix-geassisteerde laserdesorptie / ionisatie (MALDI)9,10,11 die minder uitgebreid is gebruikt voor de top-down analyse, deels omdat het voornamelijk is gekoppeld aan time-of-flight (TOF) massaanalysatoren, die een beperkte resolutie hebben in vergelijking met andere massaanalysatoren. Ondanks deze beperkingen zijn MALDI-TOF- en MALDI-TOF-TOF-instrumenten gebruikt voor de snelle top-down analyse van zuivere eiwitten en gefractioneerde en ongefractioneerde mengsels van eiwitten. Voor de identificatie van zuivere eiwitten is in-source decay (ISD) een bijzonder nuttige techniek omdat het massaspectrometrie (MS) analyse van ISD-fragmentionen mogelijk maakt, evenals tandem massaspectrometrie (MS / MS) van eiwitionfragmenten die sequentiespecifiek fragment leveren, vaak van de N- en C-termini van het doeleiwit, analoog aan Edman-sequencing12,13 . Een nadeel van de ISD-benadering is dat, net als bij Edman-sequencing, het monster slechts één eiwit mag bevatten. De enige eiwitbehoefte is te wijten aan de behoefte aan eenduidige toeschrijving van fragmentionen aan een voorloperion. Als er twee of meer eiwitten in een monster aanwezig zijn, kan het moeilijk zijn om toe te wijzen welke fragmentionen tot welke voorloperionen behoren.

Fragment ion/precursor ion attributie kan worden aangepakt met behulp van MALDI-TOF-TOF-MS/MS. Zoals bij elk klassiek MS/MS-experiment worden precursorionen massaal geselecteerd/geïsoleerd voorafgaand aan fragmentatie, en de gedetecteerde fragmentionen kunnen worden toegeschreven aan een specifiek voorloperion. De voor deze benadering beschikbare dissociatietechnieken zijn echter beperkt tot voornamelijk hoge-energie botsing-geïnduceerde dissociatie (HE-CID)14 of post-source decay (PSD)15,16. HE-CID en PSD zijn het meest effectief in het fragmenteren van peptiden en kleine eiwitten, en de sequentiedekking kan in sommige gevallen beperkt zijn. Bovendien resulteert PSD in polypeptide backbone cleavage (PBC) voornamelijk aan de C-terminale kant van asparagine- en glutaminezuurresiduen door een fenomeen dat het asparaginezuureffect wordt genoemd17,18,19,20.

MALDI-TOF-MS heeft ook een nichetoepassing gevonden in de taxonomische identificatie van micro-organismen: bacteriën21,schimmels22en virussen23. MS-spectra worden bijvoorbeeld gebruikt om onbekende bacteriën te identificeren in vergelijking met een referentiebibliotheek van MS-spectra van bekende bacteriën met behulp van patroonherkenningsalgoritmen voor vergelijking. Deze aanpak is zeer succesvol gebleken vanwege de snelheid en eenvoud, hoewel het een nachtelijke kweek van het isolaat vereist. De eiwitionen die door deze benadering worden gedetecteerd (meestal minder dan 20 kDa) bestaan uit een MS-vingerafdruk die taxonomische resolutie mogelijk maakt op geslachts- en soortniveau en in sommige gevallen op de ondersoort24 en stamniveau25,26. Er blijft echter een noodzaak om niet alleen taxonomisch potentieel pathogene micro-organismen te classificeren, maar ook specifieke virulentiefactoren, toxines en antimicrobiële resistentie (AMR) factoren te identificeren. Om dit te bereiken, wordt de massa van peptiden, eiwitten of kleine moleculen gemeten door MS en vervolgens geïsoleerd en gefragmenteerd door MS / MS.

Pathogene bacteriën dragen vaak cirkelvormige stukjes DNA die plasmiden worden genoemd. Plasmiden, samen met profagen, zijn een belangrijke vector van horizontale genoverdracht tussen bacteriën en zijn verantwoordelijk voor de snelle verspreiding van antimicrobiële resistentie en andere virulentiefactoren over bacteriën. Plasmiden kunnen ook antibacteriële (AB) genen dragen, bijvoorbeeld colicine en bacteriocine. Wanneer deze genen tot expressie worden gebracht en de eiwitten worden uitgescheiden, werken ze om de eiwitvertalingsmachinerie van naburige bacteriën die dezelfde milieuniche bezetten uit te schakelen27. Deze bacteriedodende enzymen kunnen echter ook een risico vormen voor de gastheer die ze heeft geproduceerd. Als gevolg hiervan wordt een gen mede tot expressie gebracht door de gastheer dat specifiek de functie van een AB-enzym remt en wordt aangeduid als het immuniteitseiwit (Im).

DNA-beschadigende antibiotica zoals mitomycine-C en ciprofloxacine worden vaak gebruikt om de SOS-respons te induceren in Shiga-toxineproducerende E. coli (STEC) waarvan het Shiga-toxinegen(stx) wordt aangetroffen in een profaaggenoom dat aanwezig is in het bacteriële genoom28. We hebben eerder antibiotica-inductie, MALDI-TOF-TOF-MS / MS en top-down proteomische analyse gebruikt om Stx-typen en subtypen geproduceerd door STEC-stammen29,30,31, 32te detecteren enteidentificeren. In het vorige werk werd STEC O113:H21 stam RM7788 's nachts gekweekt op agarmedia aangevuld met mitomycine-C. In plaats van de verwachte B-subeenheid van Stx2a bij m/z ~7816 te detecteren, werd echter een ander eiwition gedetecteerd bij m/z ~7839 en geïdentificeerd als een plasmide-gecodeerd hypothetisch eiwit met onbekende functie33. In het huidige werk identificeerden we twee plasmide-gecodeerde AB-Im-eiwitten geproduceerd door deze stam met behulp van antibiotische inductie, MALDI-TOF-TOF-MS / MS, en top-down proteomische analyse met behulp van stand-alone software die is ontwikkeld om silico-eiwitsequenties afgeleid van whole-genome sequencing (WGS) te verwerken en te scannen. Daarnaast werd de mogelijkheid van post-translation modifications (PTM) met sequentie-afkapping in de software opgenomen. De immuniteitseiwitten werden met behulp van deze software geïdentificeerd uit de gemeten massa van het volwassen eiwition en sequentiespecifieke fragmentionen van PBC veroorzaakt door het asparaginezuureffect en gedetecteerd door MS / MS-PSD. Ten slotte werd een promotor geïdentificeerd stroomopwaarts van de AB / Im-genen in een plasmide-genoom dat de expressie van deze genen kan verklaren wanneer deze stam wordt blootgesteld aan een DNA-beschadigend antibioticum. Delen van dit werk werden gepresenteerd op de National American Chemical Society Fall 2020 Virtual Meeting & Expo (17-20 augustus 2020)34.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Microbiologische monstervoorbereiding

  1. Ent 25 ml Luria-bouillon (LB) in een conische buis van 50 ml met E. coli O113:H21 stam RM7788 (of een andere bacteriestam) uit een glycerolvoorraad met behulp van een steriele lus van 1 μL. Beding de buis en de voorkweek op 37 °C met schudden (200 rpm) gedurende 4 uur.
  2. Aliquot 100 μL voorgekweekte bouillon en verspreid op een LB agarplaat aangevuld met 400 of 800 ng / ml mitomycine-C. Kweek agar platen statisch 's nachts in een incubator bij 37 °C.
    LET OP: STEC-stammen zijn pathogene micro-organismen. Voer alle microbiologische manipulaties uit, buiten het kweken, in een BSL-2 bioveiligheidskast.
  3. Oogst bacteriële cellen uit enkele zichtbare kolonies met behulp van een steriele lus van 1 μL en breng over naar een met O-ring beklede schroefdop microcentrifugebuis van 2,0 ml met 300 μL water van HPLC-kwaliteit. Sluit de buis, vortex kort en centrifugeer gedurende 2 minuten op 11.337 x g om de cellen te pelleteren.

2. Massaspectrometrie

  1. Plaats 0,75 μL aliquot van het monster supernatant op het roestvrijstalen MALDI-doel en laat het drogen. Overlay de gedroogde monstervlek met a0,75 μL aliquot van een verzadigde oplossing van sinapinic acid in 33% acetonitril, 67% water en 0,2% trifluoracetinezuur. Laat de plek drogen.
  2. Analyseer de gedroogde monstervlekken met behulp van een MALDI-TOF-TOF massaspectrometer.
    1. Nadat u het MALDI-doel in de massaspectrometer hebt geladen, klikt u op de knop voor MS lineaire modusacquisitie in de acquisitiesoftware. Voer het te analyseren m/z-bereik in door de m/z van de onder- en bovengrenzen (bijv. 2 kDa tot 20 kDa) in hun respectieve velden in te voeren in de software van de acquisitiemethode.
    2. Klik op de voorbeeldspot om te worden geanalyseerd op de MALDI-doelsjabloon in de software. Druk vervolgens op de linkermuisknop en sleep de muiscursor over de voorbeeldvlek om het rechthoekige gebied op te geven dat moet worden bemonsterd voor laserablatie / ionisatie. Laat de muisknop los en de acquisitie zal initiëren. Verzamel 1.000 lasershots voor elke monsterplek.
      OPMERKING: Gegevensverzameling wordt in realtime weergegeven in het software-acquisitievenster.
    3. Als er geen ionen worden gedetecteerd, verhoogt u de laserintensiteit door de glijdende schaalbalk onder Laserintensiteit in de software aan te passen totdat het eiwitionensignaal wordt gedetecteerd. Dit wordt drempel genoemd.
      OPMERKING: Kalibreer het instrument voorafgaand aan de monsterspotanalyse extern in MS lineaire modus met eiwitkalibraten waarvan de m/z het te analyseren bereik overspannen, bijvoorbeeld de +1- en +2-ladingstoestanden van eiwitkalibraten: cytochroom-C, lysozym en myoglobine bestrijken een massabereik van 2 kDa tot 20 kDa. Een tussenmassa binnen het gespecificeerde massabereik wordt gebruikt als focusmassa, bijvoorbeeld 9 kDa. De focusmassa is het ion waarvan de m/z optimaal is gericht voor detectie door de lineaire modusdetector.
    4. Wanneer de ms lineaire modus acquisitie is voltooid, klikt u op de knop voor MS/MS reflectron mode acquisitie in de acquisitie software. Voer de te analyseren voorlopermassa in het veld Precursor Mass in. Voer vervolgens een isolatiebreedte (in Da) in het Precursor Mass Window in voor de lage en hoge massazijde van de precursormassa, bijvoorbeeld ±100 Da.
    5. Klik op de knop CID Uit. Klik op de knop Metastable Suppressor ON. Pas de laserintensiteit aan tot ten minste 90% van de maximale waarde door de glijdende schaalbalk onder de laserintensiteit in de software aan te passen.
    6. Klik op de voorbeeldspot om te worden geanalyseerd op de MALDI-doelsjabloon in de software. Druk vervolgens op de linkermuisknop en sleep de muiscursor over de voorbeeldvlek om het rechthoekige gebied op te geven dat moet worden bemonsterd voor laserablatie / ionisatie. Laat de muisknop los en de acquisitie wordt gestart. Verzamel 10.000 laserfoto's voor elke monsterplek.
      OPMERKING: Voorafgaand aan de monsterspotanalyse moet het instrument extern worden gekalibreerd in MS/MS-reflectronmodus met behulp van de fragmentionen van post-source decay (PSD) van de +1-ladingstoestand van gealkyleerd thioredotoxine35.
  3. Verwerk geen ruwe MS-gegevens. Verwerk ms/ms-psd ruwe gegevens met behulp van de volgende reeks stappen in de opgegeven volgorde: geavanceerde basislijncorrectie (32, 0,5, 0,0) gevolgd door ruisonderscheiding (twee standaarddeviaties) gevolgd door Gaussiaanse afvlakking (31 punten).
  4. Inspecteer MS/MS-PSD-gegevens handmatig op de aanwezigheid van prominente fragmentionen gegenereerd door PBC19,20.
  5. Evalueer MS/MS-gegevens met betrekking tot de absolute en relatieve abundantie van fragmentionen en hun signaal-ruis (S/N). Gebruik alleen de meest voorkomende fragmentionen voor eiwitidentificatie, vooral als de MS / MS-PSD-gegevens luidruchtig zijn.

3. In silico eiwit database constructie

  1. Genereer een tekstbestand met in silico eiwitsequenties van de bacteriestam, die door de Protein Biomarker Seeker-software worden gescand voor de eiwitidentificatie. Eiwitsequenties zijn afgeleid van whole-genome sequencing (WGS) van de stam die wordt geanalyseerd (of een nauw verwante stam).
  2. Ga naar de NCBI/PubMed (https://www.ncbi.nlm.nih.gov/protein/) website om ongeveer 5.000 eiwitsequenties te downloaden van de specifieke bacteriestam (bijv. Escherichia coli O113:H21 stam RM7788) die wordt geanalyseerd. De maximale downloadgrootte is 200 reeksen.
    1. Kopieer en plak de 25 downloads vervolgens in één tekstbestand. Selecteer de FASTA-indeling (tekst) voor elke download.

4. Operating Protein Biomarker Seeker software

  1. Dubbelklik op het uitvoerbare bestand Protein Biomarker Seeker. Er verschijnt een venster met de grafische gebruikersinterface (GUI)(Figuur 1,bovenpaneel).
  2. Voer de massa van de eiwitbiomarker (zoals gemeten in MS-lineaire modus) in het Mature Protein Mass-veld in. Voer vervolgens de massameetfout in het veld Massatolerantie in. De standaard massameetfout is ±10 Da voor een eiwit van 10.000 Da.
  3. Klik eventueel op de knop Complementary b/y ion Protein Mass Calculator om de eiwitmassa te berekenen uit een vermeende complementair fragmentionenpaar (CFIP of b/y). Er verschijnt een pop-upvenster, Protein Mass Calculator Tool(Figuur 1,onderste paneel).
    1. Voer de m/z van de vermeende CFIP in en klik op de knop Paar toevoegen. De berekende eiwitmassa verschijnt.
    2. Kopieer en plak dit getal in het veld Mature Protein Mass en sluit het venster Protein Mass Calculator Tool.
  4. Selecteer een N-terminal signaalpeptidelengte door op het vak Residubeperking instellen te klikken. Er verschijnt een pop-up met een glijdende schaal en cursor. Verplaats de cursor naar de gewenste signaalpeptidelengte (maximaal 50). Als er geen signaalpeptidelengte is geselecteerd, wordt een onbeperkte sequentie-afkapping uitgevoerd door de software.
  5. Selecteer onder de Fragment Ion Condition in de GUI residuen voor polypeptide backbone cleavage (PBC). Klik op de vakjes van een of meer residuen: D, E, N en/of P.
    1. Klik op de knop Fragmentionen (+1) invoeren om te worden doorzocht. Er verschijnt een pop-upfragmentpagina. Klik vervolgens op de knop Fragmention toevoegen, wat overeenkomt met het aantal fragmentionen dat moet worden ingevoerd, d.w.z. één klik voor elk fragmention. Er verschijnt een vervolgkeuzelijst voor elk fragmention dat moet worden ingevoerd.
    2. Voer de m/z van de fragmentionen en de bijbehorende m/z-tolerantie in. Wanneer u klaar bent, klikt u op de knop Opslaan en sluiten.
      OPMERKING: Een redelijke m/z-tolerantie is ±1,5.
    3. Selecteer het minimum aantal fragmentionen dat moet worden gematcht voor een identificatie door naar het gewenste aantal te scrollen in het vak rechts van Hoeveel fragmentionen moeten worden gematcht.
      OPMERKING: Drie wedstrijden zouden voldoende moeten zijn.
    4. Selecteer cysteïneresiduen om in hun geoxideerde toestand te zijn door op de overeenkomstige cirkel te klikken. Als er na de zoekopdracht geen eiwitidentificaties worden gevonden, herhaalt u de zoekopdracht met cysteines in hun verminderde toestand. Als er na de zoekopdracht geen identificaties worden gevonden, verbreedt u de fragmentiontolerantie tot ±3 en herhaalt u de zoekopdracht.
  6. Klik onder Bestandsinstellingenop de knop FASTA-bestand selecteren om door het FASTA-bestand (tekst) te bladeren en te selecteren dat de in silico-eiwitsequenties bevat van de bacteriestam die eerder is geconstrueerd in protocolstappen 3.1 tot 3.2. Selecteer vervolgens een uitvoermap en maak een uitvoerbestandsnaam.
  7. Klik op de knop Zoekopdracht uitvoeren op bestandsvermeldingen. Er verschijnt een pop-upvenster met de titel Zoekparameters bevestigen (figuur 1,onderste paneel), waarin de zoekparameters worden weergegeven voordat de zoekopdracht wordt gestart.
  8. Als de zoekparameters correct zijn, klikt u op de knop Zoekopdracht starten. Als de zoekparameters niet correct zijn, klikt u op de knop Annuleren en voert u de juiste parameters opnieuw in. Zodra de zoekopdracht is gestart, wordt het parametervenster gesloten en verschijnt er een nieuw pop-upvenster met een voortgangsbalk(figuur 1,onderste paneel) met de voortgang van de zoekopdracht en een lopende telling van het aantal gevonden identificaties.
  9. Na voltooiing van de zoekopdracht (enkele seconden) wordt de voortgangsbalk automatisch gesloten en wordt een samenvatting van de zoekopdracht weergegeven in het veld Logboek van de GUI(Figuur 2,bovenpaneel). Daarnaast verschijnt er ook een nieuw pop-upvenster met de eiwitidentificatie(s) indien aanwezig(Figuur 2,onderste paneel).
    OPMERKING: In silico worden eiwitsequenties met niet-herkende residuen, bijvoorbeeld U of X, automatisch overgeslagen uit de analyse en deze sequenties worden vervolgens gerapporteerd met een apart pop-upvenster om de operator te waarschuwen over welke (eventuele) sequenties zijn overgeslagen na voltooiing van de zoekopdracht.

5. Bevestiging van de eiwitsequentie na het zoeken

  1. Bevestig de juistheid van een kandidaatvolgorde door handmatige analyse.
    OPMERKING: Het doel van de Protein Biomarker Seeker-software is om een eiwitsequentie met hoge nauwkeurigheid te identificeren door veel duidelijk onjuiste eiwitsequenties uit overweging te nemen en sequentieafkapping op te nemen als een mogelijke PTM in het volwassen eiwit. Omdat het aantal mogelijke geretourneerde kandidaatsequenties weinig is, is handmatige bevestiging beheersbaar.
  2. Genereer een tabel met de gemiddelde m/z van b- en y-type fragmentionen van de kandidaatsequentie met behulp van massaspectrometrie of proteomische software met dergelijke functionaliteit. Vergelijk de gemiddelde m/z van in silicofragmentionen aan de C-terminale zijde van D-, E- en N-residuen (en aan de N-terminale zijde van P-residuen) met de m/z van prominente fragmentionen uit de MS/MS-PSD-gegevens.
    OPMERKING: De meest prominente MS/MS-PSD-fragmentionen moeten gemakkelijk kunnen worden gematcht met D-, E- en N-geassocieerde silicofragmentionen. Het fragmentatiemechanisme van het asparaginezuureffect is echter minder efficiënt in de buurt van de N- of C-termini van een eiwitsequentie36.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Figuur 3 (bovenpaneel) toont de MS van STEC O113:H21 stam RM7788 's nachts gekweekt op LBA aangevuld met 400 ng/ml mitomycine-C. Pieken bij m/z 7276, 7337 en 7841 waren eerder geïdentificeerd als cold-shock protein C (CspC), cold-shock protein E (CspE) en een plasmide-borne protein met onbekende functie, respectievelijk33. Het eiwition bij m/z 9780 [M+H]+ werd geanalyseerd door MS/MS-PSD zoals weergegeven in figuur 3 (onderste paneel). Het voorloperion werd geïsoleerd met een timed-ion selector (TIS) venster ±100 Da. Fragmentionen worden geïdentificeerd aan de hand van hun m/z en type/nummer. Het fragmention bij m/z 2675,9 (gemarkeerd met een ster) is overlopend van de dissociatie van het metastabierbare eiwition bij m/z 9655 in figuur 3 (bovenpaneel). Het theoretisch gemiddelde m/z van elk fragmention wordt tussen haakjes weergegeven op basis van PBC van de hierboven getoonde sequentie van colicine E3-immuniteitseiwit (Im3). Locaties van PBC zijn gemarkeerd met een rood sterretje met de bijbehorende fragmention (en) geproduceerd. Het N-terminale methionine is onderstreept, wat betekent dat het posttranslatisch wordt verwijderd in het rijpe eiwit. De sequentie heeft een enkel cysteïneresidu (boxed) en wordt daarom beschouwd als in zijn gereduceerde toestand.

Met behulp van de massa van de eiwitbiomarker en enkele prominente niet-complementaire fragmentionen: m/z 1813.8, 2128.9 en 4293.7 (±1,5 tolerantie) (Figuur 1, onderste paneel) en het beperken van PBC tot de C-terminale kant van D- en E-residuen, werd slechts één kandidaat-sequentie gerapporteerd door de software: Im3-eiwitsequentie (zonder zijn N-terminale methionine) (Figuur 2 , onderste paneel). Bij het selecteren van fragmentionen voor een zoekopdracht, moet worden benadrukt dat elke groep niet-complementaire fragmentionen ervan uitgaat dat het optellen van de m / z van twee fragmentionen in de groep (en het aftrekken van twee protonen) resulteert in een massasom die niet binnen de biomarkermassa en bijbehorende massatolerantie valt (±10 Da). Concept WGS van RM7788 onthulde 5008 eiwitsequenties (open leesframes)37. Van deze ~5.000 volledige eiwitsequenties voldeden 189.490 volledige en partiële sequenties (onbeperkte afkapping) aan de biomarkermassacriteria(figuur 2,bovenpaneel). Die sequenties die de massacriteria passeren, ondergaan vervolgens in silico PBC aan de C-terminale kant van D- en/of E-residuen. De resulterende fragmentionen die worden gegenereerd, worden vervolgens vergeleken met de waargenomen fragmentionen die worden ingevoerd. De door de software gerapporteerde kandidaatvolgorde was uitsluitend gebaseerd op de massa en drie D- en/of E-specifieke PBC-locaties. De specificiteit die door zo'n kleine hoeveelheid informatie wordt bereikt, zal in de volgende sectie worden besproken.

Zoals weergegeven in figuur 3 (onderste paneel), zijn de meest voorkomende fragmentionen het resultaat van PBC aan de C-terminale kant van D- en E-residuen via het asparaginezuureffectfragmentatiemechanisme19,20. Er worden twee CFIP's waargenomen: b67/y17 (m/z 7645,1 / m/z 2128,9) en b70/y14 (m/z 7959,4 / m/z 1813,8). Deze CFIP kunnen worden gebruikt om de massa van het eiwitprecursorion nauwkeuriger te berekenen met behulp van de eenvoudige formule: b (m / z) + y (m / z) - 2H+ = eiwitmassa (Da)33. Met behulp van de twee CFIP verkrijgen we een gemiddelde massa van het eiwit: 9771,6 Da, wat dichter bij de theoretische waarde van 9772,5 Da ligt dan de gemeten massa van het eiwition in MS-lineaire modus: 9779 Da(Figuur 3,bovenpaneel). Slechts een paar CFIP werden gedetecteerd omdat de meeste voorloperionen met het ioniserende proton gesekwestreerd waren bij het enige arginineresidu: R80. De hogere gasfase basiciteit van arginine (237,0 kcal/mol38) in vergelijking met een lysineresidu (K) (221,8 kcal/mol38) is waarschijnlijk verantwoordelijk voor preferentiële sekwestratie van het ioniserende proton bij het enige R-residu.

Figuur 4 (bovenpaneel) toont de MS van STEC O113:H21 stam RM7788 's nachts gekweekt op LBA aangevuld met 800 ng/ml mitomycine-C. Figuur 4 (bovenste paneel) lijkt sterk op figuur 3 (bovenpaneel), hoewel er verschillen zijn in de relatieve abundantie van sommige eiwitionen als gevolg van de verschillen in gebruikte antibioticaconcentraties. Er zijn ook lichte verschuivingen in eiwitbiomarker m/z die verschillen in externe kalibratie van het instrument op verschillende dagen weerspiegelen. Nogmaals, de eiwitionen op m / z 7272, 7335 en 7838 zijn respectievelijk CspC, CspE en een plasmide-overgedragen eiwit. Daarnaast detecteren we het Im3-eiwition bij m/z 9778 (zij het met minder overvloed dan in figuur 3) en een eiwition bij m/z 9651 [M+H]+. Figuur 4 (onderste paneel) toont MS/MS-PSD van het eiwitprecursorion bij m/z 9651. Het voorloperion werd geïsoleerd met behulp van een smaller en asymmetrisch TIS-venster van -75/+60 Da om bijdragen van aangrenzende eiwitionen bij m/z 9539 en 9778 te elimineren. Fragmentionen worden geïdentificeerd aan de hand van hun m/z en type/nummer. De volgorde van het immuniteitseiwit van bacteriocine (Im-Bac) wordt hierboven weergegeven. Sites van PBC zijn gemarkeerd met een rood sterretje met hun bijbehorende fragmention (en). Het theoretisch gemiddelde m/z van elk fragmention wordt ook tussen haakjes in het spectrum weergegeven. De Im-Bac-sequentie heeft ook een enkel cysteïneresidu (boxed) en wordt daarom in zijn gereduceerde toestand beschouwd.

Met behulp van de eiwitbiomarkermassa, drie prominente niet-complementaire fragmentionen: m/z 2675.4, 3853.5 en 5772.8 (±1,50 tolerantie) uit figuur 4 en het beperken van PBC tot alleen de C-terminale kant van D- en/of E- en/of asparagine (N)-residuen, werd slechts één kandidaat-sequentie door de software gerapporteerd: Im-Bac-eiwit. De kandidaatsequentie werd opgehaald na het scannen van 191.375 volledige of gedeeltelijke sequenties die voldeden aan de criteria voor biomarkermassa en -tolerantie (±10 Da). De kandidaatsequentie werd door de software uitsluitend geïdentificeerd op basis van de massa en drie D- en/of E- en/of N-specifieke PBC-locaties.

De meest prominente fragmentionen in figuur 4 (onderste paneel) waren opnieuw het resultaat van PBC aan de C-terminale kant van D- en/of E-residuen en ook aan de N-terminale kant van een van de P-residuen20. We zien ook PBC aan de C-terminale kant van een N-residu dat waarschijnlijk ook zal optreden door een asparaginezuureffectachtig fragmentatiemechanisme39,40. De zwakte van het eiwitvoorloper ionensignaal resulteert in een beperkt aantal interpreteerbare fragmentionen. De nauwkeurigheid van het fragmention m/z neemt af met fragmentionen abundantie. Er werd geen CFIP gedetecteerd, vermoedelijk omdat het ioniserende proton werd gesekwestreerd bij het enige arginineresidu (R74) van de eiwitionensequentie. Alle fragmentionen bevatten het R74-residu, in overeenstemming met deze hypothese.

De promotor van antibacteriële immuniteitsgenen
Figuur 5 toont een deel van de 6482 bp contig00100 van E. coli stam RM7788 (GenBank: NWVS01000096.1) van whole-genome shotgun sequencing37. De coderende regio's voor colicine E3, het immuniteitseiwit (Im3), het immuniteitseiwit van bacteriocine (Im-Bac) en een lysis-eiwit zijn geel gemarkeerd. Stroomopwaarts van het coderende gebied voor het colicine E3-gen bevinden zich het -35-gebied, de Pribnow-box (PB), omgekeerde herhaling van de SOS-box, de Shine-Dalgarno / ribosomale bindingsplaats (SD / RBS)27. Er is een intergeen gebied met negen base paren tussen colicine E3 en Im3. LexA (een repressor-eiwit en een autopeptidase) bindt zich aan de SOS-box en blokkeert de expressie van genen stroomafwaarts. Bij DNA-schade (bijv. UV-straling of DNA-beschadigende antibiotica) ondergaat LexA zelfsplitsing waardoor expressie van genen stroomafwaartsmogelijk wordt 27,28. De expressie van deze twee immuniteitseiwitten is dus consistent met blootstelling van deze stam aan een DNA-beschadigend antibioticum.

Figure 1
Figuur 1: Schermafbeeldingen van Protein Biomarker Seeker-software. Bovenpaneel: Grafische gebruikersinterface (GUI) van de Protein Biomarker Seeker-software. Onderste deelvensters: pop-upvensters van Protein Mass Calculator Tool, Fragment Page, Confirm Search Parameters en Search progress bar. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 2
Figuur 2: Zoekresultaten van een eiwitidentificatie met behulp van Protein Biomarker Seeker software. Bovenpaneel: overzicht van zoekresultaten die worden weergegeven in het logveld van de software-GUI. Onderste paneel: Een pop-upvenster met een eiwitidentificatie met behulp van de software. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 3
Figuur 3: Massaspectrometrie analyse van STEC O113:H21 stam RM7788. Bovenpaneel: MS van STEC O113:H21 stam RM7788 's nachts gekweekt op LBA aangevuld met 400 ng/ml mitomycine-C. Onderste paneel: MS/MS-PSD van het eiwitvoorloperion bij m/z 9780 (bovenpaneel). Het voorloperion werd geïsoleerd met een TIS-venster ±100 Da. Fragmentionen worden geïdentificeerd aan de hand van hun m/z- en ionentype. De volgorde van het immuniteitseiwit voor colicine E3 (Im3) wordt getoond. Basisresiduen (plaatsen van mogelijke ladingsvastlegging) zijn blauw gemarkeerd. PBC's worden gemarkeerd met een rood sterretje met de bijbehorende fragmention(en) gegenereerd. Het theoretisch gemiddelde m/z van elk fragment wordt tussen haakjes weergegeven. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 4
Figuur 4: Massaspectrometrie analyse van STEC O113:H21 stam RM7788. Bovenpaneel: MS van STEC O113:H21 stam RM7788 's nachts gekweekt op LBA aangevuld met 800 ng/ml mitomycine-C. Bodempaneel: MS/MS-PSD van het eiwitprecursorion bij m/z 9651 (bovenpaneel). Het voorloperion werd geïsoleerd met een asymmetrisch TIS-venster van -75 aan de lage m/z-zijde van het voorloperion en +60 aan de hoge m/z-zijde van het voorloperion. Fragmentionen worden geïdentificeerd aan de hand van hun m/z- en ionentype. De volgorde van het immuniteitseiwit van bacteriocine (Im-Bac) wordt getoond. Basisresiduen (plaatsen van mogelijke ladingsvastlegging) zijn blauw gemarkeerd. PBC's worden gemarkeerd met een rood sterretje met de bijbehorende fragmention(en) gegenereerd. Het theoretisch gemiddelde m/z van elk fragmention wordt tussen haakjes weergegeven. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 5
Figuur 5: Analyse van een deel van het plasmidegenoom gedragen door E. coli O113:H21 stam RM7788. Een deel van de 6482 bp contig00100 van E. coli O113:H21 stam RM7788 (GenBank: NWVS01000096.1) van whole genome shotgun sequencing37. Klik hier om een grotere versie van deze figuur te bekijken.

Aanvullend dossier 1 (S1 im3): Resultaten van benchmarking analyse van software met behulp van geselecteerde fragmentionen van Im3 (uit figuur 3,onderste paneel). Klik hier om dit bestand te downloaden.

Aanvullend bestand 2 (S2 ImBac): Resultaten van benchmarking analyse van software met behulp van geselecteerde fragmentionen van Im-Bac (uit figuur 4,onderste paneel). Klik hier om dit bestand te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Overwegingen bij het protocol
De belangrijkste sterke punten van het huidige protocol zijn de snelheid, eenvoud van monstervoorbereiding en het gebruik van een instrument dat relatief eenvoudig te bedienen, te trainen en te onderhouden is. Hoewel bottom-up en top-down proteomische analyse door vloeistofchromatografie-ESI-HR-MS alomtegenwoordig zijn en in veel opzichten veel beter dan top-down door MALDI-TOF-TOF, vereisen ze meer tijd, arbeid en expertise. De complexiteit van instrumenten kan vaak van invloed zijn op de vraag of bepaalde instrumentplatforms waarschijnlijk zullen worden overgenomen door wetenschappers die niet formeel zijn opgeleid in massaspectrometrie. De top-down benadering met MALDI-TOF-TOF is bedoeld om de analyse van MALDI-TOF-MS uit te breiden tot buiten het huidige gebruik voor taxonomische identificatie van bacteriën in klinische microbiologische laboratoria, zonder de arbeid, complexiteit of expertise die nodig is voor analyse drastisch te verhogen.

Het protocol maakt geen gebruik van een mechanische (of elektrische) cellysisstap. Hoewel uitgescheiden of extracellulaire eiwitten kunnen worden gedetecteerd met behulp van het protocol, werd een eerdere versie van deze methode voor het eerst ontwikkeld voor de detectie van Shiga-toxine (Stx) van STEC-stammen waarbij antibiotica-inductie de bacteriële SOS-respons veroorzaakt, wat resulteert in expressie van faaggenen, waaronder stx- en late faaggenen die verantwoordelijk zijn voor bacteriële cellysis41 . We ontdekten dat door antibiotica geïnduceerde cellysis bepaalde voordelen heeft voor de detectie van Stx en plasmide-eiwitten die SOS-promotors hebben (huidig werk). Zeker, mechanische cellysis (bijv. Kralen kloppen) kan ook worden gebruikt (hoewel niet gebruikt in het huidige werk). Mechanische lysis resulteert er echter in dat alle bacteriële cellen worden gelyseerd (niet alleen geïnduceerde cellen), wat resulteert in het verrijken van het monster met overvloedige, sterk geconserveerde gastheereiwitten die de detectie van faag- en plasmide-eiwitten uit een niet-gefractioneerd monster uitdagender kunnen maken.

De antibioticumconcentraties voor een bacteriestam bleken over het algemeen reproduceerbaar te zijn met betrekking tot de gedetecteerde antibiotica-geïnduceerde eiwitten. We merkten variaties op in de relatieve eiwitrijkdom met betrekking tot de door antibiotica geïnduceerde eiwitten die werden gedetecteerd. Aangezien onze analyse kwalitatief (niet kwantitatief) is, hoeft de abundantie van eiwitbiomarkers alleen voldoende te zijn voor een adequate MS/MS-analyse. Een vermeende STEC-stam wordt eerst gekweekt met een reeks antibioticaconcentraties (bijv. 300 ng / ml tot 2.000 ng / ml mitomycine-C) om de optimale concentratie te bepalen, zodat deze de bacteriële SOS-respons activeert terwijl het nog steeds voldoende bacteriële cellen biedt om te oogsten. Voor de STEC-stam RM7788 vonden we dat de optimale antibioticumconcentratie voor de detectie van de geïdentificeerde biomarkers 400 tot 800 ng / ml mitomycine-C was.

Naast eiwitsequentieafkapping kunnen E. coli-eiwitten PTM's hebben die toevoeging van massa met zich meebrengen, bijvoorbeeld fosforylering, glycosylering, enz. Aangezien MS/MS PSD gebruikt voor dissociatie van afzonderlijk geladen metastabiele eiwitionen (minder dan 20 kDa in massa) gegenereerd door MALDI, zouden dergelijke PTM's die aan residuzijketens zijn bevestigd waarschijnlijk gemakkelijk dissociatief verlies ondergaan omdat PSD een ergodische dissociatietechniek is. De aanwezigheid van dergelijke PTM's kan worden afgeleid uit het verschijnen van een fragmention dat in massa dicht bij het oorspronkelijke voorloperion ligt (minus de massa van de PTM) in de MS/MS-gegevens. Noch PSD, noch de software zou echter in staat zijn om te identificeren waar dergelijke PTM's zijn aangesloten. Bovendien kan de software alleen eiwitten identificeren uit fragmentionen van PBC en niet dissociatief verlies van kleine moleculen (bijv. Water of ammoniak) of PTM's die aan de zijketens van residuen zijn bevestigd. Als echter fragmentionen van PBC worden gedetecteerd, kan het eiwit nog steeds worden geïdentificeerd met behulp van de software door het eiwitmassatolerantievenster te verbreden om de massa van de PTM op te nemen of eenvoudigweg de massa van het eiwitfragmention in te voeren die overeenkomt met dissociatief verlies van de vermoedelijke PTM. Elke identificatie door de software zou van de eiwitsequentie zijn zonder de PTM. Interessant is dat we tot nu toe geen eiwitten met fosforylering, glycosylering, enz. hebben gedetecteerd in ons bacteriële werk. Dat kan echter te wijten zijn aan: hun relatieve abundantie door MALDI, het gebruikte massabereik: 2-20 kDa, dat dergelijke PTM's ongewoon labiel kunnen zijn en mogelijk de toepassing van de MALDI-matrix niet overleven, of dat dergelijke PTM's zeer snel dissociatief verlies in de bron kunnen ondergaan voordat ionen uit de bron worden versneld.

Momenteel omvat de software geen cysteïnealkylering en ons monsterprotocol bevat geen disulfidereductiestap voor cysteïneresiduen. Het protocol is verduidelijkt om aan te geven dat de zoekopdracht moet worden uitgevoerd met cysteïneresiduen in hun geoxideerde toestand en als er geen identificatie wordt verkregen, om de zoekopdracht opnieuw uit te voeren met cysteïneresiduen in hun gereduceerde toestand. Als er geen identificaties meer worden gevonden, verlaagt het verbreden van de fragmentiontolerantie tot ±2 of ±3 de drempel voor fragmentionmatching, waardoor sequenties met cysteines kunnen worden gematcht, ongeacht of ze aanwezig zijn in hun geoxideerde en / of gereduceerde toestanden.

Top-down proteomische analyse door MALDI-TOF-TOF massaspectrometrie
De meeste top-down proteomische analyse is bereikt met behulp van ESI en hoge resolutie massaspectrometrieplatforms. Daarentegen zijn er minder top-down proteomische analyses uitgevoerd met behulp van MALDI-TOF-TOF-platforms. Bijgevolg is er zeer weinig top-down proteomische software voor analyse van afzonderlijk geladen metastabieuze eiwitionen gegenereerd en geanalyseerd door MALDI-TOF-MS / MS-PSD die het asparaginezuureffect benutten voor fragmentatie15,42. Daar zijn een aantal redenen voor. Ten eerste is de ionisatie-efficiëntie van MALDI gericht op peptiden en eiwitten met een lager molecuulgewicht, en deze vertekening is vooral duidelijk bij een mengsel van eiwitten zoals zou worden gevonden in een niet-gefractioneerd bacterieel cellysaat. Ten tweede genereert MALDI lage ladingstoestanden en is er weinig of geen Coulomb-afstoting om de dissociatie van eiwitionen te vergemakkelijken. Ten derde is de dekking van de PSD-sequentie vrij beperkt in tegenstelling tot andere technieken ECD7,ETD7,UV-PD8,enz. Ten vierde neemt de fragmentatie-efficiëntie van PSD af met toenemende massa van het eiwition. Ten vijfde hebben ergodische dissociatietechnieken, zoals PSD, de neiging om te resulteren in gemakkelijk dissociatief verlies van PTM's die aan residuen zijn gehecht, bijvoorbeeld fosforylering, glycosylering, enz., Waardoor het een uitdaging wordt om de plaats van PTM-hechting te bepalen. Ondanks deze ernstige beperkingen heeft top-down analyse met behulp van MALDI-TOF-TOF-MS/MS-PSD duidelijke voordelen, bijvoorbeeld eenvoud van monstervoorbereiding, afwezigheid van LC-scheiding, isolatie van metastabieuze eiwitionen door MS/MS waardoor fragmentionen kunnen worden toegeschreven aan precursorionen, identificatie van PTM's met sequentieafkapping en intramoleculaire disulfidebindingen en vooral de snelheid van de analyse. In combinatie met in silico-eiwitsequenties afgeleid van WGS-gegevens, kan deze techniek snelle informatie opleveren voordat andere meer tijdrovende en arbeidsintensieve analyses worden voltooid.

De Protein Biomarker Seeker-software is ontwikkeld met behulp van IntelliJ en geschreven in Java om eiwitaminozuursequenties afgeleid van WGS van een bacteriestam efficiënt te verwerken en te zoeken. De software is aangepast van een eerder algoritme dat als macro binnen Excel33werkte. We hebben besloten om een zelfstandige versie van de software te ontwikkelen met een GUI-interface om het gebruiksvriendelijker te maken en verdere verbeteringen aan te bieden.

In het geval van PTM's waarbij eiwitsequentieafkapping betrokken is, verwijdert de software achtereenvolgens een aminozuurresidu van de N-terminus terwijl iteratief residuen van de sequentie worden toegevoegd totdat de massasom de gemeten massa van de gedetecteerde eiwitbiomarker ontmoet of overschrijdt. Hoewel dit proces kan resulteren in een zeer groot aantal eiwitmassafragmenten (~ 200.000 van ~ 5000 volledige eiwitsequenties), heeft het het voordeel dat potentiële eiwitfragmenten niet worden uitgesloten van de afkapping op de N-terminus of C-terminus (of beide), hoe onwaarschijnlijk een dergelijke afkapping vanuit biologisch perspectief ook kan zijn. Deze benadering wordt onbeperkte verkorting genoemd. De meest voorkomende bacteriële PTM's met afkapping zijn echter verwijdering van het N-terminale methionine of N-terminale signaalpeptide. Als gevolg hiervan stelt de software de operator ook in staat om een bovengrens (50 residuen) te selecteren voor residu-afkapping vanaf de N-terminus, wat resulteert in veel minder eiwitfragmenten die voldoen aan de criteria voor eiwitbiomarkermassa.

PBC's aan de C-terminale kant van D- en E-residuen en aan de N-terminale kant van P-residuen zijn consistent met het asparaginezuureffectmechanisme, dat zowel experimenteel als theoretisch uitgebreid is bestudeerd17,18,19,20. Opname van PBC aan de C-terminale kant van N-residuen werd in de software opgenomen vanwege een asparaginezuureffectachtig mechanisme dat is waargenomen voor een aantal metastabieuze eiwitionen in ons laboratorium39,40. De meest voorkomende fragmentionen van de dissociatie van afzonderlijk geladen metastabieuze eiwitionen geanalyseerd door MS / MS-PSD zijn te wijten aan het fragmentatiemechanisme van het asparaginezuureffect. De operator selecteert de meest prominente fragmentionen uit de MS/MS-PSD-gegevens en voert hun m/z in de software in, evenals een bijbehorende fragmentiontolerantie (±m/z). De fragmentiontolerantie kan voor elk fragmention worden aangepast om de relatieve abundantie ervan weer te geven. Een geschikte fragmentionentolerantie kan variëren van ±1,0 tot ±2,5 m/z, afhankelijk van de absolute abundantie van het fragmention en de relatieve abundantie ervan in vergelijking met chemische achtergrondruis. Typisch, hoe overvloediger een fragmention, hoe beter de massanauwkeurigheid, waardoor een smallere fragmentiontolerantie kan worden gebruikt.

MS/MS-PSD-gegevens van metastabieuze eiwitionen kunnen dramatisch variëren in termen van hun complexiteit. Sommige MS/MS-PSD spectra zijn gemakkelijker te interpreteren dan andere. Er zijn verschillende redenen voor dit fenomeen. Ten eerste kan het eiwition niet efficiënt fragmenteren op de tijdschaal van de analyse (~ 10-30 μs), misschien omdat het gevouwen of gedeeltelijk gevouwen blijft, zelfs na oplosbaarheid in de MALDI-matrixoplossing. Ten tweede kunnen metastabiele eiwitionen, naast PBC, dissociatief verlies van kleine moleculen ondergaan, d.w.z. ammoniak (-17 Da) of water (-18 Da)15. Een belangrijke bijdrage aan de spectrale complexiteit lijkt dissociatief verlies van ammoniak uit de zijketen van R-residuen te zijn33. We hebben een toename waargenomen in spectrale complexiteit van MS/MS-PSD-gegevens met het aantal R-residuen in de eiwitsequentie. Eiwitten zonder R-residuen (YahO-eiwit36 en koude-shock-eiwit CspC33,43), met één R-residu (koude-shock eiwit CspE33 en B-subeenheid van Stx241), met twee R-residuen (hypothetisch eiwit33), produceren MS / MS-PSD-spectra die relatief ongecompliceerd en gemakkelijk te interpreteren zijn. Wanneer het aantal R-residuen echter toeneemt tot drie (HU-eiwit44), of vier (ubiquitine35encold-shock eiwit CsbD33,43), neemt de spectrale complexiteit aanzienlijk toe. De software vergelijkt fragmentionen van PBC bij residuen die specifiek zijn voor het asparaginezuureffectmechanisme, alleen omdat dit het meest toegankelijke dissociatiekanaal is van afzonderlijk geladen metastabieuze eiwitionen geanalyseerd door MS / MS-PSD. De software bevat geen fragmentionen als gevolg van dissociatief verlies (of verlies) van kleine neutrale molecuul(s). Daarom is het belangrijk dat de operator geen fragmentionen selecteert die kleine neutrale dissociatieve verliezen bevatten. Fragmentionen van PBC zijn meestal de meest prominente fragmentionen; wanneer het aantal R-residuen in een eiwit echter toeneemt tot drie of vier, kan het meest voorkomende fragmention op een PBC-locatie er een zijn met een klein dissociatief verlies (of verliezen). Als een dergelijke cluster van fragmentionen (gescheiden door veelvouden van 17 of 18 m/z) wordt gedetecteerd, moet het fragmention met de hoogste m/z binnen een cluster het ion zijn dat in de fragmentionzoekparameters wordt ingevoerd.

Er moet worden benadrukt dat de software niet is ontworpen voor operatorvrije proteomische identificatie. De operator moet selecteren welke fragmentionen uit MS/MS-PSD-gegevens in de zoekopdracht moeten worden opgenomen. Op basis van talrijke experimenten die het asparaginezuureffect van MS/MS-PSD hebben bevestigd, zijn de meest prominente fragmentionen echter altijd het resultaat van PBC aan de C-terminale kant van D- of E- of N-residuen. Het nut van de software is dat het veel duidelijk onjuiste sequenties elimineert en slechts een paar waarschijnlijke kandidaten ophaalt. Sommige kandidaatsequenties kunnen worden geëlimineerd op basis van de afwezigheid van een fragmention waarbij een D-residu in een sequentie naar verwachting een prominent fragmention zal genereren. D-residuen resulteren steevast in prominente fragmentionen in de hele polypeptide-ruggengraat, behalve wanneer ze zich binnen enkele residuen van de N- of C-termini bevinden, waar de efficiëntie van het asparaginezuureffect afneemt36.

Minimumaantal PBC-locaties dat nodig is voor voorlopige eiwitidentificatie
Een CFIP wordt gevormd uit twee identieke eiwitvoorloperionen die dissociëren op dezelfde PBC-plaats, maar hun ioniserende proton aan weerszijden van de splitsingsplaats hebben. Hoewel een CFIP kan worden gebruikt om de massa van de eiwitbiomarker nauwkeuriger te berekenen (waardoor een vernauwing van de eiwitmassatolerantie tijdens een zoekopdracht mogelijk is), is het nut ervan voor sequentiespecifieke identificatie minder nuttig dan dat van twee niet-complementaire fragmentionen gevormd uit twee verschillende splitsingsplaatsen, die een grotere identificatiespecificiteit bieden. Het gemak waarmee de twee AB-Im-eiwitten werden geïdentificeerd, bracht ons ertoe te speculeren over het minimale aantal fragmentionen dat nodig is om voorlopig de juiste eiwitsequentie van duizenden eiwitten of eiwitfragmentsequenties te identificeren. We stelden al snel vast dat niet het aantal fragmentionen op zich, maar het aantal niet-complementaire fragmentionen belangrijk is omdat elk niet-complementair fragmention één PBC-site vertegenwoordigt, terwijl een CFIP dezelfde splitsingsplaats vertegenwoordigt. Identificatiespecificiteit wordt dus afgeleid van het aantal gedetecteerde PBC-locaties en niet van het aantal fragmentionen.

Het is mogelijk dat het succes in identificatie met slechts drie fragmentionen gewoon toevallig was. Om deze hypothese te testen en vertekening in de selectie van fragmentionen te elimineren, creëerden we een benchmarkingmodule binnen de software die willekeurig fragmentionen selecteert uit een grotere pool van complementaire en / of niet-complementaire fragmentionen. De grotere fragmentionenpool werd geselecteerd uit de 14 prominente fragmentionen die in figuur 3 (onderste paneel) werden geïdentificeerd op basis van hun relatieve abundantie.

Het testprotocol was als volgt. Met behulp van een binaire zoekopdracht werden drie fragmentionen willekeurig geselecteerd uit de pool van 14 prominente fragmentionen in figuur 3 (onderste paneel) (m / z 1813.8, 2128.9, 3881.3, 4293.7, 5158.0, 6505.0, 6619.9, 6939.4, 7645.1, 7959.4, 8022.7, 8136.2, 8583.3 en 8961.5). Een ionencohort met drie fragmenten werd vergeleken met in silicofragmentionen van PBC aan de C-terminale kant van D- of E- of N-residuen en een combinatie van D & E en D & E & N. Deze vergelijking werd uitgevoerd voor elk individueel fragmention van een cohort, voor de drie fragmentionenparen van een cohort en voor de driefragmentionencombinatie van een cohort. Om een vergelijking als een overeenkomst te kunnen tellen, moeten beide fragmentionen van een paar en alle drie fragmentionen van een combinatie overeenkomen met in silico fragmentionen. Na voltooiing van de analyse wordt een ander ionencohort met drie fragmenten willekeurig geselecteerd en wordt de analyse herhaald. Herhaling in fragmentionenselectie was toegestaan. Aangezien er 364 mogelijke combinaties zijn [(n!/r!( n-r)!] van een driefragmentenionencohort (r) uit een pool van 14 fragmentionen (n), werden slechts 10 analyses uitgevoerd zoals weergegeven in de S1Im3 (Aanvullende informatie).

De identificatie-eis van drie fragmenten lijkt een algemeen verschijnsel te zijn, zoals weergegeven in kolom 3_ABC van de tabellen 2-7, 9-10 (S1Im3). Alle tellingen van 1 in de kolom 3_ABC komen overeen met de Im3-sequentie (zonder N-terminale methionine). De enige fout in de identificatie deed zich voor omdat het fragmention bij m/z 8136.2 (weergegeven in figuur 3,onderste paneel en grijs gemarkeerd in tabellen 1 en 8)de fragmentiontolerantie overschreed (±1,5 m/z) die voor de analyse was ingevoerd. Aangezien het testalgoritme vereist dat alle fragmentionen van een ionencohort met drie fragmenten worden gematcht, zou elke groep die het m / z 8136.2-fragmention omvatte, de juiste eiwitsequentie niet identificeren / tellen.

Tabel 6 in S1Im3 laat zien dat wanneer twee van de drie fragmentionen complementair zijn (geel gemarkeerd), meer onjuiste sequenties aan de criteria voldeden dan die waargenomen wanneer alle drie fragmentionen niet-complementair waren. Zoals eerder opgemerkt, komt dit omdat een CFIP overeenkomt met een enkele PBC-site, een drempel die kan worden bereikt door veel meer onjuiste silicosequenties in vergelijking met het gebruik van twee niet-complementaire fragmentionen die overeenkomen met twee PBC-sites, een strenger criterium.

Een soortgelijke analyse werd uitgevoerd op zes prominente fragmentionen (m/z 2675.4, 2904.5, 3076.2, 3853.5, 5657.5 en 5772.8) van Im-Bac weergegeven in figuur 4 (onderste paneel). In tegenstelling tot Im3 heeft Im-Bac geen waarneembare CFIP, daarom komen de zes fragmentionen vermoedelijk overeen met zes PBC-locaties. Aangezien er 20 mogelijke combinaties van een ionencohort met drie fragmenten zijn geselecteerd uit een pool van zes fragmentionen, werden slechts 10 analyses uitgevoerd zoals weergegeven in de tabellen van S2 Im-Bac (aanvullende informatie). De Im-Bac-sequentie werd correct geïdentificeerd/geteld voor alle drie-fragmentionengroepen in kolom 3_ABC in alle analyses. In vier analyses werden ook een of twee onjuiste sequenties gematcht. Dit kleine aantal onjuiste sequenties is echter een beheersbaar aantal voor handmatige bevestiging.

Over het algemeen lijken complementaire en/of niet-complementaire fragmentionen die overeenkomen met twee of drie PBC-locaties voldoende specificiteit te bieden om een of twee kandidaatsequenties op te halen. Natuurlijk moeten de door de operator geselecteerde fragmentionen relatief overvloedig zijn en een goede S / N hebben. Een of twee fragmentionen van een enkele PBC-locatie bieden niet voldoende specificiteit om te voorkomen dat een onwerkbaar aantal onjuiste sequenties wordt opgehaald die door de operator moeten worden bevestigd. Het is niet duidelijk waarom twee of drie PBC-sites voldoende zijn, maar een enkele PBC-site is blijkbaar niet specifiek genoeg. Hoewel onbeperkte afkapping resulteert in ~200.000 eiwitten en eiwitfragmentsequenties die voldoen aan de criteria voor eiwitmassa, is het waarschijnlijk dat de plaats/residuspecifieke aard van de splitsingsplaatsen, d.w.z. de C-terminale kant van D-, E- en N-residuen, bijdraagt aan de scherpe vernauwing van mogelijke sequenties tijdens fragmentionenvergelijking. Dit kan gedeeltelijk te wijten zijn aan de frequentie van D-, E- en N-residuen in bacteriële eiwitsequenties, evenals hun unieke locaties in eiwitsequenties in het proteoom van bacteriën. Zure residuen spelen een cruciale rol in de eiwitstructuur en oplosmiddelinteracties. Bijgevolg zijn hun frequentie en locaties in de primaire sequentie van cruciaal belang, zo niet uniek voor de eiwitfunctie en kunnen ze verklaren waarom slechts een paar PBC-locaties nodig zijn om voorlopig de juiste eiwitsequentie te identificeren tussen honderdduizenden onjuiste sequenties.

Vanuit een gasfasechemieperspectief komt het belang van D-, E- en N-residuen voort uit hun deelname aan een dissociatiekanaal dat toegankelijk is bij lage interne energieën van afzonderlijk geladen metastabieuze eiwitionen gegenereerd door MALDI en verval door PSD20. De relatief lange tijdschaal (~10-30 μs) van moleculaire ionfragmentatie door PSD betekent dat de interne energie van het eiwition gerandomiseerd is over alle trillings- en rotatiegraden van het moleculaire ion, zodat dissociatie ergodisch en statistisch is. Er moet ook op worden gewezen dat het mechanisme van asparaginezuureffect een moleculaire ionenherschikking omvat die optreedt door een reeks stappen of een enkele gecoördineerde stap met meerdere atomen totdat een gunstige geometrie wordt bereikt die de activeringsbarrière van PBC17,18,19verlaagt .

Twee plasmide-gecodeerde antibacteriële immuniteitseiwitten geproduceerd door een STEC-stam werden geïdentificeerd met behulp van een protocol met antibiotica-inductie, MALDI-TOF-TOF-MS / MS-PSD, en top-down proteomische analyse. Deze eiwitten werden geïdentificeerd met behulp van in eigen huis ontwikkelde software die de gemeten massa van het eiwit en een relatief klein aantal sequentiespecifieke fragmentionen bevat die zijn gevormd als gevolg van het asparaginezuureffect. De software vergelijkt de MS- en MS/MS-gegevens met in silico-eiwit- en eiwitfragmentsequenties die zijn afgeleid van WGS-gegevens. Hoewel de software geen identificatiestatistieken of scores biedt, elimineert het een zeer hoog percentage onjuiste sequenties, wat resulteert in een zeer klein aantal kandidaatsequenties (een of twee) die gemakkelijk kunnen worden bevestigd door handmatige inspectie. Ten slotte onthulde handmatige inspectie van de WGS-gegevens van deze bacteriestam een promotor (SOS-doos) stroomopwaarts van de AB- en Im-genen in een plasmidegenoom, die de expressie van deze genen rationaliseert als gevolg van blootstelling aan DNA-beschadigende antibiotica.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben geen belangenverstrengeling.

Acknowledgments

Protein Biomarker Seeker software is vrij beschikbaar (gratis) door contact op te nemen met Clifton K. Fagerquist op clifton.fagerquist@usda.gov. We willen de steun van dit onderzoek erkennen door ARS, USDA, CRIS-subsidie: 2030-42000-051-00-D.

Materials

Name Company Catalog Number Comments
4000 Series Explorer software AB Sciex Version 3.5.3
4800 Plus MALDI TOF/TOF Analyzer AB Sciex
Acetonitrile Optima LC/MS grade Fisher Chemical A996-1
BSL-2 biohazard cabinet The Baker Company SG403A-HE
Cytochrome-C Sigma C2867-10MG
Data Explorer software AB Sciex Version 4.9
Focus Protein Reduction-Alkylation kit G-Biosciences 786-231
GPMAW software Lighthouse Data Version 10.0
Incubator VWR 9120973
LB Agar Invitrogen 22700-025
Luria Broth Invitrogen 12795-027
Lysozyme Sigma L4919-1G
Microcentrifuge Tubes, 2 mL, screw-cap, O-ring Fisher Scientific 02-681-343
MiniSpin Plus Centrifuge Eppendorf 22620207
Mitomycin-C (from streptomyces) Sigma-Aldrich M0440-5MG
Myoglobin Sigma M5696-100MG
Shaker MaxQ 420HP Model 420 Thermo Scientific Model 420
Sinapinic acid Thermo Scientific 1861580
Sterile 1 uL loops Fisher Scientific 22-363-595
Thioredoxin (E. coli, recombinant) Sigma T0910-1MG
Trifluoroacetic acid Sigma-Aldrich 299537-100G
Water Optima LC/MS grade Fisher Chemical W6-4

DOWNLOAD MATERIALS LIST

References

  1. Fornelli, L., et al. Accurate sequence analysis of a monoclonal antibody by top-down and middle-down orbitrap mass spectrometry applying multiple ion activation techniques. Analytical Chemistry. 90 (14), 8421-8429 (2018).
  2. Fornelli, L., et al. Top-down proteomics: Where we are, where we are going. Journal of Proteomics. 175, 3-4 (2018).
  3. He, L., et al. Top-down proteomics-a near-future technique for clinical diagnosis. Annals of Translational Medicine. 8 (4), 136 (2020).
  4. Wu, Z., et al. MASH explorer: A universal software environment for top-down proteomics. Journal of Proteome Research. 19 (9), 3867-3876 (2020).
  5. Konermann, L., Metwally, H., Duez, Q., Peters, I. Charging and supercharging of proteins for mass spectrometry: recent insights into the mechanisms of electrospray ionization. Analyst. 144 (21), 6157-6171 (2019).
  6. Bourmaud, A., Gallien, S., Domon, B. Parallel reaction monitoring using quadrupole-Orbitrap mass spectrometer: Principle and applications. Proteomics. 16 (15-16), 2146-2159 (2016).
  7. Hart-Smith, G. A review of electron-capture and electron-transfer dissociation tandem mass spectrometry in polymer chemistry. Analitica Chimica Acta. 808, 44-55 (2014).
  8. Brodbelt, J. S., Morrison, L. J., Santos, I. Ultraviolet photodissociation mass spectrometry for analysis of biological molecules. Chemical Reviews. 120 (7), 3328-3380 (2020).
  9. Karas, M., Bachmann, D., Bahr, U., Hillenkamp, F. Matrix-assisted ultraviolet-laser desorption of nonvolatile compounds. International Journal of Mass Spectrometry and Ion Processes. 78, 53-68 (1987).
  10. Karas, M., Bachmann, D., Hillenkamp, F. Influence of the wavelength in high-irradiance ultraviolet-laser desorption mass-spectrometry of organic-molecules. Analytical Chemistry. 57 (14), 2935-2939 (1985).
  11. Tanaka, K., et al. Protein and polymer analyses up to m/z 100 000 by laser ionization time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 2 (8), 151-153 (1988).
  12. Resemann, A., et al. Top-down de Novo protein sequencing of a 13.6 kDa camelid single heavy chain antibody by matrix-assisted laser desorption ionization-time-of-flight/time-of-flight mass spectrometry. Analytical Chemistry. 82 (8), 3283-3292 (2010).
  13. Suckau, D., Resemann, A. T3-sequencing: targeted characterization of the N- and C-termini of undigested proteins by mass spectrometry. Analytical Chemistry. 75 (21), 5817-5824 (2003).
  14. Mikhael, A., Jurcic, K., Fridgen, T. D., Delmas, M., Banoub, J. Matrix-assisted laser desorption/ionization time-of-flight/time-of-flight tandem mass spectrometry (negative ion mode) of French Oak Lignin: A Novel Series of Lignin and Tricin Derivatives attached to Carbohydrate and Shikimic acid Moieties. Rapid Communications in Mass Spectrometry. 34 (18), 8841 (2020).
  15. Demirev, P. A., Feldman, A. B., Kowalski, P., Lin, J. S. Top-down proteomics for rapid identification of intact microorganisms. Analytical Chemistry. 77 (22), 7455-7461 (2005).
  16. Fagerquist, C. K. Unlocking the proteomic information encoded in MALDI-TOF-MS data used for microbial identification and characterization. Expert Review of Proteomics. 14 (1), 97-107 (2017).
  17. Gu, C., Tsaprailis, G., Breci, L., Wysocki, V. H. Selective gas-phase cleavage at the peptide bond C-terminal to aspartic acid in fixed-charge derivatives of Asp-containing peptides. Analytical Chemistry. 72 (23), 5804-5813 (2000).
  18. Herrmann, K. A., Wysocki, V. H., Vorpagel, E. R. Computational investigation and hydrogen/deuterium exchange of the fixed charge derivative tris(2,4,6-trimethoxyphenyl) phosphonium: implications for the aspartic acid cleavage mechanism. Journal of the American Society for Mass Spectrometry. 16 (7), 1067-1080 (2005).
  19. Rozman, M. Aspartic acid side chain effect-experimental and theoretical insight. Journal of the American Society for Mass Spectrometry. 18 (1), 121-127 (2007).
  20. Yu, W., Vath, J. E., Huberty, M. C., Martin, S. A. Identification of the facile gas-phase cleavage of the Asp-Pro and Asp-Xxx peptide bonds in matrix-assisted laser desorption time-of-flight mass spectrometry. Analytical Chemistry. 65 (21), 3015-3023 (1993).
  21. Luethy, P. M., Johnson, J. K. The use of Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry (MALDI-TOF MS) for the identification of pathogens causing sepsis. The Journal of Applied Laboratory Medicine. 3 (4), 675-685 (2019).
  22. Knabl, L., Lass-Florl, C. Antifungal susceptibility testing in Candida species: current methods and promising new tools for shortening the turnaround time. Expert Review of Anti-Infective Therapy. 18 (8), 779-787 (2020).
  23. Gould, O., Ratcliffe, N., Krol, E., de Lacy Costello, B. Breath analysis for detection of viral infection, the current position of the field. Journal of Breath Research. 14 (4), 041001 (2020).
  24. Fagerquist, C. K., et al. Sub-speciating Campylobacter jejuni by proteomic analysis of its protein biomarkers and their post-translational modifications. Journal of Proteome Research. 5 (10), 2527-2538 (2006).
  25. Sandrin, T. R., Goldstein, J. E., Schumaker, S. MALDI TOF MS profiling of bacteria at the strain level: a review. Mass Spectrometry Reviews. 32 (3), 188-217 (2013).
  26. Christner, M., et al. Rapid MALDI-TOF mass spectrometry strain typing during a large outbreak of Shiga-Toxigenic Escherichia coli. PLoS One. 9 (7), 101924 (2014).
  27. Masaki, H., Ohta, T. Colicin E3 and its immunity genes. Journal of Molecular Biology. 182 (2), 217-227 (1985).
  28. Michel, B. After 30 years of study, the bacterial SOS response still surprises us. PLoS Biology. 3 (7), 255 (2005).
  29. Fagerquist, C. K., Sultan, O. Induction and identification of disulfide-intact and disulfide-reduced beta-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS and top-down proteomics. Analyst. 136 (8), 1739-1746 (2011).
  30. Fagerquist, C. K., Sultan, O. Top-down proteomic identification of furin-cleaved alpha-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS. Journal of Biomedicine & Biotechnology. 2010, 123460 (2010).
  31. Fagerquist, C. K., et al. Top-down proteomic identification of Shiga toxin 2 subtypes from Shiga toxin-producing Escherichia coli by matrix-assisted laser desorption ionization-tandem time of flight mass spectrometry. Applied and Environmental Microbiology. 80 (9), 2928-2940 (2014).
  32. Fagerquist, C. K., Zaragoza, W. J., Lee, B. G., Yambao, J. C., Quiñones, B. Clinically-relevant Shiga toxin 2 subtypes from environmental Shiga toxin-producing Escherichia coli identified by top-down/middle-down proteomics and DNA sequencing. Clinical Mass Spectrometry. 11, 27-36 (2019).
  33. Fagerquist, C. K., Lee, B. G., Zaragoza, W. J., Yambao, J. C., Quiñones, B. Software for top-down proteomic identification of a plasmid-borne factor (and other proteins) from genomically sequenced pathogenic bacteria using MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 438, 1-12 (2019).
  34. Fagerquist, C. K., Rojas, E. ACS Fall 2020 Virtual Meeting & Expo. American Chemical Society, Virtual. , (2020).
  35. Fagerquist, C. K., Sultan, O. A new calibrant for matrix-assisted laser desorption/ionization time-of-flight-time-of-flight post-source decay tandem mass spectrometry of non-digested proteins for top-down proteomic analysis. Rapid Communications in Mass Spectrometry. 26 (10), 1241-1248 (2012).
  36. Fagerquist, C. K., Zaragoza, W. J. Complementary b/y fragment ion pairs from post-source decay of metastable YahO for calibration of MALDI-TOF-TOF-MS/MS. International Journal of Mass Spectrometry. 415, 29-37 (2017).
  37. Quinones, B., Yambao, J. C., Lee, B. G. Draft genome sequences of Escherichia coli O113:H21 strains recovered from a major produce production region in California. Genome Announcements. 5 (44), 01203-01217 (2017).
  38. Harrison, A. G. The gas-phase basicities and proton affinities of amino acids and peptides. Mass Spectrometry Reviews. 16 (4), 201-217 (1997).
  39. Fagerquist, C. K. Polypeptide backbone cleavage on the C-terminal side of asparagine residues of metastable protein ions analyzed by MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 457, (2020).
  40. Fagerquist, C. K., Zaragoza, W. J. Mass Spectrometry: Application to the Clinical Lab 2019 (MSACL 2019). , Palm Springs, CA. (2019).
  41. Fagerquist, C. K., Zaragoza, W. J. Bacteriophage cell lysis of Shiga toxin-producing Escherichia coli for top-down proteomic identification of Shiga toxins 1 & 2 using matrix-assisted laser desorption/ionization tandem time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 30 (6), 671-680 (2016).
  42. Fagerquist, C. K., et al. Web-based software for rapid top-down proteomic identification of protein biomarkers, with implications for bacterial identification. Applied and Environmental Microbiology. 75 (13), 4341-4353 (2009).
  43. Fagerquist, C. K., et al. Rapid identification of protein biomarkers of Escherichia coli O157:H7 by matrix-assisted laser desorption ionization-time-of-flight-time-of-flight mass spectrometry and top-down proteomics. Analytical Chemistry. 82 (7), 2717-2725 (2010).
  44. Maus, A., Bisha, B., Fagerquist, C., Basile, F. Detection and identification of a protein biomarker in antibiotic-resistant Escherichia coli using intact protein LC offline MALDI-MS and MS/MS. Journal of Applied Microbiology. 128 (3), 697-709 (2020).

Tags

Scheikunde Nummer 171
Identificatie van antibacteriële immuniteitseiwitten in <em>Escherichia coli</em> met behulp van MALDI-TOF-TOF-MS/MS en top-down proteomische analyse
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Fagerquist, C. K., Rojas, E.More

Fagerquist, C. K., Rojas, E. Identification of Antibacterial Immunity Proteins in Escherichia coli using MALDI-TOF-TOF-MS/MS and Top-Down Proteomic Analysis. J. Vis. Exp. (171), e62577, doi:10.3791/62577 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter