Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Identifiering av antibakteriella immunitetsproteiner i Escherichia coli med MALDI-TOF-TOF-MS/MS och top-down proteomisk analys

Published: May 23, 2021 doi: 10.3791/62577

Summary

Här presenterar vi ett protokoll för snabb identifiering av proteiner som produceras av genomiskt sekvenserade patogena bakterier med MALDI-TOF-TOF tandem masspektrometri och uppifrån och ner proteomisk analys med programvara som utvecklats internt. Metastabila proteinjoner fragment på grund av aspartsyra effekten och denna specificitet utnyttjas för protein identifiering.

Abstract

Detta protokoll identifierar immunitetsproteinerna i de bakteriedödande enzymerna: colicin E3 och bakterian, som produceras av en patogen Escherichia coli-stam med antibiotikainduktion och identifieras av MALDI-TOF-TOF tandem masspektrometri och uppifrån och ner proteomisk analys med programvara som utvecklats internt. Immunitet proteinet av colicin E3 (Im3) och immunitet proteinet av bakteriin (Im-Bac) identifierades från framträdande b- och/eller y-typ fragment joner som genereras av polypeptid stamnät klyvning (PBC) på C-terminal sidan av aspartic syra, glutamic syra och asparagin rester av aspartic syra effekt fragmentering mekanism. Programvaran skannar snabbt i silico protein sekvenser härrör från hela genomsekvensering av bakteriestammen. Programvaran tar också iterativt bort aminosyrarester av en proteinsekvens i händelse av att den mogna proteinsekvensen trunkeras. En enda proteinsekvens besatt massa och fragmentjoner överensstämmer med de som detekteras för varje immunitetsprotein. Kandidatsekvensen inspekterades sedan manuellt för att bekräfta att alla upptäckta fragmentjoner kunde tilldelas. N-terminalen methionine av Im3 togs bort post-translationally, medan Im-Bac hade den fullständiga sekvensen. Dessutom fann vi att endast två eller tre icke-kompletterande fragmentjoner som bildas av PBC är nödvändiga för att identifiera rätt proteinsekvens. Slutligen identifierades en promotor (SOS box) uppströms av de antibakteriella och immunitet gener i en plasmid genom av bakteriell stam.

Introduction

Analys och identifiering av osmälta proteiner genom masspektrometri kallas proteomisk analys uppifrån och ned1,2,3,4. Det är nu en etablerad teknik som använder elektrosprayjonisering (ESI)5 och högupplösta massanalysatorer6, och sofistikerade dissociationstekniker, t.ex. elektronöverförings dissociation (ETD), elektronfångst dissociation (ECD)7,ultraviolett foto-dissociation (UV-PD)8, etc.

Den andra mjuka joniseringstekniken är matrisassisterad laserdesorption/jonisering (MALDI)9,10,11 som har använts mindre omfattande för top-down-analysen, delvis för att den främst är kopplad till time-of-flight (TOF) massanalysatorer, som har begränsad upplösning jämfört med andra massanalysatorer. Trots dessa begränsningar har MALDI-TOF- och MALDI-TOF-TOF-instrument utnyttjats för snabb top-down-analys av rena proteiner och fraktionerade och odragna blandningar av proteiner. För identifiering av rena proteiner är in-source decay (ISD) en särskilt användbar teknik eftersom den möjliggör massspektrometri (MS) analys av ISD-fragmentjoner, liksom tandemmasspektrometri (MS/MS) av proteinjonfragment som ger sekvensspecifikt fragment ofta från N- och C-termini av målproteinet, analogt med Edman sekvensering12,13 . En nackdel med ISD-metoden är att provet, som i Edman-sekvensering, endast får innehålla ett protein. Det enda proteinkravet beror på behovet av otvetydig tillskrivning av fragmentjoner till en prekursorjon. Om två eller flera proteiner finns i ett prov kan det vara svårt att tilldela vilka fragmentjoner som tillhör vilka prekursorjoner.

Fragmentjon-/prekursorjonattribution kan åtgärdas med MALDI-TOF-TOF-MS/MS. Som med alla klassiska MS/MS-experiment är prekursorjoner massvalda/isolerade före fragmentering, och de fragmentjoner som detekteras kan hänföras till en specifik prekursorjon. De dissociationstekniker som är tillgängliga för detta tillvägagångssätt är dock begränsade till främst högenergikollision inducerad dissociation (HE-CID)14 eller efter-source decay (PSD)15,16. HE-CID och PSD är mest effektiva på fragmentering peptider och små proteiner, och sekvenstäckningen kan i vissa fall begränsas. Dessutom resulterar PSD i polypeptid stamklyvning (PBC) främst på C-terminalsidan av aspartiska och glutaminsyrarester av ett fenomen som kallas aspartsyraeffekten17,18,19,20.

MALDI-TOF-MS har också hittat en nischapplikation i taxonomisk identifiering av mikroorganismer: bakterier21, svampar22och virus23. MS-spektra används till exempel för att identifiera okända bakterier i jämförelse med ett referensbibliotek med MS-spektra av kända bakterier med hjälp av mönsterigenkänningsalgoritmer för jämförelse. Detta tillvägagångssätt har visat sig vara mycket framgångsrikt på grund av dess hastighet och enkelhet, även om det kräver en övernattning av isolatet. De proteinjoner som detekteras genom detta tillvägagångssätt (vanligtvis under 20 kDa) omfattar ett ms-fingeravtryck som möjliggör taxonomisk upplösning på släkt- och artnivå och i vissa fall vid underarterna24 och stamnivå25,26. Det finns dock fortfarande ett behov av att inte bara taxonomiskt klassificera potentiellt patogena mikroorganismer utan också identifiera specifika virulensfaktorer, toxiner och antimikrobiell resistens (AMR) faktorer. För att uppnå detta mäts massan av peptider, proteiner eller små molekyler med MS och isoleras och fragmenteras därefter av MS/MS.

Patogena bakterier bär ofta cirkulära bitar av DNA som kallas plasmider. Plasmider, tillsammans med profager, är en viktig vektor för horisontell genöverföring mellan bakterier och är ansvariga för den snabba spridningen av antimikrobiell resistens och andra virulensfaktorer över bakterier. Plasmider kan också bära antibakteriella (AB) gener, t.ex. colicin och baktericin. När dessa gener uttrycks och proteinerna utsöndras, agerar de för att inaktivera proteinöversättningsmaskineriet hos närliggande bakterier som upptar samma miljönisch27. Men dessa bakteriedödande enzymer kan också utgöra en risk för värden som producerade dem. Följaktligen uttrycks en gen av värden som specifikt hämmar funktionen hos ett AB-enzym och kallas dess immunitetsprotein (Im).

DNA-skadliga antibiotika som mitomycin-C och ciprofloxacin används ofta för att inducera SOS-svaret i Shiga toxinproducerande E. coli (STEC) vars Shiga toxingen(stx) finns i ett profaggenom som finns i bakteriegenomet28. Vi har använt antibiotikainduktion, MALDI-TOF-TOF-MS/MS, och uppifrån och ner proteomisk analys tidigare för att upptäcka och identifiera Stx typer och subtyper som produceras av STEC stammar29,30,31,32. I det tidigare arbetet odlades STEC O113:H21 stam RM7788 över natten på agar media kompletterat med mitomycin-C. Men istället för att upptäcka den förväntade B-underenheten av Stx2a vid m/z ~7816 upptäcktes en annan proteinjon vid m/z ~7839 och identifierades som ett plasmidkodat hypotetiskt protein av okänd funktion33. I det aktuella arbetet identifierade vi två plasmidkodade AB-Im-proteiner som produceras av denna stam med hjälp av antibiotikainduktion, MALDI-TOF-TOF-MS/MS och uppifrån och ner proteomisk analys med fristående programvara utvecklad för att bearbeta och skanna i silico proteinsekvenser som härrör från helgenomsekvensering (WGS). Dessutom införlivades möjligheten till ändringar efter översättning (PTM) som involverar sekvens trunkering i programvaran. Immunitetsproteinerna identifierades med hjälp av denna programvara från den uppmätta massan av mogna proteinjon och sekvensspecifika fragmentjoner från PBC orsakade av aspartsyraeffekten och detekteras av MS/MS-PSD. Slutligen identifierades en promotor uppströms AB/Im-generna i ett plasmidgenom som kan förklara uttrycket av dessa gener när denna stam utsätts för ett DNA-skadligt antibiotikum. Delar av detta arbete presenterades på National American Chemical Society Fall 2020 Virtual Meeting & Expo (17-20 augusti 2020)34.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Mikrobiologisk provberedning

  1. Inokulera 25 ml Luriabuljong (LB) i ett koniskt rör på 50 ml med E. coli O113:H21 stam RM7788 (eller annan bakteriestam) från ett glycerollager med en steril 1 μL-slinga. Kapa röret och förkulturen vid 37 °C med skakningar (200 varv/min) i 4 timmar.
  2. Alikvot 100 μL förkulturerad buljong och sprids på en LB agarplatta kompletterad med 400 eller 800 ng/ml mitomycin-C. Odla agarplattor statiskt över natten i en inkubator vid 37 °C.
    VARNING: STEC stammar är patogena mikroorganismer. Utför alla mikrobiologiska manipuleringar, bortom odling, i ett BSL-2 biosäkerhetsskåp.
  3. Skörda bakterieceller från enstaka synliga kolonier med en steril 1 μL-slinga och överför till ett 2,0 ml O-ringfodrat skruvlock microcentrifugerör som innehåller 300 μL HPLC-klassat vatten. Kapa röret, virveln kort och centrifugera vid 11 337 x g i 2 minuter för att pelletera cellerna.

2. Masspektrometri

  1. Spot 0,75 μL alikvot av provsnanten på maldi-målet i rostfritt stål och låt den torka. Överlagra den torkade provfläcken med a0,75 μL alikvot av en mättad lösning av sinapinsyra i 33% acetonitril, 67% vatten och 0,2% trifluoreetsyra. Låt platsen torka.
  2. Analysera de torkade provfläckarna med hjälp av en MALDI-TOF-TOF-masspektrometer.
    1. När du har laddat MALDI-målet i masspektrometern klickar du på knappen för MS linjärt lägesförvärv i förvärvsprogramvaran. Ange det m/z-intervall som ska analyseras genom att ange m/z för de nedre och övre gränserna (t.ex. 2 kDa till 20 kDa) i deras respektive fält i programvaran för förvärvsmetoden.
    2. Klicka på exempelplatsen som ska analyseras på MALDI-målmallen i programvaran. Tryck sedan ned den vänstra musknappen och dra muspekaren över exempelplatsen för att ange det rektangulära område som ska provas för laserablation/jonisering. Släpp musknappen så initieras förvärvet. Samla in 1 000 laserbilder för varje provplats.
      DATAförvärv visas i realtid i fönstret för programvaruförvärv.
    3. Om inga joner upptäcks ökar du laserintensiteten genom att justera sliding scale bar under Laser Intensity i programvaran tills proteinjonsignalen detekteras. Detta kallas tröskelvärde.
      OBS: Före provpunktsanalysen kalibrerar du instrumentet externt i MS linjärt läge med proteinkalibranter vars m/z spänner över det område som analyseras, t.ex. En mellanliggande massa inom det angivna massområdet används som fokusmassa, t.ex. 9 kDa. Fokusmassan är den jon vars m/z är optimalt fokuserad för detektering av den linjära lägesdetektorn.
    4. När förvärvet av MS linjärt läge är klart klickar du på knappen för ms/MS-reflektronlägesförvärv i anskaffningsprogrammet. Ange den prekursormassa som ska analyseras i fältet Precursor Mass. Ange sedan en isoleringsbredd (i Da) i precursormassfönstret för den låga och höga masssidan av prekursormassan, t.ex. ±100 Da.
    5. Klicka på knappen CID Off. Klicka på knappen Metastable Suppressor ON. Justera laserintensiteten till minst 90 % av dess maximala värde genom att justera glidskalan under laserintensiteten i programvaran.
    6. Klicka på exempelplatsen som ska analyseras på MALDI-målmallen i programvaran. Tryck sedan ned den vänstra musknappen och dra muspekaren över provplatsen för att ange det rektangulära område som ska provas för laserablation/jonisering. Släpp musknappen så initieras förvärvet. Samla in 10 000 laserbilder för varje provplats.
      OBS: Före provpunktsanalysen bör instrumentet kalibreras externt i MS/MS-reflektorläge med hjälp av fragmentjoner från efterkällans sönderfall (PSD) i +1 laddningstillståndet för alkylerad tiooredoxin35.
  3. Bearbeta inte rådata från MS. Bearbeta MS/MS-PSD-rådata med hjälp av följande stegsekvens i den angivna ordningen: avancerad baslinjekorrigering (32, 0,5, 0,0) följt av brusborttagning (två standardavvikelser) följt av Gaussian-utjämning (31 poäng).
  4. Kontrollera MS/MS-PSD-data manuellt med hjälp av förekomsten av framträdande fragmentjoner som genereras av PBC19,20.
  5. Utvärdera MS/MS-data med avseende på det absoluta och relativa överflödet av fragmentjoner och deras signal-till-brus (S/N). Använd endast de mest rikliga fragmentjonerna för proteinidentifiering, särskilt om MS/MS-PSD-data är bullriga.

3. I silico protein databas konstruktion

  1. Generera en textfil som innehåller i silico proteinsekvenser av bakteriestammen, som kommer att skannas av Protein Biomarker Seeker programvara för proteinidentifiering. Proteinsekvenser härleds från helgenomsekvensering (WGS) av stammen som analyseras (eller en närbesläktad stam).
  2. Gå till NCBI/PubMeds (https://www.ncbi.nlm.nih.gov/protein/) webbplats för att ladda ner cirka 5 000 proteinsekvenser av den specifika bakteriestammen (t.ex. Escherichia coli O113:H21 stam RM7788) som analyseras. Den maximala nedladdningsstorleken är 200 sekvenser.
    1. Följaktligen kopierar och klistrar du in de 25 nedladdningarna i en enda textfil. Välj FASTA-format (text) för varje nedladdning.

4. Programvara för att använda proteinbiomarkörsökare

  1. Dubbelklicka på den körbara filen Protein Biomarker Seeker. Ett grafiskt gränssnittsfönster (GUI) visas (bild 1, övre panelen).
  2. Ange massan av proteinbiomarkören (mätt i MS-linjärt läge) i fältet Mogen proteinmassa. Ange sedan massmätningsfelet i fältet Masstolerans. Standardmassmätningsfelet är ±10 Da för ett 10 000 Da-protein.
  3. Klicka eventuellt på knappen Kompletterande b/y jon Protein Mass Calculator för att beräkna proteinmassan från ett förmodat kompletterande fragmentjonpar (CFIP eller b/y). Ett popup-fönster, Protein Mass Calculator Tool, visas (bild 1, nedre panelen).
    1. Ange m/z för den förmodade CFIP och klicka på knappen Lägg till par. Den beräknade proteinmassan kommer att visas.
    2. Kopiera och klistra in det här numret i fältet Mogen proteinmassa och stäng fönstret Protein Mass Calculator Tool.
  4. Välj en N-terminal SignalPeptidlängd genom att klicka på rutan Ange restbegränsning. Ett popup-fönster med en glidande skala och markör visas. Flytta markören till önskad signalpeptidlängd (högst 50). Om ingen signalpeptidlängd väljs kommer en obegränsad sekvens trunkering att utföras av programvaran.
  5. Under fragmentjontillståndet i det grafiska gränssnittet väljer du rester för polypeptids stamklyvning (PBC). Klicka på rutorna med en eller flera rester: D, E, N och/eller P.
    1. Klicka på knappen Ange fragmentjoner (+1) Som ska sökas. En popup-fragmentsida visas. Klicka sedan på knappen Lägg till fragmentjon, som motsvarar antalet fragmentjoner som ska matas in, dvs. ett klick för varje fragmentjon. Ett listningsfält visas för varje fragmentjon som ska anges.
    2. Ange fragmentjonernas m/z och deras tillhörande m/z-tolerans. När du är klar klickar du på knappen Spara och stäng.
      OBS: En rimlig m/z-tolerans är ±1,5.
    3. Välj det minsta antalet fragmentjoner som måste matchas för en identifiering genom att bläddra till önskat nummer i rutan till höger om Hur många fragmentjoner som behöver matchas.
      OBS: Tre matcher bör vara tillräckligt.
    4. Välj cysteinrester som ska oxideras genom att klicka på motsvarande cirkel. Om inga proteinidentifieringar hittas efter sökningen, upprepa sökningen med cysteiner i deras reducerade tillstånd. Om inga identifieringar hittas efter sökningen breddar du fragmentjontoleransen till ±3 och upprepar sökningen.
  6. Klicka på knappen Välj FASTA-fil under Filinställningarnaför att bläddra bland och välja FASTA-filen (text) som innehåller in silico-proteinsekvenserna av bakteriestammen som tidigare konstruerats i protokollstegen 3.1 till 3.2. Välj sedan en utdatamapp och skapa ett utdatafilnamn.
  7. Klicka på knappen Kör sök på filposter. Ett popup-fönster visas med titeln Bekräfta sökparametrar (bild 1, nedre panelen) som visar sökparametrarna innan sökningen påbörjas.
  8. Om sökparametrarna är korrekta klickar du på knappen Börja sökning. Om sökparametrarna inte är korrekta klickar du på knappen Avbryt och anger rätt parametrar igen. När sökningen har initierats stängs parameterfönstret och ett nytt popup-fönster med en förloppsindikator visas (bild 1, nedre panelen) som visar sökningens förlopp och en löpande räkning av antalet identifieringar som hittades.
  9. När sökningen är klar (några sekunder) stängs förloppsindikatorn automatiskt och en sammanfattning av sökningen visas i fältet Logg i gui(bild 2, övre panelen). Dessutom visas ett nytt popup-fönster som visar proteinidentifieringen om någon (bild 2, nedre panelen).
    OBS: I silicoproteinsekvenser med okända rester, t.ex. U eller X, hoppas automatiskt över från analysen och dessa sekvenser rapporteras därefter med ett separat popup-fönster för att varna operatören om vilka (om några) sekvenser som hoppades över när sökningen slutfördes.

5. Bekräftelse efter sökning av proteinsekvens

  1. Bekräfta riktigheten av en kandidatsekvens genom manuell analys.
    OBS: Syftet med Protein Biomarker Seeker-programvaran är att identifiera en proteinsekvens med hög noggrannhet genom att eliminera många uppenbart felaktiga proteinsekvenser från övervägande och införliva sekvens trunkering som en möjlig PTM i det mogna proteinet. Eftersom antalet möjliga kandidatsekvenser som returneras är få är manuell bekräftelse hanterbar.
  2. Generera en tabell över de genomsnittliga m/z-fragmentjonerna av b- och y-typ i kandidatsekvensen med hjälp av masspektrometri eller proteomisk programvara som har sådan funktionalitet. Jämför medelvärdet m/z av silicofragmentjoner på C-terminalsidan av D-, E-och N-rester (och på N-terminalsidan av P-rester) med m/z av framträdande fragmentjoner från MS/MS-PSD-data.
    OBS: De mest framträdande MS/MS-PSD fragmentjonerna bör enkelt matchas med D-, E-och N-associerade i silico fragmentjoner. Aspartic syra effekt fragmentering mekanism är dock mindre effektiv nära N- eller C-termini i en proteinsekvens36.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Figur 3 (övre panelen) visar MS för STEC O113:H21 stam RM7788 odlas över natten på LBA kompletterad med 400 ng/mL mitomycin-C. Toppar vid m/z 7276, 7337 och 7841 hade tidigare identifierats som kallchockprotein C (CspC), kallchockprotein E (CspE) och ett plasmidburet protein med okänd funktion, respektive33. Proteinjonen vid m/z 9780 [M+H]+ analyserades av MS/MS-PSD enligt figur 3 (nedre panelen). Prekursorjonen isolerades med ett TIS-fönster (timed-ion) ±100 Da. Fragmentjoner identifieras av deras m/z och typ/nummer. Fragmentjonen vid m/z 2675.9 (markerad med en stjärna) är spridning från dissociationen av den metastabila proteinjonen vid m/z 9655 som visas i figur 3 (övre panelen). Det teoretiska medelvärdet m/z för varje fragmentjon visas inom parentes baserat på PBC i sekvensen av kolicin E3 immunitetsprotein (Im3) som visas ovan. Platser för PBC markeras med en röd asterisk med motsvarande fragmentjon(er) producerade. N-terminal methionine understryks som betecknar att det post-translationally tas bort i det mogna proteinet. Sekvensen har en enda cysteinrester (boxad) och anses därför vara i sitt reducerade tillstånd.

Med hjälp av massan av proteinbiomarkören och några framträdande icke-kompletterande fragmentjoner: m/z 1813.8, 2128.9 och 4293.7 (tolerans ±1.5) (figur 1, bottenpanel) och begränsning av PBC till C-terminalsidan av D- och E-rester, rapporterades endast en kandidatsekvens av programvaran: Im3-proteinsekvens (utan dess N-terminal metionin)(figur 2) (figur 2 , nedre panelen). När du väljer fragmentjoner för en sökning bör det betonas att alla grupper av icke-kompletterande fragmentjoner förutsätter att summering av m/z för två fragmentjoner i gruppen (och subtrahering av två protoner) resulterar i en massa summa som inte faller inom biomarkörmassan och tillhörande masstolerans (±10 Da). Utkast WGS av RM7788 visade 5008 proteinsekvenser (öppna läsramar)37. Av dessa ~5 000 fullständiga proteinsekvenser uppfyllde 189 490 fullständiga och partiella sekvenser (obegränsad trunkering) biomarkörmassakriterierna (figur 2, övre panel). De sekvenser som passerar massakriterierna genomgår sedan i silico PBC på C-terminalsidan av D- och/eller E-rester. De resulterande fragmentjonerna som genereras jämförs sedan med de observerade fragmentjoner som anges. Kandidatsekvensen som rapporterades av programvaran baserades enbart på dess massa och tre D- och/eller E-specifika PBC-webbplatser. Den specificitet som uppnås genom en så liten mängd information kommer att diskuteras i nästa avsnitt.

Som visas i figur 3 (bottenpanel) är de vanligaste fragmentjonerna resultatet av PBC på C-terminalsidan av D- och E-rester via aspartsyraeffektfragmenteringsmekanismen19,20. Två CFIP observeras: b67/y17 (m/z 7645.1 / m/z 2128.9) och b70/y14 (m/z 7959.4 / m/z 1813.8). Dessa CFIP kan användas för att mer exakt beräkna massan av proteinprekursorjonen med hjälp av den enkla formeln: b (m/z) + y (m/z) - 2H+ = proteinmassa (Da)33. Med hjälp av de två CFIP får vi en genomsnittlig massa av proteinet: 9771,6 Da, vilket är närmare dess teoretiska värde på 9772,5 Da än proteinjonens uppmätta massa i MS-linjärt läge: 9779 Da (figur 3, övre panel). Endast ett fåtal CFIP upptäcktes eftersom de flesta av prekursor joner har joniserande proton beslagtogs på den enda arginin rester: R80. Arginin (237,0 kcal/mol 38) högre gasfasgrunditet (237,0 kcal/mol38)jämfört med en lysinrester (K) (221,8 kcal/mol38)är sannolikt ansvarig för förmånlig kvarhållande av joniserande proton vid den enda R-resterna.

Figur 4 (övre panel) visar MS för STEC O113:H21 stam RM7788 odlas över natten på LBA kompletterad med 800 ng/mL mitomycin-C. Figur 4 (övre panelen) är ganska lik figur 3 (övre panelen), även om det finns skillnader i det relativa överflöd av vissa proteinjoner på grund av skillnaderna i antibiotikakoncentrationer som används. Det finns också små förändringar i proteinbiomarkör m/z som återspeglar skillnader i extern kalibrering av instrumentet på olika dagar. Återigen är proteinjonerna vid m/z 7272, 7335 och 7838 CspC, CspE respektive ett plasmidburet protein. Dessutom detekterar vi Im3-proteinjonen vid m/z 9778 (om än med mindre överflöd än i figur 3) samt en proteinjon vid m/z 9651 [M+H]+. Figur 4 (nedre panelen) visar MS/MS-PSD för proteinprekursorjonen vid m/z 9651. Prekursorjonen isolerades med hjälp av ett smalare och asymmetriskt TIS fönster på -75/+60 Da för att eliminera bidrag av intilliggande proteinjoner vid m/z 9539 och 9778. Fragmentjoner identifieras med m/z och typ/nummer. Sekvensen av immunitetsproteinet av bakteriion (Im-Bac) visas ovan. Platser för PBC markeras med en röd asterisk med motsvarande fragmentjoner. Det teoretiska medelvärdet m/z för varje fragmentjon visas också inom parenteser i spektrumet. Im-Bac-sekvensen har också en enda cysteinrester (boxad) och anses därför vara i sitt reducerade tillstånd.

Med hjälp av proteinbiomarkörmassan, tre framstående icke-kompletterande fragmentjoner: m/z 2675.4, 3853.5 och 5772.8 (±1.50 tolerans) från figur 4 och begränsning av PBC till endast C-terminalsidan av D- och/eller E- och/eller asparagine (N)-rester, rapporterades endast en kandidatsekvens av programvaran: Im-Bac protein. Kandidatsekvensen hämtades efter skanning av 191 375 fullständiga eller partiella sekvenser som uppfyllde kriterierna för biomarkörmassa och tolerans (±10 Da). Kandidatsekvensen identifierades av programvaran baserat enbart på dess massa och tre D- och/eller E- och/eller N-specifika PBC-webbplatser.

De mest framträdande fragmentjonerna i figur 4 (bottenpanelen) var återigen resultatet av PBC på C-terminalsidan av D- och/eller E-rester och även på N-terminalsidan av en av P-resterna20. Vi observerar också PBC på C-terminalsidan av en N-rester som också sannolikt kommer att uppstå av en aspartsyra effektliknande fragmenteringsmekanism39,40. Svagheten hos proteinprekursorjonsignalen resulterar i ett begränsat antal tolkningsbara fragmentjoner. Noggrannheten hos fragmentjonen m/z minskar med fragmentjonens överflöd. Ingen CFIP upptäcktes förmodligen på grund av att joniserande proton beslagtas vid den enda arginin rester (R74) av protein jon sekvensen. Alla fragmentjoner innehåller R74 rester, överensstämmer med denna hypotes.

Arrangören av antibakteriella immunitetsgener
Figur 5 visar en del av 6482 bp contig00100 av E. coli stam RM7788 (GenBank: NWVS01000096.1) från helgenom hagelgevär sekvensering37. Kodningsregionerna för colicin E3, dess immunitetsprotein (Im3), immunitetsproteinet av bakteriin (Im-Bac) och ett lysprotein markeras i gult. Uppströms kodningsregionen för colicin E3-genen är -35-regionen, Pribnow-lådan (PB), inverterad upprepning av SOS-lådan, Shine-Dalgarno/ribosomal bindningsställe (SD/RBS)27. Det finns en nio bas-par intergen region mellan colicin E3 och Im3. LexA (ett förtryckarprotein och ett autopeptidas) binder till SOS-lådan som blockerar uttrycket av gener nedströms. Vid DNA-skador (t.ex. UV-strålning eller DNA-skadliga antibiotika) genomgår LexA självklyvning som möjliggör uttryck av gener nedströms27,28. Således är uttrycket av dessa två immunitetsproteiner förenligt med exponering av denna stam för ett DNA-skadligt antibiotikum.

Figure 1
Bild 1: Skärmdumpar av Protein Biomarker Seeker programvara. Topppanel: Grafiskt användargränssnitt (GUI) för Protein Biomarker Seeker-programvaran. Nedersterade paneler: Popup-fönster i Protein Mass Calculator Tool, Fragment Page, Confirm Search Parameters och Search progress bar. Klicka här för att se en större version av den här figuren.

Figure 2
Figur 2: Sökresultat för en proteinidentifiering med hjälp av Protein Biomarker Seeker programvara. Övre panel: Sammanfattning av sökresultat som visas i loggfältet i programvaru-GUI. Nedersta panel: Ett popup-fönster som visar en proteinidentifiering med hjälp av programvaran. Klicka här för att se en större version av den här figuren.

Figure 3
Figur 3: Massspektrometrianalys av STEC O113:H21 stam RM7788. Topppanel: MS av STEC O113:H21 stam RM7788 odlas över natten på LBA kompletterad med 400 ng/mL mitomycin-C. Nedre panel: MS/MS-PSD för proteinprekursorjonen vid m/z 9780 (övre panel). Prekursorjonen isolerades med ett TIS-fönster ±100 Da. Fragmentjoner identifieras av deras m/z och jontyp. Sekvensen av immunitetsproteinet för kolicin E3 (Im3) visas. Basrester (platser för eventuell laddningsbindning) markeras i blått. PBC markeras med en röd asterisk med motsvarande fragmentjon(er) genererade. Det teoretiska medelvärdet m/z för varje fragmentjoner visas inom parentes. Klicka här för att se en större version av den här figuren.

Figure 4
Figur 4: Massspektrometrianalys av STEC O113:H21 stam RM7788. Topppanel: MS av STEC O113:H21 stam RM7788 odlas över natten på LBA kompletterad med 800 ng/mL mitomycin-C. Nedre panel: MS/MS-PSD för proteinprekursorjonen vid m/z 9651 (övre panel). Prekursor jon isolerades med en asymmetrisk TIS fönster på -75 på den låga m/z sidan av föregångaren jon och +60 på den höga m/z sidan av föregångaren jon. Fragmentjoner identifieras av deras m/z- och jontyp. Sekvensen av immunitetsproteinet av bakteriion (Im-Bac) visas. Basrester (platser för eventuell laddningsbindning) markeras i blått. PBC markeras med en röd asterisk med motsvarande fragmentjon(er) genererade. Det teoretiska medelvärdet m/z för varje fragmentjon visas inom parentes. Klicka här för att se en större version av den här figuren.

Figure 5
Figur 5: Analys av en del av plasmidgenomet som bärs av E. coli O113:H21 stam RM7788. En del av 6482 bp contig00100 av E. coli O113:H21 stam RM7788 (GenBank: NWVS01000096.1) från hela genom hagelgevär sekvensering37. Klicka här för att se en större version av den här figuren.

Kompletterande fil 1 (S1 Im3): Resultat av benchmarking analys av programvara med hjälp av utvalda fragmentjoner av Im3 (från figur 3, nedre panelen). Klicka här för att ladda ner den här filen.

Kompletterande fil 2 (S2 ImBac): Resultat av benchmarking analys av programvara med hjälp av utvalda fragmentjoner av Im-Bac (från figur 4, nedre panelen). Klicka här för att ladda ner den här filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Protokollöverväganden
De främsta styrkorna med det nuvarande protokollet är dess hastighet, enkelhet i provberedning och användning av ett instrument som är relativt lätt att använda, tränas på och underhålla. Även om nedifrån och upp och uppifrån proteomisk analys av flytande kromatografi-ESI-HR-MS är allestädes närvarande och mycket överlägsen i många avseenden till top-down av MALDI-TOF-TOF, kräver de mer tid, arbetskraft och expertis. Instrumentkomplexitet kan ofta påverka om vissa instrumentplattformar sannolikt kommer att antas av forskare som inte formellt utbildats i masspektrometri. Top-down-metoden med MALDI-TOF-TOF är avsedd att utöka analysen av MALDI-TOF-MS utöver dess nuvarande användning för taxonomisk identifiering av bakterier i kliniska mikrobiologiska laboratorier samtidigt som den inte dramatiskt ökar det arbete, komplexitet eller expertis som krävs för analys.

Protokollet använder inte något mekaniskt (eller elektriskt) celllyssteg. Även om utsöndrade eller extracellulära proteiner kan detekteras med hjälp av protokollet, utvecklades först en tidigare version av denna metod för påvisande av Shiga-toxin (Stx) från STEC-stammar där antibiotikainduktion utlöser bakteriell SOS-respons som resulterar i uttryck av faggener, inklusive stx samt sena faggener som är ansvariga för bakteriell celllys41 . Vi fann att antibiotikainducerad celllys har vissa fördelar för detektion av Stx samt plasmidproteiner som har SOS-promotorer (nuvarande arbete). Visst kan mekanisk celllys (t.ex. pärlslagning) också användas (även om den inte används i det nuvarande arbetet). Mekanisk lys resulterar dock i att alla bakterieceller lyses (inte bara inducerade celler) vilket resulterar i att provet berikas med rikliga, mycket bevarade värdproteiner som kan göra detektion av fag- och plasmidproteiner från ett obetalt prov mer utmanande.

Antibiotikakoncentrationerna för en bakteriestam konstaterades vara allmänt reproducerbara med avseende på de antibiotikainducerade proteiner som upptäckts. Vi noterade variationer i det relativa protein överflöd med avseende på de antibiotika-inducerade proteiner som upptäckts. Eftersom vår analys är kvalitativ (inte kvantitativ) behöver proteinbiomarkörens överflöd endast vara tillräckligt för adekvat MS/MS-analys. En förmodad STEC-stam odlas först med en rad antibiotikakoncentrationer (t.ex. 300 ng/mL till 2 000 ng/ml mitomycin-C) för att bestämma den optimala koncentrationen så att den utlöser bakteriell SOS-respons samtidigt som den ger tillräckligt med bakterieceller för skörd. För STEC stam RM7788 fann vi att den optimala antibiotika koncentrationen för detektion av de identifierade biomarkörerna var 400 till 800 ng/mL mitomycin-C.

Förutom proteinsekvens trunkering kan E. coli-proteiner ha PMM som innebär tillsats av massa, t.ex. fosforylering, glykosylering etc. Eftersom MS/MS använder PSD för dissociation av ensedade metastabila proteinjoner (under 20 kDa i massa) som genereras av MALDI, skulle sådana PMM som är fästa vid resthalter sidokedjor sannolikt genomgå lätt dissociativ förlust eftersom PSD är en ergodisk dissociation teknik. Förekomsten av sådana PMM kan härledas från utseendet av en fragmentjon nära i massa till den ursprungliga prekursorjonen (minus PTM: s massa) i MS/ MS-data. Varken PSD eller programvaran skulle dock kunna identifiera var sådana PPM:er är anslutna. Dessutom kan programvaran endast identifiera proteiner från fragmentjoner av PBC och inte dissociativ förlust av små molekyler (t.ex. vatten eller ammoniak) eller PTMs som är fästa vid resthalternas sidokedjor. Men om fragmentjoner från PBC upptäcks, kan proteinet fortfarande identifieras med hjälp av programvaran genom att antingen bredda fönstret för proteinmassatolerans till att omfatta massan av PTM eller helt enkelt ange massan av proteinfragmentjonen som motsvarar dissociativ förlust av den misstänkta PTM. All identifiering av programvaran skulle vara av proteinsekvensen utan PTM. Intressant nog har vi inte upptäckt proteiner med fosforylering, glykosylering etc. i vårt bakteriearbete hittills. Detta kan dock bero på: deras relativa överflöd av MALDI, det massintervall som används: 2-20 kDa, att sådana PMM kan vara ovanligt labila och kanske inte överlever tillämpningen av MALDI-matrisen, eller att sådana PMM kan genomgå mycket snabb dissociativ förlust i källan innan joner accelereras från källan.

För närvarande innehåller programvaran inte cystein alkylation, och vårt provprotokoll innehåller inte ett disulfidreduktionssteg för cysteinrester. Protokollet har förtydligats för att indikera att sökningen ska drivas med cysteinrester i oxiderat tillstånd, och om ingen identifiering erhålls, sedan att utföra sökningen igen med cysteinrester i deras reducerade tillstånd. Om inga identifieringar hittas igen sänks tröskelvärdet för fragmentjontolerans till ±2 eller ±3 tröskelvärdet för fragmentjonmatchning så att sekvenser med cysteiner kan matchas oavsett om de förekommer i oxiderade och/eller reducerade tillstånd.

Proteomisk analys uppifrån och ner av MALDI-TOF-TOF masspektrometri
De flesta proteomiska analyser uppifrån och ned har uppnåtts med hjälp av ESI och högupplösta masspektrometriplattformar. Däremot har färre proteomiska analyser uppifrån och ned utförts med maldi-tof-tof-plattformar. Följaktligen finns det mycket lite proteomisk programvara uppifrån och ner för analys av ensedladdade metastabila proteinjoner som genereras och analyseras av MALDI-TOF-TOF-MS/MS-PSD som utnyttjar aspartsyraeffekten för fragmentering15,42. Det finns ett antal skäl till detta. För det första är joniseringseffektiviteten hos MALDI partisk mot lägre molekylviktspeptider och proteiner, och denna bias är särskilt uppenbar med en blandning av proteiner som skulle hittas i en obefraktad bakteriell cell lysate. För det andra genererar MALDI lågladdningstillstånd, och det finns liten eller ingen Coulomb-avstötning för att underlätta proteinjondissociation. För det tredje är PSD-sekvenstäckningen ganska begränsad till skillnad från andra tekniker ECD7, ETD7, UV-PD8, etc. För det fjärde minskar fragmenteringseffektiviteten hos PSD med ökande massa av proteinjonen. För det femte tenderar ergoda dissociationstekniker, såsom PSD, att resultera i lätt dissociativ förlust av PMM som är fästa vid rester, t.ex. fosforylering, glykosylering etc., vilket gör det utmanande att bestämma platsen för PTM-fastsättning. Trots dessa allvarliga begränsningar har top-down-analys med MALDI-TOF-TOF-MS/MS-PSD tydliga fördelar, t.ex. I kombination med i silico protein sekvenser härrör från WGS data, denna teknik kan ge snabb information innan andra mer tidskrävande och arbetsintensiva analyser är slutförda.

Protein Biomarker Seeker-programvaran utvecklades med intelliJ och skrevs i Java för att effektivt bearbeta och söka protein aminosyrasekvenser som härrör från WGS av en bakteriestam. Programvaran ändrades från en tidigare algoritm som fungerade som ett makro i Excel33. Vi bestämde oss för att utveckla en fristående version av programvaran med ett GUI-gränssnitt för att göra den mer användarvänlig samt ge ytterligare förbättringar.

I händelse av PTMs som involverar proteinsekvens trunkering, tar programvaran sekventiellt bort en aminosyrarester från N-ändstationen samtidigt som den iterativt lägger till rester av sekvensen tills massasumman uppfyller eller överstiger den uppmätta massan av den detekterade proteinbiomarkören. Även om denna process kan resultera i ett mycket stort antal proteinmassafragment (~ 200 000 från ~ 5000 fullständiga proteinsekvenser), har det fördelen att inte utesluta några potentiella proteinfragment från trunkeringen vid N-ändstationen eller C-ändstationen (eller båda) hur osannolik sådan trunkering än kan vara ur ett biologiskt perspektiv. Detta tillvägagångssätt kallas obegränsad trunkering. De vanligaste bakteriella PMM: er som involverar trunkering är dock avlägsnande av N-terminal metionin eller N-terminal signal peptid. Följaktligen tillåter programvaran också operatören att välja en övre gräns (50 rester) för rester från N-ändstationen, vilket resulterar i mycket färre proteinfragment som uppfyller proteinbiomarkörens massakriterier.

PBC på C-terminalsidan av D- och E-rester samt på N-terminalsidan av P-rester överensstämmer med aspartsyraeffektmekanismen, som har studerats i stor utsträckning både experimentellt och teoretiskt17,18,19,20. Införande av PBC på C-terminalsidan av N-rester inkluderades i programvaran på grund av en aspartsyra effektliknande mekanism som har observerats för ett antal metastabila proteinjoner i vårt laboratorium39,40. De mest rikliga fragmentjoner från dissociation av ensly laddade metastapel proteinjoner analyseras av MS/MS-PSD beror på aspartic syra effekt fragmentering mekanism. Operatören väljer de mest framträdande fragmentjonerna från MS/MS-PSD-data och anger deras m/z i programvaran samt en tillhörande fragmentjontolerans (±m/z). Fragmentjontoleransen kan justeras för varje fragmentjon för att återspegla dess relativa överflöd. En lämplig fragmentjontolerans kan variera mellan ±1,0 och ±2,5 m/z beroende på fragmentjonens absoluta överflöd samt dess relativa förekomst jämfört med bakgrundskemiskt brus. Vanligtvis, ju rikligare en fragmentjon, desto bättre är dess massnoggrannhet, vilket gör att en smalare fragmentjontolerans kan användas.

MS/MS-PSD-data för metastabila proteinjoner kan variera dramatiskt när det gäller deras komplexitet. Vissa MS/MS-PSD-spektra är lättare att tolka än andra. Det finns flera orsaker till detta fenomen. För det första kanske proteinjonen inte fragmenteras effektivt på analysens tidsskala (~ 10-30 μs) kanske för att den förblir vikt eller delvis vikt även efter solubilisering i MALDI-matrislösningen. För det andra, förutom PBC, kan metastabila proteinjoner genomgå dissociativ förlust av små molekyler, dvs ammoniak (-17 Da) eller vatten (-18 Da)15. En betydande bidragsgivare till spektral komplexitet verkar vara dissociativ förlust av ammoniak från sidokedjan av R-rester33. Vi har observerat en ökning av spektral komplexitet ms/MS-PSD data med antalet R-rester i protein sekvensen. Proteiner utan R-rester (YahO-protein36 och kallchockprotein CspC33,43), med en R-rest (kallchockprotein CspE33 och B-underenhet av Stx241), med två R-rester (hypotetiskt protein33), producerar MS/MS-PSD-spektra som är relativt okomplicerade och lätta att tolka. Men när antalet R-rester ökar till tre (HU-protein44), eller fyra (ubiquitin35ochkoldchockprotein CsbD33,43),ökar spektralkomplexiteten avsevärt. Programvaran jämför fragmentjoner från PBC vid rester som är specifika för aspartsyraeffektmekanismen endast eftersom detta är den mest tillgängliga dissociationskanalen för enskilt laddade metastabila proteinjoner analyserade av MS/MS-PSD. Programvaran innehåller inte fragmentjoner som härrör från dissociativ förlust (eller förluster) av små neutrala molekyler. Följaktligen är det viktigt att operatören inte väljer fragmentjoner som innehåller små neutrala dissociativa förluster. Fragmentjoner från PBC är vanligtvis de mest framträdande fragmentjonerna; Men när antalet R-rester i ett protein ökar till tre eller fyra, kan den mest rikliga fragmentjonen på en PBC-plats vara en som inkluderar en liten dissociativ förlust (eller förluster). Om ett sådant kluster av fragmentjoner (åtskilda av multiplar på 17 eller 18 m/z) upptäcks, bör fragmentjonen med den högsta m/z i ett kluster vara den som anges i fragmentjonsökningsparametrarna.

Det bör betonas att programvaran inte var utformad för operatörsfri proteomisk identifiering. Operatören måste välja vilka fragmentjoner från MS/MS-PSD-data som ska ingå i sökningen. Baserat på många experiment som har bekräftat aspartsyraeffekten av MS/MS-PSD, är dock de mest framträdande fragmentjonerna alltid resultatet av PBC på C-terminalsidan av D- eller E- eller N-rester. Verktyget med programvaran är att den eliminerar många uppenbart felaktiga sekvenser och hämtar bara några sannolika kandidater. Vissa kandidatsekvenser kan elimineras baserat på avsaknaden av en fragmentjon där en D-rest i en sekvens förväntas generera en framträdande fragmentjon. D-rester resulterar alltid i framträdande fragmentjoner i hela polypeptidstommen, utom när de ligger inom några rester av N- eller C-termini där aspartsyraeffektens effektivitet minskarmed 36.

Minsta antal PBC-platser som behövs för preliminär proteinidentifiering
En CFIP bildas av två identiska proteinprekursorjoner som separerar på samma PBC-plats men har sin joniserande proton på motsatta sidor av klyvningsplatsen. Även om en CFIP kan användas för att beräkna massan av proteinbiomarkören mer exakt (vilket möjliggör en minskning av proteinmassatoleransen under en sökning), är dess användbarhet för sekvensspecifik identifiering mindre användbar än för två icke-kompletterande fragmentjoner som bildas från två olika klyvningsplatser, vilket ger större identifierings specificitet. Den lätthet med vilken de två AB-Im-proteinerna identifierades fick oss att spekulera om det minsta antalet fragmentjoner som krävs för att preliminärt identifiera rätt proteinsekvens från tusentals proteiner eller proteinfragmentsekvenser. Vi bestämde oss snabbt för att det inte var antalet fragmentjoner i sig utan antalet icke-kompletterande fragmentjoner som är viktigt eftersom varje icke-kompletterande fragmentjon representerar en PBC-plats medan en CFIP representerar samma klyvningsplats. Identifierings specificitet härleds således från antalet PBC-platser som upptäckts, inte antalet fragmentjoner.

Det är möjligt att framgången med identifiering med endast tre fragmentjoner kan ha varit helt enkelt slumpartad. För att testa denna hypotes och för att eliminera partiskhet i valet av fragmentjoner skapade vi en benchmarkingmodul inom programvaran som slumpmässigt väljer fragmentjoner från en större pool av kompletterande och/ eller icke-kompletterande fragmentjoner. Den större fragmentjonpoolen valdes ut bland de 14 framträdande fragmentjoner som identifierades i figur 3 (nedre panelen) baserat på deras relativa överflöd.

Testprotokollet var följande. Med hjälp av en binär sökning valdes tre fragmentjoner slumpmässigt ut från poolen med 14 framträdande fragmentjoner i figur 3 (nedre panelen) (m/z 1813.8, 2128,9, 3881,3, 4293,7, 5158,0, 6505,0, 6619,9, 6939,4, 7645,1, 7959,4, 8022,7, 8136,2, 8583,3 och 896. En trefragmentsjonkohort jämfördes med i silicofragmentjoner från PBC på C-terminalsidan av D- eller E- eller N-rester samt en kombination av D & E och D & E & N. Denna jämförelse utfördes för varje enskild fragmentjonjon av en kohort, för de tre fragmentjonparen i en kohort och för kombinationen av trefragment jon av en kohort. För att en jämförelse ska räknas som en matchning måste både fragmentjoner av ett par och alla tre fragmentjoner av en kombination matcha med i silico fragmentjoner. Efter avslutad analys väljs en annan jonkohort med tre fragment slumpmässigt ut och analysen upprepas. Upprepning i fragmentjon val var tillåtet. Eftersom det finns 364 möjliga kombinationer [(n!/r!( n-r)!] av en jonkohort med tre fragment (r) från en pool med 14 fragmentjoner (n) utfördes endast 10 analyser som visas i S1Im3 (Kompletterande information).

Kravet på identifiering av tre fragment verkar vara ett allmänt fenomen som visas i kolumn 3_ABC i tabellerna 2-7, 9-10 (S1Im3). Alla räkningar på 1 i kolumnen 3_ABC motsvarar Im3-sekvensen (utan N-terminal methionin). Det enda felet i identifieringen inträffade eftersom fragmentjonen vid m/z 8136.2 (visas i figur 3, nedre panelen och markerad i grått i tabellerna 1 och 8) överskred fragmentjontoleransen (±1,5 m/z) som anges för analysen. Eftersom testalgoritmen kräver att alla fragmentjoner i en jonkohort med tre fragment matchas, skulle alla grupper som inkluderade fragmentjonen m/z 8136.2 inte identifiera/räkna rätt proteinsekvens.

Tabell 6 i S1Im3 visar att när två av tre fragmentjoner kompletterar varandra (markerade i gult) matchade fler felaktiga sekvenser kriterierna än de som observerades när alla tre fragmentjonerna inte kompletterade varandra. Som tidigare nämnts beror detta på att en CFIP motsvarar en enda PBC-plats, en tröskel som kan uppnås med många fler felaktiga i silico-sekvenser jämfört med att använda två icke-kompletterande fragmentjoner som motsvarar två PBC-platser, ett strängare kriterium.

En liknande analys utfördes på sex framträdande fragmentjoner (m/z 2675,4, 2904,5, 3076,2, 3853,5, 5657,5 och 5772,8) av Im-Bac som visas i figur 4 (nedre panelen). Till skillnad från Im3 har Im-Bac ingen urskiljbar CFIP, därför motsvarar de sex fragmentjonerna förmodligen sex PBC-platser. Eftersom det finns 20 möjliga kombinationer av en jonkohort med tre fragment utvalda från en pool med sex fragmentjoner, utfördes endast 10 analyser som visas i tabellerna för S2 Im-Bac (Kompletterande information). Im-Bac-sekvensen identifierades korrekt/räknades för alla trefragment jongrupper i kolumn 3_ABC i alla analyser. I fyra analyser matchades också en eller två felaktiga sekvenser. Detta lilla antal felaktiga sekvenser är dock ett hanterbart nummer för manuell bekräftelse.

Sammantaget verkar kompletterande och/eller icke-kompletterande fragmentjoner som motsvarar två eller tre PBC-webbplatser ge tillräcklig specificitet för att hämta en eller två kandidatsekvenser. Naturligtvis bör de fragmentjoner som valts av operatören vara relativt rikliga och ha bra S / N. En eller två fragmentjoner från en enda PBC-plats ger inte tillräcklig specificitet för att undvika att hämta ett ogenomförbart antal felaktiga sekvenser som måste bekräftas av operatören. Det är inte klart varför två eller tre PBC-webbplatser är tillräckliga, men en enda PBC-webbplats är tydligen inte tillräckligt specifik. Även om obegränsad trunkering resulterar i ~200 000 proteiner och proteinfragmentsekvenser som uppfyller proteinmassakriterierna, är det troligt att klyvningsplatsernas plats/restspecifika karaktär, dvs. C-terminalsidan av D-, E-och N-rester, bidrar till en kraftig minskning av möjliga sekvenser under fragmentjonjämförelse. Detta kan delvis bero på frekvensen av D-, E-och N-rester i bakteriella proteinsekvenser samt deras unika platser i proteinsekvenser över proteom av bakterier. Sura rester spelar en avgörande roll i proteinstruktur och lösningsmedelsinteraktioner. Följaktligen är deras frekvens och platser i den primära sekvensen kritiska om inte unika för proteinfunktionen och kan förklara varför endast ett fåtal PBC-platser är nödvändiga för att preliminärt identifiera rätt proteinsekvens bland hundratusentals felaktiga sekvenser.

Ur ett gasfaskemiperspektiv härrör betydelsen av D-, E-och N-rester från deras deltagande i en dissociationskanal som är tillgänglig vid låga inre energier av ensedladdade metastabila proteinjoner som genereras av MALDI och sönderfall av PSD20. Den relativt långa tidsskalan (~10-30 μs) av molekylär jonfragmentering med PSD innebär att proteinjonens inre energi randomiseras bland alla vibrations- och rotationsgrader av den molekylära jonen så att dissociation är ergodisk och statistisk. Det bör också påpekas att mekanismen för aspartsyraeffekt innebär en molekylär jon omorganisering som sker genom en sekvens av steg eller ett enda samordnat steg som involverar flera atomer tills en gynnsam geometri uppnås som sänker aktiveringsbarriären för PBC17,18,19.

Två plasmid-kodade antibakteriella immunitet proteiner produceras av en STEC stam identifierades med hjälp av ett protokoll som omfattar antibiotiska induktion, MALDI-TOF-TOF-MS/MS-PSD och uppifrån och ner proteomic analys. Dessa proteiner identifierades med hjälp av programvara som utvecklats internt som innehåller proteinets uppmätta massa och ett relativt litet antal sekvensspecifika fragmentjoner som bildas som ett resultat av aspartsyraeffekten. Programvaran jämför MS- och MS/MS-data med i silicoprotein- och proteinfragmentsekvenser som härrör från WGS-data. Även om programvaran inte tillhandahåller identifieringsmått eller poängsättning, eliminerar den en mycket hög andel felaktiga sekvenser som resulterar i ett mycket litet antal kandidatsekvenser (en eller två) som enkelt kan bekräftas genom manuell inspektion. Slutligen visade manuell inspektion av WGS data av denna bakteriell stam en promotor (SOS box) uppströms AB och Im gener i en plasmid genom, som rationaliserar uttryck av dessa gener på grund av exponering av DNA-skadliga antibiotika.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har inga intressekonflikter.

Acknowledgments

Protein Biomarker Seeker programvara är fritt tillgänglig (utan kostnad) genom att kontakta Clifton K. Fagerquist på clifton.fagerquist@usda.gov. Vi vill erkänna stöd för denna forskning av ARS, USDA, CRIS-bidrag: 2030-42000-051-00-D.

Materials

Name Company Catalog Number Comments
4000 Series Explorer software AB Sciex Version 3.5.3
4800 Plus MALDI TOF/TOF Analyzer AB Sciex
Acetonitrile Optima LC/MS grade Fisher Chemical A996-1
BSL-2 biohazard cabinet The Baker Company SG403A-HE
Cytochrome-C Sigma C2867-10MG
Data Explorer software AB Sciex Version 4.9
Focus Protein Reduction-Alkylation kit G-Biosciences 786-231
GPMAW software Lighthouse Data Version 10.0
Incubator VWR 9120973
LB Agar Invitrogen 22700-025
Luria Broth Invitrogen 12795-027
Lysozyme Sigma L4919-1G
Microcentrifuge Tubes, 2 mL, screw-cap, O-ring Fisher Scientific 02-681-343
MiniSpin Plus Centrifuge Eppendorf 22620207
Mitomycin-C (from streptomyces) Sigma-Aldrich M0440-5MG
Myoglobin Sigma M5696-100MG
Shaker MaxQ 420HP Model 420 Thermo Scientific Model 420
Sinapinic acid Thermo Scientific 1861580
Sterile 1 uL loops Fisher Scientific 22-363-595
Thioredoxin (E. coli, recombinant) Sigma T0910-1MG
Trifluoroacetic acid Sigma-Aldrich 299537-100G
Water Optima LC/MS grade Fisher Chemical W6-4

DOWNLOAD MATERIALS LIST

References

  1. Fornelli, L., et al. Accurate sequence analysis of a monoclonal antibody by top-down and middle-down orbitrap mass spectrometry applying multiple ion activation techniques. Analytical Chemistry. 90 (14), 8421-8429 (2018).
  2. Fornelli, L., et al. Top-down proteomics: Where we are, where we are going. Journal of Proteomics. 175, 3-4 (2018).
  3. He, L., et al. Top-down proteomics-a near-future technique for clinical diagnosis. Annals of Translational Medicine. 8 (4), 136 (2020).
  4. Wu, Z., et al. MASH explorer: A universal software environment for top-down proteomics. Journal of Proteome Research. 19 (9), 3867-3876 (2020).
  5. Konermann, L., Metwally, H., Duez, Q., Peters, I. Charging and supercharging of proteins for mass spectrometry: recent insights into the mechanisms of electrospray ionization. Analyst. 144 (21), 6157-6171 (2019).
  6. Bourmaud, A., Gallien, S., Domon, B. Parallel reaction monitoring using quadrupole-Orbitrap mass spectrometer: Principle and applications. Proteomics. 16 (15-16), 2146-2159 (2016).
  7. Hart-Smith, G. A review of electron-capture and electron-transfer dissociation tandem mass spectrometry in polymer chemistry. Analitica Chimica Acta. 808, 44-55 (2014).
  8. Brodbelt, J. S., Morrison, L. J., Santos, I. Ultraviolet photodissociation mass spectrometry for analysis of biological molecules. Chemical Reviews. 120 (7), 3328-3380 (2020).
  9. Karas, M., Bachmann, D., Bahr, U., Hillenkamp, F. Matrix-assisted ultraviolet-laser desorption of nonvolatile compounds. International Journal of Mass Spectrometry and Ion Processes. 78, 53-68 (1987).
  10. Karas, M., Bachmann, D., Hillenkamp, F. Influence of the wavelength in high-irradiance ultraviolet-laser desorption mass-spectrometry of organic-molecules. Analytical Chemistry. 57 (14), 2935-2939 (1985).
  11. Tanaka, K., et al. Protein and polymer analyses up to m/z 100 000 by laser ionization time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 2 (8), 151-153 (1988).
  12. Resemann, A., et al. Top-down de Novo protein sequencing of a 13.6 kDa camelid single heavy chain antibody by matrix-assisted laser desorption ionization-time-of-flight/time-of-flight mass spectrometry. Analytical Chemistry. 82 (8), 3283-3292 (2010).
  13. Suckau, D., Resemann, A. T3-sequencing: targeted characterization of the N- and C-termini of undigested proteins by mass spectrometry. Analytical Chemistry. 75 (21), 5817-5824 (2003).
  14. Mikhael, A., Jurcic, K., Fridgen, T. D., Delmas, M., Banoub, J. Matrix-assisted laser desorption/ionization time-of-flight/time-of-flight tandem mass spectrometry (negative ion mode) of French Oak Lignin: A Novel Series of Lignin and Tricin Derivatives attached to Carbohydrate and Shikimic acid Moieties. Rapid Communications in Mass Spectrometry. 34 (18), 8841 (2020).
  15. Demirev, P. A., Feldman, A. B., Kowalski, P., Lin, J. S. Top-down proteomics for rapid identification of intact microorganisms. Analytical Chemistry. 77 (22), 7455-7461 (2005).
  16. Fagerquist, C. K. Unlocking the proteomic information encoded in MALDI-TOF-MS data used for microbial identification and characterization. Expert Review of Proteomics. 14 (1), 97-107 (2017).
  17. Gu, C., Tsaprailis, G., Breci, L., Wysocki, V. H. Selective gas-phase cleavage at the peptide bond C-terminal to aspartic acid in fixed-charge derivatives of Asp-containing peptides. Analytical Chemistry. 72 (23), 5804-5813 (2000).
  18. Herrmann, K. A., Wysocki, V. H., Vorpagel, E. R. Computational investigation and hydrogen/deuterium exchange of the fixed charge derivative tris(2,4,6-trimethoxyphenyl) phosphonium: implications for the aspartic acid cleavage mechanism. Journal of the American Society for Mass Spectrometry. 16 (7), 1067-1080 (2005).
  19. Rozman, M. Aspartic acid side chain effect-experimental and theoretical insight. Journal of the American Society for Mass Spectrometry. 18 (1), 121-127 (2007).
  20. Yu, W., Vath, J. E., Huberty, M. C., Martin, S. A. Identification of the facile gas-phase cleavage of the Asp-Pro and Asp-Xxx peptide bonds in matrix-assisted laser desorption time-of-flight mass spectrometry. Analytical Chemistry. 65 (21), 3015-3023 (1993).
  21. Luethy, P. M., Johnson, J. K. The use of Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry (MALDI-TOF MS) for the identification of pathogens causing sepsis. The Journal of Applied Laboratory Medicine. 3 (4), 675-685 (2019).
  22. Knabl, L., Lass-Florl, C. Antifungal susceptibility testing in Candida species: current methods and promising new tools for shortening the turnaround time. Expert Review of Anti-Infective Therapy. 18 (8), 779-787 (2020).
  23. Gould, O., Ratcliffe, N., Krol, E., de Lacy Costello, B. Breath analysis for detection of viral infection, the current position of the field. Journal of Breath Research. 14 (4), 041001 (2020).
  24. Fagerquist, C. K., et al. Sub-speciating Campylobacter jejuni by proteomic analysis of its protein biomarkers and their post-translational modifications. Journal of Proteome Research. 5 (10), 2527-2538 (2006).
  25. Sandrin, T. R., Goldstein, J. E., Schumaker, S. MALDI TOF MS profiling of bacteria at the strain level: a review. Mass Spectrometry Reviews. 32 (3), 188-217 (2013).
  26. Christner, M., et al. Rapid MALDI-TOF mass spectrometry strain typing during a large outbreak of Shiga-Toxigenic Escherichia coli. PLoS One. 9 (7), 101924 (2014).
  27. Masaki, H., Ohta, T. Colicin E3 and its immunity genes. Journal of Molecular Biology. 182 (2), 217-227 (1985).
  28. Michel, B. After 30 years of study, the bacterial SOS response still surprises us. PLoS Biology. 3 (7), 255 (2005).
  29. Fagerquist, C. K., Sultan, O. Induction and identification of disulfide-intact and disulfide-reduced beta-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS and top-down proteomics. Analyst. 136 (8), 1739-1746 (2011).
  30. Fagerquist, C. K., Sultan, O. Top-down proteomic identification of furin-cleaved alpha-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS. Journal of Biomedicine & Biotechnology. 2010, 123460 (2010).
  31. Fagerquist, C. K., et al. Top-down proteomic identification of Shiga toxin 2 subtypes from Shiga toxin-producing Escherichia coli by matrix-assisted laser desorption ionization-tandem time of flight mass spectrometry. Applied and Environmental Microbiology. 80 (9), 2928-2940 (2014).
  32. Fagerquist, C. K., Zaragoza, W. J., Lee, B. G., Yambao, J. C., Quiñones, B. Clinically-relevant Shiga toxin 2 subtypes from environmental Shiga toxin-producing Escherichia coli identified by top-down/middle-down proteomics and DNA sequencing. Clinical Mass Spectrometry. 11, 27-36 (2019).
  33. Fagerquist, C. K., Lee, B. G., Zaragoza, W. J., Yambao, J. C., Quiñones, B. Software for top-down proteomic identification of a plasmid-borne factor (and other proteins) from genomically sequenced pathogenic bacteria using MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 438, 1-12 (2019).
  34. Fagerquist, C. K., Rojas, E. ACS Fall 2020 Virtual Meeting & Expo. American Chemical Society, Virtual. , (2020).
  35. Fagerquist, C. K., Sultan, O. A new calibrant for matrix-assisted laser desorption/ionization time-of-flight-time-of-flight post-source decay tandem mass spectrometry of non-digested proteins for top-down proteomic analysis. Rapid Communications in Mass Spectrometry. 26 (10), 1241-1248 (2012).
  36. Fagerquist, C. K., Zaragoza, W. J. Complementary b/y fragment ion pairs from post-source decay of metastable YahO for calibration of MALDI-TOF-TOF-MS/MS. International Journal of Mass Spectrometry. 415, 29-37 (2017).
  37. Quinones, B., Yambao, J. C., Lee, B. G. Draft genome sequences of Escherichia coli O113:H21 strains recovered from a major produce production region in California. Genome Announcements. 5 (44), 01203-01217 (2017).
  38. Harrison, A. G. The gas-phase basicities and proton affinities of amino acids and peptides. Mass Spectrometry Reviews. 16 (4), 201-217 (1997).
  39. Fagerquist, C. K. Polypeptide backbone cleavage on the C-terminal side of asparagine residues of metastable protein ions analyzed by MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 457, (2020).
  40. Fagerquist, C. K., Zaragoza, W. J. Mass Spectrometry: Application to the Clinical Lab 2019 (MSACL 2019). , Palm Springs, CA. (2019).
  41. Fagerquist, C. K., Zaragoza, W. J. Bacteriophage cell lysis of Shiga toxin-producing Escherichia coli for top-down proteomic identification of Shiga toxins 1 & 2 using matrix-assisted laser desorption/ionization tandem time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 30 (6), 671-680 (2016).
  42. Fagerquist, C. K., et al. Web-based software for rapid top-down proteomic identification of protein biomarkers, with implications for bacterial identification. Applied and Environmental Microbiology. 75 (13), 4341-4353 (2009).
  43. Fagerquist, C. K., et al. Rapid identification of protein biomarkers of Escherichia coli O157:H7 by matrix-assisted laser desorption ionization-time-of-flight-time-of-flight mass spectrometry and top-down proteomics. Analytical Chemistry. 82 (7), 2717-2725 (2010).
  44. Maus, A., Bisha, B., Fagerquist, C., Basile, F. Detection and identification of a protein biomarker in antibiotic-resistant Escherichia coli using intact protein LC offline MALDI-MS and MS/MS. Journal of Applied Microbiology. 128 (3), 697-709 (2020).

Tags

Kemi nummer 171
Identifiering av antibakteriella immunitetsproteiner i <em>Escherichia coli</em> med MALDI-TOF-TOF-MS/MS och top-down proteomisk analys
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Fagerquist, C. K., Rojas, E.More

Fagerquist, C. K., Rojas, E. Identification of Antibacterial Immunity Proteins in Escherichia coli using MALDI-TOF-TOF-MS/MS and Top-Down Proteomic Analysis. J. Vis. Exp. (171), e62577, doi:10.3791/62577 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter