Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Identificazione di proteine immunitarie antibatteriche in Escherichia coli utilizzando MALDI-TOF-TOF-MS/MS e analisi proteomica top-down

Published: May 23, 2021 doi: 10.3791/62577

Summary

Qui presentiamo un protocollo per la rapida identificazione di proteine prodotte da batteri patogeni sequenziati genomicamente utilizzando la spettrometria di massa tandem MALDI-TOF-TOF e l'analisi proteomica top-down con software sviluppato internamente. Gli ioni proteici metastabili si frammentano a causa dell'effetto dell'acido aspartico e questa specificità viene sfruttata per l'identificazione delle proteine.

Abstract

Questo protocollo identifica le proteine immunitarie degli enzimi battericidi: colicina E3 e batteriocina, prodotte da un ceppo patogeno di Escherichia coli mediante induzione antibiotica, e identificate dalla spettrometria di massa tandem MALDI-TOF-TOF e dall'analisi proteomica top-down con software sviluppato internamente. La proteina immunitaria della colicina E3 (Im3) e la proteina immunitaria della batteriocina (Im-Bac) sono state identificate da prominenti ioni frammento di tipo b e/o y generati dalla scissione della spina dorsale polipeptidica (PBC) sul lato C-terminale dell'acido aspartico, dell'acido glutammico e dei residui di asparagina mediante il meccanismo di frammentazione dell'effetto dell'acido aspartico. Il software scansiona rapidamente in silico sequenze proteiche derivate dal sequenziamento dell'intero genoma del ceppo batterico. Il software rimuove inoltre iterativamente i residui di amminoacidi di una sequenza proteica nel caso in cui la sequenza proteica matura venga troncata. Una singola sequenza proteica possedeva ioni di massa e frammento coerenti con quelli rilevati per ciascuna proteina immunitaria. La sequenza candidata è stata quindi ispezionata manualmente per confermare che tutti gli ioni frammento rilevati potessero essere assegnati. La metionina N-terminale di Im3 è stata rimossa post-traduzionalmente, mentre Im-Bac ha avuto la sequenza completa. Inoltre, abbiamo scoperto che solo due o tre ioni frammento non complementari formati da PBC sono necessari per identificare la corretta sequenza proteica. Infine, è stato identificato un promotore (SOS box) a monte dei geni antibatterici e immunitari in un genoma plasmidiale del ceppo batterico.

Introduction

L'analisi e l'identificazione di proteine non digerite mediante spettrometria di massa è indicata come analisi proteomica top-down1,2,3,4. È ormai una tecnica consolidata che utilizza analizzatori di massa elettrospray (ESI)5 e ad alta risoluzione6e sofisticate tecniche di dissociazione, ad esempio dissociazione a trasferimento di elettroni (ETD), dissociazione a cattura elettronica (ECD)7,fotossociazione ultravioletta (UV-PD)8, ecc.

L'altra tecnica di ionizzazione morbida è il desorbimento/ionizzazione laser assistita da matrice (MALDI)9,10,11 che è stato meno ampiamente utilizzato per l'analisi top-down, in parte perché è principalmente accoppiato agli analizzatori di massa a tempo di volo (TOF), che hanno una risoluzione limitata rispetto ad altri analizzatori di massa. Nonostante queste limitazioni, gli strumenti MALDI-TOF e MALDI-TOF-TOF sono stati sfruttati per la rapida analisi top-down di proteine pure e miscele frazionate e non frazionate di proteine. Per l'identificazione di proteine pure, il decadimento in-source (ISD) è una tecnica particolarmente utile perché consente l'analisi di spettrometria di massa (MS) di ioni frammento ISD, nonché la spettrometria di massa tandem (MS/MS) di frammenti ionici proteici fornendo frammenti specifici di sequenza spesso dai termini N- e C della proteina bersaglio, analogamente al sequenziamento Edman12,13 . Uno svantaggio dell'approccio ISD è che, come nel sequenziamento di Edman, il campione deve contenere una sola proteina. L'unico requisito proteico è dovuto alla necessità di attribuire in modo inequivocabile gli ioni frammento a uno ione precursore. Se due o più proteine sono presenti in un campione, può essere difficile assegnare quali ioni frammento appartengono a quali ioni precursori.

L'attribuzione di ioni frammento/ione precursore può essere affrontata utilizzando MALDI-TOF-TOF-MS/MS. Come con qualsiasi esperimento classico di MS/MS, gli ioni precursori sono selezionati/isolati in massa prima della frammentazione e gli ioni frammento rilevati possono essere attribuiti a uno specifico ione precursore. Tuttavia, le tecniche di dissociazione disponibili per questo approccio sono limitate principalmente alla dissociazione indotta da collisioni ad alta energia (HE-CID)14 o al decadimento post-sorgente (PSD)15,16. HE-CID e PSD sono più efficaci nel frammentare peptidi e piccole proteine e la copertura della sequenza può, in alcuni casi, essere limitata. Inoltre, la PSD provoca la scissione della spina dorsale polipeptidica (PBC) principalmente sul lato C-terminale dei residui di acido aspartico e glutammico da un fenomeno chiamato effetto acido aspartico17,18,19,20.

MALDI-TOF-MS ha anche trovato un'applicazione di nicchia nell'identificazione tassonomica dei microrganismi: batteri21, funghi22e virus23. Ad esempio, gli spettri MS vengono utilizzati per identificare batteri sconosciuti rispetto a una libreria di riferimento di spettri MS di batteri noti utilizzando algoritmi di riconoscimento dei modelli per il confronto. Questo approccio si è rivelato di grande successo grazie alla sua velocità e semplicità, sebbene richieda una coltivazione notturna dell'isolato. Gli ioni proteici rilevati da questo approccio (di solito sotto i 20 kDa) comprendono un'impronta digitale MS che consente la risoluzione tassonomica a livello di genere e specie e in alcuni casi alla sottospecie24 e al livello di ceppo25,26. Tuttavia, rimane la necessità non solo di classificare tassonomicamente i microrganismi potenzialmente patogeni, ma anche di identificare specifici fattori di virulenza, tossine e fattori di resistenza antimicrobica (AMR). Per raggiungere questo obiettivo, la massa di peptidi, proteine o piccole molecole viene misurata dalla SM e successivamente isolata e frammentata dalla SM / MS.

I batteri patogeni spesso trasportano pezzi circolari di DNA chiamati plasmidi. I plasmidi, insieme ai profagi, sono un importante vettore di trasferimento genico orizzontale tra batteri e sono responsabili della rapida diffusione della resistenza antimicrobica e di altri fattori di virulenza tra i batteri. I plasmidi possono anche trasportare geni antibatterici (AB), ad esempio colicina e batteriocina. Quando questi geni sono espressi e le proteine secrete, agiscono per disabilitare il meccanismo di traduzione proteica dei batteri vicini che occupano la stessa nicchia ambientale27. Tuttavia, questi enzimi battericidi possono anche rappresentare un rischio per l'ospite che li ha prodotti. Di conseguenza, un gene è co-espresso dall'ospite che inibisce specificamente la funzione di un enzima AB e viene indicato come la sua proteina immunitaria (Im).

Gli antibiotici dannosi per il DNA come la mitomicina-C e la ciprofloxacina sono spesso usati per indurre la risposta SOS nell'E. coli produttore della tossina Shiga (STEC) il cui gene della tossina Shiga(stx) si trova all'interno di un genoma di profago presente nel genoma batterico28. Abbiamo utilizzato l'induzione antibiotica, MALDI-TOF-TOF-MS/MS e l'analisi proteomica top-down in precedenza per rilevare e identificare tipi e sottotipi di Stx prodotti dai ceppi STEC29,30,31,32. Nel lavoro precedente, il ceppo STEC O113:H21 RM7788 è stato coltivato durante la notte su mezzi di agar integrati con mitomicina-C. Tuttavia, invece di rilevare la subunità B prevista di Stx2a a m / z ~7816, è stato rilevato uno ione proteico diverso a m / z ~ 7839 e identificato come una proteina ipotetica codificata con plasmidi di funzione sconosciuta33. Nel lavoro attuale, abbiamo identificato due proteine AB-Im codificate con plasmidi prodotte da questo ceppo utilizzando l'induzione antibiotica, MALDI-TOF-TOF-MS/ MS e l'analisi proteomica top-down utilizzando un software autonomo sviluppato per elaborare e scansionare sequenze proteiche in silico derivate dal sequenziamento dell'intero genoma (WGS). Inoltre, nel software è stata incorporata la possibilità di modifiche post-traduzione (PTM) che comportano il troncamento della sequenza. Le proteine immunitarie sono state identificate utilizzando questo software dalla massa misurata dello ione proteina matura e dagli ioni frammento specifici della sequenza da PBC causati dall'effetto dell'acido aspartico e rilevati da MS / MS-PSD. Infine, è stato identificato un promotore a monte dei geni AB / Im in un genoma plasmidico che può spiegare l'espressione di questi geni quando questo ceppo è esposto a un antibiotico dannoso per il DNA. Parti di questo lavoro sono state presentate al National American Chemical Society Fall 2020 Virtual Meeting & Expo (17-20 agosto 2020)34.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Preparazione microbiologica del campione

  1. Inoculare 25 mL di brodo di Luria (LB) in un tubo conico da 50 mL con E. coli O113:H21 ceppo RM7788 (o un altro ceppo batterico) da un ceppo di glicerolo utilizzando un anello sterile da 1 μL. Tappare il tubo e la precoltura a 37 °C con agitazione (200 giri/min) per 4 ore.
  2. Aliquota 100 μL di brodo precolturato e spalmabile su una piastra di agar LB integrata con 400 o 800 ng/mL di mitomicina-C. Coltura di piastre di agar staticamente durante la notte in un incubatore a 37 °C.
    ATTENZIONE: I ceppi STEC sono microrganismi patogeni. Eseguire tutte le manipolazioni microbiologiche, oltre alla coltivazione, in un armadio di biosicurezza BSL-2.
  3. Raccogliere cellule batteriche da singole colonie visibili utilizzando un anello sterile da 1 μL e trasferirle in un tubo microcentrifugale con tappo a vite rivestito con O-ring da 2,0 mL contenente 300 μL di acqua di grado HPLC. Tappare brevemente il tubo, il vortice e centrifugare a 11.337 x g per 2 minuti per pellettizzare le celle.

2. Spettrometria di massa

  1. Individuare l'aliquota di 0,75 μL del surnatante campione sul target MALDI in acciaio inossidabile e lasciarlo asciugare. Sovrapporre il punto del campione essiccato con un'aliquota di a0,75 μL di una soluzione satura di acido sinapinico in acetonitrile al 33%, acqua al 67% e acido trifluoracetico allo 0,2%. Lasciare asciugare il punto.
  2. Analizzare i punti del campione essiccato utilizzando uno spettrometro di massa MALDI-TOF-TOF.
    1. Dopo aver caricato il target MALDI nello spettrometro di massa, fare clic sul pulsante per l'acquisizione della modalità lineare MS nel software di acquisizione. Inserire l'intervallo m/z da analizzare inserendo m/z dei limiti inferiore e superiore (ad esempio, da 2 kDa a 20 kDa) nei rispettivi campi nel software del metodo di acquisizione.
    2. Fare clic sul punto di esempio da analizzare sul modello di destinazione MALDI nel software. Quindi, premere il pulsante sinistro del mouse e trascinare il cursore del mouse sul punto campione per specificare la regione rettangolare da campionare per l'ablazione/ionizzazione laser. Rilascia il pulsante del mouse e l'acquisizione avrà inizio. Raccogli 1.000 colpi laser per ogni punto campione.
      NOTA: l'acquisizione dei dati viene visualizzata in tempo reale nella finestra di acquisizione del software.
    3. Se non vengono rilevati ioni, aumentare l'intensità del laser regolando la barra della scala scorrevole sotto Intensità laser nel software fino a quando non viene rilevato il segnale ionica proteico. Questo è indicato come soglia.
      NOTA: Prima dell'analisi spot del campione, calibrare esternamente lo strumento in modalità lineare MS con calibranti proteici il cui m/z copre l'intervallo analizzato, ad esempio gli stati di carica +1 e +2 dei calibranti proteici: citocromo-C, lisozima e mioglobina coprono un intervallo di massa da 2 kDa a 20 kDa. Una massa intermedia all'interno dell'intervallo di massa specificato viene utilizzata come massa di messa a fuoco, ad esempio 9 kDa. La massa di messa a fuoco è lo ione il cui m/z è focalizzato in modo ottimale per il rilevamento da parte del rilevatore in modalità lineare.
    4. Al termine dell'acquisizione in modalità lineare MS, fare clic sul pulsante per l'acquisizione in modalità reflectron MS/MS nel software di acquisizione. Immettere la massa del precursore da analizzare nel campo Massa precursore. Quindi, inserisci una larghezza di isolamento (in Da) nella finestra di massa del precursore per il lato di massa bassa e alta della massa del precursore, ad esempio ±100 Da.
    5. Fare clic sul pulsante CID Off. Fate clic sul pulsante Soppressore metastabile ON .Metastable Suppressor ON. Regolare l'intensità del laser ad almeno il 90% del suo valore massimo regolando la barra della scala scorrevole sotto l'intensità laser nel software.
    6. Fare clic sul punto di esempio da analizzare sul modello di destinazione MALDI nel software. Quindi premere il pulsante sinistro del mouse e trascinare il cursore del mouse sul punto campione per specificare la regione rettangolare da campionare per l'ablazione/ionizzazione laser. Rilascia il pulsante del mouse e l'acquisizione avrà inizio. Raccogli 10.000 colpi laser per ogni punto campione.
      NOTA: Prima dell'analisi dello spot del campione, lo strumento deve essere calibrato esternamente in modalità MS/MS-reflectron utilizzando gli ioni frammento del decadimento post-sorgente (PSD) dello stato di carica +1 della tioredossina alchilata35.
  3. Non elaborare dati MS grezzi. Elaborare i dati grezzi MS/MS-PSD utilizzando la seguente sequenza di passaggi nell'ordine specificato: correzione avanzata della linea di base (32, 0,5, 0,0) seguita dalla rimozione del rumore (due deviazioni standard) seguita da levigatura gaussiana (31 punti).
  4. Ispezionare manualmente i dati MS/MS-PSD per la presenza di ioni frammento prominenti generati da PBC19,20.
  5. Valutare i dati MS/MS rispetto all'abbondanza assoluta e relativa di ioni frammento e al loro segnale-rumore (S/N). Utilizzare solo gli ioni frammento più abbondanti per l'identificazione delle proteine, specialmente se i dati MS/MS-PSD sono rumorosi.

3. Costruzione del database delle proteine in silico

  1. Generare un file di testo contenente sequenze proteiche in silico del ceppo batterico, che verranno scansionate dal software Protein Biomarker Seeker per l'identificazione della proteina. Le sequenze proteiche sono derivate dal sequenziamento dell'intero genoma (WGS) del ceppo analizzato (o da un ceppo strettamente correlato).
  2. Accedi al sito Web NCBI / PubMed (https://www.ncbi.nlm.nih.gov/protein/) per scaricare circa 5.000 sequenze proteiche del ceppo batterico specifico (ad esempio, Escherichia coli O113: H21 ceppo RM7788) analizzato. La dimensione massima di download è di 200 sequenze.
    1. Di conseguenza, copia e incolla i 25 download in un unico file di testo. Selezionare il formato FASTA (testo) per ogni download.

4. Software di ricerca di biomarcatori proteici operativi

  1. Fare doppio clic sul file eseguibile Protein Biomarker Seeker. Apparirà una finestra dell'interfaccia utente grafica (GUI)(Figura 1,pannello superiore).
  2. Immettere la massa del biomarcatore proteico (misurata in modalità MS-lineare) nel campo Massa proteica matura. Quindi, immettere l'errore di misurazione della massa nel campo Tolleranza di massa. L'errore di misurazione della massa standard è ±10 Da per una proteina da 10.000 Da.
  3. Facoltativamente, fare clic sul pulsante Calcolatore di massa proteica b/y complementare per calcolare la massa proteica da una presunta coppia di ioni frammento complementare (CFIP o b/y). Apparirà una finestra pop-up, Protein Mass Calculator Tool,(Figura 1,pannello inferiore).
    1. Inserisci la m/z del CFIP putativo e fai clic sul pulsante Aggiungi coppia. Apparirà la massa proteica calcolata.
    2. Copia e incolla questo numero nel campo Massa proteica matura e chiudi la finestra dello strumento Calcolatore di massa proteica.
  4. Selezionare una lunghezza peptidica del segnale N-terminale facendo clic sulla casella Imposta restrizione residui. Apparirà un pop-up con una scala scorrevole e un cursore. Spostare il cursore sulla lunghezza del peptide del segnale desiderata (massimo 50). Se non è selezionata alcuna lunghezza del peptide del segnale, il software eseguirà un troncamento della sequenza senza restrizioni.
  5. Nella condizione di frammento ionico nella GUI, selezionare i residui per la scissione della spina dorsale polipeptidico (PBC). Clicca sulle caselle di uno o più residui: D, E, N e/o P.
    1. Fare clic sul pulsante Inserisci ioni frammento (+1) da cercare. Apparirà una pagina di frammento pop-up. Quindi, fare clic sul pulsante Aggiungi ione frammento, che corrisponde al numero di ioni frammento da inserire, ovvero un clic per ogni ione frammento. Apparirà un campo a discesa per ogni frammento di ione da inserire.
    2. Immettete m/z degli ioni frammento e la tolleranza m/z associata. Al termine, fai clic sul pulsante Salva e chiudi.
      NOTA: una tolleranza m/z ragionevole è ±1.5.
    3. Selezionare il numero minimo di ioni frammento che devono essere abbinati per un'identificazione scorrendo fino al numero desiderato nella casella a destra di Quanti ioni frammento devono essere abbinati.
      NOTA: tre corrispondenze dovrebbero essere adeguate.
    4. Selezionare i residui di cisteina allo stato ossidato facendo clic sul cerchio corrispondente. Se non vengono trovate identificazioni proteiche dopo la ricerca, ripetere la ricerca con ciste nel loro stato ridotto. Se non vengono trovate identificazioni dopo la ricerca, allargare la tolleranza allo ione del frammento a ±3 e ripetere la ricerca.
  6. Sotto il File Setup, fare clic sul pulsante Seleziona file FASTA per sfogliare e selezionare il file FASTA (testo) contenente le sequenze proteiche in silico del ceppo batterico precedentemente costruito nei passaggi del protocollo da 3.1 a 3.2. Quindi selezionare una cartella di output e creare un nome di file di output.
  7. Fare clic sul pulsante Esegui ricerca su voci di file. Apparirà una finestra pop-up intitolata Conferma parametri di ricerca ( Figura1, pannello inferiore), che visualizza i parametri di ricerca prima dell'avvio della ricerca.
  8. Se i parametri di ricerca sono corretti, fare clic sul pulsante Inizia ricerca. Se i parametri di ricerca non sono corretti, fare clic sul pulsante Annulla e immettere di nuovo i parametri corretti. Una volta avviata la ricerca, la finestra dei parametri si chiude e viene visualizzata una nuova finestra pop-up con una barra di avanzamento(Figura 1,pannello inferiore) che mostra l'avanzamento della ricerca e un conteggio in esecuzione del numero di identificazioni trovate.
  9. Al termine della ricerca (pochi secondi), la barra di avanzamento si chiude automaticamente e un riepilogo della ricerca viene visualizzato nel campo Log della GUI (Figura 2, pannello superiore). Inoltre, apparirà anche una nuova finestra pop-up che mostra le eventuali identificazioni proteiche(Figura 2,pannello inferiore).
    NOTA: Le sequenze proteiche in silico con residui non riconosciuti, ad esempio U o X, vengono automaticamente saltate dall'analisi e queste sequenze vengono successivamente segnalate con una finestra pop-up separata per avvisare l'operatore di quali (eventuali) sequenze sono state saltate al completamento della ricerca.

5. Conferma post-ricerca della sequenza proteica

  1. Confermare la correttezza di una sequenza candidata mediante analisi manuale.
    NOTA: Lo scopo del software Protein Biomarker Seeker è quello di identificare una sequenza proteica con elevata precisione eliminando molte sequenze proteiche ovviamente errate dalla considerazione e incorporando il troncamento della sequenza come possibile PTM nella proteina matura. Poiché il numero di possibili sequenze candidate restituite è esime, la conferma manuale è gestibile.
  2. Generare una tabella della media m/z di ioni frammento di tipo b e y della sequenza candidata utilizzando qualsiasi spettrometria di massa o software proteomico avente tale funzionalità. Confrontare la media m/z di ioni frammento in silico sul lato C-terminale dei residui D-, E-, e N-(e sul lato N-terminale dei residui P) con la m/z di ioni frammento prominenti dai dati MS/MS-PSD.
    NOTA: gli ioni frammento MS/MS-PSD più importanti devono essere facilmente abbinati agli ioni frammento in silico associati a D, E e N. Tuttavia, il meccanismo di frammentazione dell'effetto acido aspartico è meno efficiente vicino ai termini N o C di una sequenza proteica36.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

La Figura 3 (pannello superiore) mostra la MS del ceppo STEC O113:H21 RM7788 coltivato durante la notte su LBA integrato con 400 ng/mL di mitomicina-C. I picchi a m/z 7276, 7337 e 7841 erano stati identificati in precedenza come proteina C (CspC), proteina E (CspE) e una proteina a plasmide di funzione sconosciuta, rispettivamente33. Lo ione proteico a m/z 9780 [M+H]+ è stato analizzato da MS/MS-PSD come mostrato nella Figura 3 (pannello inferiore). Lo ione precursore è stato isolato con una finestra di selezione degli ioni tempori (TIS) ±100 Da. Gli ioni frammento sono identificati dal loro m/z e dal tipo/numero. Lo ione frammento a m/z 2675,9 (evidenziato con una stella) è spillover dalla dissociazione dello ione proteina metastabile a m/z 9655 mostrato in Figura 3 (pannello superiore). La media teorica m/z di ogni frammento ione è mostrata tra parentesi in base alla PBC della sequenza della proteina immunitaria della colicina E3 (Im3) mostrata sopra. I siti di PBC sono evidenziati con un asterisco rosso con lo o gli ioni frammento corrispondenti prodotti. La metionina N-terminale è sottolineata a significare che viene rimossa post-traduzionalmente nella proteina matura. La sequenza ha un singolo residuo di cisteina (inscatoato) ed è quindi considerata allo stato ridotto.

Utilizzando la massa del biomarcatore proteico e alcuni importanti ioni di frammento non complementari: m/z 1813.8, 2128.9 e 4293.7 (tolleranza ±1.5) (Figura 1, pannello inferiore) e limitando la PBC al lato C-terminale dei residui D- ed E- è stata riportata dal software solo una sequenza candidata: sequenza proteica Im3 (senza la sua metionina N-terminale) (Figura 2 , pannello inferiore). Quando si selezionano gli ioni frammento per una ricerca, va sottolineato che qualsiasi gruppo di ioni frammento non complementari presuppone che sommando gli ioni m/z di due frammenti qualsiasi nel gruppo (e sottraendo due protoni) si ottiene una somma di massa che non rientra nella massa del biomarcatore e nella tolleranza di massa associata (±10 Da). La bozza di WGS di RM7788 ha rivelato 5008 sequenze proteiche (frame di lettura aperti)37. Di queste circa 5.000 sequenze proteiche complete, 189.490 sequenze complete e parziali (troncamento senza restrizioni) hanno soddisfatto i criteri di massa del biomarcatore(Figura 2,pannello superiore). Quelle sequenze che superano i criteri di massa subiscono quindi in silico PBC sul lato C-terminale dei residui D- e/o E. Gli ioni frammento risultanti generati vengono quindi confrontati con gli ioni frammento osservati inseriti. La sequenza candidata riportata dal software si basava esclusivamente sulla sua massa e su tre siti PBC specifici per D e/o E. La specificità raggiunta da una così piccola quantità di informazioni sarà discussa nella prossima sezione.

Come mostrato in Figura 3 (pannello inferiore), gli ioni frammento più abbondanti sono il risultato di PBC sul lato C-terminale dei residui D- ed E attraverso il meccanismo di frammentazione dell'effetto acido aspartico19,20. Si osservano due CFIP: b67/y17 (m/z 7645.1 / m/z 2128.9) e b70/y14 (m/z 7959.4 / m/z 1813.8). Questi CFIP possono essere utilizzati per calcolare con maggiore precisione la massa dello ione precursore della proteina usando la semplice formula: b (m / z) + y (m / z) - 2H+ = massa proteica (Da)33. Usando i due CFIP, otteniamo una massa media della proteina: 9771,6 Da, che è più vicina al suo valore teorico di 9772,5 Da rispetto alla massa misurata dello ione proteico in modalità MS-lineare: 9779 Da(Figura 3,pannello superiore). Solo pochi CFIP sono stati rilevati perché la maggior parte degli ioni precursori con il protone ionizzante sequestrato all'unico residuo di arginina: R80. La maggiore basicità in fase gassosa dell'arginina (237,0 kcal/mol38)rispetto ad un residuo di lisina (K) (221,8 kcal/mol38)è probabilmente responsabile del sequestro preferenziale del protone ionizzante al solo residuo R.

La Figura 4 (pannello superiore) mostra la SM del ceppo STEC O113:H21 RM7788 coltivato durante la notte su LBA integrato con mitomicina-C 800 ng/mL. La Figura 4 (pannello superiore) è abbastanza simile alla Figura 3 (pannello superiore), sebbene vi siano differenze nell'abbondanza relativa di alcuni ioni proteici a causa delle differenze nelle concentrazioni di antibiotici utilizzate. Ci sono anche lievi cambiamenti nel biomarcatore proteico m / z che riflettono le differenze nella calibrazione esterna dello strumento in giorni diversi. Ancora una volta, gli ioni proteici a m / z 7272, 7335 e 7838 sono rispettivamente CspC, CspE e una proteina trasmessa da plasmidi. Inoltre, rileviamo lo ione proteina Im3 a m/z 9778 (anche se con minore abbondanza rispetto alla Figura 3)e uno ione proteico a m/z 9651 [M+H]+. La Figura 4 (pannello inferiore) mostra MS/MS-PSD dello ione precursore della proteina a m/z 9651. Lo ione precursore è stato isolato utilizzando una finestra TIS più stretta e asimmetrica di -75/+60 Da per eliminare i contributi degli ioni proteici adiacenti a m/z 9539 e 9778. Gli ioni frammento sono identificati dal loro m/z e dal tipo/numero. La sequenza della proteina immunitaria della batteriocina (Im-Bac) è mostrata sopra. I siti di PBC sono evidenziati con un asterisco rosso con i loro ioni di frammento corrispondenti. La media teorica m/z di ogni frammento ione è anche mostrata tra parentesi nello spettro. La sequenza Im-Bac ha anche un singolo residuo di cisteina (in scatola) ed è quindi considerata nel suo stato ridotto.

Utilizzando la massa del biomarcatore proteico, tre importanti ioni frammento non complementari: m / z 2675.4, 3853.5 e 5772.8 (tolleranza ±1.50) dalla Figura 4 e limitando la PBC al solo lato C-terminale dei residui D- e / o E - e / o asparagina (N), solo una sequenza candidata è stata segnalata dal software: la proteina Im-Bac. La sequenza candidata è stata recuperata dopo aver scansionato 191.375 sequenze complete o parziali che soddisfacevano i criteri di massa e tolleranza del biomarcatore (±10 Da). La sequenza candidata è stata identificata dal software basato esclusivamente sulla sua massa e su tre siti PBC specifici per D e/o E e/o N.

Gli ioni frammento più importanti nella Figura 4 (pannello inferiore) erano, ancora una volta, il risultato di PBC sul lato C-terminale di D e/o E-residui e anche sul lato N-terminale di uno dei residui P20. Osserviamo anche PBC sul lato C-terminale di un N-residuo che è anche probabile che si verifichi da un meccanismo di frammentazione simile all'effetto dell'acido aspartico39,40. La debolezza del segnale ionica precursore della proteina si traduce in un numero limitato di ioni frammento interpretabili. L'accuratezza dello ione frammento m/z diminuisce con l'abbondanza di ioni frammento. Non è stata rilevata alcuna CFIP a causa presumibilmente del sequestro del protone ionizzante all'unico residuo di arginina (R74) della sequenza ionica proteica. Tutti gli ioni frammento contengono il residuo R74, coerente con questa ipotesi.

Il promotore dei geni dell'immunità antibatterica
La Figura 5 mostra una porzione del contig00100 di 6482 bp del ceppo di E. coli RM7788 (GenBank: NWVS01000096.1) dal sequenziamento dell'intero genoma37. Le regioni codificanti per la colicina E3, la sua proteina immunitaria (Im3), la proteina immunitaria della batteriocina (Im-Bac) e una proteina di lisi sono evidenziate in giallo. A monte della regione codificante per il gene della colicina E3 si trovano la regione -35, la scatola di Pribnow (PB), la ripetizione invertita della scatola SOS, il sito di legame Shine-Dalgarno/ribosomiale (SD/RBS)27. Esiste una regione intergenica a nove coppie di basi tra colicina E3 e Im3. LexA (una proteina repressore e un'autopeptidasi) si lega alla scatola SOS bloccando l'espressione dei geni a valle. In caso di danni al DNA (ad esempio, radiazioni UV o antibiotici dannosi per il DNA), LexA subisce un'auto-scissione che consente l'espressione dei geni a valle27,28. Pertanto, l'espressione di queste due proteine immunitarie è coerente con l'esposizione di questo ceppo a un antibiotico dannoso per il DNA.

Figure 1
Figura 1: Schermate del software Protein Biomarker Seeker. Pannello superiore: Interfaccia utente grafica (GUI) del software Protein Biomarker Seeker. Pannelli inferiori: finestre popup di Protein Mass Calculator Tool, Fragment Page, Confirm Search Parameters e Search progress bar. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 2
Figura 2: Risultati della ricerca di un'identificazione proteica utilizzando il software Protein Biomarker Seeker. Pannello superiore: riepilogo dei risultati della ricerca visualizzati nel campo Log della GUI del software. Pannello inferiore: una finestra pop-up che mostra l'identificazione di una proteina utilizzando il software. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 3
Figura 3: Analisi spettrometrica di massa del ceppo STEC O113:H21 RM7788. Pannello superiore: MS di STEC O113:H21 ceppo RM7788 coltivato durante la notte su LBA integrato con 400 ng/mL mitomicina-C. Pannello inferiore: MS/MS-PSD dello ione precursore della proteina a m/z 9780 (pannello superiore). Lo ione precursore è stato isolato con una finestra TIS ±100 Da. Gli ioni frammento sono identificati dal loro tipo m/z e ionte. Viene mostrata la sequenza della proteina immunitaria per la colicina E3 (Im3). I residui di base (siti di possibile sequestro della carica) sono evidenziati in blu. I PBC sono evidenziati con un asterisco rosso con gli ioni di frammento corrispondenti generati. La media teorica m/z di ogni frammento di ioni è mostrata tra parentesi. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 4
Figura 4: Analisi spettrometrica di massa del ceppo STEC O113:H21 RM7788. Pannello superiore: MS di STEC O113:H21 ceppo RM7788 coltivato durante la notte su LBA integrato con 800 ng/mL mitomicina-C. Pannello inferiore: MS/MS-PSD dello ione precursore proteico a m/z 9651 (pannello superiore). Lo ione precursore è stato isolato con una finestra TIS asimmetrica di -75 sul lato basso m/z dello ione precursore e +60 sul lato alto m/z dello ione precursore. Gli ioni frammento sono identificati dal loro tipo m/z e io ioni. Viene mostrata la sequenza della proteina immunitaria della batteriocina (Im-Bac). I residui di base (siti di possibile sequestro della carica) sono evidenziati in blu. I PBC sono evidenziati con un asterisco rosso con gli ioni di frammento corrispondenti generati. La media teorica m/z di ogni frammento ione è mostrata tra parentesi. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 5
Figura 5: Analisi di una sezione del genoma plasmidico trasportata da E. coli O113:H21 ceppo RM7788. Una porzione del 6482 bp contig00100 di E. coli O113:H21 ceppo RM7788 (GenBank: NWVS01000096.1) da intero genoma shotgun sequenziamento37. Fare clic qui per visualizzare una versione più grande di questa figura.

Fascicolo complementare 1 (S1 Im3): Risultati dell'analisi di benchmarking del software utilizzando ioni frammento selezionati di Im3 (dalla Figura 3,pannello inferiore). Fare clic qui per scaricare questo file.

Fascicolo supplementare 2 (S2 ImBac): Risultati dell'analisi di benchmarking del software utilizzando ioni frammento selezionati di Im-Bac (dalla Figura 4,pannello inferiore). Fare clic qui per scaricare questo file.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Considerazioni sul protocollo
I punti di forza principali del protocollo attuale sono la sua velocità, la semplicità di preparazione del campione e l'uso di uno strumento relativamente facile da usare, da addestrare e mantenere. Sebbene l'analisi proteomica bottom-up e top-down mediante cromatografia liquida-ESI-HR-MS sia onnipresente e di gran lunga superiore sotto molti aspetti all'top-down di MALDI-TOF-TOF, richiedono più tempo, lavoro e competenza. La complessità dello strumento può spesso influenzare se è probabile che determinate piattaforme strumentali vengano adottate da scienziati non formalmente addestrati in spettrometria di massa. L'approccio top-down con MALDI-TOF-TOF ha lo scopo di estendere l'analisi di MALDI-TOF-MS oltre il suo attuale uso per l'identificazione tassonomica dei batteri nei laboratori di microbiologia clinica, senza aumentare drasticamente il lavoro, la complessità o le competenze richieste per l'analisi.

Il protocollo non impiega alcuna fase di lisi cellulare meccanica (o elettrica). Sebbene le proteine secrete o extracellulari possano essere rilevate utilizzando il protocollo, una versione precedente di questo metodo è stata inizialmente sviluppata per il rilevamento della tossina Shiga (Stx) da ceppi STEC in cui l'induzione antibiotica innesca la risposta SOS batterica con conseguente espressione di geni fagici, inclusi stx e geni fagici tardivi responsabili della lisi cellulare batterica41 . Abbiamo scoperto che la lisi cellulare indotta da antibiotici ha alcuni vantaggi per il rilevamento di Stx e proteine plasmidiche che hanno promotori SOS (lavoro attuale). Certamente, la lisi cellulare meccanica (ad esempio, il battito delle perle) può anche essere utilizzata (sebbene non utilizzata nel lavoro attuale). Tuttavia, la lisi meccanica provoca la lissinga di tutte le cellule batteriche (non semplicemente le cellule indotte), con il risultato che il campione viene arricchito con proteine ospiti abbondanti e altamente conservate che possono rendere più difficile il rilevamento di proteine di fagi e plasmidi da un campione non sezionato.

Le concentrazioni di antibiotici per un ceppo batterico sono risultate generalmente riproducibili rispetto alle proteine indotte da antibiotici rilevate. Abbiamo notato variazioni nell'abbondanza relativa di proteine rispetto alle proteine indotte da antibiotici rilevate. Poiché la nostra analisi è qualitativa (non quantitativa), l'abbondanza di biomarcatori proteici deve essere sufficiente solo per un'adeguata analisi della SM / SM. Un ceppo STEC putativo viene prima coltivato con una gamma di concentrazioni di antibiotici (ad esempio, da 300 ng / mL a 2.000 ng / mL di mitomicina-C) per determinare la concentrazione ottimale in modo tale da innescare la risposta SOS batterica pur fornendo abbastanza cellule batteriche per la raccolta. Per il ceppo STEC RM7788, abbiamo scoperto che la concentrazione ottimale di antibiotici per il rilevamento dei biomarcatori identificati era da 400 a 800 ng / mL di mitomicina-C.

Oltre al troncamento della sequenza proteica, le proteine di E. coli possono avere PTM che comportano l'aggiunta di massa, ad esempio fosforilazione, glicosilazione, ecc. Poiché MS/MS utilizza PSD per la dissociazione di ioni proteici metastabili caricati solo (sotto i 20 kDa in massa) generati da MALDI, tali PTM attaccati a catene laterali di residui subirebbero probabilmente una facile perdita dissociativa perché la PSD è una tecnica di dissociazione ergodica. La presenza di tali PTM potrebbe essere dedotta dalla comparsa di uno ione frammento vicino in massa allo ione precursore originale (meno la massa del PTM) nei dati MS/MS. Tuttavia, né PSD né il software sarebbero in grado di identificare dove tali PTM sono collegati. Inoltre, il software può identificare solo proteine da ioni frammento di PBC e non perdita dissociativa di piccole molecole (ad esempio, acqua o ammoniaca) o PTM attaccati alle catene laterali dei residui. Tuttavia, se vengono rilevati ioni frammento da PBC, la proteina potrebbe ancora essere identificata utilizzando il software allargando la finestra di tolleranza della massa proteica per includere la massa del PTM o semplicemente inserendo la massa dello ione frammento proteico corrispondente alla perdita dissociativa del ptM sospetto. Qualsiasi identificazione da parte del software sarebbe della sequenza proteica senza il PTM. È interessante notare che finora non abbiamo rilevato proteine con fosforilazione, glicosilazione, ecc. Nel nostro lavoro batterico. Tuttavia, ciò può essere dovuto a: la loro abbondanza relativa da parte di MALDI, l'intervallo di massa utilizzato: 2-20 kDa, che tali PTM possono essere insolitamente labili e potrebbero non sopravvivere all'applicazione della matrice MALDI, o che tali PTM possono subire una perdita dissociativa molto rapida nella sorgente prima che gli ioni siano accelerati dalla sorgente.

Attualmente, il software non include l'alchilazione della cisteina e il nostro protocollo di campionamento non include una fase di riduzione del disolfuro per i residui di cisteina. Il protocollo è stato chiarito per indicare che la ricerca deve essere operata con residui di cisteina nel loro stato ossidato e, se non si ottiene alcuna identificazione, quindi eseguire nuovamente la ricerca con residui di cisteina nel loro stato ridotto. Se non vengono trovate identificazioni, l'allargamento della tolleranza ione del frammento a ±2 o ±3 abbassa la soglia per la corrispondenza degli ioni di frammento consentendo di abbinare sequenze con ciste se sono presenti nei loro stati ossidati e / o ridotti.

Analisi proteomica top-down mediante spettrometria di massa MALDI-TOF-TOF
La maggior parte delle analisi proteomiche top-down è stata realizzata utilizzando ESI e piattaforme di spettrometria di massa ad alta risoluzione. Al contrario, sono state condotte meno analisi proteomiche top-down utilizzando piattaforme MALDI-TOF-TOF. Di conseguenza, esiste pochissimo software proteomico top-down per l'analisi di ioni proteici metastabili caricati solo generati e analizzati da MALDI-TOF-TOF-MS/MS-PSD che sfruttano l'effetto acido aspartico per la frammentazione15,42. Ci sono una serie di ragioni per questo. In primo luogo, l'efficienza di ionizzazione di MALDI è sbilanciata verso peptidi e proteine a basso peso molecolare, e questo pregiudizio è particolarmente evidente con una miscela di proteine come si trova in un lisato cellulare batterico non compensato. In secondo luogo, MALDI genera stati di bassa carica e c'è poca o nessuna repulsione di Coulomb per facilitare la dissociazione degli ioni proteici. In terzo luogo, la copertura della sequenza PSD è piuttosto limitata a differenza di altre tecniche ECD7, ETD7, UV-PD8, ecc. In quarto luogo, l'efficienza di frammentazione della PSD diminuisce con l'aumentare della massa dello ione proteico. In quinto luogo, le tecniche di dissociazione ergodica, come la PSD, tendono a provocare una facile perdita dissociativa di PTM attaccati ai residui, ad esempio fosforilazione, glicosilazione, ecc., Rendendo difficile determinare il sito di attaccamento PTM. Nonostante queste gravi limitazioni, l'analisi top-down con MALDI-TOF-TOF-MS/MS-PSD presenta chiari vantaggi, ad esempio la semplicità della preparazione del campione, l'assenza di separazione LC, l'isolamento di ioni proteici metastabili da parte di MS/MS che consente l'attribuzione di ioni frammento a ioni precursori, l'identificazione di PTM che coinvolgono il troncamento della sequenza e i legami disolfuro intramolecolare e, soprattutto, la velocità di analisi. Se combinata con sequenze proteiche in silico derivate dai dati WGS, questa tecnica può fornire informazioni rapide prima che vengano completate altre analisi più dispendiose in termini di tempo e lavoro.

Il software Protein Biomarker Seeker è stato sviluppato utilizzando IntelliJ e scritto in Java per elaborare e cercare in modo efficiente sequenze di aminoacidi proteici derivati da WGS di un ceppo batterico. Il software è stato modificato da un algoritmo precedente che funzionava come una macro all'interno di Excel33. Abbiamo deciso di sviluppare una versione standalone del software con un'interfaccia GUI per renderlo più user-friendly e fornire ulteriori miglioramenti.

Nel caso di PTM che comportano il troncamento della sequenza proteica, il software rimuove sequenzialmente un residuo di amminoacidi dal N-terminus mentre aggiunge iterativamente residui della sequenza fino a quando la somma di massa raggiunge o supera la massa misurata del biomarcatore proteico rilevato. Sebbene questo processo possa portare a un numero molto elevato di frammenti di massa proteica (~ 200.000 da ~ 5000 sequenze proteiche complete), ha il vantaggio di non escludere alcun potenziale frammento proteico dal troncamento al N-terminus o C-terminus (o entrambi), per quanto improbabile possa essere tale troncamento da una prospettiva biologica. Questo approccio è indicato come troncamento senza restrizioni. Tuttavia, i PTM batterici più comuni che coinvolgono il troncamento sono la rimozione della metionina N-terminale o del peptide di segnale N-terminale. Di conseguenza, il software consente anche all'operatore di selezionare un limite superiore (50 residui) per il troncamento dei residui dal terminale N, il che si traduce in un numero molto inferiore di frammenti proteici che soddisfano i criteri di massa del biomarcatore proteico.

I PBC sul lato C-terminale dei residui D- ed E e sul lato N-terminale dei residui P sono coerenti con il meccanismo dell'effetto acido aspartico, che è stato ampiamente studiato sia sperimentalmente che teoricamente17,18,19,20. L'inclusione di PBC sul lato C-terminale dei residui di N è stata inclusa nel software a causa di un meccanismo simile all'effetto dell'acido aspartico che è stato osservato per un certo numero di ioni proteici metastabili nel nostro laboratorio39,40. Gli ioni frammento più abbondanti dalla dissociazione di ioni proteici metastabili caricati solo analizzati da MS/MS-PSD sono dovuti al meccanismo di frammentazione dell'effetto acido aspartico. L'operatore seleziona gli ioni frammento più importanti dai dati MS/MS-PSD e inserisce il loro m/z nel software e una tolleranza iotrice di frammento associata (±m/z). La tolleranza allo ione del frammento può essere regolata per ogni ione frammento per riflettere la sua abbondanza relativa. Un'appropriata tolleranza allo ione frammento può variare tra ±1,0 e ± 2,5 m/z a seconda dell'abbondanza assoluta dello ione frammento e della sua abbondanza relativa rispetto al rumore chimico di fondo. In genere, più abbondante è uno ione frammento, migliore è la sua precisione di massa, che consente di utilizzare una tolleranza ioionica del frammento più stretta.

I dati MS/MS-PSD degli ioni proteici metastabili possono variare notevolmente in termini di complessità. Alcuni spettri MS/MS-PSD sono più facilmente interpretabili di altri. Ci sono diverse ragioni per questo fenomeno. In primo luogo, lo ione proteico potrebbe non frammentarsi in modo efficiente sulla scala temporale dell'analisi (~ 10-30 μs) forse perché rimane piegato o parzialmente piegato anche dopo la solubilizzazione nella soluzione a matrice MALDI. In secondo luogo, oltre alla PBC, gli ioni proteici metastabili possono subire una perdita dissociativa di piccole molecole, cioè ammoniaca (-17 Da) o acqua (-18 Da)15. Un contributo significativo alla complessità spettrale sembra essere la perdita dissociativa di ammoniaca dalla catena laterale dei residui di R33. Abbiamo osservato un aumento della complessità spettrale dei dati MS/MS-PSD con il numero di residui R nella sequenza proteica. Proteine senza residui di R (proteina YahO36 e proteina DspC33,43), con un residuo R (proteina D-shock fredda CspE33 e subunità B di Stx241), con due residui R (ipotetica proteina33), producono spettri MS/MS-PSD relativamente semplici e facili da interpretare. Tuttavia, quando il numero di residui di R aumenta a tre (proteina HU44)o quattro (ubiquitina35e proteina d'urto D-urto CsbD33,43),la complessità spettrale aumenta in modo significativo. Il software confronta gli ioni frammento di PBC a residui specifici del meccanismo di effetto dell'acido aspartico solo in quanto questo è il canale di dissociazione più accessibile degli ioni proteici metastabili caricati solo analizzati da MS / MS-PSD. Il software non include ioni frammento derivanti da perdita (o perdita) dissociativa di piccole molecole neutre. Di conseguenza, è importante che l'operatore non selezioni ioni frammento che includono piccole perdite dissociative neutre. Gli ioni frammento di PBC sono in genere gli ioni frammento più importanti; tuttavia, quando il numero di residui di R in una proteina aumenta a tre o quattro, lo ione frammento più abbondante in un sito PBC può essere quello che include una piccola perdita (o perdite) dissociative. Se viene rilevato un tale gruppo di ioni frammento (separati da multipli di 17 o 18 m/z), lo ione frammento con il più alto m/z all'interno di un cluster dovrebbe essere quello inserito nei parametri di ricerca dello ione frammento.

Va sottolineato che il software non è stato progettato per l'identificazione proteomica senza operatore. L'operatore deve selezionare quali ioni frammento dai dati MS/MS-PSD devono essere inclusi nella ricerca. Tuttavia, sulla base di numerosi esperimenti che hanno confermato l'effetto dell'acido aspartico da MS/ MS-PSD, gli ioni frammento più importanti sono sempre il risultato di PBC sul lato C-terminale dei residui D- o E- o N. L'utilità del software è che elimina molte sequenze ovviamente errate e recupera solo alcuni probabili candidati. Alcune sequenze candidate possono essere eliminate in base all'assenza di uno ione frammento in cui ci si aspetterebbe che un residuo D in una sequenza generi uno ione frammento prominente. Invariabilmente, i residui di D provocano ioni frammento prominenti in tutta la spina dorsale polipeptidica tranne quando si trovano all'interno di pochi residui di N- o C-termini dove l'efficienza dell'effetto acido aspartico diminuisce36.

Numero minimo di siti PBC necessari per l'identificazione provvisoria delle proteine
Un CFIP è formato da due ioni precursori proteici identici che si dissociano nello stesso sito PBC ma hanno il loro protone ionizzante su lati opposti del sito di scissione. Sebbene un CFIP possa essere utilizzato per calcolare la massa del biomarcatore proteico in modo più accurato (consentendo un restringimento della tolleranza alla massa proteica durante una ricerca), la sua utilità per l'identificazione specifica della sequenza è meno utile di quella di due ioni frammento non complementari formati da due diversi siti di scissione, che forniscono una maggiore specificità di identificazione. La facilità con cui sono state identificate le due proteine AB-Im ci ha portato a speculare sul numero minimo di ioni frammento necessari per identificare provvisoriamente la corretta sequenza proteica da migliaia di proteine o sequenze di frammenti proteici. Abbiamo rapidamente determinato che non era il numero di ioni frammento di per sé, ma il numero di ioni frammento non complementari che è importante perché ogni ione frammento non complementare rappresenta un sito PBC mentre un CFIP rappresenta lo stesso sito di scissione. Pertanto, la specificità di identificazione deriva dal numero di siti PBC rilevati non dal numero di ioni frammento.

È possibile che il successo nell'identificazione con solo tre ioni frammento possa essere stato semplicemente fortuito. Per testare questa ipotesi ed eliminare i pregiudizi nella selezione degli ioni frammento, abbiamo creato un modulo di benchmarking all'interno del software che seleziona casualmente ioni frammento da un pool più ampio di ioni frammento complementari e / o non complementari. Il pool di ioni frammento più grande è stato selezionato tra i 14 ioni frammento prominenti identificati nella Figura 3 (pannello inferiore) in base alla loro abbondanza relativa.

Il protocollo di test era il seguente. Utilizzando una ricerca binaria, tre ioni frammento sono stati selezionati in modo casuale dal pool di 14 ioni frammento prominenti nella Figura 3 (pannello inferiore) (m/z 1813.8, 2128.9, 3881.3, 4293.7, 5158.0, 6505.0, 6619.9, 6939.4, 7645.1, 7959.4, 8022.7, 8136.2, 8583.3 e 8961.5). Una coorte di ioni a tre frammenti è stata confrontata con ioni frammento in silico da PBC sul lato C-terminale di residui D- o E- o N, nonché una combinazione di D & E e D & E & N. Questo confronto è stato eseguito per ogni singolo frammento di ione di una coorte, per le tre coppie di ioni frammento di una coorte e per la combinazione di ioni a tre frammenti di una coorte. Affinché un confronto sia conteggiato come una corrispondenza, sia gli ioni frammento di una coppia che tutti e tre gli ioni frammento di una combinazione devono corrispondere agli ioni frammento in silico. Dopo il completamento dell'analisi, un'altra coorte di ioni a tre frammenti viene selezionata in modo casuale e l'analisi viene ripetuta. La ripetizione nella selezione degli ioni di frammento era consentita. Poiché ci sono 364 combinazioni possibili [(n!/r!( n-r)!] di una coorte ioica a tre frammenti (r) da un pool di 14 ioni frammento (n), sono state eseguite solo 10 analisi come mostrato nell'S1Im3 (Informazioni supplementari).

Il requisito di identificazione degli ioni a tre frammenti sembra essere un fenomeno generale, come mostrato nella colonna 3_ABC delle tabelle 2-7, 9-10 (S1Im3). Tutti i conteggi di 1 nella colonna 3_ABC corrispondono alla sequenza Im3 (senza metionina N-terminale). L'unico errore di identificazione si è verificato perché lo ione frammento a m/z 8136.2 (mostrato in Figura 3,pannello inferiore ed evidenziato in grigio nelle Tabelle 1 e 8)ha superato la tolleranza iogeni del frammento (±1,5 m/z) inserita per l'analisi. Poiché l'algoritmo di test richiede che tutti gli ioni frammento di una coorte di ioni a tre frammenti siano abbinati, qualsiasi gruppo che includesse lo ione frammento m / z 8136.2 non riuscirebbe a identificare / contare la sequenza proteica corretta.

La tabella 6 in S1Im3 mostra che quando due dei tre ioni frammento sono complementari (evidenziati in giallo), più sequenze errate corrispondono ai criteri rispetto a quelle osservate quando tutti e tre gli ioni frammento non erano complementari. Come notato in precedenza, questo perché un CFIP corrisponde a un singolo sito PBC, una soglia che è raggiungibile da molte più sequenze in silico errate rispetto all'utilizzo di due ioni frammento non complementari che corrispondono a due siti PBC, un criterio più rigoroso.

Un'analisi simile è stata eseguita su sei ioni frammento prominenti (m/z 2675.4, 2904.5, 3076.2, 3853.5, 5657.5 e 5772.8) di Im-Bac mostrati nella Figura 4 (pannello inferiore). A differenza di Im3, Im-Bac non ha CFIP distinguibile, quindi i sei ioni frammento corrispondono presumibilmente a sei siti PBC. Poiché ci sono 20 possibili combinazioni di una coorte di ioni a tre frammenti selezionata da un pool di sei ioni frammento, sono state eseguite solo 10 analisi come mostrato nelle tabelle di S2 Im-Bac (Informazioni supplementari). La sequenza Im-Bac è stata correttamente identificata/contata per tutti i gruppi ionici a tre frammenti nella colonna 3_ABC in tutte le analisi. In quattro analisi, sono state abbinate anche una o due sequenze errate. Tuttavia, questo piccolo numero di sequenze errate è un numero gestibile per la conferma manuale.

Nel complesso, gli ioni frammento complementari e/o non complementari che corrispondono a due o tre siti PBC sembrano fornire una specificità sufficiente per recuperare una o due sequenze candidate. Naturalmente, gli ioni frammento selezionati dall'operatore dovrebbero essere relativamente abbondanti e avere un buon S/N. Uno o due ioni frammento da un singolo sito PBC non forniscono una specificità sufficiente per evitare di recuperare un numero impraticabile di sequenze errate che devono essere confermate dall'operatore. Non è chiaro perché due o tre siti PBC siano adeguati, ma un singolo sito PBC apparentemente non è abbastanza specifico. Sebbene il troncamento senza restrizioni si traduca in circa 200.000 proteine e sequenze di frammenti proteici che soddisfano i criteri di massa proteica, è probabile che la natura specifica del sito / residuo dei siti di scissione, cioè il lato C-terminale dei residui D-, E-, e N, contribuisca al netto restringimento delle possibili sequenze durante il confronto tra frammenti ionici. Ciò può essere dovuto, in parte, alla frequenza dei residui D-, E-, e N-residue nelle sequenze proteiche batteriche, nonché alle loro posizioni uniche nelle sequenze proteiche attraverso il proteoma dei batteri. I residui acidi svolgono un ruolo fondamentale nella struttura proteica e nelle interazioni con i solventi. Di conseguenza, la loro frequenza e posizione nella sequenza primaria sono critiche se non uniche per la funzione proteica e possono spiegare perché sono necessari solo pochi siti PBC per identificare provvisoriamente la sequenza proteica corretta tra centinaia di migliaia di sequenze errate.

Dal punto di vista della chimica in fase gassosa, l'importanza dei residui D-, E e N deriva dalla loro partecipazione a un canale di dissociazione accessibile a basse energie interne di ioni proteici metastabili caricati solo generati da MALDI e decadimento da PSD20. La scala temporale relativamente lunga (~10-30 μs) della frammentazione degli ioni molecolari da parte della PSD significa che l'energia interna dello ione proteico è randomizzata tra tutti i gradi di libertà vibrazionale e rotazionale dello ione molecolare in modo tale che la dissociazione sia ergodica e statistica. Va inoltre sottolineato che il meccanismo dell'effetto acido aspartico comporta un riarrangiamento ionico molecolare che avviene per una sequenza di passi o un singolo passo concertato che coinvolge più atomi fino a raggiungere una geometria favorevole che abbassa la barriera di attivazione di PBC17,18,19.

Due proteine dell'immunità antibatterica codificate con plasmidi prodotte da un ceppo STEC sono state identificate utilizzando un protocollo che coinvolge l'induzione antibiotica, MALDI-TOF-TOF-MS/MS-PSD e l'analisi proteomica top-down. Queste proteine sono state identificate utilizzando un software sviluppato internamente che incorpora la massa misurata della proteina e un numero relativamente piccolo di ioni frammento specifici della sequenza formati a seguito dell'effetto dell'acido aspartico. Il software confronta i dati MS e MS/MS con le sequenze di proteine in silico e frammenti proteici derivati dai dati WGS. Sebbene il software non fornisca metriche di identificazione o punteggio, elimina una percentuale molto elevata di sequenze errate con conseguente numero molto piccolo di sequenze candidate (una o due) che possono essere facilmente confermate dall'ispezione manuale. Infine, l'ispezione manuale dei dati WGS di questo ceppo batterico ha rivelato un promotore (SOS box) a monte dei geni AB e Im in un genoma plasmidico, che razionalizza l'espressione di questi geni a causa dell'esposizione di antibiotici dannosi per il DNA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Gli autori non hanno conflitti di interesse.

Acknowledgments

Il software Protein Biomarker Seeker è disponibile gratuitamente (senza alcun costo) contattando Clifton K. Fagerquist all'clifton.fagerquist@usda.gov. Desideriamo riconoscere il sostegno a questa ricerca da parte di ARS, USDA, CRIS grant: 2030-42000-051-00-D.

Materials

Name Company Catalog Number Comments
4000 Series Explorer software AB Sciex Version 3.5.3
4800 Plus MALDI TOF/TOF Analyzer AB Sciex
Acetonitrile Optima LC/MS grade Fisher Chemical A996-1
BSL-2 biohazard cabinet The Baker Company SG403A-HE
Cytochrome-C Sigma C2867-10MG
Data Explorer software AB Sciex Version 4.9
Focus Protein Reduction-Alkylation kit G-Biosciences 786-231
GPMAW software Lighthouse Data Version 10.0
Incubator VWR 9120973
LB Agar Invitrogen 22700-025
Luria Broth Invitrogen 12795-027
Lysozyme Sigma L4919-1G
Microcentrifuge Tubes, 2 mL, screw-cap, O-ring Fisher Scientific 02-681-343
MiniSpin Plus Centrifuge Eppendorf 22620207
Mitomycin-C (from streptomyces) Sigma-Aldrich M0440-5MG
Myoglobin Sigma M5696-100MG
Shaker MaxQ 420HP Model 420 Thermo Scientific Model 420
Sinapinic acid Thermo Scientific 1861580
Sterile 1 uL loops Fisher Scientific 22-363-595
Thioredoxin (E. coli, recombinant) Sigma T0910-1MG
Trifluoroacetic acid Sigma-Aldrich 299537-100G
Water Optima LC/MS grade Fisher Chemical W6-4

DOWNLOAD MATERIALS LIST

References

  1. Fornelli, L., et al. Accurate sequence analysis of a monoclonal antibody by top-down and middle-down orbitrap mass spectrometry applying multiple ion activation techniques. Analytical Chemistry. 90 (14), 8421-8429 (2018).
  2. Fornelli, L., et al. Top-down proteomics: Where we are, where we are going. Journal of Proteomics. 175, 3-4 (2018).
  3. He, L., et al. Top-down proteomics-a near-future technique for clinical diagnosis. Annals of Translational Medicine. 8 (4), 136 (2020).
  4. Wu, Z., et al. MASH explorer: A universal software environment for top-down proteomics. Journal of Proteome Research. 19 (9), 3867-3876 (2020).
  5. Konermann, L., Metwally, H., Duez, Q., Peters, I. Charging and supercharging of proteins for mass spectrometry: recent insights into the mechanisms of electrospray ionization. Analyst. 144 (21), 6157-6171 (2019).
  6. Bourmaud, A., Gallien, S., Domon, B. Parallel reaction monitoring using quadrupole-Orbitrap mass spectrometer: Principle and applications. Proteomics. 16 (15-16), 2146-2159 (2016).
  7. Hart-Smith, G. A review of electron-capture and electron-transfer dissociation tandem mass spectrometry in polymer chemistry. Analitica Chimica Acta. 808, 44-55 (2014).
  8. Brodbelt, J. S., Morrison, L. J., Santos, I. Ultraviolet photodissociation mass spectrometry for analysis of biological molecules. Chemical Reviews. 120 (7), 3328-3380 (2020).
  9. Karas, M., Bachmann, D., Bahr, U., Hillenkamp, F. Matrix-assisted ultraviolet-laser desorption of nonvolatile compounds. International Journal of Mass Spectrometry and Ion Processes. 78, 53-68 (1987).
  10. Karas, M., Bachmann, D., Hillenkamp, F. Influence of the wavelength in high-irradiance ultraviolet-laser desorption mass-spectrometry of organic-molecules. Analytical Chemistry. 57 (14), 2935-2939 (1985).
  11. Tanaka, K., et al. Protein and polymer analyses up to m/z 100 000 by laser ionization time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 2 (8), 151-153 (1988).
  12. Resemann, A., et al. Top-down de Novo protein sequencing of a 13.6 kDa camelid single heavy chain antibody by matrix-assisted laser desorption ionization-time-of-flight/time-of-flight mass spectrometry. Analytical Chemistry. 82 (8), 3283-3292 (2010).
  13. Suckau, D., Resemann, A. T3-sequencing: targeted characterization of the N- and C-termini of undigested proteins by mass spectrometry. Analytical Chemistry. 75 (21), 5817-5824 (2003).
  14. Mikhael, A., Jurcic, K., Fridgen, T. D., Delmas, M., Banoub, J. Matrix-assisted laser desorption/ionization time-of-flight/time-of-flight tandem mass spectrometry (negative ion mode) of French Oak Lignin: A Novel Series of Lignin and Tricin Derivatives attached to Carbohydrate and Shikimic acid Moieties. Rapid Communications in Mass Spectrometry. 34 (18), 8841 (2020).
  15. Demirev, P. A., Feldman, A. B., Kowalski, P., Lin, J. S. Top-down proteomics for rapid identification of intact microorganisms. Analytical Chemistry. 77 (22), 7455-7461 (2005).
  16. Fagerquist, C. K. Unlocking the proteomic information encoded in MALDI-TOF-MS data used for microbial identification and characterization. Expert Review of Proteomics. 14 (1), 97-107 (2017).
  17. Gu, C., Tsaprailis, G., Breci, L., Wysocki, V. H. Selective gas-phase cleavage at the peptide bond C-terminal to aspartic acid in fixed-charge derivatives of Asp-containing peptides. Analytical Chemistry. 72 (23), 5804-5813 (2000).
  18. Herrmann, K. A., Wysocki, V. H., Vorpagel, E. R. Computational investigation and hydrogen/deuterium exchange of the fixed charge derivative tris(2,4,6-trimethoxyphenyl) phosphonium: implications for the aspartic acid cleavage mechanism. Journal of the American Society for Mass Spectrometry. 16 (7), 1067-1080 (2005).
  19. Rozman, M. Aspartic acid side chain effect-experimental and theoretical insight. Journal of the American Society for Mass Spectrometry. 18 (1), 121-127 (2007).
  20. Yu, W., Vath, J. E., Huberty, M. C., Martin, S. A. Identification of the facile gas-phase cleavage of the Asp-Pro and Asp-Xxx peptide bonds in matrix-assisted laser desorption time-of-flight mass spectrometry. Analytical Chemistry. 65 (21), 3015-3023 (1993).
  21. Luethy, P. M., Johnson, J. K. The use of Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry (MALDI-TOF MS) for the identification of pathogens causing sepsis. The Journal of Applied Laboratory Medicine. 3 (4), 675-685 (2019).
  22. Knabl, L., Lass-Florl, C. Antifungal susceptibility testing in Candida species: current methods and promising new tools for shortening the turnaround time. Expert Review of Anti-Infective Therapy. 18 (8), 779-787 (2020).
  23. Gould, O., Ratcliffe, N., Krol, E., de Lacy Costello, B. Breath analysis for detection of viral infection, the current position of the field. Journal of Breath Research. 14 (4), 041001 (2020).
  24. Fagerquist, C. K., et al. Sub-speciating Campylobacter jejuni by proteomic analysis of its protein biomarkers and their post-translational modifications. Journal of Proteome Research. 5 (10), 2527-2538 (2006).
  25. Sandrin, T. R., Goldstein, J. E., Schumaker, S. MALDI TOF MS profiling of bacteria at the strain level: a review. Mass Spectrometry Reviews. 32 (3), 188-217 (2013).
  26. Christner, M., et al. Rapid MALDI-TOF mass spectrometry strain typing during a large outbreak of Shiga-Toxigenic Escherichia coli. PLoS One. 9 (7), 101924 (2014).
  27. Masaki, H., Ohta, T. Colicin E3 and its immunity genes. Journal of Molecular Biology. 182 (2), 217-227 (1985).
  28. Michel, B. After 30 years of study, the bacterial SOS response still surprises us. PLoS Biology. 3 (7), 255 (2005).
  29. Fagerquist, C. K., Sultan, O. Induction and identification of disulfide-intact and disulfide-reduced beta-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS and top-down proteomics. Analyst. 136 (8), 1739-1746 (2011).
  30. Fagerquist, C. K., Sultan, O. Top-down proteomic identification of furin-cleaved alpha-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS. Journal of Biomedicine & Biotechnology. 2010, 123460 (2010).
  31. Fagerquist, C. K., et al. Top-down proteomic identification of Shiga toxin 2 subtypes from Shiga toxin-producing Escherichia coli by matrix-assisted laser desorption ionization-tandem time of flight mass spectrometry. Applied and Environmental Microbiology. 80 (9), 2928-2940 (2014).
  32. Fagerquist, C. K., Zaragoza, W. J., Lee, B. G., Yambao, J. C., Quiñones, B. Clinically-relevant Shiga toxin 2 subtypes from environmental Shiga toxin-producing Escherichia coli identified by top-down/middle-down proteomics and DNA sequencing. Clinical Mass Spectrometry. 11, 27-36 (2019).
  33. Fagerquist, C. K., Lee, B. G., Zaragoza, W. J., Yambao, J. C., Quiñones, B. Software for top-down proteomic identification of a plasmid-borne factor (and other proteins) from genomically sequenced pathogenic bacteria using MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 438, 1-12 (2019).
  34. Fagerquist, C. K., Rojas, E. ACS Fall 2020 Virtual Meeting & Expo. American Chemical Society, Virtual. , (2020).
  35. Fagerquist, C. K., Sultan, O. A new calibrant for matrix-assisted laser desorption/ionization time-of-flight-time-of-flight post-source decay tandem mass spectrometry of non-digested proteins for top-down proteomic analysis. Rapid Communications in Mass Spectrometry. 26 (10), 1241-1248 (2012).
  36. Fagerquist, C. K., Zaragoza, W. J. Complementary b/y fragment ion pairs from post-source decay of metastable YahO for calibration of MALDI-TOF-TOF-MS/MS. International Journal of Mass Spectrometry. 415, 29-37 (2017).
  37. Quinones, B., Yambao, J. C., Lee, B. G. Draft genome sequences of Escherichia coli O113:H21 strains recovered from a major produce production region in California. Genome Announcements. 5 (44), 01203-01217 (2017).
  38. Harrison, A. G. The gas-phase basicities and proton affinities of amino acids and peptides. Mass Spectrometry Reviews. 16 (4), 201-217 (1997).
  39. Fagerquist, C. K. Polypeptide backbone cleavage on the C-terminal side of asparagine residues of metastable protein ions analyzed by MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 457, (2020).
  40. Fagerquist, C. K., Zaragoza, W. J. Mass Spectrometry: Application to the Clinical Lab 2019 (MSACL 2019). , Palm Springs, CA. (2019).
  41. Fagerquist, C. K., Zaragoza, W. J. Bacteriophage cell lysis of Shiga toxin-producing Escherichia coli for top-down proteomic identification of Shiga toxins 1 & 2 using matrix-assisted laser desorption/ionization tandem time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 30 (6), 671-680 (2016).
  42. Fagerquist, C. K., et al. Web-based software for rapid top-down proteomic identification of protein biomarkers, with implications for bacterial identification. Applied and Environmental Microbiology. 75 (13), 4341-4353 (2009).
  43. Fagerquist, C. K., et al. Rapid identification of protein biomarkers of Escherichia coli O157:H7 by matrix-assisted laser desorption ionization-time-of-flight-time-of-flight mass spectrometry and top-down proteomics. Analytical Chemistry. 82 (7), 2717-2725 (2010).
  44. Maus, A., Bisha, B., Fagerquist, C., Basile, F. Detection and identification of a protein biomarker in antibiotic-resistant Escherichia coli using intact protein LC offline MALDI-MS and MS/MS. Journal of Applied Microbiology. 128 (3), 697-709 (2020).

Tags

Chimica Numero 171
Identificazione di proteine immunitarie antibatteriche in <em>Escherichia coli</em> utilizzando MALDI-TOF-TOF-MS/MS e analisi proteomica top-down
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Fagerquist, C. K., Rojas, E.More

Fagerquist, C. K., Rojas, E. Identification of Antibacterial Immunity Proteins in Escherichia coli using MALDI-TOF-TOF-MS/MS and Top-Down Proteomic Analysis. J. Vis. Exp. (171), e62577, doi:10.3791/62577 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter