IDBac är en öppen källkod masspektrometri-baserad bioinformatik pipeline som integrerar data från både intakt protein och specialiserade metabolitspektra, som samlats in på cell material skrapats från bakteriella kolonier. Pipelinen gör det möjligt för forskare att snabbt organisera hundratals till tusentals bakteriella kolonier till förmodade taxonomiska grupper, och ytterligare differentiera dem baserat på specialiserad metabolit produktion.
För att visualisera sambandet mellan bakteriell fylogeni och specialiserade metabolit produktion av bakteriella kolonier som växer på näringsagar, utvecklade vi IDBac-en låg kostnad och hög genomströmning Matrix-Assisted laserdesorption/jonisering masspektrometri (MALDI-TOF MS) för bioinformatik vid tiden för flygning. IDBac programvara är utformad för icke-experter, är fritt tillgänglig, och kan analysera några till tusentals bakteriella kolonier. Här presenterar vi procedurer för beredning av bakteriekolonier för MALDI-TOF MS-analys, MS-instrumentdrift och databehandling och visualisering i IDBac. I synnerhet, vi instruera användare hur man kluster bakterier i dendrogram baserat på protein MS fingeravtryck och interaktivt skapa metabolit Association nätverk (MANs) från specialiserade metabolit data.
Ett stort hinder för forskare som studerar bakteriell funktion är förmågan att snabbt och samtidigt bedöma den taxonomiska identiteten hos en mikroorganism och dess förmåga att producera specialiserade metaboliter. Detta har hindrat betydande framsteg i förståelsen av sambandet mellan bakteriell fylogeni och specialiserad metabolit produktion i de flesta bakterier isolerade från miljön. Även om MS-baserade metoder som använder protein fingeravtryck för att gruppera och identifiera bakterier är väl beskrivna1,2,3,4, dessa studier har i allmänhet utförts på små grupper av isolat, på ett artspecifikt sätt. Viktigt, information om specialiserad metabolit produktion, en stor drivrutin för mikrobiell funktion i miljön, har förblivit oinkorporerade i dessa studier. Silva et al.5 tillhandahöll nyligen en omfattande historia som beskriver underutnyttjandet av MALDI-TOF MS för att analysera specialiserade metaboliter och bristen på programvara för att lindra nuvarande flaskhalsar i bioinformatik. För att ta itu med dessa brister skapade vi IDBac, en pipeline för bioinformatik som integrerar både linjära och reflectron lägen av MALDI-TOF MS6. Detta gör det möjligt för användare att snabbt visualisera och differentiera bakteriella isolat baserat på både protein och specialiserade metaboliten MS fingeravtryck, respektive.
IDBac är kostnadseffektivt, högt dataflöde och utformat för den lekmanna användaren. Det är fritt tillgängligt (chasemc.github.io/IDBac), och endast kräver tillgång till en MALDI-TOF masspektrometer (reflectron läge kommer att krävas för specialiserad metabolit analys). Provberedning förlitar sig på den enkla “utökade direktöverföringen” metod7,8 och data samlas in med konsekutiva linjära och reflectron förvärv på en enda MALDI-Target spot. Med idbac, är det möjligt att analysera den förmodade fylogeni och specialiserade metabolit produktion av hundratals kolonier på under fyra timmar, inklusive provberedning, datainsamling, och datavisualisering. Detta ger en betydande tid och kostnadsfördel jämfört med traditionella metoder för att identifiera bakterier (såsom gensekvensering), och analysera metabolisk produktion (vätskekromatografi-masspektrometri [LCMS] och liknande kromatografiska metoder).
Med hjälp av data som erhållits i linjär lägesanalys använder IDBac hierarkisk klustring för att representera protein spektra. Eftersom spektra främst representerar joniserade ribosomala proteiner, ger de en representation av den fylogenetiska mångfalden som finns i ett prov. Dessutom innehåller IDBac reflectron läge data för att Visa specialiserade metabolit fingeravtryck som Metabolitassociation nätverk (MANs). MANs är tvåpartsnätverk som möjliggör enkel visualisering av delad och unik metabolit produktion mellan bakteriella isolat. IDBac-plattformen gör det möjligt för forskare att analysera både protein och specialiserade metabolitdata parallellt men också individuellt om endast en data typ förvärvas. Viktigare, IDBac processer rådata från Bruker och Xiamen instrument, samt txt, tab, CSV, mzXML, och mzML. Detta eliminerar behovet av manuell konvertering och formatering av datauppsättningar, och avsevärt minskar risken för användarfel eller misskötsel av MS-data.
Den IDBac protokoll Detaljer bakteriella protein och specialiserade metabolit datainsamling och analys av upp till 384 bakteriella isolat i 4 h av en enda forskare. Med IDBac finns det ingen anledning att extrahera DNA från bakteriella isolat eller generera specialiserade metabolitextrakt från flytande fermenterings buljonger och analysera dem med hjälp av kromatografiska metoder. Istället, protein och specialiserade metabolit data samlas genom att helt enkelt sprida material från bakteriella kolonier direkt på en MALDI måltavla. Detta minskar kraftigt tiden och kostnaden i samband med alternativa tekniker såsom 16S rRNA Gene sekvensering och LCMS9.
Det är viktigt att lägga till en matris blank och kalibreringspunkter till MALDI plattan, och vi rekommenderar att du använder ett lämpligt antal replikat för att säkerställa reproducerbarhet och statistiskt förtroende. Antalet replikat kommer att vara experiment beroende. Till exempel, om en användare avser att skilja tusentals kolonier från en samling av miljö mångfald plattor, kan färre replikat vara nödvändigt (vårt labb samlar in tre tekniska replikat per koloni). Alternativt, om en användare vill skapa en anpassad databas av stammar från specifika bakteriella taxa för att snabbt fastställa underarter klassificeringar av okända isolat, då fler replikat är lämpliga (vårt labb samlar in åtta biologiska replikat per stam).
IDBac är ett verktyg för att snabbt differentiera mycket relaterade bakteriella isolat baserat på förmodade taxonomisk information och specialiserad metabolit produktion. Det kan komplettera eller fungera som en föregångare till ortogonala metoder såsom djupgående genetiska analyser, studier med metabolit produktion och funktion, eller karakterisering av specialiserad metabolit struktur med kärnmagnetisk resonans-spektroskopi och/eller LC-MS/MS.
Specialiserade metabolitproduktion (IDBac MANs) är mycket mottagliga för bakterietillväxt villkor, särskilt med hjälp av olika medier, vilket är en potentiell begränsning av metoden. Men dessa egenskaper kan utnyttjas av användaren, som IDBac kan lätt generera MANs visar skillnaderna i specialiserade metabolit produktion under en mängd olika tillväxtförhållanden. Det är viktigt att notera att medan specialiserade metabolit fingeravtryck kan variera beroende på tillväxt, har vi tidigare visat att protein fingeravtryck förblir relativt stabila över dessa variabler (se Clark et al.6). När man arbetar med miljö mångfald plattor, rekommenderar vi rening av bakteriella isolat före analys för att minska eventuella bidrag från angränsande bakteriell Cross-Talk.
Slutligen, avsaknaden av en sökbar offentlig databas med protein MS fingeravtryck är en stor brist i användningen av denna metod för att klassificera okända miljö bakterier. Vi skapade idbac med detta i åtanke, och inkluderade automatiserad omvandling av data till ett community-accepterat Open-Source format (mzml)10,11,12 och utformat programvaran för att möjliggöra sökning, delning och skapandet av anpassade databaser. Vi håller på att skapa en stor offentlig databas (> 10000 fullt karakteriserade stammar), som kommer att möjliggöra klassificering av vissa isolat på Art-nivå, inklusive länkar till GenBank anslutningsnummer när de är tillgängliga.
IDBac är öppen källkod och koden är tillgänglig för alla att anpassa sina dataanalys och visualisering behov. Vi rekommenderar att användare konsultera en omfattande litteratur (Sauer et al.7, Silva et al.5) för att hjälpa till att stödja och utforma sina experimentella mål. Vi är värd för ett diskussionsforum på: https://groups.Google.com/forum/#!forum/idbac och ett sätt att rapportera problem med programvaran på: https://github.com/chasemc/IDBacApp/Issues.
The authors have nothing to disclose.
Detta arbete stöddes av nationella institutet för allmän medicinsk vetenskap Grant R01 GM125943, National Geographic Grant CP-044R-17; Isländska forskningsfonden Grant 152336-051; och University of Illinois at Chicago Startup Funds. Dessutom tackar vi följande bidragsgivare: Dr Amanda Bulman för hjälp med MALDI-TOF MS protein förvärvs parametrar; Dr Terry Moore och Dr Atul Jain för recrystallizing alfa-cyano-4-hydroxycinnamic Acid Matrix (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |