IDBac er en åpen-kildekode Mass massespektrometri-baserte bioinformatikk rørledning som integrerer data fra både intakt protein og spesialiserte metabolitten Spectra, samlet på celle materiale skrapet fra bakterielle kolonier. Rørledningen gjør det mulig for forskere å raskt organisere hundrevis til tusenvis av bakterielle kolonier i antatte taksonomisk grupper, og ytterligere differensiere dem basert på spesialiserte metabolitten produksjon.
For å visualisere forholdet mellom bakteriell fylogeni og spesialisert metabolitten produksjon av bakterielle kolonier som vokser på næringsstoffer agar, utviklet vi IDBac-en lav pris og høy gjennomstrømming matrise-assistert laser desorpsjon/ionisering Time-of-Flight masse massespektrometri (MALDI-TOF MS) bioinformatikk rørledning. IDBac programvare er utviklet for ikke-eksperter, er fritt tilgjengelig, og i stand til å analysere noen få til tusenvis av bakterielle kolonier. Her presenterer vi prosedyrer for utarbeidelse av bakterie kolonier for MALDI-TOF MS analyse, MS instrument drift, og databehandling og visualisering i IDBac. Spesielt instruerer vi brukerne hvordan å klynge bakterier i dendrograms basert på protein MS fingeravtrykk og interaktivt opprette metabolitten Association Networks (MANs) fra spesialiserte metabolitten data.
En stor barriere for forskere som studerer bakteriell funksjon er evnen til raskt og samtidig vurdere taksonomisk identiteten til en mikroorganismen og dens evne til å produsere spesialiserte metabolitter. Dette har forhindret betydelige fremskritt i å forstå forholdet mellom bakteriell fylogeni og spesialisert metabolitten produksjon i de fleste bakterier isolert fra miljøet. Selv om MS-baserte metoder som bruker protein fingeravtrykk for å gruppere og identifisere bakterier er godt beskrevet1,2,3,4, disse studiene har generelt vært utført på små grupper av isolat, på en art-spesifikk måte. Viktigere, informasjon om spesialiserte metabolitten produksjon, en stor pådriver for mikrobiell funksjon i miljøet, har vært kommunefritt i disse studiene. Silva et al.5 nylig gitt en omfattende historie detaljering UNDERUSE av MALDI-TOF MS å analysere spesialiserte metabolitter og mangel på programvare for å avlaste dagens bioinformatikk flaskehalser. For å løse disse svakhetene, skapte vi IDBac, en bioinformatikk rørledning som integrerer både lineære og reflectron moduser MALDI-TOF MS6. Dette gjør at brukerne raskt visualisere og differensiere bakteriell isolerer basert på både protein og spesialiserte metabolitten MS fingeravtrykk, henholdsvis.
IDBac er kostnadseffektiv, høy gjennomstrømming, og designet for lå brukeren. Det er fritt tilgjengelig (chasemc.github.io/IDBac), og krever bare tilgang til en MALDI-TOF masse spektrometer (reflectron modus vil være nødvendig for spesialiserte metabolitten analyse). Prøve forberedelser er avhengig av den enkle “utvidet direkte overføring”-metoden7,8 og data samles inn med etterfølgende lineære og reflectron oppkjøp på ett enkelt MALDI sted. Med IDBac, er det mulig å analysere antatte fylogeni og spesialisert metabolitten produksjon av hundrevis av kolonier på under fire timer, inkludert prøve utarbeidelse, datainnsamling, og data visualisering. Dette presenterer en betydelig tid og kostnader fordel over tradisjonelle metoder for å identifisere bakterier (for eksempel gen sekvensering), og analysere metabolske output (flytende kromatografi-Mass massespektrometri [LCMS] og lignende kromatografiske metoder).
Ved hjelp av data innhentet i lineær modus analyse, sysselsetter IDBac hierarkisk Clustering å representere Relatedness av protein Spectra. Siden Spectra for det meste representerer ionisert ribosomal proteiner, gir de en representasjon av Fylogenetiske mangfoldet stede i en prøve. I tillegg inkorporerer IDBac reflectron modus data for å vise spesialiserte metabolitten fingeravtrykk som metabolitten Association Networks (MANs). MANs er bipartite nettverk som gir mulighet for enkel visualisering av delte og unike metabolitten produksjon mellom bakteriell isolerer. Den IDBac plattformen lar forskere til å analysere både protein og spesialiserte metabolitten data i tandem, men også individuelt hvis bare én data-type er ervervet. Viktigere, IDBac behandler rådata fra bruker og Xiamen instrumenter, samt txt, tab, CSV, mzXML, og mzML. Dette eliminerer behovet for manuell konvertering og formatering av datasett, og reduserer risikoen for bruker feil eller mishandling av MS-data betraktelig.
Den IDBac protokollen detaljer bakteriell protein og spesialiserte metabolitten datainnsamling og analyse av opptil 384 bakteriell isolerer i 4 timer av en enkelt forsker. Med IDBac er det ikke nødvendig å trekke ut DNA fra bakteriell isolerer eller generere spesialiserte metabolitten ekstrakter fra flytende gjæring kjøttkraft og analysere dem ved hjelp av kromatografiske metoder. I stedet, protein og spesialisert metabolitten data er samlet inn ved å spre materiale fra bakterielle kolonier direkte på en MALDI mål plate. Dette reduserer betydelig tid og kostnader forbundet med alternative teknikker som 16S rRNA gen sekvensering og LCMS9.
Det er viktig å legge en matrise blank og kalibrering flekker til MALDI plate, og vi anbefaler å bruke et passende antall replikerer for å sikre reproduserbarhet og statistisk tillit. Antallet replikeres vil bli eksperiment avhengig. For eksempel, hvis en bruker har til hensikt å differensiere tusenvis av kolonier fra en samling av miljømessige mangfold plater, færre replikerer kan være nødvendig (vår Lab samler tre tekniske replikerer per koloni). Alternativt, hvis en bruker ønsker å opprette en egendefinert database av stammer fra bestemte bakterielle arter å raskt bestemme sub-arter klassifikasjoner av ukjent isolat, deretter flere replikerer er hensiktsmessig (vår Lab samler åtte biologiske replikerer per eller belastning).
IDBac er et verktøy for raskt å skille svært relaterte bakterielle isolerer basert på antatte taksonomisk informasjon og spesialiserte metabolitten produksjon. Det kan utfylle eller tjene som en forløper til ortogonale metoder som i dybden genetiske analyser, studier som involverer metabolitten produksjon og funksjon, eller karakterisering av spesialiserte metabolitten struktur av Nuclear magnetisk resonans spektroskopi og/eller LC-MS/MS.
Specialized metabolitten produksjon (IDBac MANs) er svært utsatt for bakterielle vekstforhold, spesielt ved hjelp av ulike medier, som er en potensiell begrensning av metoden. Men disse egenskapene kan utnyttes av brukeren, som IDBac kan lett generere MANs viser forskjellene i spesialiserte metabolitten produksjon under en rekke vekstforhold. Det er viktig å merke seg at mens spesialiserte metabolitten fingeravtrykk kan variere fra vekst tilstand, har vi tidligere vist at protein fingeravtrykk fortsatt relativt stabilt på tvers av disse variablene (se Clark et al.6). Når du arbeider med miljømessige mangfold plater, anbefaler vi rensing bakteriell isolat før analyse for å redusere mulige bidrag fra nabokommunene bakteriell cross-talk.
Til slutt, mangelen på en søkbar offentlig database med protein MS fingeravtrykk er en stor brist i bruk av denne metoden for å klassifisere ukjente miljømessige bakterier. Vi opprettet IDBac med dette i tankene, og inkluderte automatisk konvertering av data til et Community-akseptert Open-Source format (mzML)10,11,12 og utviklet programvaren for å tillate søking, deling og opprettelse av egendefinerte databaser. Vi er i ferd med å skape en stor offentlig database (> 10000 fullt karakterisert stammer), som vil tillate klassifisering av noen isolerer til arten-nivå, inkludert lenker til GenBank tiltredelse tall når det er tilgjengelig.
IDBac er åpen kildekode og koden er tilgjengelig for alle å tilpasse sine dataanalyse og visualisering behov. Vi anbefaler at brukerne Rådfører seg med en omfattende mengde litteratur (sauer et al.7, Silva et al.5) for å hjelpe til med å støtte og designe sine eksperimentelle mål. Vi arrangerer et forum for diskusjon på: https://groups.google.com/forum/#!forum/idbac og et middel til å rapportere problemer med programvaren på: https://GitHub.com/chasemc/IDBacApp/Issues.
The authors have nothing to disclose.
Dette arbeidet ble støttet av National Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17; Det islandske forskningsfondet Grant 152336-051; og University of Illinois i Chicago oppstart midler. Også, vi takker følgende bidragsytere: Dr. Amanda Bulman for hjelp med MALDI-TOF MS protein oppkjøpet parametere; Dr. Terry Moore og Dr. Atul Jain for recrystallizing Alpha-cyano-4-hydroxycinnamic acid Matrix (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |