En massespektrometri-guidet genom minedrift protokol er etableret og beskrevet her. Den er baseret på oplysninger om genomsekvenser og LC-MS/MS-analyse og har til formål at lette identifikationen af molekyler fra komplekse mikrobielle ekstrakter og planteekstrakter.
Det kemiske rum, der er omfattet af naturlige produkter, er enormt og almindeligt ukendt. Derfor er praktiske metoder til at udføre vidtrækkende evaluering af deres funktioner i naturen og potentielle menneskelige fordele (f.eks for narkotika opdagelse applikationer) ønskes. Denne protokol beskriver kombinationen af genomminedrift (GM) og molekylære netværk (MN), to nutidige tilgange, der matcher genklyngekodede anmærkninger i hele genomsekvensering med kemiske struktursignaturer fra rå metaboliske ekstrakter. Dette er det første skridt i retning af opdagelsen af nye naturlige enheder. Disse begreber, når de anvendes sammen, er defineret her som MS-guidet genom minedrift. I denne metode er de vigtigste komponenter tidligere udpeget (ved hjælp af MN), og strukturelt relaterede nye kandidater er forbundet med genom sekvens anmærkninger (ved hjælp af GM). Kombinere GM og MN er en rentabel strategi for at målrette nye molekyle backbones eller høste metaboliske profiler med henblik på at identificere analoger fra allerede kendte forbindelser.
Undersøgelser af sekundær metabolisme består ofte af screening af rå ekstrakter til specifikke biologiske aktiviteter efterfulgt af rensning, identifikation og karakterisering af bestanddele, der tilhører aktive fraktioner. Denne proces har vist sig at være effektiv og har fremmet isolationen af flere kemiske enheder. Men i dag er dette ses som umuligt, primært på grund af de høje satser for genopdagelse. Som den farmaceutiske industri revolutionerede uden kendskab til roller og funktioner specialiserede metabolitter, deres identifikation blev udført under laboratorieforhold, der ikke præcist repræsenterer naturen1. I dag er der en bedre forståelse af naturlige signalering påvirkninger, sekresion, og tilstedeværelsen af de fleste mål på målbart lave koncentrationer. Derudover vil regulering af processen hjælpe det akademiske samfund og medicinalindustrien til at drage fordel af denne viden. Det vil også gavne forskning, der indebærer direkte isolering af metabolitter i forbindelse med tavse biosyntetiske genklynger (BGC)2.
I den forbindelse har fremskridt inden for genomisk sekventering fornyet interesse for screening af mikroorganismers metabolitter. Dette skyldes, at analysere genomiske oplysninger om udækkede biosyntetiske klynger kan afsløre gener, der koder nye forbindelser, der ikke observeres eller produceres under laboratorieforhold. Mange mikrobielle hele genom projekter eller udkast er tilgængelige i dag, og antallet vokser hvert år, hvilket giver massive udsigter til at afdække nye bioaktive molekyler gennem genom minedrift3,4.
Atlasset over biosyntetiske genklynger er den nuværende største samling af automatisk udvindede genklynger som en del af den integrerede mikrobielle genomplatform under Joint Genome Institute (JGI IMG-ABC)2. Senest har minimuminformationen for biosyntetiske genklynger (MIBiG) Standardiseringsinitiativ fremmet manuel reannotation af bgcs, hvilket giver et meget kurateret referencedatasæt5. I dag, masser af værktøjer er tilgængelige for at muliggøre beregningsmæssige minedrift af genetiske data og deres forbindelse til kendte sekundære metabolitter. Der er også udviklet forskellige strategier for at få adgang til nye bioaktive naturprodukter (dvs. heterologt udtryk, målgensletning, in vitro-rekonstitution, genomisk sekvens, isotopstyret screening [genomisotoptilgang], manipulation af lokale og globale tilsynsmyndigheder, resistensmålbaseret minedrift, kulturuafhængig minedrift og senest MS-styrede/kodetilgange22,6,7,8,9, 10,11,12,13,14,15).
Genomminedrift som en enestående strategi kræver en indsats for at anmærke en enkelt eller lille gruppe molekyler; dermed er der stadig huller i processen, hvor nye forbindelser prioriteres til isolation og strukturbelysning. I princippet er disse tilgange kun rettet mod én biosyntetisk vej pr. eksperiment, hvilket resulterer i en langsom opdagelseshastighed. I denne forstand er brugen af GM sammen med en molekylær netværkstilgang et vigtigt fremskridt for forskning i naturlige produkter14,15.
Alsidigheden, nøjagtigheden og den høje følsomhed af flydende kromatografi-massespektrometri (LC-MS) gør det til en god metode til sammentæding identifikation. I øjeblikket har flere platforme investeret algoritmer og software suiter for ikke-målrettede metabolomics16,17,18,19,20. Kernen i disse programmer omfatter funktionsregistrering (peak picking)21 og peak alignment, som giver mulighed for match af identiske funktioner på tværs af en batch af prøver og søge efter mønstre. MS mønster-baserede algoritmer22,23 sammenligne karakteristiske fragmentering mønstre og matche MS2 ligheder genererer molekylære familier deler strukturelle funktioner. Disse funktioner kan derefter fremhæves og grupperes, hvilket giver mulighed for hurtigt at opdage kendte og ukendte molekyler fra en kompleks biologisk ekstrakt ved tandem MS2,24,25. Tandem MS er derfor en alsidig metode til at få strukturelle oplysninger om flere kemotyper, der er indeholdt i en stor mængde data samtidigt.
Global Natural Products Social Molecular Networking (BNPS)26 algoritme bruger den normaliserede fragment ioner intensitet til at konstruere flerdimensionale vektorer, hvor ligheder sammenlignes ved hjælp af en cosinus funktion. Forholdet mellem forskellige overordnede ioner afbildes i en diagramrepræsentation, hvor hver fragmentering visualiseres som en node (cirkler), og hver nodes sammenktening defineres af en kant (linjer). Den globale visualisering af molekyler fra en enkelt kilde defineres som et molekylært netværk. Strukturelt divergerende molekyler, der fragmenterer entydigt vil danne deres egen specifikke klynge eller konstellation, mens beslægtede molekyler klynge sammen. Klyngedannelse kemotyper tillader den hypotetiske tilslutning af lignende strukturelle træk til deres biosyntetiske oprindelse.
Kombinationen af både kemotype-til-genotype og genotype-til-kemotype tilgange er kraftfuld, når man skaber bioinformatik forbindelser mellem BGCs og deres små molekyle produkter27. Derfor ms-guidede genom minedrift er en hurtig metode og lav materiale-forbrugende strategi, og det hjælper bro forældre ioner og biosyntetiske veje afsløret af WGS af en eller flere stammer under forskellige metaboliske og miljømæssige forhold.
Arbejdsprocessen i denne protokol (figur 1) består i at fodre WGS-data i en biosyntetisk genklyngeanmærkningsplatform som antiSMASH28,29,30. Det hjælper med at vurdere de mange forskellige forbindelser og klasse af forbindelser kodet af genomet. Der skal vedtages en strategi for at målrette indsatsen mod en biosyntetisk genklynge , der koder en kemisk enhed af interesse , og dyrkningsekstrakter fra en vild typestamme og/eller heterolog stamme , der indeholder BGC , kan analyseres for at generere klyngebaserede ioner baseret på ligheder ved hjælp af GNPS26,31. Det er derfor muligt at identificere nye molekyler, der forbinder med den målrettede BGC, og som ikke er tilgængelige i databasen (hovedsagelig ukendte analoger, undertiden fremstillet i lave titers). Det er relevant at antage, at brugerne kan bidrage til disse platforme, og at tilgængeligheden af bioinformatik og MS/MS-data stiger hurtigt, hvilket fører til en konstant udvikling og opgradering af effektive beregningsværktøjer og algoritmer til at styre effektive forbindelser af komplekse ekstrakter med molekyler.
Figur 1: Oversigt over hele arbejdsprocessen. Vist er en illustration af bioinformatik, kloning, og molekylære netværkstrin involveret i den beskrevne MS-guidede genom minedrift tilgang til at identificere nye metabolitter. Klik her for at se en større version af dette tal.
Denne protokol beskriver en hurtig og effektiv arbejdsgang til at kombinere genomminedrift og molekylære netværk som udgangspunkt for den naturlige produktopdagelsespipeline. Selv om mange applikationer er i stand til at visualisere sammensætningen og relatedness af MS-påviselige molekyler i et netværk, flere er vedtaget her for at visualisere strukturelt lignende grupperede molekyler. Ved hjælp af denne strategi, nye cyclodepsipeptid produkter observeret i metaboliske ekstrakter af Streptomyces sp. CBMAI 2042 er med succes identificeret. Styret af genomminedrift, hele biosyntetiske gen klynge kodning for valinomyciner er anerkendt og klonet ind i producenten stamme Streptomyces coelicolor M1146. Endelig, efter en MS mønster-baserede molekylære netværk, molekyler opdaget af MS er korreleret med BGCs ansvarlig for deres biogenesis32.
Den største fordel ved denne protokol er dens evne til hurtigt at dereplikere metaboliske profiler og bro genomiske oplysninger med MS data med henblik på at belyse strukturerne i nye molekyler, især strukturelle analoger2. På grundlag af genomiske oplysninger kan forskellige naturlige produkters kemotyper undersøges, såsom polyketid (PK), nonribosomale peptider (NRP) og glycosylated natural products (BNP) samt kryptiske BGCs. Metabolomisk screening giver beviser for aktiverede BGC-profiler …
The authors have nothing to disclose.
Den finansielle støtte til denne undersøgelse blev ydet af São Paulo Research Foundation – FAPESP (2019/10564-5, 2014/12727-5 og 2014/50249-8 til L.G.O; 2013/12598-8 og 2015/01013-4 til R.S.; og 2019/08853-9 til C.F.F.A). B.S.P, C.F.F.A., og L.G.O. modtog stipendier fra Det Nationale Råd for Videnskabelig og Teknologisk Udvikling – CNPq (205729/2018-5, 162191/2015-4 og 313492/2017-4). L.G.O. er også taknemmelig for tilskuddet fra programmet For Women in Science (2008, Brasilianske Edition). Alle forfattere anerkender CAPES (Koordinering for forbedring af de videregående uddannelser personale) for at støtte post-graduering programmer i Brasilien.
Acetonitrile | Tedia | AA1120-048 | HPLC grade |
Agar | Oxoid | LP0011 | NA |
Apramycin | Sigma Aldrich | A2024 | NA |
Carbenicillin | Sigma Aldrich | C9231 | NA |
Centrifuge | Eppendorf | NA | 5804 |
Chloramphenicol | Sigma Aldrich | C3175 | NA |
Column C18 | Agilent Technologies | NA | ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902 |
Kanamycin | Sigma Aldrich | K1377 | NA |
Manitol P.A.- A.C.S. | Synth | NA | NA |
Microcentrifuge | Eppendorf | NA | 5418 |
Nalidixic acid | Sigma Aldrich | N4382 | NA |
Phusion Flash High-Fidelity PCR Master Mix | ThermoFisher Scientific | F548S | NA |
Q-TOF mass spectrometer | Agilent technologies | NA | 6550 iFunnel Q-TOF LC/MS |
Sacarose P.A.- A.C.S. | Synth | NA | NA |
Shaker/Incubator | Marconi | MA420 | NA |
Sodium Chloride | Synth | NA | P. A. – ACS |
Soy extract | NA | NA | NA |
Sucrose | Synth | NA | P. A. – ACS |
Thermal Cycles | Eppendorf | NA | Mastercycler Nexus Gradient |
Thiostrepton | Sigma Aldrich | T8902 | NA |
Tryptone | Oxoid | LP0042 | NA |
Tryptone Soy Broth | Oxoid | CM0129 | NA |
UPLC | Agilent Technologies | NA | 1290 Infinity LC System |
Yeast extract | Oxoid | LP0021 | NA |