Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Mass pektrometri-guidad genombrytning som ett verktyg för att avslöja nya naturliga produkter

Published: March 12, 2020 doi: 10.3791/60825

Summary

Här upprättas och beskrivs här ett masspektrometristyrt styrt genombrytningsprotokoll. Den bygger på genomsekvensinformation och LC-MS/MS-analys och syftar till att underlätta identifiering av molekyler från komplexa mikrobiella och växtextrakt.

Abstract

Det kemiska utrymme som täcks av naturliga produkter är enorm och allmänt okända. Därför, praktiska metoder för att utföra omfattande utvärdering av deras funktioner i naturen och potentiella mänskliga fördelar (t.ex. för drug discovery applikationer) önskas. Detta protokoll beskriver kombinationen av genombrytning (GM) och molekylära nätverk (MN), två samtida metoder som matchar genklusterkodade anteckningar i hela genomsekvensering med kemisk struktur signaturer från råa metaboliska extrakt. Detta är det första steget mot upptäckten av nya naturliga enheter. Dessa begrepp definieras här som MS-vägledd genombrytning. I den här metoden har huvudkomponenterna tidigare betecknats (med MN) och strukturellt relaterade nya kandidater associeras med genomsekvensanteckningar (med GM). Kombinera GM och MN är en lönsam strategi för att rikta nya molekyl ben eller skörda metaboliska profiler för att identifiera analoger från redan kända föreningar.

Introduction

Undersökningar av sekundär metabolism består ofta av screening råextrakt för specifika biologiska aktiviteter följt av rening, identifiering och karakterisering av de beståndsdelar som tillhör aktiva fraktioner. Denna process har visat sig vara effektiv och främjat isolering av flera kemiska enheter. Men numera är detta ses som omöjligt, främst på grund av den höga andelen återupptäckt. Eftersom läkemedelsindustrin revolutionerade utan kunskap om specialiserade metaboliters roller och funktioner utfördes deras identifiering under laboratorieförhållanden som inte korrekt representerade naturen1. Idag finns det en bättre förståelse för naturliga signalering influenser, sekretion, och förekomsten av de flesta mål på omätbart låga koncentrationer. Dessutom kommer reglering av processen att hjälpa den akademiska världen och läkemedelsindustrin att dra nytta av denna kunskap. Det kommer också att gynna forskning som omfattar direkt isolering av metaboliter relaterade till tysta biosyntetiska genkluster (BGCs)2.

I detta sammanhang har framsteg inom genomisk sekvensering förnyat intresset för screening av mikroorganismmetaboliter. Detta beror på att analysera genomisk information av avslöjade biosyntetiska kluster kan avslöja gener kodning nya föreningar som inte observerats eller produceras under laboratorieförhållanden. Många mikrobiella hela genom projekt eller utkast finns idag, och antalet växer varje år, vilket ger stora möjligheter att avslöja nya bioaktiva molekyler genom gruvdrift3,4.

Atlas of Biosynthetic Gene Clusters är den nuvarande största samlingen av automatiskt minerade genkluster som en del av den integrerade mikrobiella genomplattformen vid Joint Genome Institute (JGI IMG-ABC)2. Senast har standardiseringsinitiativet för biosyntetiska genkluster (MIBiG) främjat den manuella reannotationen av BGC, vilket ger en mycket kurerad referensdatauppsättning5. Numera finns det gott om verktyg för att möjliggöra beräkningsbrytning av genetiska data och deras anslutning till kända sekundära metaboliter. Olika strategier har också utvecklats för att få tillgång till nya bioaktiva naturprodukter (dvs. heterologuttryck, målgenborttagning, in vitro-reconstitution, genomisk sekvens, isotopstyrd screening [genomisotopmetoden], manipulering av lokala och globala tillsynsmyndigheter, motståndsbaserad gruvdrift, kulturoberoende gruvdrift och, på senare tid, MS-guidad/kod närmar sig2,6,,7,8,9, 10,11,12,13,14,15).

Genombrytning som en enastående strategi kräver insatser för att kommentera en enda eller liten grupp molekyler; Därmed kvarstår luckor i processen där nya föreningar prioriteras för isolering och strukturklarklarering. I princip, dessa metoder mål endast en biosyntetisk väg per experiment, vilket resulterar i en långsam upptäckt takt. I denna mening, med hjälp av GM tillsammans med en molekylär nätverksstrategi utgör ett viktigt framsteg för naturliga produktforskning14,15.

Mångsidigheten, noggrannheten och den höga känsligheten hos flytande kromatografi-masspektrometri (LC-MS) gör det till en bra metod för sammansatt identifiering. För närvarande har flera plattformar investerat algoritmer och programsviter för oriktade metabolomik16,17,18,19,20. Kärnan i dessa program innehåller funktionsdetektering (toppplockning)21 och toppjustering, vilket gör att matchning av identiska funktioner mellan en grupp prover och sökning efter mönster. MS mönsterbaserade algoritmer22,23 jämföra karakteristiska fragmentering mönster och matcha MS2 likheter som genererar molekylära familjer som delar strukturella funktioner. Dessa funktioner kan sedan markeras och grupperas, vilket ger möjlighet att snabbt upptäcka kända och okända molekyler från ett komplext biologiskt extrakt av tandem MS2,24,25. Tandem MS är därför en mångsidig metod för att få strukturell information av flera chemotypes som finns i en stor mängd data samtidigt.

Algoritmen Global Natural Products Social Molecular Networking (GNPS)26 använder den normaliserade fragmentjonintensiteten för att konstruera flerdimensionella vektorer, där likheter jämförs med hjälp av en cosinfunktion. Förhållandet mellan olika överordnade joner ritas i en diagramrepresentation, där varje fragmentering visualiseras som en nod (cirklar) och relateradheten för varje nod definieras av en kant (linjer). Den globala visualiseringen av molekyler från en enda källa definieras som ett molekylärt nätverk. Strukturellt divergerande molekyler som fragmenterar unikt kommer att bilda sin egen specifika kluster eller konstellation, medan relaterade molekyler kluster tillsammans. Klustring chemotypes möjliggör hypotetisk anslutning av liknande strukturella funktioner till deras biosyntetiska ursprung.

Kombinera både chemotype-to-genotyp och genotyp-till-chemotype metoder är kraftfull när du skapar bioinformatik länkar mellan BGCs och deras små molekylprodukter27. Därför är MS-guidad genombrytning en snabb metod och låg materialförbrukande strategi, och det hjälper bro moderjoner och biosyntetiska vägar avslöjas av WGS av en eller flera stammar under olika metaboliska och miljömässiga förhållanden.

Arbetsflödet för detta protokoll (figur 1) består av att mata WGS-data till en biosyntetisk genklusteranteckningsplattform som antiSMASH28,29,30. Det hjälper till att uppskatta olika föreningar och klass av föreningar kodade av genomet. En strategi för att rikta en biosyntetisk gen kluster kodning en kemisk enhet av intresse måste antas, och kultur extrakt från en vild typ stam och / eller heterolog stam som innehåller BGC kan analyseras för att generera klustrade joner baserat på likheter med GNPS26,31. Följaktligen är det möjligt att identifiera nya molekyler som associerar med den riktade BGC och som inte är tillgängliga i databasen (huvudsakligen okända analoger, ibland producerade i lågtiter). Det är relevant att anse att användarna kan bidra till dessa plattformar och att tillgången till bioinformatik och MS/MS-data ökar snabbt, vilket leder till en ständig utveckling och uppgradering av effektiva beräkningsverktyg och algoritmer för att styra effektiva anslutningar av komplexa extrakt med molekyler.

Figure 1
Bild 1: Översikt över hela arbetsflödet. Visas är en illustration av bioinformatik, kloning och molekylära nätverk steg som deltar i den beskrivna MS-guidad genomgruva strategi för att identifiera nya metaboliter. Klicka här för att se en större version av denna siffra.

Detta protokoll beskriver ett snabbt och effektivt arbetsflöde för att kombinera genombrytning och molekylära nätverk som utgångspunkt för den naturliga produktidentifieringspipelinen. Även om många applikationer kan visualisera sammansättningen och släktskapen hos MS-detekterbara molekyler i ett nätverk, antas flera här för att visualisera strukturellt liknande klustrade molekyler. Med hjälp av denna strategi, nya cyclodepsipeptide produkter som observerats i metaboliska extrakt av Streptomyces sp. CBMAI 2042 identifieras framgångsrikt. Guidad av genombrytning, hela biosyntetiska genkluster kodning för valinomycins är erkänd och klonas i producenten stam Streptomyces coelicolor M1146. Slutligen, efter en MS mönster-baserade molekylära nätverk, de molekyler som upptäckts av MS är korrelerade med BGCs ansvarar för deras biogenesis32.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Genombrytning för biosyntetiska genkluster

  1. Utför hela genomsekvensering (WGS) som det första steget för att välja ett biosyntetiskt genkluster (BCG) för MS-guidad genombrytning. Hela genomet utkast av stam av intresse (bakterier) kan erhållas genom Illumina MiSeq teknik med hjälp av följande med hög kvalitet genomisk DNA: hagelgevär TruSeq PCR-Free bibliotek prep och Nextera Mate Pair Library Preparation Kit33.
    OBS: Efter sekvensering kan Illumina hagelgevärbibliotek och Illumina mate pair library monteras med Newbler v3.0 (Roche, 454) assembler program (finns på ) och kommenterade med hjälp av en pipeline baserad på FgeneSB (finns på ), som beskrivits tidigare33. Microbiology Resource Announcements (MRA) är en helt öppen åtkomsttidskrift med artiklar som publicerar tillgängligheten för mikrobiologiska resurser som deponerats i en tillgänglig databas (finns på ). Kandidaten protein-kodning gener identifieras med hjälp av RAST server anteckning34, och Hela Genomet Shotgun (WGS) projektet deponeras i DDBJ/ENA/GenBank (finns på ) och Gold (finns på ) sekvens databaser.
  2. För att få i silico information om sekundär metabolism genkluster anteckningar från en komplett sekvenserade genom, skicka sekvensfilen (GenBank / EMBL eller FASTA format) till en antiSMASH plattform (finns på ).
  3. Välj genkluster av intresse från utdata (bild 2) baserat på det mest liknande kända klustret.
    OBS: För det första är det rutin att utforska gen-för-gen och genomföra enskilda sökningar (blastp) för att utvärdera vilka funktioner som är associerade med de önskade biosyntetiska gengrupperna. Den här proceduren kan också hjälpa till att avgöra vilken BGC sannolikt är associerad med produktionen av en önskad förening, även om det är en låg procentsats. En antiSMASH förutsägelse anser att alla gener i ett kluster för att göra procentuell täckning, vilket kan utgöra en global låg andel av likheten för den riktade BGC. Men vid analys av gen-för-gen, är det möjligt att få mer exakt information med hjälp av de mest liknande kända klustret. För det andra har antiSMASH två alternativ för att förfina en sökning: 1) upptäckt strikthet: graden av stränghet som det biosyntetiska genklustret måste betraktas som en hit. För det här alternativet bör användaren använda följande parametrar: a) strikt: identifierar uteslutande väldefinierade kluster som innehåller alla nödvändiga regioner, omottagliga för fel om genetisk information; b) avslappnad: upptäcker partiella kluster som saknar en eller flera funktionella regioner, som också fungerar för att upptäcka den strikta funktionen; eller c) lös: upptäcker dåligt definierade kluster och kluster som sannolikt matchar primära metaboliter, vilket kan leda till uppkomsten av falska positiva eller dåligt definierade BGCs. Det andra alternativet är 2) extra funktioner: vilken typ av information plattformen måste söka efter och visa i utdata. I allmänhet kan dessa två alternativ spara tid efter förutsägelsen. AntiSMASH-jobbet kräver dock en längre tidsperiod.

Figure 2
Bild 2: Utdata från antiSMASH-plattformen. Sekundär metabolism i silico analys från hela genomsekvens ennotation. Klicka här för att se en större version av denna siffra.

  1. Baserat på DNA-sekvensinformation från BGC, design primers (20-25 nt) flankera genen klustret för ESAC(E. coli/Streptomyces Konstgjorda kromosom) bibliotek screening.
    OBS: Olika metoder35,36 kan användas för att fånga hela biosyntetiska genkluster från DNA. Här är den metod som används byggandet av en representativ ESAC bibliotek37,38 från Streptomyces sp. CBMAI 2042 som innehåller kloner med genomsnittlig storlek fragment av ~ 95 kb.

2. Heterologt uttryck för hela biosyntetiska genkluster från ESAC biblioteket

  1. Flytta ESAC-vektorn från E. coli DH10B till E. coli ET12567 genom treföräldrakonjugation32.
    1. Inokulera E. coli ET12567 (CamR), TOPO10/pR9604 (CarbR), DH10B/ESAC4H (AprR) i 5 ml Luria-Bertani (LB) medium som innehåller kloramphenicol (25 μg/mL), karbenicillin (100 μg/mL) och apramycin (50 g μl/mL).
    2. Inkubera kulturen över natten vid 37 °C och 250 rpm.
    3. Inokulera 500 μL av natten sett kultur i 10 ml LB medium som innehåller en halv koncentration av antibiotika.
    4. Inkubera kulturen vid 37 °C och 250 rpm tills de når en A600 av 0,4–0,6.
    5. Skörda cellerna genom centrifugering vid 2 200 x g i 5 min.
    6. Tvätta cellerna två gånger med 20 ml LB-medium.
    7. Återupphäng cellerna i 500 μL LB-medium.
    8. Blanda 20 μL av varje stam i ett mikrocentrifugrör och droppa in i en agarplatta med LB-medium som saknar antibiotika.
    9. Inkubera plattorna vid 37 °C över natten.
    10. Strimla de odlade cellerna på en färsk LB agar platta som innehåller antibiotika och inkuberas vid 37 °C över natten.

3. Streptomyces/E. coli konjugation

  1. För att få den rekombinanta heterologorganismen, utför konjugering32 mellan E. coli ET12567 som innehåller ESAC-vektorn, helper plasmid pR9604 och Streptomyces coelicolor M1146 eller en annan vald värdstam39.
  2. Dag 1: Inokulerade isolerade kolonier av S. coelicolor M1146 i 25 ml TSBY medium i en 250 mL Erlenmeyer kolv utrustad med en inox-fjäder vid 30 °C och 200 rpm för 48 h.
  3. Dag 2/3: Inokulat ET12567/ESAC/pR9604 i 5 ml LB-medium som innehåller kloramphenicol (25 μg/ml), karbenicillin (100 μg/mL) och apramycin (50 μg/mL) över natten vid 37 °C och 250 rpm.
  4. Dag 3/4: Vaccinera 500 μL av nattens kultur i 10 ml 2TY (i ett 50 mL koniskt rör) som innehåller halvbearbetningkoncentrationer av antibiotika. Inkubera vid 37 °C och 250 rpm tills de når en A600 av 0,4–0,6.
  5. Centrifugera kulturerna (ET12567/ESAC/pR9604 och M1146) vid 2200 x g i 10 min.
  6. Tvätta pelletsen 2x i 20 ml 2TY medium och återsuspendiera i 500 μL 2TY.
  7. Alikvot 200 μL i S. coelicolor M1146 suspension och späd i 500 μL av 2TY (suspension A).
  8. Alikvot 200 μL suspension A och späd i 500 μL 2TY (suspension B).
  9. Alikvot 200 μL suspension B och späd i 500 μL 2TY (suspension C).
  10. Alikvot 200 μL i ET12567/ESAC/pR9604 suspension och blanda med 200 μL suspension C.
  11. Platta 150 μL av konjugationsblandningen på en SFM-agarplatta som saknar antibiotika.
  12. Inkubera vid 30 °C i 16 h.
  13. Täck plattor med 1 ml antibiotikalösning (enligt plasmidresistens). Efter torkning, inkubera vid 30 °C i 4–7 dagar.
    OBS: Här bereds en lösning som innehåller 1,0 mg/mL thiostrepton och 0,5 mg/mL nalidixsyra.
  14. Strimma förmodade exconjugants på SFM agar plattor som innehåller tiostrepton (50 mg/mL) och nalidixsyra (25 mg/mL). Inkubera vid 30 °C.
  15. Streak exkonjuganter på en SFM agar som innehåller endast nalidixsyra.
  16. Utför PCR-analys med isolerade kolonier för att bekräfta att hela genklustret har överförts till S. coelicolor M1146-värden.

4. Stamodling

  1. För att få den metaboliska profilen, vaccinera 1/100 av stammens förodling i lämpliga jäsningsmedier och under lämpliga odlingsförhållanden.
  2. Centrifugkulturer på 2200 x g i 10 min.
  3. Utför extraktionen enligt klassen av intresseföreningen40.

5. Förvärva massspektra och förberedelse för GNPS-analys

  1. För att hämta MS/MS-data programmerar du lämpliga HPLC- och masspektrometrimetoder med hjälp av kontrollprogramvaran. Både databeroende masspektrometrianalys (DDA) med hög och låg upplösning kan analyseras.
    OBS: I allmänhet är en 1 mg/ml-lösning av komplexa råextraktprover idealisk. Utspädningar behövs för mindre komplexa extrakt. Det bör noteras att MS/MS-nätverk är det påvisbara molekylära nätverket under givna massspektrometriska förhållanden.
  2. Konvertera massspektra till .mzXML-format med MSConvert från Proteowizard (finns på ). Indataparametrarna för konverteringen illustreras i figur 3. Data från programvara från nästan alla företag är kompatibla.

Figure 3
Bild 3: Använda MsConvert för att konvertera MS-filer till mzXML-tillägget. Rätt parameter för GNPS-analys visas. Instruktionerna är följande: lägg till alla MS-filer i ruta 1 och lägg till filtret Toppplockning i ruta 2; för det här filtret använder du algoritmleverantören. och konverteringsprocesserna kommer att följa. Klicka här för att se en större version av denna siffra.

  1. Ladda upp de konverterade LC-MS/MS-filerna till GNPS-databasen. Två alternativ finns tillgängliga: med hjälp av ett FTP -protokoll (file transfer protocol) eller direkt i en webbläsare via onlineplattformen.
    Detaljerad information om hur du installerar och överför data till GNPS finns på .

6. BNIAnalys

  1. När du har skapat ett konto i GNPS (finns på ) loggar du in på det skapade kontot Skapa molekylärt nätverk. Lägg till en befattning.
  2. Grundläggande alternativ: Välj mzXML-filer för att utföra molekylära nätverk. De kan organiseras i upp till sex grupper. Välj bibliotek en dereplication-rutin (bild 4).
    OBS: Dessa grupper stör inte molekylär nätverkskonstruktion. Denna information kommer endast att användas för den grafiska representationen.

Figure 4
Figur 4: Använda online GNPS-plattform för att utföra molekylär nätverksanalys. Val av mzXML-filer görs genom att klicka i ruta 1. I den öppna dialogrutan kan filerna väljas från personlig mapp (ruta 2) eller laddas upp på den andra fliken med hjälp av den dra-och-släpp filuppladdaren (mindre än 20 MB). Filerna kan grupperas i upp till sex grupper. Klicka här för att se en större version av denna siffra.

  1. Välj prekursorjonmasstolerans och fragmentjonmasstolerans på 0,02 Da respektive 0,05 Da.
    OBS: GNPS har olika typer av stränghet tillgängliga baserat på 1) hur exakt MS / MS-data är och 2) hur exakt föreningen måste vara. Grundläggande alternativ: i den här mappen är det möjligt att ställa prekursor Jon masstolerans och fragmentjon masstolerans. Dessa parametrar används som en guide för att avgöra hur exakt prekursorjonen och fragmentjonen måste vara. De valda masstoleranserna beror på upplösningen och noggrannheten hos den massspektrometer som används.
  2. Avancerade nätverksalternativ: Välj parametrarna enligt figur 5. Dessa parametrar påverkar direkt nätverksklusterstorleken och formuläret. En annan parameter i avsnittet återstående flikar är för avancerade användare. lämna därför standardvärdena.
    OBS: Avancerade parametrar kan läsas i GNPS-dokumentation (finns på ).

Figure 5
Figur 5: Använda BNI för att utföra molekylär nätverksanalys (avancerade alternativ). Min Pair Cos kommer direkt att påverka storleken på kluster, eftersom höga värden kommer att resultera i att kombinera närbesläktade föreningar och låga värden för att kombinera avlägset besläktade föreningar. Användning av värden som är för låga bör undvikas. Minsta matchade fragmentjoner representerar antalet delade fragment mellan två fragmenteringsspektra som ska kopplas i nätverket. Tillsammans styr båda parametrarna nätverksformatet. lägre värden kommer att kluster mer avlägset relaterade föreningar och vice versa. Använda rätt värden kommer att i hög grad hjälpa föreningen klarlägga. Klicka här för att se en större version av denna siffra.

  1. Välj en e-postadress för att få en avisering när arbetet är klart och skicka jobbet.

7. Analys av BNI-resultat

  1. Logga in på GNPS. Välj Jobb > Publicerat jobb > Gjort för att öppna jobbet. En webbsida öppnas enligt bilden I figur 6. Alla resultat från molekylära nätverk kommer att visas.
  2. Välj Visa spektrala familjer (I webbläsarnätverket Visualizer) om du vill se alla nätverkskluster (röd ruta, figur 6).

Figure 6
Bild 6: Använda BNI för att visualisera resultaten av molekylära nätverk. Alla relaterade sammansatta kluster kan ses i sikte spektrala familjer (röd ruta). Om du bara vill visualisera biblioteksträffar bör "visa alla biblioteksträffar" (blå ruta) väljas. För bättre grafisk representation av molekylära nätverksresultat, "Direct Cytoscape Preview" (gul låda) bör laddas ner, och den senaste versionen av Cytoscape bör användas. Klicka här för att se en större version av denna siffra.

  1. En lista visas med alla genererade molekylära nätverkskluster. Om en bibliotekssökning har valts för att generera resultaten visas preliminärt molekylidentifiering i AllID:n. Välj Visa om du vill visualisera dem.
    OBS: Dataanalyserna kan drivas för andra resultat (dvs. genombrytning, biologiska analyser, biblioteksdereplikeringsmolekyler osv.).
  2. Om du vill analysera det molekylära nätverksklustret väljer du Visualisera nätverk.
    OBS: Varje kluster består av noder (cirklar) och kanter, som representerar molekyler och molekylär likhet, respektive. Dereplikerade molekyler kommer att markeras som en blå nod i online webbläsare nätverk visualizer.
  3. Markera överordnad massa (röd ruta, figur 7) i rutan nodetiketter .
  4. I rutan med kantetiketter väljer du Cosine eller DeltaMZ för att observera nodlikhet eller massskillnad mellan noder respektive (gul ruta, figur 7).
  5. När det gäller multigruppsanalyser klickar du på Rita pajer i nodfärgrutan för att observera hur ofta varje nod visas i varje grupp (blå ruta, figur 7).
    OBS: Andra val är möjliga, men de som föreslås ovan är optimala för att kommentera klusternoder och reda ut deras strukturer.

Figure 7
Bild 7: Använda BNI för att visualisera molekylära klusterresultat. När du har öppnat molekylära kluster för bättre datavisualisering bör följande väljas: "Överordnad massa" som nodetiketter (röd ruta); "DeltaMZ" som kantetiketter (gul låda). och "Rita pajer" som nod färg (blå låda). Navigera genom molekylära klustret och försök att kommentera alla noder. Klicka här för att se en större version av denna siffra.

  1. Om du vill visa alla biblioteksträffar väljer du Visa alla biblioteksträffar (blå ruta, bild 7).
    Obs: Dessutom kan MNW laddas ner i "Direct Cytoscape Preview/Download" (gul ruta, figur 7),och filen kan öppnas i Cytoscape-plattformen (finns på ) för fler alternativ i grafisk struktur.
  2. Manuell bekräftelse av dereplikerade föreningar och struktur klarläggande av relaterade föreningar behövs. Öppna fragmenteringsspektraet direkt i GNPS-plattformen eller i originalråa filer.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Protokollet exemplifierades framgångsrikt med hjälp av en kombination av genombrytning, heterologuttryck och MS-guidad/kod metoder för att få tillgång till nya specialiserade valinomycin analoger molekyler. Genomet-till-molekylarbetsflödet för målet, valinomycin (VLM), representeras i figur 8. Streptomyces sp. CBMAI 2042 utkast genom analyserades i silico, och VLM genklustret identifierades sedan och överfördes till en heterolog värd. Heterologa och vilda typ stammar odlades i treexemplar med rätt jäsning villkor, partitionerad med etylacetat, och koncentrerade för att generera rå extrakt. Från produkten förvärvades MS/MS-data för att generera en tandemMS-metabolitprofil för molekylära nätverk. Figur 9 representerar de klustrade joner som erhållits från MS/MS-data från Streptomyces sp. CBMAI 2042 råextrakt, där karakteristiska fragmenteringsmönster och motsvarande MS-likheter tyder på att en molekylär familj delar strukturella egenskaper2. Efter kända biosyntetiska logik och bioinformatik insikter, och stöds av mönsterbaserade MS / MS spektra, strukturen på fyra ursprungligen rapporterade cyclodepsipeptides var klarlägga, och deras ursprung var korrelerade med samma biosyntetiska genkluster som ansvarar för VLM montering32.

Molekylära nätverksdata (finns på ) behandlades i en GNPS-plattform och deponerades i en massiv lagringsplats (MSV000083709). För dereplication, två strategier valdes för att fylla i nätverket med tidigare beskrivna föreningar: 1) Dereplicator (finns på ) och 2) ett verktyg för identifiering av peptidering av naturliga produkter som heter VarQuest (finns på Vår tidigare publikation ger ytterligare detaljer32.

Figure 8
Bild 8: Arbetsflöde från i silico genomsekvensanalys till MS-datainsamling. a)Ett utkast från Streptomyces sp. CBMAI 2042 genom et erhålls av Illumina MiSeq-sekvensering. b)Valinomycin BGC identifiering och anteckning. (C)Efter att hela genklustret har överförts till en lämplig värd odlas stammen. Etylacetatextraktet från kulturen analyseras av LC för att få en profil av producerade sekundära metaboliter. Kromatogrammet visar att valinomycin, montanastatin och fem analoger produceras av VLM BGC uttryck i en heterolog värd. Klicka här för att se en större version av denna siffra.

Figure 9
Bild 9: Molekylära nätverksresultat. (A)Molekylärt nätverk från Streptomyces sp. CBMAI 2042 extrakt. Molekylära nätverkjoner som motsvarar valinomycin, en redan känd förening med motsvarande BGC kommenterade i Streptomyces sp. CBMAI 2042 genom, är grupperade med joner relaterade till analoger som först beskrivs för VLM BGC. b)MS-spektra och kemiska strukturer för valinomycin och besläktade analoger visas. Klicka här för att se en större version av denna siffra.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Den starkaste fördelen med detta protokoll är dess förmåga att snabbt dereplikera metaboliska profiler och bro genomisk information med MS-data för att belysa strukturerna hos nya molekyler, särskilt strukturella analoger2. Baserat på genomisk information kan olika naturprodukter undersökas, såsom polyketider (PK), nonribosomala peptider (NRP) och glykoserade naturprodukter (BNP), samt kryptiska BGCs. Metabolomisk screening ger bevis på aktiverade BGC-profiler och kemisk mångfald som produceras av en specifik stam under laboratorieförhållanden. En BGC kan således klonas till direkt produktion av en ny förening eller okända analoger relaterade till en redan känd BGC, underlättad av likheter som upptäckts genom molekylärt nätverk. Därför hjälper detta förfarande till att skilja värdefulla föreningar som produceras av naturliga källor och kan användas som vägledning för framtida isoleringssteg, som är vanliga i naturliga produktrörledningar.

MS-guidad genombrytning beskrevs för det första inom områdena peptidogenomik41 och glykogenomik42. För att uppskatta omfattningen av den kemiska mångfalden av peptidprodukter utvecklade Dorrestein och kollegor en automatiserad metod med hjälp av MS och genomik för att visualisera sambandet mellan uttryckta naturprodukter (celltyp) och deras genkluster (genotyp). Begreppet MS-guidad genombrytning beskrevs sedan när peptidspecialiserade metaboliter användes. Här tillämpades en metod för identifiering av mikrobiella glykosformade naturprodukter (GNP) med hjälp av en GM-metod och tandemMS som ett verktyg för att snabbt ansluta GNP-celltyper (från mikrobiella metabolomer) med motsvarande biosyntetiska genotyper efter sockeravtryck.

Begreppet peptidogenomik har tillämpats för att avslöja stenothricin genkluster i Streptomyces roseosporus, vilket ger de första insikterna i den breda nyttan av GNPS som en plattform43. Mönsterbaserad genombrytning och molekylärnätverk kombinerades slutligen med GNPS-plattformen26 för att underlätta dereplication av nya föreningar, kända föreningar, detektion av nya analoger och strukturklarklarering av 35 Stammar av Salinispora. Detta ledde till isolering och karakterisering av retimycin A, en quinomycin-typ depsipeptid44. Efter införandet av GNPS, integrerade metabolomik och genomgruvemetoder har blivit den mest mångsidiga vägen att ansluta molekylära nätverk med biosyntetiska kapacitet45,,46,47,48,49,50.

Detta protokoll förstärker möjligheten att använda genomiska och metabolomiska analyser för att undersöka produktionen av kända och okända kemiskt analoga föreningar i några steg samtidigt som låga nivåer av material. Den modell som presenteras här är relaterad till valinomycin analog identifiering från råextrakt genom molekylärnätverksdereplication. Analogernas struktur härledas av fragmenteringav ms/ms/ms och följer den biosyntetiska logiken hos klonade VLM BGCs.

Olika program finns för gruvdrift sekundära metabolit biosyntetiska genkluster51 och för metabolit klarläggande, men open source alternativ har fördelarna på grund av ständiga uppdateringar, och de är öppna för det vetenskapliga samfundet. I denna mening är antiSMASH och GNPS-plattformen de mest populära valen.

Detta allmänna förfarande kan ändras för andra extraktionsmetoder baserade på den naturliga källan som utforskas. Mer än en metod för extraktion kan också kombineras enligt metabolitegenskaper (dvs. polaritet, hydroforbicitet, förmågan att bilda miceller), och även liknande egenskaper, olika lösningsmedel eller harts kan uppnå förbättrade resultat. Vanligtvis framställs extrakt från flytande medelodling, men det finns en uppsjö av extraktionsmetoder tillgängliga för att isolera berikade extrakt och screena alla biologiska prov av intresse.

Vid inhämtning av MS-data bör databeroende analys av förvärv (DDA) användas. Denna fråga är viktig när ett större antal föreningar utvärderas i en enda injektion. När dda utför bör det maximala antalet MS/MS-spektra för varje prekursorjon och maximalt antal olika prekursorjoner kompenseras. När du använder snabb skanningsutrustning kan detta uppnås med högre skanningshastigheter (~6–10 MS/MS-sökningar per cykel). Men i lägre skanningsutrustning kan MN-prestanda endast ökas med bättre kromatografisk upplösning. De mest omfattande data som fylls i molekylära nätverk bör erhållas. För MS-datainsamling är fast kollisionsenergi möjlig, men rampenergier är lämpliga för att ge bättre resultat. Det finns inga optimala förhållanden som perfekt fungerar för alla prover. Att uppnå tillräcklig ms-analys är avgörande för följande steg. Hädanefter bör de molekylära nätverksklusterna genereras och dereplikeras enligt förfarandet.

Ett vanligt felsökningsfel saknar intensiteter för massor. Normalt kan detta lösas genom att införa högre kollisionsenergi under analys. Ibland observeras inga korrelationer mellan spektra- och GNPS-biblioteket, vilket är mycket ovanligt. I det här fallet bör du se till att mappen öppnas korrekt i MS-programmet före visualisering eftersom fel ibland kan skapas under konverteringssteget till MzXML-filer.

När det gäller genombrytning kommer den mest exakta produktionen från genklusteranteckningsplattformar att tillhandahållas för hela genomsekvensering av högre kvalitet för båda, enskilda stam- eller kulturoberoende gruvdrift. Högkvalitativ sekvensering kommer att generera högkvalitativa bioinformatiska insikter för dereplication av biosyntetiska vägar. Däremot, även om BGC förutsägelse bioinformatik programvara har snabbt utvecklas, exakta förutsägelser om genfunktion och förmodade produkter är fortfarande svårt, särskilt när man undersöker nya biosyntetiska vägar och funktioner som inte kan förutsägas i silico. Dessutom är vissa biosyntetiska maskiner påfallande bevaras, medan enzymologi som är involverad i hybridsystem, trans-ATmodulära PKs och NRPSs erkänns som undantag för kolinjäritetsregeln. I denna mening, heterolog uttryck och förbättringar i bioinformatik produktion programvara kan hjälpa belysa oförutsägbara enzymfunktioner och ovanliga biokemi52,53,54. Anrikningen av offentliga databaser kommer att leda till mer exakta förutsägelser och upptäckt av nya specialiserade metaboliter, eftersom kostnaden för WGS inte utgör handikapp för genomgruvdrift.

Slutligen är de starkaste fördelarna med integrerade metabolomiska och genomgruvemetoder relaterade till deras genomförbarhet att utföra genotyp och cellulära dereplication via automatiserad och hög genomströmningsanalys som förbinder genomisk, transkriptomisk och metabolomadata för att effektivt koppla samman gener med molekyler.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Det ekonomiska stödet till denna studie tillhandahölls av São Paulo Research Foundation - FAPESP (2019/10564-5, 2014/12727-5 och 2014/50249-8 till L.G.O; 2013/12598-8 och 2015/01013-4 till R.S.; och 2019/08853-9 till C.F.F.A). B.S.P, C.F.F.A., och L.G.O. fick stipendier från Nationella rådet för vetenskaplig och teknisk utveckling - CNPq (205729/2018-5, 162191/2015-4 och 313492/2017-4). L.G.O. är också tacksam för det bidragsstöd som programmet For Women in Science (2008, Brazilian Edition). Alla författare erkänner CAPES (Samordning för förbättring av högre utbildning personal) för att stödja efter examen program i Brasilien.

Materials

Name Company Catalog Number Comments
Acetonitrile Tedia AA1120-048 HPLC grade
Agar Oxoid LP0011 NA
Apramycin Sigma Aldrich A2024 NA
Carbenicillin Sigma Aldrich C9231 NA
Centrifuge Eppendorf NA 5804
Chloramphenicol Sigma Aldrich C3175 NA
Column C18 Agilent Technologies NA ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902
Kanamycin Sigma Aldrich K1377 NA
Manitol P.A.- A.C.S. Synth NA NA
Microcentrifuge Eppendorf NA 5418
Nalidixic acid Sigma Aldrich N4382 NA
Phusion Flash High-Fidelity PCR Master Mix ThermoFisher Scientific F548S NA
Q-TOF mass spectrometer Agilent technologies NA 6550 iFunnel Q-TOF LC/MS
Sacarose P.A.- A.C.S. Synth NA NA
Shaker/Incubator Marconi MA420 NA
Sodium Chloride Synth NA P. A. - ACS
Soy extract NA NA NA
Sucrose Synth NA P. A. - ACS
Thermal Cycles Eppendorf NA Mastercycler Nexus Gradient
Thiostrepton Sigma Aldrich T8902 NA
Tryptone Oxoid LP0042 NA
Tryptone Soy Broth Oxoid CM0129 NA
UPLC Agilent Technologies NA 1290 Infinity LC System
Yeast extract Oxoid LP0021 NA

DOWNLOAD MATERIALS LIST

References

  1. Davies, J. Specialized microbial metabolites: functions and origins. The Journal of Antibiotics. 66 (7), Tokyo. 361-364 (2013).
  2. Ziemert, N., Alanjary, M., Weber, T. The evolution of genome mining in microbes - a review. Natural Product Reports. 33 (8), 988-1005 (2016).
  3. Zerikly, M., Challis, G. L. Strategies for the Discovery of New Natural Products by Genome Mining. ChemBioChem. 10 (4), 625-633 (2009).
  4. Gomez-Escribano, J. P., Bibb, M. J. Heterologous expression of natural product biosynthetic gene clusters in Streptomyces coelicolor: from genome mining to manipulation of biosynthetic pathways. Journal of Industrial Microbiology & Biotechnology. 41 (2), 425-431 (2014).
  5. Medema, M. H., et al. Minimum Information about a Biosynthetic Gene cluster. Nature Chemical Biology. 11 (9), 625-631 (2015).
  6. Lautru, S., Deeth, R. J., Bailey, L. M., Challis, G. L. Discovery of a new peptide natural product by Streptomyces coelicolor genome mining. Nature Chemical Biology. 1 (5), 265-269 (2005).
  7. Chiang, Y. -M., et al. Molecular Genetic Mining of the Aspergillus Secondary Metabolome: Discovery of the Emericellamide Biosynthetic Pathway. Chemistry & Biology. 15 (6), 527-532 (2008).
  8. Huang, T., et al. Identification and Characterization of the Pyridomycin Biosynthetic Gene Cluster of Streptomyces pyridomyceticus NRRL B-2517. Journal of Biological Chemistry. 286 (23), 20648-20657 (2011).
  9. Udwary, D. W., et al. Genome sequencing reveals complex secondary metabolome in the marine actinomycete Salinispora tropica. Proceedings of the National Academy of Sciences. 104 (25), 10376-10381 (2007).
  10. Gross, H., et al. The Genomisotopic Approach: A Systematic Method to Isolate Products of Orphan Biosynthetic Gene Clusters. Chemistry & Biology. 14 (1), 53-63 (2007).
  11. Spohn, M., Wohlleben, W., Stegmann, E. Elucidation of the zinc-dependent regulation in Amycolatopsis japonicum enabled the identification of the ethylenediamine-disuccinate ([S,S ]-EDDS) genes. Environmental Microbiology. 18 (4), 1249-1263 (2016).
  12. Thaker, M. N., Waglechner, N., Wright, G. D. Antibiotic resistance-mediated isolation of scaffold-specific natural product producers. Nature Protocols. 9 (6), 1469-1479 (2014).
  13. Katz, M., Hover, B. M., Brady, S. F. Culture-independent discovery of natural products from soil metagenomes. Journal of Industrial Microbiology & Biotechnology. 43, 129-141 (2016).
  14. Quinn, R. A., et al. Molecular Networking as a Drug Discovery, Drug Metabolism, and Precision Medicine Strategy. Trends in Pharmacological Sciences. 38 (2), 143-154 (2017).
  15. Yang, J. Y., et al. Molecular Networking as a Dereplication Strategy. Journal of Natural Products. 76 (9), 1686-1699 (2013).
  16. Lommen, A. MetAlign: Interface-Driven, Versatile Metabolomics Tool for Hyphenated Full-Scan Mass Spectrometry Data Preprocessing. Analytical Chemistry. 81 (8), 3079-3086 (2009).
  17. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  18. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  19. Tautenhahn, R., Patti, G. J., Rinehart, D., Siuzdak, G. XCMS Online: A Web-Based Platform to Process Untargeted Metabolomic Data. Analytical Chemistry. 84 (11), 5035-5039 (2012).
  20. Kuhl, C., Tautenhahn, R., Böttcher, C., Larson, T. R., Neumann, S. CAMERA: An Integrated Strategy for Compound Spectra Extraction and Annotation of Liquid Chromatography/Mass Spectrometry Data Sets. Analytical Chemistry. 84 (1), 283-289 (2012).
  21. Katajamaa, M., Orešič, M. Data processing for mass spectrometry-based metabolomics. Journal of Chromatography A. 1158, 318-328 (2007).
  22. Liu, W. -T., et al. Interpretation of Tandem Mass Spectra Obtained from Cyclic Nonribosomal Peptides. Analytical Chemistry. 81 (11), 4200-4209 (2009).
  23. Ng, J., et al. Dereplication and de novo sequencing of nonribosomal peptides. Nature Methods. 6 (8), 596-599 (2009).
  24. Liaw, C., et al. Vitroprocines, new antibiotics against Acinetobacter baumannii, discovered from marine Vibrio sp. QWI-06 using mass-spectrometry-based metabolomics approach. Scientific Reports. 5 (1), 1-11 (2015).
  25. Kang, K. B., et al. Targeted Isolation of Neuroprotective Dicoumaroyl Neolignans and Lignans from Sageretia theezans Using in Silico Molecular Network Annotation Propagation-Based Dereplication. Journal of Natural Products. 81 (8), 1819-1828 (2018).
  26. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  27. Doroghazi, J. R., et al. A roadmap for natural product discovery based on large-scale genomics and metabolomics. Nature Chemical Biology. 10 (11), 963-968 (2014).
  28. Medema, M. H., et al. antiSMASH: rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genome sequences. Nucleic Acids Research. 39, 339-346 (2011).
  29. Weber, T., et al. antiSMASH 3.0-a comprehensive resource for the genome mining of biosynthetic gene clusters. Nucleic Acids Research. 43, 237-243 (2015).
  30. Blin, K., et al. antiSMASH 5.0: updates to the secondary metabolite genome mining pipeline. Nucleic Acids Research. 47, 81-87 (2019).
  31. Watrous, J., et al. Mass spectral molecular networking of living microbial colonies. Proceedings of the National Academy of Sciences. 109 (26), 1743-1752 (2012).
  32. Paulo, B. S., Sigrist, R., Angolini, C. F. F., De Oliveira, L. G. New Cyclodepsipeptide Derivatives Revealed by Genome Mining and Molecular Networking. ChemistrySelect. 4 (27), 7785-7790 (2019).
  33. Gonzaga de Oliveira, L., Sigrist, R., Sachetto Paulo, B., Samborskyy, M. Whole-Genome Sequence of the Endophytic Streptomyces sp. Strain CBMAI 2042, Isolated from Citrus sinensis. Microbiology Resource Announcements. 8 (2), 1-2 (2019).
  34. Aziz, R. K., et al. The RAST Server: Rapid Annotations using Subsystems Technology. BMC Genomics. 9 (1), 75 (2008).
  35. Nah, H. -J., Pyeon, H. -R., Kang, S. -H., Choi, S. -S., Kim, E. -S. Cloning and Heterologous Expression of a Large-sized Natural Product Biosynthetic Gene Cluster in Streptomyces Species. Frontiers in Microbiology. 8, 1-10 (2017).
  36. Zhang, J. J., Tang, X., Moore, B. S. Genetic platforms for heterologous expression of microbial natural products. Natural Product Reports. 36 (9), 1313-1332 (2019).
  37. Alduina, R., et al. Artificial chromosome libraries of Streptomyces coelicolor A3(2) and Planobispora rosea. FEMS Microbiology Letters. 218 (1), 181-186 (2003).
  38. Jones, A. C., et al. Phage P1-Derived Artificial Chromosomes Facilitate Heterologous Expression of the FK506 Gene Cluster. PLoS One. 8 (7), 69319 (2013).
  39. Gomez-Escribano, J. P., Bibb, M. J. Engineering Streptomyces coelicolor for heterologous expression of secondary metabolite gene clusters. Microbial Biotechnology. 4 (2), 207-215 (2011).
  40. Cannell, R. J. P. Natural Products Isolation. , Humana Press. Totowa, NJ. (1998).
  41. Kersten, R. D., et al. A mass spectrometry-guided genome mining approach for natural product peptidogenomics. Nature Chemical Biology. 7 (11), 794-802 (2011).
  42. Kersten, R. D., et al. Glycogenomics as a mass spectrometry-guided genome-mining method for microbial glycosylated molecules. Proceedings of the National Academy of Sciences. 110 (47), 4407-4416 (2013).
  43. Liu, W., et al. MS/MS-based networking and peptidogenomics guided genome mining revealed the stenothricin gene cluster in Streptomyces roseosporus. The Journal of Antibiotics. 67 (1), Tokyo. 99-104 (2014).
  44. Duncan, K. R., et al. Molecular Networking and Pattern-Based Genome Mining Improves Discovery of Biosynthetic Gene Clusters and their Products from Salinispora Species. Chemistry & Biology. 22 (4), 460-471 (2015).
  45. Cao, L., et al. MetaMiner: A Scalable Peptidogenomics Approach for Discovery of Ribosomal Peptide Natural Products with Blind Modifications from Microbial Communities. Cell Systems. , (2019).
  46. Chen, L. -Y., Cui, H. -T., Su, C., Bai, F. -W., Zhao, X. -Q. Analysis of the complete genome sequence of a marine-derived strain Streptomyces sp. S063 CGMCC 14582 reveals its biosynthetic potential to produce novel anti-complement agents and peptides. PeerJ. 7 (1), 6122 (2019).
  47. Kim Tiam, S., et al. Insights into the Diversity of Secondary Metabolites of Planktothrix Using a Biphasic Approach Combining Global Genomics and Metabolomics. Toxins. 11 (9), 498 (2019).
  48. Özakin, S., Ince, E. Genome and metabolome mining of marine obligate Salinispora strains to discover new natural products. Turkish Journal of Biology. 43 (1), 28-36 (2019).
  49. Trivella, D. B. B., de Felicio, R. The Tripod for Bacterial Natural Product Discovery: Genome Mining, Silent Pathway Induction, and Mass Spectrometry-Based Molecular Networking. mSystems. 3 (2), 00160 (2018).
  50. Maansson, M., et al. An Integrated Metabolomic and Genomic Mining Workflow To Uncover the Biosynthetic Potential of Bacteria. mSystems. 1 (3), 1-14 (2016).
  51. Blin, K., Kim, H. U., Medema, M. H., Weber, T. Recent development of antiSMASH and other computational approaches to mine secondary metabolite biosynthetic gene clusters. Briefings in Bioinformatics. 20 (4), 1103-1113 (2019).
  52. Fisch, K. M. Biosynthesis of natural products by microbial iterative hybrid PKS-NRPS. RSC Advances. 3 (40), 18228-18247 (2013).
  53. Tatsuno, S., Arakawa, K., Kinashi, H. Analysis of Modular-iterative Mixed Biosynthesis of Lankacidin by Heterologous Expression and Gene Fusion. The Journal of Antibiotics. 60 (11), Tokyo. 700-708 (2007).
  54. Helfrich, E. J. N., Piel, J. Biosynthesis of polyketides by trans-AT polyketide synthases. Natural Product Reports. 33 (2), 231-316 (2016).

Tags

Retraction genombrytning molekylära nätverkande masspektrometristyrd genombrytning naturliga produkter Streptomyces,målmolekylärt nätverk hela genomsekvensering
Mass pektrometri-guidad genombrytning som ett verktyg för att avslöja nya naturliga produkter
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sigrist, R., Paulo, B. S., Angolini, More

Sigrist, R., Paulo, B. S., Angolini, C. F. F., De Oliveira, L. G. Mass Spectrometry-Guided Genome Mining as a Tool to Uncover Novel Natural Products. J. Vis. Exp. (157), e60825, doi:10.3791/60825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter