Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Mass Spectrometrie-Guided Genome Mining als Werkzeug zur Aufdeckung neuartiger Naturprodukte

Published: March 12, 2020 doi: 10.3791/60825

Summary

Hier wird ein Massenspektrometrie-geführtes Genom-Mining-Protokoll erstellt und beschrieben. Es basiert auf Genomsequenzinformationen und LC-MS/MS-Analysen und zielt darauf ab, die Identifizierung von Molekülen aus komplexen mikrobiellen und pflanzlichen Extrakten zu erleichtern.

Abstract

Der chemische Raum, der von natürlichen Produkten bedeckt wird, ist immens und weithin unerkannt. Daher sind bequeme Methoden zur umfassenden Bewertung ihrer Funktionen in der Natur und potenziellen menschlichen Nutzen (z. B. für Anwendungen zur Arzneimittelentdeckung) wünschenswert. Dieses Protokoll beschreibt die Kombination von Genom-Mining (GM) und molekularer Vernetzung (MN), zwei zeitgenössischen Ansätzen, die genclustercodierte Anmerkungen in der sequenziierten Gesamtheit des Genoms mit chemischen Struktursignaturen aus rohen metabolischen Extrakten abgleichen. Dies ist der erste Schritt zur Entdeckung neuer natürlicher Wesen. Diese Konzepte werden, wenn sie zusammen angewendet werden, hier als MS-geführter Genomabbau definiert. Bei dieser Methode sind die Hauptkomponenten zuvor (mit MN) gekennzeichnet, und strukturell verwandte neue Kandidaten werden mit Genomsequenzanmerkungen (mit GM) verknüpft. Die Kombination von GM und MN ist eine gewinnbringende Strategie, um neue Molekül-Rückgrate anzusprechen oder metabolische Profile zu ernten, um Analoga aus bereits bekannten Verbindungen zu identifizieren.

Introduction

Untersuchungen des Sekundärstoffwechsels bestehen häufig darin, Rohextrakte auf spezifische biologische Aktivitäten zu untersuchen, gefolgt von Reinigung, Identifizierung und Charakterisierung der Bestandteile aktiver Fraktionen. Dieser Prozess hat sich als effizient erwiesen und die Isolierung mehrerer chemischer Einheiten gefördert. Heutzutage wird dies jedoch als undurchführbar angesehen, vor allem aufgrund der hohen Wiederentdeckungsraten. Als die pharmazeutische Industrie revolutionierte, ohne die Rollen und Funktionen spezialisierter Metaboliten zu kennen, wurde ihre Identifizierung unter Laborbedingungen durchgeführt, die die Natur nicht genau darstellten1. Heute gibt es ein besseres Verständnis von natürlichen Signaleinflüssen, Sekretion und das Vorhandensein der meisten Ziele bei nicht nachweisbar niedrigen Konzentrationen. Darüber hinaus wird die Regulierung des Prozesses der akademischen Gemeinschaft und der pharmazeutischen Industrie helfen, dieses Wissen zu nutzen. Es wird auch der Forschung zugute kommen, die die direkte Isolierung von Metaboliten im Zusammenhang mit stillen biosynthetischen Genclustern (BGCs)2betrifft.

In diesem Zusammenhang haben Fortschritte bei der genomischen Sequenzierung das Interesse an screening-Mikroorganismenmetaboliten erneut geweckt. Dies liegt daran, dass die Analyse der genomischen Informationen von nicht entdeckten biosynthetischen Clustern Gene aufdecken kann, die neuartige Verbindungen kodieren, die nicht beobachtet oder unter Laborbedingungen produziert werden. Viele mikrobielle ganze Genomprojekte oder Entwürfe sind heute verfügbar, und die Zahl wächst jedes Jahr, was massive Aussichten für die Entdeckung neuer bioaktiver Moleküle durch Genomabbau3,4bietet.

Der Atlas der biosynthetischen Gencluster ist die derzeit größte Sammlung automatisch abgebauter Gencluster als Bestandteil der Integrated Microbial Genomes Platform des Joint Genome Institute (JGI IMG-ABC)2. Zuletzt hat die Standardisierungsinitiative Minimum Information for Biosynthetic Gene Clusters (MIBiG) die manuelle Reannotation von BGCs gefördert und einen hochgradig kuratierten Referenzdatensatz 5 zur Verfügunggestellt. Heutzutage stehen viele Werkzeuge zur Verfügung, um das rechnerische Mining genetischer Daten und deren Verbindung zu bekannten sekundären Metaboliten zu ermöglichen. Außerdem wurden verschiedene Strategien für den Zugang zu neuen bioaktiven Naturprodukten entwickelt (z. B. heterologe Expression, Zielgenlöschung, In-vitro-Rekonstitution, genomische Sequenz, isotopengeführtes Screening [genomisotopen Ansatz], Manipulation lokaler und globaler Regulierungsbehörden, resistenzzielbasierter Bergbau, kulturunabhängiger Bergbau und in jüngerer Zeit MS-geführte/code-Ansätze2,6,7,8,9, 10,11,12,13,14,15).

Genomabbau als einzigartige Strategie erfordert Anstrengungen, um eine einzelne oder kleine Gruppe von Molekülen zu kommentieren; So bleiben Lücken im Prozess, in denen neue Verbindungen für Isolation und Strukturaufklärung priorisiert werden. Im Prinzip zielen diese Ansätze nur auf einen biosynthetischen Pfad pro Experiment ab, was zu einer langsamen Entdeckungsrate führt. In diesem Sinne stellt die Verwendung von GM zusammen mit einem molekularen Vernetzungsansatz einen wichtigen Fortschritt für die Naturproduktforschungdar 14,15.

Die Vielseitigkeit, Genauigkeit und hohe Empfindlichkeit der Flüssigchromatographie-Massenspektrometrie (LC-MS) machen es zu einer guten Methode zur zusammengesetzten Identifizierung. Derzeit haben mehrere Plattformen Algorithmen und Software-Suiten für ungezielte Metabolomik16,17,18,19,20investiert. Der Kern dieser Programme umfasst die Feature-Erkennung (Peak Picking)21 und die Spitzenausrichtung, die die Übereinstimmung identischer Features über einen Stapel von Samples und die Suche nach Mustern ermöglicht. MS-Muster-basierte Algorithmen22,23 vergleichen charakteristische Fragmentierungsmuster und stimmen MS2-Ähnlichkeiten überein, die molekulare Familien mit strukturellen Merkmalen erzeugen. Diese Merkmale können dann hervorgehoben und gebündelt werden, was die Fähigkeit verleiht, bekannte und unbekannte Moleküle aus einem komplexen biologischen Extrakt durch Tandem MS2,24,25schnell zu entdecken. Daher ist Tandem MS eine vielseitige Methode, um strukturelle Informationen über mehrere Chemotypen zu erhalten, die in einer großen Datenmenge gleichzeitig enthalten sind.

Der Global Natural Products Social Molecular Networking (GNPS)26-Algorithmus verwendet die normalisierte Fragmentionen-Intensität, um multidimensionale Vektoren zu konstruieren, bei denen Ähnlichkeiten mit einer Kosinusfunktion verglichen werden. Die Beziehung zwischen verschiedenen übergeordneten Ionen wird in einer Diagrammdarstellung dargestellt, in der jede Fragmentierung als Knoten (Kreise) visualisiert wird und die Verwandtschaft jedes Knotens durch eine Kante (Linien) definiert wird. Die globale Visualisierung von Molekülen aus einer Hand wird als molekulares Netzwerk definiert. Strukturell divergierende Moleküle, die auf einzigartige Weise fragmentieren, bilden ihren eigenen spezifischen Cluster oder ihre eigene Konstellation, während sich verwandte Moleküle zusammenschließen. Clustering-Chemotypen ermöglichen die hypothetische Verbindung ähnlicher struktureller Merkmale mit ihren biosynthetischen Ursprüngen.

Die Kombination sowohl von Chemotyp-zu-Genotyp- als auch von Genotyp-zu-Chemotyp-Ansätzen ist eine starke Wirkung, wenn es darum geht, Bioinformatik-Verbindungen zwischen BGCs und ihren kleinen Molekülprodukten herzustellen27. Daher ist MS-geführter Genomabbau eine schnelle Methode und eine strategie mit geringem Materialverbrauch, und es hilft, Elternionen und biosynthetische Wege zu überbrücken, die von WGS einer oder mehrerer Stämme unter verschiedenen metabolischen und ökologischen Bedingungen aufgedeckt wurden.

Der Workflow dieses Protokolls (Abbildung 1) besteht darin, WGS-Daten in eine biosynthetische Gencluster-Anmerkungsplattform wie antiSMASH28,29,30einzuspeisen. Es hilft, die Vielfalt der Verbindungen und Klasse der Verbindungen durch das Genom kodiert zu schätzen. Es muss eine Strategie zur Zielart ierung eines biosynthetischen Genclusters angenommen werden, der für eine chemische Einheit von Interesse kodiert, und Kulturextrakte aus einem WildenStamm und/oder heterologen Stamm, der den BGC enthält, können analysiert werden, um clusterierte Ionen auf der Grundlage von Ähnlichkeiten mit GNPS26,31zu erzeugen. Folglich ist es möglich, neue Moleküle zu identifizieren, die mit dem zielgerichteten BGC assoziiert werden und in der Datenbank nicht verfügbar sind (hauptsächlich unbekannte Analoga, manchmal in niedrigen Tistern produziert). Es ist wichtig zu berücksichtigen, dass Benutzer zu diesen Plattformen beitragen können und dass die Verfügbarkeit von Bioinformatik und MS/MS-Daten rapide zunimmt, was zu einer ständigen Weiterentwicklung und Aktualisierung effektiver Rechenwerkzeuge und Algorithmen führt, um effiziente Verbindungen komplexer Extrakte mit Molekülen zu steuern.

Figure 1
Abbildung 1: Übersicht über den gesamten Workflow. Gezeigt wird eine Illustration der bioinformatischen, klonenden und molekularen Vernetzungsschritte, die im beschriebenen MS-geführten Genom-Mining-Ansatz zur Identifizierung neuer Metaboliten beteiligt sind. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Dieses Protokoll beschreibt einen schnellen und effizienten Workflow, um Genom-Mining und molekulare Vernetzung als Ausgangspunkt für die Pipeline zur Entdeckung natürlicher Produkte zu kombinieren. Obwohl viele Anwendungen in der Lage sind, die Zusammensetzung und Verwandtheit von MS-detektierbaren Molekülen in einem Netzwerk zu visualisieren, werden hier mehrere verwendet, um strukturell ähnliche gruppierte Moleküle zu visualisieren. Mit dieser Strategie, neuartige Cyclodepsipeptid Produkte in metabolischen Extrakten von Streptomyces sp. CBMAI 2042 beobachtet werden erfolgreich identifiziert. Geleitet vom Genombergbau wird der gesamte biosynthetische Gencluster, der für Valinomycine kodiert, erkannt und in den Produzentenstamm Streptomyces coelicolor M1146 geklont. Schließlich korrelieren die von MS nachgewiesenen Moleküle nach einer MS-Muster-basierten molekularen Vernetzung mit BGCs, die für ihre Biogenese verantwortlich sind32.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Genomabbau für biosynthetische Gencluster

  1. Führen Sie die gesamte Genomsequenzierung (WGS) als ersten Schritt zur Wahl eines biosynthetischen Genclusters (BCG) für den MS-geführten Genombergbau durch. Der gesamte Genomentwurf des Stammes von Interesse (Bakterien) kann durch Illumina MiSeq Technologie mit den folgenden mit hochwertigen genomischen DNA erhalten werden: Schrotflinte TruSeq PCR-Free Bibliothek Prep und Nextera Mate Pair Library Preparation Kit33.
    ANMERKUNG: Nach der Sequenzierung können die Illumina-Schrotflintenbibliothek und die Illumina-Paarbibliothek mit dem Newbler v3.0 (Roche, 454) Assembler-Programm (gefunden unter ) und mit Anmerkungen über eine Pipeline basierend auf FgeneSB (gefunden unter ), wie zuvor beschrieben33. Microbiology Resource Announcements (MRA) ist ein vollständig offenes Journal mit Artikeln, in der die Verfügbarkeit von mikrobiologischen Ressourcen veröffentlicht wird, die in einem verfügbaren Repository deponiert werden (gefunden unter ). Die Kandidaten-Protein-Codierungsgene werden mit der RAST-Server-Anmerkung34identifiziert, und das Projekt Whole Genome Shotgun (WGS) wird in der DDBJ/ENA/GenBank (gefunden unter ) und Gold (gefunden unter ) abgelagert.
  2. Um in silico Informationen über Sekundärstoffwechsel-Gencluster-Anmerkungen aus einem vollständigen sequenzierten Genom zu erhalten, senden Sie die Sequenzdatei (GenBank/EMBL- oder FASTA-Format) an eine AntiSMASH-Plattform (gefunden unter ).
  3. Wählen Sie den Gencluster aus Ausgabedaten (Abbildung 2) basierend auf dem ähnlichsten bekannten Cluster aus.
    HINWEIS: Erstens ist es Routine, Gen für Gen zu erforschen und individuelle Recherchen (Blastp) durchzuführen, um zu bewerten, welche Funktionen mit den gewünschten biosynthetischen Gengruppen verbunden sind. Dieses Verfahren kann auch helfen, zu bestimmen, welche BGC wahrscheinlich mit der Produktion einer gewünschten Verbindung verbunden ist, auch wenn es ein niedriger Prozentsatz ist. Eine AntiSMASH-Vorhersage berücksichtigt alle Gene innerhalb eines Clusters als prozentuale Abdeckung, die einen globalen niedrigen Prozentsatz der Ähnlichkeit für die angestrebte BGC darstellen kann. Bei der Analyse von Gen-by-Gen ist es jedoch möglich, genauere Informationen mithilfe des ähnlichsten bekannten Clusters zu erhalten. Zweitens hat antiSMASH zwei Möglichkeiten, eine Suche zu verfeinern: 1) Nachweisstriktigkeit: der Grad der Strenge, auf den der biosynthetische Gencluster als Hit betrachtet werden muss. Für diese Option sollte der Benutzer die folgenden Parameter verwenden: a) streng: erkennt ausschließlich klar definierte Cluster, die alle erforderlichen Regionen enthalten, die für Fehler in Bezug auf genetische Informationen unannehmbar sind; b) entspannt: erkennt teilteile Cluster, die einen oder mehrere Funktionsbereich vermissen, was auch zur Erkennung der strengen Funktion funktioniert; oder c) lose: erkennt schlecht definierte Cluster und Cluster, die wahrscheinlich mit primären Metaboliten übereinstimmen, was zum Auftreten falsch positiver oder schlecht definierter BGCs führen kann. Die andere Option ist 2) zusätzliche Funktionen: die Art der Informationen, die die Plattform suchen und in der Ausgabe anzeigen muss. Im Allgemeinen können diese beiden Optionen nach der Vorhersage Zeit sparen. Der AntiSMASH-Job erfordert jedoch einen längeren Zeitraum.

Figure 2
Abbildung 2: Ausgabe von antiSMASH-Plattform. Sekundärstoffwechsel in der Silico-Analyse aus der gesamten Genomsequenz-Anmerkung. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

  1. Basierend auf DNA-Sequenzinformationen des BGC flankieren Designprimer (20–25 nt) den Gencluster für das ESAC -E. coli/Streptomyces Artificial Chromosome) Bibliothekscreening.
    HINWEIS: Verschiedene Methoden35,36 können verwendet werden, um den gesamten biosynthetischen Gencluster aus der DNA zu erfassen. Hier bei der methode wird eine repräsentative ESAC-Bibliothek37,38 aus Streptomyces sp. CBMAI 2042 gebaut, die Klone mit einer durchschnittlichen Größe von 95 kb enthält.

2. Heterologe Expression des gesamten biosynthetischen Genclusters aus der ESAC-Bibliothek

  1. Verschieben Sie den ESAC-Vektor von E. coli DH10B auf E. coli ET12567 durch triparentale Konjugation32.
    1. Inokulat E. coli ET12567 (CamR), TOPO10/pR9604 (CarbR), DH10B/ESAC4H (AprR) in 5 ml Luria-Bertani (LB) Medium mit Chloramphenicol (25 g/ml), Carbenicillin (100 g/ml) und Apramycin (50 g/ml).
    2. Die Kultur über Nacht bei 37 °C und 250 Umdrehungen von 150 Uhr bebrüten.
    3. Impfen Sie 500 l der Nachtkultur in 10 ml LB-Medium, das eine halber Konzentration von Antibiotika enthält.
    4. Inkubieren Sie die Kultur bei 37 °C und 250 Umdrehungen pro Minute bis zu einem A600 von 0.4–0.6.
    5. Ernten Sie die Zellen durch Zentrifugation bei 2.200 x g für 5 min.
    6. Waschen Sie die Zellen zweimal mit 20 ml LB Medium.
    7. Setzen Sie die Zellen in 500 l LB-Medium aus.
    8. Mischen Sie 20 l jedes Stammes in einem Mikrozentrifugenrohr und tropfen Sie in eine Agarplatte mit LB Medium ohne Antibiotika.
    9. Die Platten über Nacht bei 37 °C bebrüten.
    10. Die gewachsenen Zellen auf eine frische LB-Agarplatte mit Antibiotika streifen und über Nacht bei 37 °C brüten.

3. Streptomyces/E. coli Konjugation

  1. Um den rekombinanten heterologen Organismus zu erhalten, führen Sie konjugation32 zwischen E. coli ET12567 mit dem ESAC-Vektor, dem Helfer-Plasmid pR9604 und Streptomyces coelicolor M1146 oder einem anderen ausgewählten Wirtsstamm39durch.
  2. Tag 1: Inokulieren Sie isolierte Kolonien von S. coelicolor M1146 in 25 ml TSBY-Medium in einem 250 ml Erlenmeyer Kolben, der mit einer Inox-Feder bei 30 °C und 200 U/min für 48 h ausgestattet ist.
  3. Tag 2/3: Et12567/ESAC/pR9604 in 5 ml-Medium mit Chloramphenicol (25 g/ml), Carbenicillin (100 g/ml) und Apramycin (50 g/ml) über Nacht bei 37 °C und 250 U/min impfen.
  4. Tag 3/4: Impfen Sie 500 l der Nachtkultur in 10 ml 2TY (in einem 50 ml konischen Rohr) mit halbarbeitenden Konzentrationen von Antibiotika. Bei 37 °C und 250 Umdrehungen pro Minute inkubieren, bis eine A600 von 0,4–0,6 erreicht wird.
  5. Zentrifugieren Sie die Kulturen (ET12567/ESAC/pR9604 und M1146) bei 2200 x g für 10 min.
  6. Die Pellets 2x in 20 ml 2TY Medium waschen und in 500 l von 2TY wieder aufhängen.
  7. Aliquot 200 l der S. coelicolor M1146 Suspension und verdünnt in 500 l von 2TY (Suspension A).
  8. Aliquot 200 l Suspension A und verdünnen in 500 l von 2TY (Suspension B).
  9. Aliquot 200 l Suspension B und verdünnen in 500 l von 2TY (Suspension C).
  10. Aliquot 200 l der Aufhängung ET12567/ESAC/pR9604 und Mischung mit 200 l Suspension C.
  11. Platte 150 l des Konjugationsgemisches auf einer SFM-Agarplatte ohne Antibiotika.
  12. Bei 30 °C für 16 h inkubieren.
  13. Abdeckplatten mit 1 ml Antibiotikumlösung (entsprechend der Plasmidresistenz). Nach dem Trocknen bei 30 °C für 4–7 Tage inkubieren.
    HINWEIS: Hier beidieser Wurde eine Lösung hergestellt, die 1,0 mg/ml Thiostrepton und 0,5 mg/ml Nalidixsäure enthält.
  14. Streifen vermeintliche Exkonjugantien auf SFM-Agarplatten, die Thiostrepton (50 mg/ml) und Nalidixsäure (25 mg/ml) enthalten. Bei 30 °C inkubieren.
  15. Streifenexkonjugantien auf einen SFM-Agar, der nur Nalidixsäure enthält.
  16. Führen Sie pcR-Analysen mit isolierten Kolonien durch, um zu bestätigen, dass der gesamte Gencluster auf den S. coelicolor M1146-Wirt übertragen wurde.

4. Dehnungsanbau

  1. Um das metabolische Profil zu erhalten, impfen Sie 1/100 der Vorkultur des Stammes in geeigneten Fermentationsmedien und unter den entsprechenden Kulturbedingungen.
  2. Zentrifugenkulturen bei 2200 x g für 10 min.
  3. Führen Sie die Extraktion entsprechend der Klasse der Zinsverbindung40durch.

5. Erfassung von Massenspektren und Vorbereitung auf die GNPS-Analyse

  1. Um MS/MS-Daten zu erfassen, programmieren Sie geeignete HPLC- und Massenspektrometrie-Methoden mit der Steuerungssoftware. Es können sowohl datenabhängige Massenspektrometrieanalysen (DDA) mit hoher als auch niedriger Auflösung analysiert werden.
    HINWEIS: Im Allgemeinen ist eine 1 mg/ml Lösung komplexer Rohextraktproben ideal. Verdünnungen werden für weniger komplexe Extrakte benötigt. Es sei darauf hingewiesen, dass MS/MS-Netzwerke das nachweisbare molekulare Netzwerk unter den gegebenen massenspektrometrischen Bedingungen sind.
  2. Konvertieren Sie Massenspektren in das .mzXML-Format mit MSConvert from Proteowizard (gefunden unter ). Die Eingabeparameter für die Konvertierung sind in Abbildung 3dargestellt. Daten aus Software fast aller Unternehmen sind kompatibel.

Figure 3
Abbildung 3: Verwenden von MsConvert zum Konvertieren von MS-Dateien in die Erweiterung mzXML. Der richtige Parameter für die GNPS-Analyse wird angezeigt. Die Anweisungen lauten wie folgt: Fügen Sie alle MS-Dateien in Feld 1 hinzu und fügen Sie den Filter Peak Picking in Feld 2 hinzu; Verwenden Sie für diesen Filter den Algorithmusanbieter; und die Konvertierungsprozesse folgen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

  1. Laden Sie die konvertierten LC-MS/MS-Dateien in die GNPS-Datenbank hoch. Es stehen zwei Optionen zur Verfügung: die Verwendung eines File Transfer Protocol (FTP) oder direkt in einem Browser über die Online-Plattform.
    HINWEIS: Detaillierte Informationen zum Installieren und Übertragen von Daten an GNPS finden Sie unter .

6. GNPS-Analyse

  1. Melden Sie sich nach dem Erstellen eines Kontos in GNPS (gefunden unter ) bei dem erstellten Konto an und wählen Sie Molecular Network erstellen. Fügen Sie eine Stellenbezeichnung hinzu.
  2. Grundlegende Optionen: Wählen Sie die mzXML-Dateien aus, um das molekulare Netzwerk auszuführen. Sie können in bis zu sechs Gruppen organisiert werden. Wählen Sie die Bibliotheken für die Dereplikationsroutine aus (Abbildung 4).
    HINWEIS: Diese Gruppen stören nicht die Molekularnetzwerkkonstruktion. Diese Informationen werden nur für die grafische Darstellung verwendet.

Figure 4
Abbildung 4: Verwendung der Online-GNPS-Plattform zur Durchführung molekularer Netzwerkanalysen. Die Auswahl der mzXML-Dateien erfolgt durch Klicken in Feld 1. Im dialogoffenen Dialogfeld können die Dateien aus dem persönlichen Ordner (Feld 2) ausgewählt oder auf der zweiten Registerkarte mit dem Drag-and-Drop-Datei-Uploader (weniger als 20 MB) hochgeladen werden. Die Dateien können in bis zu sechs Gruppen gruppiert werden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

  1. Wählen Sie die Vorläuferionenmassentoleranz und die Fragmentionenmassentoleranz von 0,02 Da bzw. 0,05 Da aus.
    HINWEIS: BSPS hat verschiedene Arten von Strenge zur Verfügung, basierend auf 1) wie genau die MS / MS-Daten sind und 2) wie genau die Assoziation sein muss. Grundlegende Optionen: In diesem Ordner ist es möglich, Precursor Ion Mass Tolerance und Fragment Ion Mass Tolerancefestzulegen. Diese Parameter werden als Leitfaden verwendet, um zu bestimmen, wie präzise das Vorläuferion und Fragmention sein müssen. Die ausgewählten Massentoleranzen hängen von der Auflösung und Genauigkeit des verwendeten Massenspektrometers ab.
  2. Erweiterte Netzwerkoptionen: Wählen Sie die Parameter gemäß Abbildung 5aus. Diese Parameter beeinflussen direkt die Größe und Form des Netzwerkclusters. Ein weiterer Parameter im Abschnitt "Verbleibende Registerkarten" ist für fortgeschrittene Benutzer. lassen Sie daher die Standardwerte.
    HINWEIS: Erweiterte Parameter können in der GNPS-Dokumentation gelesen werden (gefunden unter ).

Figure 5
Abbildung 5: Verwenden von GNPS zur Durchführung molekularer Netzwerkanalysen (erweiterte Optionen). Min Pair Cos wird direkt die Größe von Clustern beeinflussen, da hohe Werte in der Kombination eng verwandter Verbindungen und niedriger Werte bei der Kombination von entfernt verwandten Verbindungen führen. Die Verwendung zu niedriger Werte sollte vermieden werden. Minimale übereinstimmende Fragmentionen stellen die Anzahl der gemeinsam genutzten Fragmente zwischen zwei Fragmentierungsspektren dar, die im Netzwerk verknüpft werden sollen. Beide Parameter leiten zusammen das Netzwerkformat. niedrigere Werte werden weiter entfernt verwandte Verbindungen clustern und umgekehrt. Die Verwendung der richtigen Werte wird die zusammengesetzte Aufklärung sehr helfen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

  1. Wählen Sie eine E-Mail-Adresse aus, um eine Benachrichtigung zu erhalten, wenn die Arbeit abgeschlossen ist, und senden Sie den Auftrag.

7. Analyse der GNPS-Ergebnisse

  1. Melden Sie sich bei GNPS an. Wählen Sie Aufträge > Veröffentlichter Einzelvorgang > Fertig aus, um den Einzelvorgang zu öffnen. Eine Webseite wird geöffnet, wie in Abbildung 6dargestellt. Alle Ergebnisse aus der molekularen Vernetzung werden angezeigt.
  2. Wählen Sie Spektralfamilien anzeigen (In Browser Network Visualizer), um alle Netzwerkcluster anzuzeigen (rotes Feld, Abbildung 6).

Figure 6
Abbildung 6: Verwenden von GNPS zur Visualisierung molekularer Netzwerkergebnisse. Alle zugehörigen zusammengesetzten Cluster können in Ansichtspektralfamilien (rotes Feld) angezeigt werden. Um nur Bibliothekstreffer zu visualisieren, sollte "Alle Bibliothekstreffer anzeigen" (blaues Feld) ausgewählt werden. Für eine bessere grafische Darstellung der Ergebnisse des molekularen Netzwerks sollte "Direct Cytoscape Preview" (gelbes Feld) heruntergeladen und die neueste Version von Cytoscape verwendet werden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

  1. Eine Liste wird mit allen generierten molekularen Netzwerkclustern angezeigt. Wenn eine Bibliothekssuche ausgewählt wurde, um die Ergebnisse zu generieren, wird die identifizierung vorläufiger Moleküle in AllIDs angezeigt. Wählen Sie Anzeigen aus, um sie zu visualisieren.
    HINWEIS: Die Datenanalysen können für andere Ergebnisse (z. B. Genomabbau, biologische Assays, Bibliotheksdereplikationsmoleküle usw.) gesteuert werden.
  2. Um den molekularen Netzwerkcluster zu analysieren, wählen Sie Netzwerk visualisieren.
    HINWEIS: Jeder Cluster besteht aus Knoten (Kreisen) und Kanten, die Moleküle bzw. molekulare Ähnlichkeit darstellen. Derepierte Moleküle werden als blauer Knoten in der Online-Browser-Netzwerk-Visualisierung hervorgehoben.
  3. Wählen Sie im Feld Knotenbeschriftungen die übergeordnete Masse aus (rotes Feld, Abbildung 7).
  4. Wählen Sie im Feld Kantenbeschriftungen Cosine oder DeltaMZ aus, um Knotenähnlichkeit bzw. Massenunterschiede zwischen Knoten zu beobachten (gelbes Feld, Abbildung 7).
  5. Klicken Sie bei Multigruppenanalysen im Feld Knotenfärbung auf Kreiss zeichnen, um die Häufigkeit zu beobachten, mit der jeder Knoten in jeder Gruppe angezeigt wird (blaues Feld, Abbildung 7).
    HINWEIS: Andere Optionen sind möglich, aber die oben vorgeschlagenen sind optimal, um Clusterknoten zu kommentieren und ihre Strukturen zu entwirren.

Figure 7
Abbildung 7: Verwenden von GNPS zur Visualisierung molekularer Clusterergebnisse. Nach dem Öffnen der molekularen Cluster für eine bessere Datenvisualisierung sollte Folgendes gewählt werden: "Elternmasse" als Knotenbeschriftungen (rotes Feld); "DeltaMZ" als Kantenbeschriftungen (gelbe box); und "Draw pies" als Knotenfärbung (blauebox). Navigieren Sie durch den molekularen Cluster, und versuchen Sie, alle Knoten zu kommentieren. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

  1. Um alle Bibliothekstreffer anzuzeigen, wählen Sie Alle Bibliothekstreffer anzeigen (blaues Feld, Abbildung 7).
    HINWEIS: Außerdem kann das MNW in "Direct Cytoscape Preview/Download" (gelbes Feld, Abbildung 7) heruntergeladen werden, und die Datei kann in der Cytoscape-Plattform (gefunden unter ) geöffnet werden, um weitere Optionen in der grafischen Struktur zu erhalten.
  2. Eine manuelle Bestätigung dereplizierter Verbindungen und eine Strukturaufklärung verwandter Verbindungen sind erforderlich. Öffnen Sie die Fragmentierungsspektren direkt in der GNPS-Plattform oder in Original-Rohdateien.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Das Protokoll wurde erfolgreich anhand einer Kombination aus Genom-Mining, heterologer Expression und MS-geführten/Code-Ansätzen für den Zugriff auf neue spezialisierte Valinomycin-Analogmoleküle veranschaulicht. Der Genom-zu-Molekül-Workflow für das Ziel, Valinomycin (VLM), ist in Abbildung 8dargestellt. Streptomyces sp. CBMAI 2042 Entwurf Genom wurde in Silico analysiert, und der VLM-Gen-Cluster wurde dann identifiziert und auf einen heterologen Wirt übertragen. Heterologe und wilde Sorten wurden in Dreifacharbeit unter geeigneten Fermentationsbedingungen angebaut, mit Ethylacetat aufgeteilt und konzentriert, um den Rohextrakt zu erzeugen. Aus dem Produkt wurden MS/MS-Daten gewonnen, um ein Tandem-MS-Metabolitenprofil für die molekulare Vernetzung zu generieren. Abbildung 9 zeigt die gruppierten Ionen, die aus MS/MS-Daten aus Streptomyces sp. CBMAI 2042 Rohextrakt gewonnen wurden, in dem charakteristische Fragmentierungsmuster und entsprechende MS-Ähnlichkeiten auf das Auftreten einer molekularen Familie mit strukturellen Merkmalen hindeuten2. Nach bekannten biosynthetischen Logik- und Bioinformatik-Erkenntnissen und unterstützt durch musterbasierte MS/MS-Spektren wurde die Struktur von vier ursprünglich gemeldeten Cyclodepsipeptiden aufgeklärt, und ihre Ursprünge wurden mit den gleichen biosynthetischen Genclustern korreliert, die für die VLM-Assembly32verantwortlich sind.

Molekulare Netzwerkdaten (gefunden unter ) wurden in einer GNPS-Plattform verarbeitet und in einem MASSIVE-Repository (MSV000083709) abgelagert. Für die Dereplikation Es wurden zwei Strategien ausgewählt, um das Netzwerk mit zuvor beschriebenen Verbindungen zu füllen: 1) Dereplicator (gefunden unter ) und 2) ein Peptid-Naturprodukt-Identifikationstool namens VarQuest (finden Sie in unserer vorherigen Publikation enthält weitere Details32.

Figure 8
Abbildung 8: Workflow von der Silico-Genomsequenzanalyse bis zur MS-Datenerfassung. (A) Ein Entwurf aus dem Genom Streptomyces sp. CBMAI 2042 wird durch Illumina MiSeq Sequenzierung erhalten. (B) Valinomycin BGC-Identifikation und -Anmerkung. (C) Nach der Übertragung des gesamten Genclusters auf einen geeigneten Wirt wird der Stamm kultiviert. Der Ethylacetat-Extrakt aus der Kultur wird von LC analysiert, um ein Profil der produzierten sekundären Metaboliten zu erhalten. Das Chromatogramm zeigt, dass Valinomycin, Montanastatin und fünf Analoga durch VLM BGC-Expression in einem heterologen Wirt hergestellt werden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Figure 9
Abbildung 9: Ergebnisse der molekularen Vernetzung. (A) Molekulare Vernetzung aus Streptomyces sp. CBMAI 2042 Extrakt. Molekulare Vernetzungsionen, die Valinomycin entsprechen, einer bereits bekannten Verbindung mit dem entsprechenden BGC, die im Streptomyces sp. CBMAI 2042 Genom mit der entsprechenden BGC-Anmerkung ennotiert ist, werden mit Ionen gruppiert, die mit Analoga verwandt sind, die zuerst für VLM BGC beschrieben werden. (B) MS-Spektren und chemische Strukturen für Valinomycin und verwandte Analoga werden gezeigt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Der stärkste Vorteil dieses Protokolls ist seine Fähigkeit, metabolische Profile schnell zu dereplizieren und genomische Informationen mit MS-Daten zu überbrücken, um die Strukturen neuer Moleküle, insbesondere struktureller Analoga2,aufzuklären. Auf der Grundlage genomischer Informationen können verschiedene natürliche Produkte- Chemotypen untersucht werden, wie Polyketide (PK), nichtribosomale Peptide (NRP) und glykosylierte Naturprodukte (BSP) sowie kryptische BGCs. Metamonomisches Screening liefert Beweise für aktivierte BGC-Profile und chemische Vielfalt, die von einem bestimmten Stamm unter Laborbedingungen erzeugt werden. So kann ein BGC geklont werden, um eine neue Verbindung oder unbekannte Analoga im Zusammenhang mit einem bereits bekannten BGC direkt zu erstellen, was durch Ähnlichkeiten erleichtert wird, die durch molekulare Vernetzung entdeckt werden. Daher hilft dieses Verfahren, wertvolle Verbindungen aus natürlichen Quellen zu unterscheiden und kann als Leitfaden für zukünftige Isolationsschritte verwendet werden, die in Natürlichenprodukt-Pipelines üblich sind.

MS-geführter Genomabbau wurde zunächst in den Bereichen Peptidogenomik41 und Glykogenomik42beschrieben. Um das Ausmaß der chemischen Vielfalt des Peptids zu schätzen, entwickelten Dorrestein und Kollegen eine automatisierte Methode, die MS und Genomik verwendet, um die Verbindung zwischen exprimierten Naturprodukten (Chemotyp) und ihren Genclustern (Genotyp) zu visualisieren. Das Konzept des MS-geführten Genomabbaus wurde dann unter Verwendung von Peptid-spezialisierten Metaboliten beschrieben. Hier wurde ein Verfahren zur Identifizierung von mikrobiellen glykosylierten Naturprodukten (BSP) mit einem GM-Ansatz und Tandem-MS als Werkzeug angewendet, um BSP-Chemotypen (aus mikrobiellen Metabolomen) nach Zuckerabdrücken schnell mit ihren entsprechenden biosynthetischen Genotypen zu verbinden.

Das Konzept der Peptidogenomik wurde angewendet, um Stenothricin-Gencluster in Streptomyces roseosporuszu enthüllen, was erste Einblicke in den breiten Nutzen von GNPS als Plattformbietet 43. Musterbasiertes Genom-Mining und molekulare Vernetzung wurden schließlich mit der GNPS-Plattform26 kombiniert, um die Dereplikation neuer Verbindungen, bekannter Verbindungen, den Nachweis neuer Analoga und die Strukturaufklärung von 35 Salinispora-Stämmen zu erleichtern. Dies führte zur Isolierung und Charakterisierung von Retimycin A, einem Quinomycin-Depsipeptid44. Nach der Einführung von GNPS sind integrierte Metabolomik und Genomabbau-Ansätze die vielseitigste Möglichkeit, molekulare Netzwerke mit biosynthetischen Fähigkeiten zu verbinden45,46,47,48,49,50.

Dieses Protokoll verstärkt die Durchführbarkeit der Verwendung genomischer und metabolomischer Analysen zur Untersuchung der Produktion bekannter und unbekannter chemisch analoger Verbindungen in wenigen Schritten unter Verbrauch geringer Mengen an Materialien. Das hier vorgestellte Modell bezieht sich auf die analoge Valinomycin-Identifikation aus Rohextrakten durch molekulare Netzwerkdereplikation. Die Struktur der Analoga wird durch MS/MS-Fragmentierung abgeleitet und folgt der biosynthetischen Logik geklonter VLM BGCs.

Verschiedene Software ist für den Abbau sekundärer Metaboliten biosynthetische Gen Cluster51 und für metabolit Aufklärung verfügbar, aber Open-Source-Optionen haben die Vorteile wegen ständiger Updates, und sie sind offen für die wissenschaftliche Gemeinschaft. In diesem Sinne sind AntiSMASH und die GNPS-Plattform die beliebtesten Entscheidungen.

Dieses allgemeine Verfahren kann für andere Extraktionsmethoden geändert werden, die auf der untersuchten natürlichen Quelle basieren. Mehr als eine Extraktionsmethode kann auch nach Metaboliteneigenschaften kombiniert werden (d. h. Polarität, Hydrophobie, die Fähigkeit, Mizellen zu bilden), und selbst ähnliche Eigenschaften, verschiedene Lösungsmittel oder Harz können zu verbesserten Ergebnissen führen. Normalerweise werden Extrakte aus flüssigem Medium Anbau hergestellt, aber es gibt eine Fülle von Extraktionsmethoden zur Verfügung, um angereicherte Extrakte zu isolieren und jede biologische Probe von Interesse zu untersuchen.

Beim Erfassen von MS-Daten sollte eine DDA-Analyse (Data Dependent Acquisition) verwendet werden. Dieses Problem ist wichtig, wenn eine größere Anzahl von Verbindungen in einer einzigen Injektion bewertet werden. Bei der Ausführung von DDA sollten die maximale Anzahl von MS/MS-Spektren jedes Vorläuferions und die maximale Anzahl verschiedener Vorläuferionen kompensiert werden. Bei Verwendung von Geräten mit schneller Scanrate kann dies mit höheren Scanraten erreicht werden (6–10 MS/MS-Scans pro Zyklus). Bei Geräten mit geringerer Scanrate kann die MN-Leistung jedoch nur mit einer besseren chromatographischen Auflösung gesteigert werden. Die umfassendsten Daten, um die molekulare Vernetzung zu füllen, sollten erhalten werden. Für die MS-Datenerfassung ist feste Kollisionsenergie möglich, rampenenergien sind jedoch geeignet, verbesserte Ergebnisse zu erzielen. Es gibt keine optimalen Bedingungen, die perfekt für alle Proben funktionieren. Für die folgenden Schritte ist die Erreichung einer ausreichenden MS-Analyse von entscheidender Bedeutung. Von nun an sollten die molekularen Netzwerkcluster nach dem Verfahren erzeugt und derepliziert werden.

Ein häufiger Fehler bei der Fehlerbehebung fehlt Intensitäten für Massen. Normalerweise kann dies durch die Einführung höherer Kollisionsenergie während der Analyse gelöst werden. Manchmal werden keine Korrelationen zwischen den Spektren und der GNPS-Bibliothek beobachtet, was sehr ungewöhnlich ist. Stellen Sie in diesem Fall sicher, dass der Ordner ordnungsgemäß in der MS-Software vordervisualisierungsgemäß geöffnet wird, da während des Konvertierungsschritts in .mzXML-Dateien manchmal Fehler erstellt werden können.

In Bezug auf den Genombergbau wird die präziseste Ausgabe von Gencluster-Anmerkungsplattformen für eine qualitativ hochwertigere Gesamtegenomsequenzierung sowohl für den einzelnen Stamm als auch für den kulturunabhängigen Bergbau bereitgestellt. Eine qualitativ hochwertige Sequenzierung wird qualitativ hochwertige bioinformatische Erkenntnisse für die Dereplikation biosynthetischer Pfade generieren. Im Gegensatz dazu, obwohl BGC Vorhersage Bioinformatik-Software hat sich schnell entwickelt, genaue Vorhersagen der Genfunktion und vermeintliche Produkte ist immer noch schwierig, vor allem bei der Untersuchung neuartiger biosynthetischer Pfade und Merkmale, die in Silico nicht vorhergesagt werden können. Außerdem werden einige biosynthetische Maschinen auffallend konserviert, während die Enzymologie, die an Hybridsystemen, trans-AT-Modul-PKs und NRPSs beteiligt ist, als Ausnahmen der Kolinearitätsregel anerkannt wird. trans In diesem Sinne können heterologe Expression und Verfeinerungen in bioinformatischer Output-Software dazu beitragen, unvorhersehbare Enzymfunktionen und ungewöhnliche Biochemie52,53,54aufzuklären. Die Anreicherung öffentlicher Datenbanken wird zu genaueren Vorhersagen und der Entdeckung neuartiger spezialisierter Metaboliten führen, da die Kosten für WGS nicht das Handicap für den Genombergbau darstellen.

Schließlich hängen die stärksten Vorteile integrierter metabolomischer und genomischer Mining-Ansätze mit ihrer Durchführbarkeit zusammen, um die Dereplikation von Genotyp und Chemotyp über eine automatisierte und hochdurchsatzbezogene Analyse durchzuführen, die genomische, transkriptomische und metabolomische Daten, um Gene effizient mit Molekülen zu verbinden.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren haben nichts zu verraten.

Acknowledgments

Die finanzielle Unterstützung für diese Studie wurde von der Forschungsstiftung von Sao Paulo - FAPESP (2019/10564-5, 2014/12727-5 und 2014/50249-8 bis L.G.O; 2013/12598-8 und 2015/01013-4 an R.S.; und 2019/08853-9 an C.F.F.A). B.S.P, C.F.F.A. und L.G.O. erhielten Stipendien des National Council for Scientific and Technological Development - CNPq (205729/2018-5, 162191/2015-4 und 313492/2017-4). L.G.O. ist auch dankbar für die Stipendienförderung durch das Programm For Women in Science (2008, Brazilian Edition). Alle Autoren würdigen CAPES (Coordination for the Improvement of Higher Education Personnel) für die Unterstützung der Post-Graduation-Programme in Brasilien.

Materials

Name Company Catalog Number Comments
Acetonitrile Tedia AA1120-048 HPLC grade
Agar Oxoid LP0011 NA
Apramycin Sigma Aldrich A2024 NA
Carbenicillin Sigma Aldrich C9231 NA
Centrifuge Eppendorf NA 5804
Chloramphenicol Sigma Aldrich C3175 NA
Column C18 Agilent Technologies NA ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902
Kanamycin Sigma Aldrich K1377 NA
Manitol P.A.- A.C.S. Synth NA NA
Microcentrifuge Eppendorf NA 5418
Nalidixic acid Sigma Aldrich N4382 NA
Phusion Flash High-Fidelity PCR Master Mix ThermoFisher Scientific F548S NA
Q-TOF mass spectrometer Agilent technologies NA 6550 iFunnel Q-TOF LC/MS
Sacarose P.A.- A.C.S. Synth NA NA
Shaker/Incubator Marconi MA420 NA
Sodium Chloride Synth NA P. A. - ACS
Soy extract NA NA NA
Sucrose Synth NA P. A. - ACS
Thermal Cycles Eppendorf NA Mastercycler Nexus Gradient
Thiostrepton Sigma Aldrich T8902 NA
Tryptone Oxoid LP0042 NA
Tryptone Soy Broth Oxoid CM0129 NA
UPLC Agilent Technologies NA 1290 Infinity LC System
Yeast extract Oxoid LP0021 NA

DOWNLOAD MATERIALS LIST

References

  1. Davies, J. Specialized microbial metabolites: functions and origins. The Journal of Antibiotics. 66 (7), Tokyo. 361-364 (2013).
  2. Ziemert, N., Alanjary, M., Weber, T. The evolution of genome mining in microbes - a review. Natural Product Reports. 33 (8), 988-1005 (2016).
  3. Zerikly, M., Challis, G. L. Strategies for the Discovery of New Natural Products by Genome Mining. ChemBioChem. 10 (4), 625-633 (2009).
  4. Gomez-Escribano, J. P., Bibb, M. J. Heterologous expression of natural product biosynthetic gene clusters in Streptomyces coelicolor: from genome mining to manipulation of biosynthetic pathways. Journal of Industrial Microbiology & Biotechnology. 41 (2), 425-431 (2014).
  5. Medema, M. H., et al. Minimum Information about a Biosynthetic Gene cluster. Nature Chemical Biology. 11 (9), 625-631 (2015).
  6. Lautru, S., Deeth, R. J., Bailey, L. M., Challis, G. L. Discovery of a new peptide natural product by Streptomyces coelicolor genome mining. Nature Chemical Biology. 1 (5), 265-269 (2005).
  7. Chiang, Y. -M., et al. Molecular Genetic Mining of the Aspergillus Secondary Metabolome: Discovery of the Emericellamide Biosynthetic Pathway. Chemistry & Biology. 15 (6), 527-532 (2008).
  8. Huang, T., et al. Identification and Characterization of the Pyridomycin Biosynthetic Gene Cluster of Streptomyces pyridomyceticus NRRL B-2517. Journal of Biological Chemistry. 286 (23), 20648-20657 (2011).
  9. Udwary, D. W., et al. Genome sequencing reveals complex secondary metabolome in the marine actinomycete Salinispora tropica. Proceedings of the National Academy of Sciences. 104 (25), 10376-10381 (2007).
  10. Gross, H., et al. The Genomisotopic Approach: A Systematic Method to Isolate Products of Orphan Biosynthetic Gene Clusters. Chemistry & Biology. 14 (1), 53-63 (2007).
  11. Spohn, M., Wohlleben, W., Stegmann, E. Elucidation of the zinc-dependent regulation in Amycolatopsis japonicum enabled the identification of the ethylenediamine-disuccinate ([S,S ]-EDDS) genes. Environmental Microbiology. 18 (4), 1249-1263 (2016).
  12. Thaker, M. N., Waglechner, N., Wright, G. D. Antibiotic resistance-mediated isolation of scaffold-specific natural product producers. Nature Protocols. 9 (6), 1469-1479 (2014).
  13. Katz, M., Hover, B. M., Brady, S. F. Culture-independent discovery of natural products from soil metagenomes. Journal of Industrial Microbiology & Biotechnology. 43, 129-141 (2016).
  14. Quinn, R. A., et al. Molecular Networking as a Drug Discovery, Drug Metabolism, and Precision Medicine Strategy. Trends in Pharmacological Sciences. 38 (2), 143-154 (2017).
  15. Yang, J. Y., et al. Molecular Networking as a Dereplication Strategy. Journal of Natural Products. 76 (9), 1686-1699 (2013).
  16. Lommen, A. MetAlign: Interface-Driven, Versatile Metabolomics Tool for Hyphenated Full-Scan Mass Spectrometry Data Preprocessing. Analytical Chemistry. 81 (8), 3079-3086 (2009).
  17. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  18. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  19. Tautenhahn, R., Patti, G. J., Rinehart, D., Siuzdak, G. XCMS Online: A Web-Based Platform to Process Untargeted Metabolomic Data. Analytical Chemistry. 84 (11), 5035-5039 (2012).
  20. Kuhl, C., Tautenhahn, R., Böttcher, C., Larson, T. R., Neumann, S. CAMERA: An Integrated Strategy for Compound Spectra Extraction and Annotation of Liquid Chromatography/Mass Spectrometry Data Sets. Analytical Chemistry. 84 (1), 283-289 (2012).
  21. Katajamaa, M., Orešič, M. Data processing for mass spectrometry-based metabolomics. Journal of Chromatography A. 1158, 318-328 (2007).
  22. Liu, W. -T., et al. Interpretation of Tandem Mass Spectra Obtained from Cyclic Nonribosomal Peptides. Analytical Chemistry. 81 (11), 4200-4209 (2009).
  23. Ng, J., et al. Dereplication and de novo sequencing of nonribosomal peptides. Nature Methods. 6 (8), 596-599 (2009).
  24. Liaw, C., et al. Vitroprocines, new antibiotics against Acinetobacter baumannii, discovered from marine Vibrio sp. QWI-06 using mass-spectrometry-based metabolomics approach. Scientific Reports. 5 (1), 1-11 (2015).
  25. Kang, K. B., et al. Targeted Isolation of Neuroprotective Dicoumaroyl Neolignans and Lignans from Sageretia theezans Using in Silico Molecular Network Annotation Propagation-Based Dereplication. Journal of Natural Products. 81 (8), 1819-1828 (2018).
  26. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  27. Doroghazi, J. R., et al. A roadmap for natural product discovery based on large-scale genomics and metabolomics. Nature Chemical Biology. 10 (11), 963-968 (2014).
  28. Medema, M. H., et al. antiSMASH: rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genome sequences. Nucleic Acids Research. 39, 339-346 (2011).
  29. Weber, T., et al. antiSMASH 3.0-a comprehensive resource for the genome mining of biosynthetic gene clusters. Nucleic Acids Research. 43, 237-243 (2015).
  30. Blin, K., et al. antiSMASH 5.0: updates to the secondary metabolite genome mining pipeline. Nucleic Acids Research. 47, 81-87 (2019).
  31. Watrous, J., et al. Mass spectral molecular networking of living microbial colonies. Proceedings of the National Academy of Sciences. 109 (26), 1743-1752 (2012).
  32. Paulo, B. S., Sigrist, R., Angolini, C. F. F., De Oliveira, L. G. New Cyclodepsipeptide Derivatives Revealed by Genome Mining and Molecular Networking. ChemistrySelect. 4 (27), 7785-7790 (2019).
  33. Gonzaga de Oliveira, L., Sigrist, R., Sachetto Paulo, B., Samborskyy, M. Whole-Genome Sequence of the Endophytic Streptomyces sp. Strain CBMAI 2042, Isolated from Citrus sinensis. Microbiology Resource Announcements. 8 (2), 1-2 (2019).
  34. Aziz, R. K., et al. The RAST Server: Rapid Annotations using Subsystems Technology. BMC Genomics. 9 (1), 75 (2008).
  35. Nah, H. -J., Pyeon, H. -R., Kang, S. -H., Choi, S. -S., Kim, E. -S. Cloning and Heterologous Expression of a Large-sized Natural Product Biosynthetic Gene Cluster in Streptomyces Species. Frontiers in Microbiology. 8, 1-10 (2017).
  36. Zhang, J. J., Tang, X., Moore, B. S. Genetic platforms for heterologous expression of microbial natural products. Natural Product Reports. 36 (9), 1313-1332 (2019).
  37. Alduina, R., et al. Artificial chromosome libraries of Streptomyces coelicolor A3(2) and Planobispora rosea. FEMS Microbiology Letters. 218 (1), 181-186 (2003).
  38. Jones, A. C., et al. Phage P1-Derived Artificial Chromosomes Facilitate Heterologous Expression of the FK506 Gene Cluster. PLoS One. 8 (7), 69319 (2013).
  39. Gomez-Escribano, J. P., Bibb, M. J. Engineering Streptomyces coelicolor for heterologous expression of secondary metabolite gene clusters. Microbial Biotechnology. 4 (2), 207-215 (2011).
  40. Cannell, R. J. P. Natural Products Isolation. , Humana Press. Totowa, NJ. (1998).
  41. Kersten, R. D., et al. A mass spectrometry-guided genome mining approach for natural product peptidogenomics. Nature Chemical Biology. 7 (11), 794-802 (2011).
  42. Kersten, R. D., et al. Glycogenomics as a mass spectrometry-guided genome-mining method for microbial glycosylated molecules. Proceedings of the National Academy of Sciences. 110 (47), 4407-4416 (2013).
  43. Liu, W., et al. MS/MS-based networking and peptidogenomics guided genome mining revealed the stenothricin gene cluster in Streptomyces roseosporus. The Journal of Antibiotics. 67 (1), Tokyo. 99-104 (2014).
  44. Duncan, K. R., et al. Molecular Networking and Pattern-Based Genome Mining Improves Discovery of Biosynthetic Gene Clusters and their Products from Salinispora Species. Chemistry & Biology. 22 (4), 460-471 (2015).
  45. Cao, L., et al. MetaMiner: A Scalable Peptidogenomics Approach for Discovery of Ribosomal Peptide Natural Products with Blind Modifications from Microbial Communities. Cell Systems. , (2019).
  46. Chen, L. -Y., Cui, H. -T., Su, C., Bai, F. -W., Zhao, X. -Q. Analysis of the complete genome sequence of a marine-derived strain Streptomyces sp. S063 CGMCC 14582 reveals its biosynthetic potential to produce novel anti-complement agents and peptides. PeerJ. 7 (1), 6122 (2019).
  47. Kim Tiam, S., et al. Insights into the Diversity of Secondary Metabolites of Planktothrix Using a Biphasic Approach Combining Global Genomics and Metabolomics. Toxins. 11 (9), 498 (2019).
  48. Özakin, S., Ince, E. Genome and metabolome mining of marine obligate Salinispora strains to discover new natural products. Turkish Journal of Biology. 43 (1), 28-36 (2019).
  49. Trivella, D. B. B., de Felicio, R. The Tripod for Bacterial Natural Product Discovery: Genome Mining, Silent Pathway Induction, and Mass Spectrometry-Based Molecular Networking. mSystems. 3 (2), 00160 (2018).
  50. Maansson, M., et al. An Integrated Metabolomic and Genomic Mining Workflow To Uncover the Biosynthetic Potential of Bacteria. mSystems. 1 (3), 1-14 (2016).
  51. Blin, K., Kim, H. U., Medema, M. H., Weber, T. Recent development of antiSMASH and other computational approaches to mine secondary metabolite biosynthetic gene clusters. Briefings in Bioinformatics. 20 (4), 1103-1113 (2019).
  52. Fisch, K. M. Biosynthesis of natural products by microbial iterative hybrid PKS-NRPS. RSC Advances. 3 (40), 18228-18247 (2013).
  53. Tatsuno, S., Arakawa, K., Kinashi, H. Analysis of Modular-iterative Mixed Biosynthesis of Lankacidin by Heterologous Expression and Gene Fusion. The Journal of Antibiotics. 60 (11), Tokyo. 700-708 (2007).
  54. Helfrich, E. J. N., Piel, J. Biosynthesis of polyketides by trans-AT polyketide synthases. Natural Product Reports. 33 (2), 231-316 (2016).

Tags

Retraktion Ausgabe 157 Genombergbau molekulare Vernetzung Massenspektrometrie-geführter Genombergbau Naturprodukte Streptomyces Zielmolekülnetzwerk gesamte Genomsequenzierung
Mass Spectrometrie-Guided Genome Mining als Werkzeug zur Aufdeckung neuartiger Naturprodukte
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sigrist, R., Paulo, B. S., Angolini, More

Sigrist, R., Paulo, B. S., Angolini, C. F. F., De Oliveira, L. G. Mass Spectrometry-Guided Genome Mining as a Tool to Uncover Novel Natural Products. J. Vis. Exp. (157), e60825, doi:10.3791/60825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter