Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Масс-спектрометрии-управляемый геном добычи в качестве инструмента для выявления новых природных продуктов

Published: March 12, 2020 doi: 10.3791/60825

Summary

Здесь создан и описан протокол добычи генома, направленного масс-спектрометрией. Он основан на информации о последовательности генома и анализе LC-MS/MS и направлен на облегчение идентификации молекул из сложных микробных и растительных экстрактов.

Abstract

Химическое пространство, покрытое натуральными продуктами, огромно и широко не признано. Поэтому необходимы удобные методологии для проведения широкомасштабной оценки их функций в природе и потенциальных благ человека (например, для применения лекарственных средств). Этот протокол описывает сочетание добычи генома (ГМ) и молекулярных сетей (MN), двух современных подходов, которые соответствуют генно-кодированным аннотациям во секвенировании всего генома с химическими сигнатурами структуры из грубых метаболических экстрактов. Это первый шаг на пути к открытию новых природных образований. Эти понятия, при применении вместе, определяются здесь как MS-управляемый геном добычи. В этом методе основные компоненты ранее обозначены (с использованием MN), а связанные структурно новые кандидаты связаны с аннотациями последовательности генома (с использованием ГМ). Объединение ГМ и MN является выгодной стратегией для целевой новой молекулы позвоночника или сбора метаболических профилей для того, чтобы определить аналоги из уже известных соединений.

Introduction

Исследования вторичного метаболизма часто состоят из скрининга сырых экстрактов для конкретных биологических видов деятельности с последующим очищением, идентификацией и характеристикой составляющих, принадлежащих к активным фракциям. Этот процесс оказался эффективным, способствуя изоляции нескольких химических организаций. Тем не менее, в настоящее время это рассматривается как неосуществимый, в основном из-за высоких темпов повторного открытия. Поскольку фармацевтическая промышленность произвела революцию, не зная о роли и функциях специализированных метаболитов, их идентификация проводилась в лабораторных условиях, которые не точно представляли природу1. Сегодня лучше понять естественные сигнальные влияния, секрецию и наличие большинства целей при неопределимо низких концентрациях. Кроме того, регулирование этого процесса поможет академическому сообществу и фармацевтической промышленности воспользоваться этими знаниями. Это также пойдет на пользу исследованиям, связанным с прямой изоляцией метаболитов, связанных с молчаливыми биосинтетическими генными кластерами (BGCs)2.

В этом контексте прогресс в области геномного секвенирования возродил интерес к скринингу метаболитов микроорганизмов. Это связано с тем, что анализ геномной информации нераскрытых биосинтетических кластеров может выявить гены, кодирующих новые соединения, не соблюдаемые и не производимые в лабораторных условиях. Многие микробные проекты всего генома или проекты доступны сегодня, и их число растет с каждым годом, обеспечивая огромные перспективы для раскрытия новых биологически активных молекул через геном добычи3,4.

Атлас биосинтетических генных кластеров является текущей крупнейшей коллекцией автоматически добытых генных кластеров в качестве компонента интегрированной платформы микробных геномов Объединенного института генома (JGI IMG-ABC)2. Совсем недавно, Минимальная информация для биосинтетических генных кластеров (MIBiG) Инициатива по стандартизации способствовала ручной реаннотации BGCs, обеспечивая высоко куратором набор справочных данных5. В настоящее время имеется множество инструментов, позволяющих осуществлять вычислительный анализ генетических данных и их связь с известными вторичными метаболитами. Различные стратегии были также разработаны для доступа к новым биологически активным натуральным продуктам (т.е. гетерологическое выражение, удаление целевых генов, восстановление в пробирке, геномная последовательность, изотоп-управляемый скрининг «геномисотемный подход», манипуляции с местными и глобальными регуляторами, добыча на основе сопротивления, культурная независимая добыча полезных ископаемых, и, в последнее время, MS-руководство/код подходы2,6,9,9,9, , 10,11,,12,,13,,14,,15).

Добыча генома как особая стратегия требует усилий по аннотатам одной или небольшой группы молекул; таким образом, сохраняются пробелы в этом процессе, в которых новые соединения отдают приоритет изоляции и разослать структуру. В принципе, эти подходы нацелены только на один биосинтетический путь в эксперимент, что приводит к медленному показателю открытия. В этом смысле использование Gm наряду с молекулярным подходом сетей представляет собой важный шаг для исследования природного продукта14,15.

Универсальность, точность и высокая чувствительность жидкой хроматографии-масс-спектрометрии (LC-MS) делают его хорошим методом для комплексной идентификации. В настоящее время несколько платформ инвестировали алгоритмы и пакеты программного обеспечения для нецелевых метаболомики16,,17,,18,,19,,20. Ядро этих программ включает в себя обнаружение функций (пиковый сбор)21 и пиковое выравнивание, что позволяет совпадать с идентичными функциями по пакету образцов и поиску шаблонов. MS шаблон на основе алгоритмов22,23 сравнить характерные модели фрагментации и матч MS2 сходства генерации молекулярных семейств обмена структурными особенностями. Эти функции могут быть выделены и сгруппированы, предоставляя возможность быстро обнаружить известные и неизвестные молекулы из сложного биологического экстракта тандемом MS2,24,25. Таким образом, тандем MS является универсальным методом получения структурной информации о нескольких хемотипов, содержащихся в большом объеме данных одновременно.

Алгоритм Глобальной естественной молекулярной сети (GNPS)26 использует нормализованную интенсивность ионов фрагментов для построения многомерных векторов, в которых сходства сравниваются с помощью косиновых функций. Взаимосвязь между различными родительскими ионами построена в представлении диаграммы, в котором каждая фрагментация визуализируется как узло (круги), а родственность каждого узла определяется краем (линиями). Глобальная визуализация молекул из одного источника определяется как молекулярная сеть. Структурно расходящиеся молекулы, которые фрагментируют однозначно, образуют свое собственное конкретное скопление или созвездие, в то время как связанные молекулы сгруппируются вместе. Кластеризация хемотипов позволяет гипотетическое соединение аналогичных структурных особенностей с их биосинтетическим происхождением.

Сочетание как хемотипа к генотипу, так и подходов к генотипу к хемотипу является мощным при создании биоинформатичных связей между BGCs и их небольшими молекулярными продуктами27. Таким образом, добыча генома с MS-наведением является быстрым методом и низкой потребляющей материал стратегией, и она помогает преодолеть родительские ионы и биосинтетические пути, выявленные WGS одного или нескольких штаммов в различных метаболических и экологических условиях.

Рабочий процесс этого протокола(рисунок 1) состоит из подачи данных WGS в биосинтетическую платформу аннотации генного кластера, такую как antiSMASH28,,29,30. Это помогает оценить разнообразие соединений и класс соединений, кодируется геномом. Стратегия для целевой биосинтетического генного кластера кодирования химической сущности, представляющие интерес, должны быть приняты, и культура экстракты из штамма дикого типа и / или гетерологовой штамм, содержащий BGC могут быть проанализированы для создания кластерных ионов на основе сходства с помощью GNPS26,31. Следовательно, можно определить новые молекулы, которые ассоциируются с целевым BGC и недоступны в базе данных (в основном неизвестные аналоги, иногда производимые в низких титрах). Уместно учитывать, что пользователи могут вносить свой вклад в эти платформы и что доступность биоинформатики и данных MS/MS быстро растет, что ведет к постоянному развитию и модернизации эффективных вычислительных инструментов и алгоритмов для руководства эффективными соединениями сложных экстрактов с молекулами.

Figure 1
Рисунок 1: Обзор всего рабочего процесса. Показано иллюстрация биоинформатических, клонирующих и молекулярных сетей, участвующих в описанном подходе к добыче генома с гидом MS для выявления новых метаболитов. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Этот протокол описывает быстрый и эффективный рабочий процесс для объединения добычи генома и молекулярных сетей в качестве отправной точки для конвейера по открытию природных продуктов. Хотя многие приложения способны визуализировать состав и родственность MS-обнаруживаемых молекул в одной сети, некоторые из них приняты здесь, чтобы визуализировать структурно похожие кластерные молекулы. Используя эту стратегию, успешно идентифицируются новые циклодепсипептидные продукты, наблюдаемые в метаболических экстрактах streptomyces sp. CBMAI 2042. Руководствуясь добычей генома, весь биосинтетический ген кластер, кодируя для валиномицинов, распознается и клонируется в штамм производителя Streptomyces coelicolor M1146. Наконец, после MS шаблон на основе молекулярной сети, молекулы, обнаруженные MS коррелируют с BGCs ответственность за их биогенеза32.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Добыча генома для биосинтетических генных кластеров

  1. Выполните секвенирование всего генома (WGS) в качестве первого шага к выбору биосинтетического генного кластера (BCG) для добычи генома с гидом MS. Весь проект генома штамма интерес (бактерии) могут быть получены с помощью illumina MiSeq технологии с использованием следующих с высоким качеством геномной ДНК: дробовик TruSeq PCR-Free библиотека подготовка и Nextera Mate Пара Библиотека Подготовка Kit33.
    ПРИМЕЧАНИЕ: После секвенирования, библиотека выстрелить Illumina и Illumina мате пара библиотека может быть собрана с помощью Newbler v3.0 (Рош, 454) сборочная программа (найденная по адресу://ngs.csr.uky.edu/Newbler)) и аннотирована с помощью конвейера на основе FgeneSB (найденная на сайте slt;http://www.softberry.com/berry.phtml?topic-fgenesb_annotator33 Микробиология ресурс Объявления (MRA) является полностью открытым доступом журнал со статьями публикации наличие любого микробиологического ресурса на хранение в доступном хранилище (найдено на lt;https://mra.asm.org.gt;gt;). Кандидат белково-кодирующих генов идентифицируются с помощью аннотации сервера RAST34, и проект Whole Genome Shotgun (WGS) откладывается в DDBJ/ENA/GenBank (найдено в zlt;https:///www.ncbi.nlm.nih.gov/genbank/)) и Gold (найдено в
  2. Чтобы получить в силико информацию о вторичном метаболизме генных кластеров аннотации из полного секвенированных генома, представить файл последовательности (GenBank / EMBL или FASTA формат) на антиsmash платформы (найдено на lt;https://antismash.secondarymetabolites.org /
  3. Выберите генный кластер, представляющий интерес, из выходных данных(рисунок 2)на основе наиболее похожего известного кластера.
    ПРИМЕЧАНИЕ: Во-первых, это рутина для изучения гена по гену и проведения индивидуальных поисков (blastp), чтобы оценить, какие функции связаны с желаемой биосинтетических групп генов. Эта процедура также может помочь определить, какой BGC, вероятно, связан с производством желаемого соединения, даже если это низкий процент. Антиsmash прогноз рассматривает все гены в кластере, чтобы сделать процентное покрытие, которое может представлять собой глобальный низкий процент сходства для направленного BGC. Однако при анализе гена по гену можно получить более точную информацию с помощью наиболее похожего известного кластера. Во-вторых, antiSMASH имеет два варианта для уточнения поиска: 1) строгость обнаружения: степень строгости, к которой биосинтетический кластер генов должен рассматриваться как хит. Для этого параметра пользователь должен использовать следующие параметры: a) строгий: обнаруживает исключительно четко определенные кластеры, содержащие все необходимые области, невосприимчивые к ошибкам в генетической информации; б) расслаблен: обнаруживает частичные кластеры, отсутствующие в одном или нескольких функциональных области, что также работает для обнаружения строгой функции; или в) свободно: обнаруживает плохо определенные кластеры и кластеры, которые, вероятно, соответствуют первичным метаболитам, что может привести к появлению ложных срабатываний или плохо определенных БГК. Другой вариант 2) дополнительные функции: тип информации, платформы должны искать и отображать в выходе. В общем, эти два варианта могут сэкономить время после предсказания. Тем не менее, работа antiSMASH требует более длительного периода времени.

Figure 2
Рисунок 2: Выход с платформы antiSMASH. Вторичный метаболизм в анализе силико из аннотации всей геномной последовательности. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

  1. Основываясь на информации о последовательности ДНК BGC, дизайн праймеров (20-25 nt) фланговых генного кластера для ESAC (E. coli/Streptomyces Искусственная хромосома) библиотеки скрининга.
    ПРИМЕЧАНИЕ: Различные методы35,36 могут быть использованы для захвата всего биосинтетического кластера генов из ДНК. Здесь используется метод строительства представительной библиотеки ESAC 37,38 от Streptomyces sp. CBMAI 2042, содержащей клонов со средним размером фрагментов95кб.

2. Гетерологусное выражение целого биосинтетического генного кластера из библиотеки ESAC

  1. Переместите вектор ESAC от E. coli DH10B к E. coli ET12567 путем трехродительского спряжения32.
    1. Привить Е. coli ET12567 (CamR), TOPO10/pR9604 (CarbR), DH10B/ESAC4H (AprR) в 5 мл Люрия-Бертани (LB) среда, содержащая хлорамфеникол (25 мкг/мл), карбенициллин (100 г м/мл) и apramycin (5 м/м).
    2. Инкубировать культуру на ночь при 37 градусах Цельсия и 250 об/мин.
    3. Прививать 500 л ночной культуры в 10 мл среды LB, содержащей половину концентрации антибиотиков.
    4. Инкубировать культуру при 37 градусах Цельсия и 250 об/мин до достиженияА 600 0,4-0,6.
    5. Урожай клеток центрифугирования на 2200 х г в течение 5 мин.
    6. Вымойте клетки дважды с 20 мл среднего LB.
    7. Повторное увеличение количества клеток в 500 л л.с.
    8. Смешайте 20 зл каждого штамма в микроцентрифуговой трубке и капайте в агарную пластину с LB-средой, не удающей антибиотиков.
    9. Инкубировать пластины при 37 градусах Цельсия на ночь.
    10. Перекинуте выращенные клетки на свежую агарную пластину LB, содержащую антибиотики, и инкубируйприте при 37 градусах Цельсия в одночасье.

3. Стрептомиции/E. coli спряжения

  1. Для получения рекомбинантного гетерологального организма, выполнить спряжение32 между E. coli ET12567, содержащий вектор ESAC, помощник плазмид pR9604, и Streptomyces coelicolor M1146 или другой выбранный штамм хозяина39.
  2. День 1: Прививать изолированные колонии S. coelicolor M1146 в 25 мл средней TSBY в колбе Erlenmeyer 250 мл, оснащенной инокс-весной при 30 градусах Цельсия и 200 об/мин при 48 ч.
  3. День 2/3: Прививать ET12567/ESAC/pR9604 в 5 мл среды LB, содержащей хлорамфеникол (25 мкг/мл), карбеницилин (100 мкг/мл) и апрамицин (50 мкг/мл) на ночь при 37 градусах Цельсия и 250 об/мин.
  4. День 3/4: Прививать 500 л ночной культуры в 10 мл 2TY (в 50 мл конической трубки), содержащий полурабочие концентрации антибиотиков. Инкубировать при 37 градусах Цельсия и 250 об/мин до достиженияА 600 0,4-0,6.
  5. Центрифуга культур (ET12567/ESAC/pR9604 и M1146) на 2200 х г в течение 10 мин.
  6. Вымойте гранулы 2x в 20 мл 2TY среднего и повторно в 500 зл от 2TY.
  7. Aliquot 200 л S. coelicolor M1146 подвески и разбавления в 500 зл от 2TY (подвеска A).
  8. Aliquot 200 л подвески А и разбавить в 500 л 2TY (подвеска B).
  9. Aliquot 200 л подвески B и разбавить в 500 л 2TY (подвеска C).
  10. Aliquot 200 л подвески ET12567/ESAC/pR9604 и смешивается с 200 злитровыми севов с.
  11. Плита 150 л спряжение смеси на агаровой пластине SFM не хватает антибиотиков.
  12. Инкубировать при 30 градусах по Цельсию на 16 ч.
  13. Накрыть пластинами 1 мл антибиотико-раствора (согласно плазмидной резистентности). После высыхания инкубировать при 30 градусах По Цельсию в течение 4-7 дней.
    ПРИМЕЧАНИЕ: Здесь был подготовлен раствор, содержащий 1,0 мг/мл тиострептона и 0,5 мг/мл налидиксовой кислоты.
  14. Полоса ориентировочных эксконъюгантов на агарные пластины SFM, содержащие тиострептон (50 мг/мл) и налидиксовую кислоту (25 мг/мл). Инкубировать при 30 градусах Цельсия.
  15. Полоса exconjugants на SFM агар, содержащий только налидиксивая кислота.
  16. Выполните пЦР-анализ с изолированными колониями, чтобы подтвердить, что весь генный кластер был перенесен на узел S. coelicolor M1146.

4. Выращивание штамма

  1. Для получения метаболического профиля привить 1/100 предкультуры штамма в соответствующих средствах брожения и при соответствующих культурных условиях.
  2. Культуры центрифуги при 2200 х г в течение 10 мин.
  3. Выполните добычу в соответствии с классом соединения интереса40.

5. Приобретение масс-спектров и подготовка к анализу ВНПС

  1. Для получения данных MS/MS, программа подходящих Методов HPLC и масс-спектрометрии с использованием программного обеспечения управления. Можно проанализировать анализ анализа масс-спектрометрии с высоким и низким разрешением (DDA).
    ПРИМЕЧАНИЕ: Как правило, 1 мг/мл раствор сложных образцов сырого экстракта является идеальным. Разбавления необходимы для менее сложных экстрактов. Следует отметить, что ms/MS сеть является обнаруживаемой молекулярной сети в данных масс-спектрометрических условиях.
  2. Преобразуйте масс-спектр в формат .mzXML с помощью MSConvert от Proteowizard (найдено в lt;http://proteowizard.sourceforge.net/-gt;gt;). Параметры ввода для преобразования иллюстрируются на рисунке 3. Данные из программного обеспечения почти всех компаний совместимы.

Figure 3
Рисунок 3: Использование MsConvert для преобразования ms файлов в расширение mzXML. Отображается правильный параметр для анализа GNPS. Инструкции следующие: добавить все файлы MS в поле 1 и добавить фильтр Пик Выбор в поле 2; для этого фильтра используйте поставщика алгоритмов; запуск прессы и процессы преобразования последуют. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

  1. Загрузите преобразованные файлы LC-MS/MS в базу данных GNPS. Доступны два варианта: с помощью протокола передачи файлов (FTP) или непосредственно в браузере через онлайн-платформу.
    ПРИМЕЧАНИЕ: Подробная информация о том, как установить и передать данные в GNPS, доступна по адресу: //ccms-ucsd.github.io/GNPSDocumentation/fileupload/

6. Анализ ВНПС

  1. После создания учетной записи в GNPS (найденной по адресу://gnps.ucsd.edu/'gt;), войдите в созданную учетную запись выберите Создать Молекулярная сеть. Добавьте должность задания.
  2. Основные параметры: выберите файлы mzXML для выполнения молекулярной сети. Они могут быть организованы в до шести групп. Выберите библиотеки для процедуры дерепликации(рисунок 4).
    ПРИМЕЧАНИЕ: Эти группы не мешают строительству молекулярной сети. Эта информация будет использоваться только для графического представления.

Figure 4
Рисунок 4: Использование онлайн-платформы GNPS для проведения молекулярного сетевого анализа. Выбор файлов mzXML осуществляется путем нажатия в поле 1. В открытом диалоговом поле файлы могут быть выбраны из личной папки (коробка 2) или загружены во вторую вкладку с помощью загрузчика файлов перетаскивания (менее 20 МБ). Файлы могут быть сгруппированы в шесть групп. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

  1. Выберите допуск ионной массы прекурсора и фрагмента 0,02 Da и 0.05 Da, соответственно.
    ПРИМЕЧАНИЕ: GNPS имеет различные типы строгости доступны на основе 1) насколько точны данные MS / MS и 2) насколько точной должна быть ассоциация. Основные варианты: в этой папке можно установить прекурсор ионно-массовой толерантности и фрагменти ионной массы толерантности. Эти параметры используются в качестве руководства для определения того, насколько точным должен быть ион и ион предшественника. Выбранные допуски массы зависят от разрешения и точности используемого масс-спектрометра.
  2. Расширенные сетевые опции: выберите параметры в соответствии с рисунком 5. Эти параметры непосредственно влияют на размер и форму сетевого кластера. Другой параметр в остающейся секции вкладок для продвинутых пользователей; таким образом, оставьте значения по умолчанию.
    ПРИМЕЧАНИЕ: Расширенные параметры можно прочитать в документации GNPS (найдено на lt;https://ccms-ucsd.github.io/GNPSDocumentation/)...

Figure 5
Рисунок 5: Использование GNPS для выполнения молекулярного анализа сети (продвинутые варианты). Min Pair Cos будет непосредственно влиять на размер кластеров, так как высокие значения приведут к объединению тесно связанных соединений и низких значений в объединении удаленных соединений. Следует избегать использования слишком низких значений. Минимальные совпадающие ионы фрагментов представляют собой количество общих фрагментов между двумя спектрами фрагментации, которые будут связаны в сети. Вместе оба параметра определяют сетевой формат; более низкие значения будут кластериться более отдаленно связанных соединений и наоборот. Использование надлежащих значений в значительной степени поможет соединения разъяснения. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

  1. Выберите адрес электронной почты для получения оповещения о завершении работы и отправьте задание.

7. Анализ результатов ВНПС

  1. Войти в GNPS. Выберите Вакансии (ru) и опубликованная работа (ru) и «Сделано для того, чтобы открыть работу. Веб-страница откроется, как показано на рисунке 6. Будут отображаться все результаты, полученные в результате молекулярной сети.
  2. Выберите View Spectral Families (In Browser Network Visualizer), чтобы увидеть все сетевые кластеры (красный ящик, рисунок 6).

Figure 6
Рисунок 6: Использование GNPS для визуализации результатов молекулярной сети. Все связанные кластеры соединений можно увидеть в видимых спектральных семейств (красный ящик). Для визуализации только библиотечных хитов следует выбрать "просмотр всех библиотечных хитов" (голубая коробка). Для лучшего графического представления результатов молекулярной сети, "Прямой Cytoscape Preview" (желтый ящик) должны быть загружены, и последняя версия Cytoscape должны быть использованы. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

  1. Список будет отображаться со всеми сгенерированными молекулярными сетевыми кластерами. Если поиск библиотеки был выбран для получения результатов, предварительная идентификация молекул будет отображаться в AllIDs. Выберите Показать, чтобы визуализировать их.
    ПРИМЕЧАНИЕ: Анализ данных может быть обусловлен для других результатов (например, добыча генома, биологические анализы, молекулы дерепликции библиотеки и т.д.).
  2. Для анализа молекулярной сетевой кластер, выберите Визуализация сети.
    ПРИМЕЧАНИЕ: Каждое скопление состоит из узлов (кругов) и краев, которые представляют молекулы и молекулярное сходство, соответственно. Дереплицированные молекулы будут выделены в виде синего узла в визуализаторе сети онлайн-браузеров.
  3. В поле меток узлов выберите родительскую массу (красная коробка, рисунок 7).
  4. В поле меток края выберите Cosine или DeltaM, чтобы наблюдать сходство узлов или разницу в массе между узлами, соответственно (желтая коробка, рисунок 7).
  5. В случае многогруппового анализа щелкните пироги draw в поле раскраски узлов, чтобы наблюдать частоту, с которой каждый узло появляется в каждой группе (голубая коробка, рисунок 7).
    ПРИМЕЧАНИЕ: Возможны и другие варианты, но те, которые были предложены выше, являются оптимальными для аннотирования кластерных узлов и распутывания их структур.

Figure 7
Рисунок 7: Использование GNPS для визуализации результатов молекулярного кластера. После открытия молекулярных кластеров для лучшей визуализации данных следует выбрать следующее: "Родительская масса" в виде меток узлов (красный ящик); "ДельтаМЗ" в виде меток кромки (желтая коробка); и "Нарисуйте пироги" в виде окраски узлов (голубая коробка). Перейдите через молекулярное скопление и попытаться аннотировать все узлы. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

  1. Чтобы увидеть все хиты библиотеки, выберите Просмотр всех хитов библиотеки (синяя коробка, рисунок 7).
    ПРИМЕЧАНИЕ: Кроме того, MNW можно скачать в "Прямой Cytoscape Preview / Скачать" (желтый ящик, рисунок 7), и файл может быть открыт в платформе Cytoscape (находится на lt;https://cytoscape.org / ) для более вариантов в графической структуре.
  2. Необходимо ручное подтверждение дереплицированных соединений и разославание структуры смежных соединений. Откройте спектры фрагментаций непосредственно на платформе GNPS или в исходных необработанных файлах.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Протокол был успешно иллюстрирован с использованием комбинации добычи генома, гетерологической экспрессии и MS-управляемых/кодовых подходов для доступа к новым специализированным молекулам аналогов валиномицина. Геном-молекулярная рабочая точка для цели, валиномицин (VLM), представлена на рисунке 8. Streptomyces sp. CBMAI 2042 проект генома был проанализирован в силико, и кластер генов VLM был затем определен и передан гетерологический хост. Гетерологические и дикие штаммы типа культивировались в тройнике, используя надлежащие условия брожения, разделены с этиловым ацетатом и концентрированы для получения сырого экстракта. Из продукта, MS / MS данные были приобретены для создания тандема MS метаболит профиль для молекулярных сетей. Рисунок 9 представляет собой кластерные ионы, полученные из данных MS/MS от Streptomyces sp. CBMAI 2042 сырой экстракт, в котором характерные модели фрагментации и соответствующие ms сходства предполагают возникновение молекулярного семейства, разделяющих структурные особенности2. После известных биосинтетических логики и биоинформатики идеи, и поддерживается на основе шаблона MS / MS спектра, структура четырех первоначально сообщил циклодепсипептидов были выяснены, и их происхождение были коррелированы с теми же биосинтетических кластеров генов, ответственных за сборку VLM32.

Молекулярные сетевые данные (найденные по адресу://gnps.ucsd.edu/ProteoSAFe/status.jsp?task-6f97aa4addfa4d20b505fb4328b088c-gt;) был обработан в платформе GNPS и сдан в массивное репозиторий (MSV000000000000000000). Для дерепликации, были выбраны две стратегии для заполнения сети с ранее описанными соединениями: 1) Дегиппоратор (находится в lt;https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task-1a5 5e768d02649aaa09d78d0d4778ef3'gt;) и 2) пептид натуральный инструмент идентификации продукта под названием Var'uest (найдено в нашей предыдущей публикации предоставляет более подробную информацию32.

Figure 8
Рисунок 8: Рабочий процесс от анализа последовательности последовательности генома силико до получения данных MS. (A) Проект из генома Streptomyces sp. CBMAI 2042 получен секвенированием Illumina MiSeq. (B) Валиномицин BGC идентификации и аннотации. (C) После переноса всего кластера генов в соответствующий хост, штамм культивируется. Экстракт этилового ацетата из культуры анализируется LC для получения профиля произведенных вторичных метаболитов. Хроматограмма показывает, что валиномицин, монтанататин и пять аналогов производятся vLM BGC выражение в гетерологических хостов. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Figure 9
Рисунок 9: Результаты молекулярной сети. (A) Молекулярная сеть от Streptomyces sp. CBMAI 2042 экстракт. Молекулярные сетевые ионы, соответствующие валиномицину, уже известному соединению с соответствующим инотированным BGC в геноме Streptomyces sp. CBMAI 2042, группируются с ионами, связанными с аналогами, впервые описанными для VLM BGC. (B) MS спектра и химических структур для валиномицина и связанных с ними аналогов показаны. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Самым сильным преимуществом этого протокола является его способность быстро дереплицировать метаболические профили и мост геномной информации с MS данных для того, чтобы выяснить структуры новых молекул, особенно структурные аналоги2. На основе геномной информации можно исследовать различные химические модели натуральных продуктов, такие как поликетиды (ПК), нерибосомные пептиды (NRP) и гликозилированные натуральные продукты (ВНП), а также загадочные БГК. Метаболомический скрининг дает доказательства активированных профилей BGC и химического разнообразия, производимого конкретным штаммом в лабораторных условиях. Таким образом, BGC может быть клонирован для прямого производства нового соединения или неизвестных аналогов, связанных с уже известным BGC, чему способствуют сходства, обнаруженные молекулярными сетями. Таким образом, эта процедура помогает различать ценные соединения, производимые природными источниками, и может быть использована в качестве руководства для будущих шагов изоляции, которые являются общими в трубопроводах натуральных продуктов.

Ms-управляемый майнинг генома был впервые описан в полях пептидогеномики41 и гликогеномики42. Чтобы оценить степень химического разнообразия пептидных природных продуктов, Доррештейн и его коллеги разработали автоматизированный метод использования MS и геномики для визуализации связи между выраженными натуральными продуктами (химиотипом) и их генными кластерами (генотипом). Концепция добычи генома с MS была описана при использовании пептидных специализированных метаболитов. Здесь в качестве инструмента для быстрого соединения хемотипов ВНП (от микробных метаболомых) с соответствующими биосинтетическими генотипами был применен метод идентификации микробных гликозилированных натуральных продуктов (ВНП) с соответствующими биосинтетическими генотипами, следящими за следами сахара.

Концепция пептидогеномики была применена для выявления синотрицина генных кластеров в Streptomyces roseosporus, обеспечивая первое понимание широкой полезности GNPS в качестве платформы43. Добыча генома и молекулярная сеть на основе шаблонов были, наконец, объединены с платформой GNPS26 для облегчения дерепликации новых соединений, известных соединений, обнаружения новых аналогов и разочаровать 35 штаммов Salinispora. Это привело к изоляции и характеристике ретимицина А, квиномицина типа депсипептида44. После внедрения GNPS комплексные метаболомики и подходы к добыче генома стали наиболее универсальным средством подключения молекулярных сетей с биосинтетическими возможностями45,,46,,47,,48,,49,,50.

Этот протокол подтверждает возможность использования геномных и метаболомических анализов для исследования производства известных и неизвестных химически химвеществ в течение нескольких шагов, потребляя при этом низкий уровень материалов. Представленная здесь модель связана с аналоговой идентификацией валиномицина из сырых экстрактов через молекулярную сетевую дерепликцию. Структура аналогов выведена фрагментацией MS/MS и соответствует биосинтетической логике клонированных VLM BGC.

Различные программы доступны для добычи вторичного метаболита биосинтетических кластеров генов51 и для разочазрения метаболита, но варианты с открытым исходным кодом имеют преимущества из-за постоянных обновлений, и они открыты для научного сообщества. В этом смысле, antiSMASH и платформа GNPS являются наиболее популярными вариантами.

Эта общая процедура может быть изменена для других методологий извлечения на основе исследуемого природного источника. Более одного метода извлечения также может быть объединена в соответствии с метаболитными свойствами (т.е. полярность, гидрофобность, способность формировать мицелли), и даже аналогичные свойства, различные растворители, или мелина может достичь улучшенных результатов. Как правило, экстракты готовятся из жидкой среды выращивания, но есть множество методов извлечения доступны для изоляции обогащенных экстрактов и экран любой биологический образец интереса.

При получении данных MS следует использовать анализ, зависящий от данных (DDA). Этот вопрос имеет важное значение, когда большее количество соединений оценивается в одной инъекции. При выполнении DDA, максимальное количество MS / MS спектры каждого иона предшественника и максимальное количество различных ионов прекурсоров должны быть компенсированы. При использовании оборудования быстрой частоты сканирования, это может быть достигнуто с более высокими скоростями сканирования (6-10 MS/MS сканирования за цикл). Однако, в более низком оборудовании тарифа сканирования, производительность MN может быть только увеличена с лучшим хроматографическим разрешением. Следует получить наиболее полные данные для заполнения молекулярных сетей. Для получения данных MS возможна фиксированная энергия столкновения, но энергия пандуса подходит для получения улучшенных результатов. Нет оптимальных условий, которые прекрасно сработали бы для всех образцов. Достижение достаточного анализа MS имеет решающее значение для следующих шагов. Отныне молекулярные сетевые кластеры должны создаваться и дереплицироваться в соответствии с процедурой.

Частая ошибка устранения неполадок отсутствует интенсивность для масс. Как правило, это может быть решена путем введения более высокой энергии столкновения во время анализа. Иногда между спектрами и библиотекой GNPS не наблюдается никаких корреляций, что очень редко. В этом случае убедитесь, что папка открывается должным образом в предварительной визуализации MS программного обеспечения, как ошибки иногда могут быть созданы во время преобразования шага к файлам .mzXML.

Что касается добычи генома, то наиболее точный выход с платформ аннотации генного кластера будет обеспечиваться для более высокого качества секвенирования всего генома как для одного штамма, так и для культурной независимой добычи. Высокое качество секвенирования будет генерировать высокое качество биоинформатики идеи для дерепликации биосинтетических путей. В отличие от этого, хотя BGC прогнозирования биоинформатики программное обеспечение быстро развивается, точные прогнозы функции генов и предполагаемого продукта по-прежнему трудно, особенно при изучении новых биосинтетических путей и особенностей, которые не могут быть предсказаны в силико. Кроме того, некоторые биосинтетические машины поразительно сохраняется, в то время как энзимология, которая участвует в гибридных системах, транс-ATмодульные ПК, и NRPSs признаются исключениями правила колинеаity. В этом смысле, гетерологические выражения и уточнения в биоинформатической выходпрограммного обеспечения может помочь прояснить непредсказуемые функции фермента и необычной биохимии52,53,54. Обогащение публичных баз данных приведет к более точным прогнозам и открытию новых специализированных метаболитов, поскольку стоимость WGS не представляет препятствие для добычи генома.

Наконец, самые сильные преимущества комплексных метаболомических и геномных подходов к добыче связаны с их осуществимостью для выполнения генотипа и дерепликации хемотипа с помощью автоматизированного и высокой пропускной системы, соединяющей геномную, транскриптомическую и метаболомические данные для эффективного соединения генов с молекулами.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам нечего раскрывать.

Acknowledgments

Финансовая поддержка этого исследования была оказана Сан-Паулу исследовательский фонд - FAPESP (2019/10564-5, 2014/12727-5 и 2014/50249-8 до L.G.O; 2013/12598-8 и 2015/01013-4 до R.S.; и 2019/08853-9 до C.F.F.A). B.S.P., C.F.F.A. и L.G.O. получили стипендии от Национального совета по научно-техническому развитию - CNPq (205729/2018-5, 162191/2015-4 и 313492/2017-4). L.G.O. также благодарна за грантовую поддержку, предоставленную программой для женщин в науке (2008, Бразильское издание). Все авторы признают CAPES (Координация по улучшению высшего образования персонала) для поддержки после окончания программы в Бразилии.

Materials

Name Company Catalog Number Comments
Acetonitrile Tedia AA1120-048 HPLC grade
Agar Oxoid LP0011 NA
Apramycin Sigma Aldrich A2024 NA
Carbenicillin Sigma Aldrich C9231 NA
Centrifuge Eppendorf NA 5804
Chloramphenicol Sigma Aldrich C3175 NA
Column C18 Agilent Technologies NA ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902
Kanamycin Sigma Aldrich K1377 NA
Manitol P.A.- A.C.S. Synth NA NA
Microcentrifuge Eppendorf NA 5418
Nalidixic acid Sigma Aldrich N4382 NA
Phusion Flash High-Fidelity PCR Master Mix ThermoFisher Scientific F548S NA
Q-TOF mass spectrometer Agilent technologies NA 6550 iFunnel Q-TOF LC/MS
Sacarose P.A.- A.C.S. Synth NA NA
Shaker/Incubator Marconi MA420 NA
Sodium Chloride Synth NA P. A. - ACS
Soy extract NA NA NA
Sucrose Synth NA P. A. - ACS
Thermal Cycles Eppendorf NA Mastercycler Nexus Gradient
Thiostrepton Sigma Aldrich T8902 NA
Tryptone Oxoid LP0042 NA
Tryptone Soy Broth Oxoid CM0129 NA
UPLC Agilent Technologies NA 1290 Infinity LC System
Yeast extract Oxoid LP0021 NA

DOWNLOAD MATERIALS LIST

References

  1. Davies, J. Specialized microbial metabolites: functions and origins. The Journal of Antibiotics. 66 (7), Tokyo. 361-364 (2013).
  2. Ziemert, N., Alanjary, M., Weber, T. The evolution of genome mining in microbes - a review. Natural Product Reports. 33 (8), 988-1005 (2016).
  3. Zerikly, M., Challis, G. L. Strategies for the Discovery of New Natural Products by Genome Mining. ChemBioChem. 10 (4), 625-633 (2009).
  4. Gomez-Escribano, J. P., Bibb, M. J. Heterologous expression of natural product biosynthetic gene clusters in Streptomyces coelicolor: from genome mining to manipulation of biosynthetic pathways. Journal of Industrial Microbiology & Biotechnology. 41 (2), 425-431 (2014).
  5. Medema, M. H., et al. Minimum Information about a Biosynthetic Gene cluster. Nature Chemical Biology. 11 (9), 625-631 (2015).
  6. Lautru, S., Deeth, R. J., Bailey, L. M., Challis, G. L. Discovery of a new peptide natural product by Streptomyces coelicolor genome mining. Nature Chemical Biology. 1 (5), 265-269 (2005).
  7. Chiang, Y. -M., et al. Molecular Genetic Mining of the Aspergillus Secondary Metabolome: Discovery of the Emericellamide Biosynthetic Pathway. Chemistry & Biology. 15 (6), 527-532 (2008).
  8. Huang, T., et al. Identification and Characterization of the Pyridomycin Biosynthetic Gene Cluster of Streptomyces pyridomyceticus NRRL B-2517. Journal of Biological Chemistry. 286 (23), 20648-20657 (2011).
  9. Udwary, D. W., et al. Genome sequencing reveals complex secondary metabolome in the marine actinomycete Salinispora tropica. Proceedings of the National Academy of Sciences. 104 (25), 10376-10381 (2007).
  10. Gross, H., et al. The Genomisotopic Approach: A Systematic Method to Isolate Products of Orphan Biosynthetic Gene Clusters. Chemistry & Biology. 14 (1), 53-63 (2007).
  11. Spohn, M., Wohlleben, W., Stegmann, E. Elucidation of the zinc-dependent regulation in Amycolatopsis japonicum enabled the identification of the ethylenediamine-disuccinate ([S,S ]-EDDS) genes. Environmental Microbiology. 18 (4), 1249-1263 (2016).
  12. Thaker, M. N., Waglechner, N., Wright, G. D. Antibiotic resistance-mediated isolation of scaffold-specific natural product producers. Nature Protocols. 9 (6), 1469-1479 (2014).
  13. Katz, M., Hover, B. M., Brady, S. F. Culture-independent discovery of natural products from soil metagenomes. Journal of Industrial Microbiology & Biotechnology. 43, 129-141 (2016).
  14. Quinn, R. A., et al. Molecular Networking as a Drug Discovery, Drug Metabolism, and Precision Medicine Strategy. Trends in Pharmacological Sciences. 38 (2), 143-154 (2017).
  15. Yang, J. Y., et al. Molecular Networking as a Dereplication Strategy. Journal of Natural Products. 76 (9), 1686-1699 (2013).
  16. Lommen, A. MetAlign: Interface-Driven, Versatile Metabolomics Tool for Hyphenated Full-Scan Mass Spectrometry Data Preprocessing. Analytical Chemistry. 81 (8), 3079-3086 (2009).
  17. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  18. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  19. Tautenhahn, R., Patti, G. J., Rinehart, D., Siuzdak, G. XCMS Online: A Web-Based Platform to Process Untargeted Metabolomic Data. Analytical Chemistry. 84 (11), 5035-5039 (2012).
  20. Kuhl, C., Tautenhahn, R., Böttcher, C., Larson, T. R., Neumann, S. CAMERA: An Integrated Strategy for Compound Spectra Extraction and Annotation of Liquid Chromatography/Mass Spectrometry Data Sets. Analytical Chemistry. 84 (1), 283-289 (2012).
  21. Katajamaa, M., Orešič, M. Data processing for mass spectrometry-based metabolomics. Journal of Chromatography A. 1158, 318-328 (2007).
  22. Liu, W. -T., et al. Interpretation of Tandem Mass Spectra Obtained from Cyclic Nonribosomal Peptides. Analytical Chemistry. 81 (11), 4200-4209 (2009).
  23. Ng, J., et al. Dereplication and de novo sequencing of nonribosomal peptides. Nature Methods. 6 (8), 596-599 (2009).
  24. Liaw, C., et al. Vitroprocines, new antibiotics against Acinetobacter baumannii, discovered from marine Vibrio sp. QWI-06 using mass-spectrometry-based metabolomics approach. Scientific Reports. 5 (1), 1-11 (2015).
  25. Kang, K. B., et al. Targeted Isolation of Neuroprotective Dicoumaroyl Neolignans and Lignans from Sageretia theezans Using in Silico Molecular Network Annotation Propagation-Based Dereplication. Journal of Natural Products. 81 (8), 1819-1828 (2018).
  26. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  27. Doroghazi, J. R., et al. A roadmap for natural product discovery based on large-scale genomics and metabolomics. Nature Chemical Biology. 10 (11), 963-968 (2014).
  28. Medema, M. H., et al. antiSMASH: rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genome sequences. Nucleic Acids Research. 39, 339-346 (2011).
  29. Weber, T., et al. antiSMASH 3.0-a comprehensive resource for the genome mining of biosynthetic gene clusters. Nucleic Acids Research. 43, 237-243 (2015).
  30. Blin, K., et al. antiSMASH 5.0: updates to the secondary metabolite genome mining pipeline. Nucleic Acids Research. 47, 81-87 (2019).
  31. Watrous, J., et al. Mass spectral molecular networking of living microbial colonies. Proceedings of the National Academy of Sciences. 109 (26), 1743-1752 (2012).
  32. Paulo, B. S., Sigrist, R., Angolini, C. F. F., De Oliveira, L. G. New Cyclodepsipeptide Derivatives Revealed by Genome Mining and Molecular Networking. ChemistrySelect. 4 (27), 7785-7790 (2019).
  33. Gonzaga de Oliveira, L., Sigrist, R., Sachetto Paulo, B., Samborskyy, M. Whole-Genome Sequence of the Endophytic Streptomyces sp. Strain CBMAI 2042, Isolated from Citrus sinensis. Microbiology Resource Announcements. 8 (2), 1-2 (2019).
  34. Aziz, R. K., et al. The RAST Server: Rapid Annotations using Subsystems Technology. BMC Genomics. 9 (1), 75 (2008).
  35. Nah, H. -J., Pyeon, H. -R., Kang, S. -H., Choi, S. -S., Kim, E. -S. Cloning and Heterologous Expression of a Large-sized Natural Product Biosynthetic Gene Cluster in Streptomyces Species. Frontiers in Microbiology. 8, 1-10 (2017).
  36. Zhang, J. J., Tang, X., Moore, B. S. Genetic platforms for heterologous expression of microbial natural products. Natural Product Reports. 36 (9), 1313-1332 (2019).
  37. Alduina, R., et al. Artificial chromosome libraries of Streptomyces coelicolor A3(2) and Planobispora rosea. FEMS Microbiology Letters. 218 (1), 181-186 (2003).
  38. Jones, A. C., et al. Phage P1-Derived Artificial Chromosomes Facilitate Heterologous Expression of the FK506 Gene Cluster. PLoS One. 8 (7), 69319 (2013).
  39. Gomez-Escribano, J. P., Bibb, M. J. Engineering Streptomyces coelicolor for heterologous expression of secondary metabolite gene clusters. Microbial Biotechnology. 4 (2), 207-215 (2011).
  40. Cannell, R. J. P. Natural Products Isolation. , Humana Press. Totowa, NJ. (1998).
  41. Kersten, R. D., et al. A mass spectrometry-guided genome mining approach for natural product peptidogenomics. Nature Chemical Biology. 7 (11), 794-802 (2011).
  42. Kersten, R. D., et al. Glycogenomics as a mass spectrometry-guided genome-mining method for microbial glycosylated molecules. Proceedings of the National Academy of Sciences. 110 (47), 4407-4416 (2013).
  43. Liu, W., et al. MS/MS-based networking and peptidogenomics guided genome mining revealed the stenothricin gene cluster in Streptomyces roseosporus. The Journal of Antibiotics. 67 (1), Tokyo. 99-104 (2014).
  44. Duncan, K. R., et al. Molecular Networking and Pattern-Based Genome Mining Improves Discovery of Biosynthetic Gene Clusters and their Products from Salinispora Species. Chemistry & Biology. 22 (4), 460-471 (2015).
  45. Cao, L., et al. MetaMiner: A Scalable Peptidogenomics Approach for Discovery of Ribosomal Peptide Natural Products with Blind Modifications from Microbial Communities. Cell Systems. , (2019).
  46. Chen, L. -Y., Cui, H. -T., Su, C., Bai, F. -W., Zhao, X. -Q. Analysis of the complete genome sequence of a marine-derived strain Streptomyces sp. S063 CGMCC 14582 reveals its biosynthetic potential to produce novel anti-complement agents and peptides. PeerJ. 7 (1), 6122 (2019).
  47. Kim Tiam, S., et al. Insights into the Diversity of Secondary Metabolites of Planktothrix Using a Biphasic Approach Combining Global Genomics and Metabolomics. Toxins. 11 (9), 498 (2019).
  48. Özakin, S., Ince, E. Genome and metabolome mining of marine obligate Salinispora strains to discover new natural products. Turkish Journal of Biology. 43 (1), 28-36 (2019).
  49. Trivella, D. B. B., de Felicio, R. The Tripod for Bacterial Natural Product Discovery: Genome Mining, Silent Pathway Induction, and Mass Spectrometry-Based Molecular Networking. mSystems. 3 (2), 00160 (2018).
  50. Maansson, M., et al. An Integrated Metabolomic and Genomic Mining Workflow To Uncover the Biosynthetic Potential of Bacteria. mSystems. 1 (3), 1-14 (2016).
  51. Blin, K., Kim, H. U., Medema, M. H., Weber, T. Recent development of antiSMASH and other computational approaches to mine secondary metabolite biosynthetic gene clusters. Briefings in Bioinformatics. 20 (4), 1103-1113 (2019).
  52. Fisch, K. M. Biosynthesis of natural products by microbial iterative hybrid PKS-NRPS. RSC Advances. 3 (40), 18228-18247 (2013).
  53. Tatsuno, S., Arakawa, K., Kinashi, H. Analysis of Modular-iterative Mixed Biosynthesis of Lankacidin by Heterologous Expression and Gene Fusion. The Journal of Antibiotics. 60 (11), Tokyo. 700-708 (2007).
  54. Helfrich, E. J. N., Piel, J. Biosynthesis of polyketides by trans-AT polyketide synthases. Natural Product Reports. 33 (2), 231-316 (2016).

Tags

Опровержение Выпуск 157 добыча генома молекулярные сети массовая спектрометрия-управляемая добыча генома натуральные продукты стрептомийки молекулярная сеть секвенирование всего генома
Масс-спектрометрии-управляемый геном добычи в качестве инструмента для выявления новых природных продуктов
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sigrist, R., Paulo, B. S., Angolini, More

Sigrist, R., Paulo, B. S., Angolini, C. F. F., De Oliveira, L. G. Mass Spectrometry-Guided Genome Mining as a Tool to Uncover Novel Natural Products. J. Vis. Exp. (157), e60825, doi:10.3791/60825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter