Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator и филигрань: инструменты для сетевого анализа метаболомных данных на основе данных

Published: November 10, 2023 doi: 10.3791/65512

Summary

Мы представляем CorrelationCalculator и Filigree, два инструмента для построения сетей на основе данных и анализа данных метаболомики. CorrelationCalculator поддерживает построение единой сети взаимодействия метаболитов на основе данных экспрессии, в то время как Filigree позволяет построить дифференциальную сеть с последующей кластеризацией и обогащением сети.

Abstract

Серьезной проблемой при анализе омиксных данных является извлечение практических биологических знаний. Метаболомика не является исключением. Общая проблема связи изменений уровней отдельных метаболитов с конкретными биологическими процессами осложняется большим количеством неизвестных метаболитов, присутствующих в исследованиях нетаргетной жидкостной хромато-масс-спектрометрии (ЖХ-МС). Кроме того, вторичный метаболизм и липидный обмен слабо представлены в существующих базах данных путей. Чтобы преодолеть эти ограничения, наша группа разработала несколько инструментов для построения и анализа сетей на основе данных. К ним относятся CorrelationCalculator и Filigree. Оба инструмента позволяют создавать сети на основе частичной корреляции на основе данных экспериментальной метаболомики, когда количество метаболитов превышает количество образцов. CorrelationCalculator поддерживает построение единой сети, в то время как Filigree позволяет построить дифференциальную сеть с использованием данных из двух групп выборок с последующей кластеризацией и обогащением сети. Мы опишем полезность и применение обоих инструментов для анализа реальных метаболомических данных.

Introduction

В последнее десятилетие метаболомика превратилась в омиксную науку благодаря достижениям в области аналитических технологий, таких как газовая хромато-масс-спектрометрия (ГХ-МС) и жидкостная хромато-масс-спектрометрия (ЖХ-МС). Эти методы позволяют одновременно измерять сотни и тысячи низкомолекулярных метаболитов, создавая сложные многомерные наборы данных. Эксперименты по метаболомике могут проводиться как в таргетном, так и в нетаргетном режимах. Целевые эксперименты по метаболомике измеряют определенные классы метаболитов. Они, как правило, основаны на гипотезах, в то время как нецелевые подходы пытаются измерить как можно больше метаболитов и по своей природе генерируют гипотезы. Таргетные анализы обычно включают внутренние стандарты и, таким образом, позволяют проводить абсолютное количественное определение интересующих метаболитов. В отличие от этого, нетаргетные анализы позволяют проводить относительную количественную оценку и включают много неизвестных метаболитов1.

Анализ метаболомных данных представляет собой многоступенчатый процесс, в котором используется множество специализированных программных средств1. Его можно разделить на следующие три основных этапа: (1) обработка данных и контроль качества, (2) статистический анализ и (3) интерпретация биологических данных. Описанные здесь инструменты предназначены для обеспечения последнего этапа анализа.

Интуитивно понятный и популярный способ интерпретации данных метаболомики заключается в сопоставлении экспериментальных измерений с метаболическими путями. Длядостижения этой цели было разработано множество инструментов, в том числе Metscape, разработанный нашей группой6. Картирование путей часто сочетается с анализом обогащения, который помогает определить наиболее значимые пути 7,8. Эти методы впервые получили известность при анализе данных экспрессии генов и были успешно применены для анализа данных протеомики и эпигеномики 9,10,11,12,13. Тем не менее, анализ данных метаболомики создает ряд проблем для подходов, основанных на знаниях. Во-первых, в дополнение к эндогенным метаболитам, метаболомные анализы измеряют экзогенные соединения, в том числе те, которые поступают из продуктов питания и других источников окружающей среды. Эти соединения, а также метаболиты, продуцируемые бактериями, не могут быть сопоставлены с человеческими или метаболическими путями других эукариотических организмов. Кроме того, охват путей вторичного метаболизма и липидного обмена в настоящее время не позволяет картировать данные с высоким разрешением на уровне, который легко поддерживал бы биологическую интерпретацию данных14,15.

Методы сетевого анализа на основе данных могут помочь преодолеть эти проблемы. Например, корреляционные сети могут помочь выявить взаимосвязи между как известными, так и неизвестными метаболитами и облегчить аннотирование неизвестных16. В то время как вычисление коэффициентов корреляции Пирсона является наиболее простым подходом к установлению линейных отношений между метаболитами, его недостаток заключается в том, что он охватывает как прямые, так и косвенные связи17,18,19. В качестве альтернативы можно вычислить коэффициенты частичной корреляции, которые могут различать прямые и косвенные связи. Геометрическое графическое моделирование (GGM) может быть использовано для оценки сетей частичной корреляции. Однако GGM требует, чтобы размер выборки и количество признаков были сопоставимы. Это состояние редко встречается в нецелевых данных ЖХ-МС, которые содержат измерения тысяч метаболических особенностей. Для преодоления этого ограничения можно использовать методы регуляризации. Графическое лассо (Глассо) и узловая регрессия являются популярными методами регуляризованного оценивания частичной корреляционной сети 16,20.

Первый из представленных здесь инструментов биоинформатики, CorrelationCalculator16, основан на алгоритме смещенной разреженной частичной корреляции (DSPC). DSPC основан на графическом моделировании лассо. В основе алгоритма лежит предположение, что число связей между метаболитами значительно меньше, чем число образцов, т.е. частичная корреляционная сеть метаболитов разрежена. Это предположение позволяет DSPC обнаружить связь между большим количеством метаболитов с использованием меньшего количества образцов, используя методы регуляризованной регрессии. Кроме того, используя шаг устранения смещения для регуляризованных регрессионных оценок, он получает выборочные распределения для параметров ребер, которые могут быть использованы для построения доверительных интервалов и проверки интересующих гипотез (например, наличие/отсутствие одного или группы ребер). Таким образом, наличие или отсутствие ребра в сети частичной корреляции может быть формально проверено с помощью вычисленных p-значений.

CorrelationCalculator оказался очень полезным для одногруппового анализа16; Однако целью многих экспериментов по метаболомике является дифференциальный анализ двух или более условий. Несмотря на то, что CorrelationCalculator можно использовать для каждой из групп отдельно для создания сетей частичной корреляции для каждого условия, этот подход ограничивает количество выборок, которые могут быть использованы для создания сети. Поскольку достаточно большой размер выборки является одним из самых важных соображений в анализе, основанном на данных, методы, которые могут использовать все доступные выборки данных для построения сетей, крайне желательны. Этот подход реализован во втором представленном здесь инструменте под названием Filigree21. Филигрань опирается на ранее опубликованный алгоритм дифференциального анализа обогащения сети (DNEA)22. В таблице 1 показаны приложения и рабочий процесс обоих инструментов.

Количество условий эксперимента (k) k = 1 k = 2
Программный инструмент CorrelationCalculator (Калькулятор корреляции) Филигрань
Входные данные • Матрица данных метаболитов x Samples • Матрица данных метаболитов x Samples
• Экспериментальные группы
Рабочий процесс
•Предварительная обработка
• Оценка сети
• Кластеризация сети
• Анализ обогащения

• Логарифмическое преобразование; Автомасштабирование
• DSPC
• Через внешние приложения
•Нет

• Логарифмическое преобразование; Автомасштабирование
• Оценка совместной сети
• Кластеризация консенсуса
• НетГСА
Визуализация данных Через внешнее приложение, например, Cytoscape Через внешнее приложение, например, Cytoscape
Тестирование метаболических модулей на связь с интересующим исходом (опционально) Через внешние приложения Через внешние приложения

Таблица 1: Область применения и рабочий процесс CorrelationCalculator и Filigree.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Калькулятор корреляции

  1. Загрузите образец входного файла с разделителями-запятыми, содержащий список метаболитов с экспериментальными измерениями на http://metscape.med.umich.edu/kora_data_240.csv.
  2. Дважды щелкните загруженный файл примера, чтобы открыть его.
    1. Убедитесь, что файл содержит метки как для образцов, так и для метаболитов.
    2. Так как образцы находятся в строках, убедитесь, что первый столбец — это имена образцов, а первый — имена метаболитов.
  3. Загрузите Java-приложение CorrelationCalculator (http://metscape.med.umich.edu/calculator.html). Дважды щелкните загруженный файл .jar, чтобы запустить приложение.
  4. На вкладке « Входные данные » нажмите кнопку «Обзор », чтобы загрузить входной файл.
  5. В разделе «Указать формат файла» используйте стрелку раскрывающегося списка, чтобы выбрать соответствующий формат входного файла. Выберите образцы в строках (дополнительный рисунок 1).
  6. Перейдите на вкладку Нормализация данных , нажав кнопку Далее >> в правом нижнем углу окна.
  7. В разделе Select Method(s) установите флажок Log2-Transform Data (Данные преобразования Log2). Установите флажок рядом с пунктом Автомасштабирование данных.
  8. В разделе « Нормализация данных» нажмите кнопку «Выполнить ».
    ПРИМЕЧАНИЕ: После завершения нормализации нажмите кнопку View Normalized Data, расположенную в разделе Normalize Data, и просмотрите обновленный набор данных (дополнительный рисунок 2).
  9. В разделе « Нормализация данных» нажмите кнопку «Сохранить » и сохраните новый файл данных.
  10. Перейдите на вкладку Анализ данных , нажав кнопку Далее >> в правом нижнем углу окна.
  11. В разделе « Вычислить корреляцию Пирсона» нажмите кнопку «Выполнить». Определите наилучший диапазон корреляции Пирсона для данных.
    1. Нажмите кнопку Просмотреть гистограмму . Просмотрите частоту максимальных оценок корреляции Пирсона для каждого признака.
    2. Нажмите кнопку Просмотреть тепловую карту . Просмотрите представление корреляционной матрицы Пирсона.
  12. В разделе «Фильтр по корреляциям Пирсона» оставьте числа по умолчанию для фильтрации по диапазону от 0,00 до 1,00
    ПРИМЕЧАНИЕ: Сдвиньте маленькую синюю стрелку справа от 1 и маленькую синюю стрелку слева от 0, чтобы изменить фильтр. Также можно ввести определенные числа в текстовые поля.
  13. В разделе Select Partial Correlation Method (Выбор метода частичной корреляции) выберите нужный метод DSPC (Метод DSPC).
    ПРИМЕЧАНИЕ: Если количество метаболитов меньше, чем количество образцов в наборе данных, можно использовать только метод DSPC.
  14. В разделе Calculate Partial Correlations нажмите кнопку Run (дополнительный рисунок 3).
  15. Нажмите « Просмотреть CSV-файл» и просмотрите результаты. Нажмите кнопку Сохранить и сохраните результаты.
  16. Нажмите кнопку Просмотреть в MetScape, чтобы запустить интерактивную корреляционную сеть.
    Karnovsky, A. et al.6 для получения дополнительной информации об использовании MetScape.
    ПРИМЕЧАНИЕ: MetScape - это приложение Cytoscape, которое позволяет создавать и исследовать корреляционные сети.

2. Филигрань

  1. Загрузите образец входного файла с разделителями-запятыми, содержащий измерения метаболитов в http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
  2. Дважды щелкните загруженный файл примера, чтобы открыть его.
    1. Убедитесь, что файл содержит примеры имен в столбце 1 и назначения групп в столбце 2. Убедитесь, что остальные столбцы содержат метаболиты/липиды.
    2. Убедитесь, что каждая строка представляет собой образец.
      ПРИМЕЧАНИЕ: Измерения метаболитов должны быть логарифмически преобразованы и автоматически масштабированы, если не выполняется агрегация признаков, в этом случае измерения должны быть преобразованы только по логарифму.
  3. Загрузите Java-приложение Filigree (http://metscape.med.umich.edu/filigree.html).
    ПРИМЕЧАНИЕ: Подробное руководство пользователя доступно на сайте http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
  4. Дважды щелкните загруженный файл .jar, чтобы запустить приложение.
  5. На вкладке Данные нажмите кнопку Обзор , чтобы загрузить входной файл.
  6. В разделе «Указать столбцы/строки» щелкните стрелку раскрывающегося списка рядом с пунктом «Идентификатор образца», чтобы выбрать соответствующее имя столбца/строки из входного файла. Выберите Образец.
  7. В разделе «Указать столбцы/строки» нажмите на стрелку раскрывающегося списка рядом с пунктом «Группа», чтобы выбрать соответствующий столбец/строку из входного файла. Выберите Группа.
  8. В разделе «Указать группы образцов» нажмите на стрелки раскрывающегося списка рядом с каждой группой , чтобы выбрать соответствующий столбец группы из входного файла. Для Группы 1 выберите Диабетический. Для Группы 2 выберите Недиабетический.
  9. В разделе Группировка объектов отметьте маркер рядом с нужным методом, Вычислить группы объектов.
  10. Нажмите кнопку Просмотреть тепловые карты . Просмотрите тепловую карту и определите желаемое процентное снижение.
  11. Используйте ползунок Уменьшение объектов , чтобы выбрать желаемое процентное уменьшение объектов. Сдвиньте маленький кружок до тех пор, пока процентное уменьшение не покажет отношение признака к выборке, равное 1,25 (дополнительный рисунок 4).
  12. Перейдите на вкладку Анализ , нажав кнопку Далее >> в правом нижнем углу окна.
  13. В разделе « Выбор выходного каталога» нажмите кнопку «Обзор» и выберите нужный каталог для хранения сгенерированных выходных файлов.
  14. Нажмите кнопку Запустить анализ , расположенную в левом нижнем углу окна. Индикаторы выполнения обновляются для каждого компонента анализа (дополнительный рисунок 5). Нажмите кнопку OK во всплывающем окне, в котором появится сообщение Анализ завершен успешно.
  15. На вкладке Анализ щелкните кнопку Обзор сетей , чтобы открыть интерактивные филигранные подсети на вкладке браузера.
  16. Щелкните ссылку Подсеть 1 в столбце Имя подсети .
  17. Исследуйте интерактивную подсеть с помощью различных кнопок. Нажмите кнопку + и увеличьте масштаб части сети. Нажмите кнопку - и уменьшите масштаб (дополнительный рисунок 6).
  18. Щёлкните по групповому узлу и перетащите его, чтобы переместить в подсети.
    ПРИМЕЧАНИЕ: Цвет узла представляет собой регулировку вверх/вниз, а непрозрачность цвета представляет изменение сгиба в большую/меньшую сторону. Цвет кромки представляет собой дифференциальное состояние между группами.
  19. Щелкните кнопку Развернуть объекты в правом верхнем углу страницы, чтобы развернуть все узлы группы. Просмотрите конкретные соединения, из которых состоят узлы группы.
  20. Щелкните кнопку Свернуть объекты в правом верхнем углу страницы, чтобы свернуть недавно развернутые узлы группы.
  21. Щелкните кнопку По группе выборки в правом верхнем углу страницы, чтобы изменить вид с одной подсети на несколько подсетей, разделенных группой. Исследуйте и сравните группы, используя это представление подсетей (дополнительный рисунок 7).
  22. Щелкните кнопку Все выборки , чтобы вернуться к виду одной подсети.
  23. Просмотрите следующую подсеть, нажав кнопку Далее в правом верхнем углу страницы.
  24. Повторите шаги 2.19-2.23 для каждой подсети.
  25. Щелкните ссылку Результаты анализа обогащения дифференциальной сети в верхней середине окна, чтобы вернуться к сводной таблице, в которой перечислены все подсети.
    ПРИМЕЧАНИЕ: Импортируйте выходные файлы ребер и/или узлов в другой программный инструмент, например Cytoscape23, для создания дополнительных визуализаций сети.

3. Дополнительные соображения

  1. На компьютерах Mac под управлением Big Sur (OSX 11.2) или более поздней версии одобрите инструмент в меню Apple > «Системные настройки» > «Безопасность и конфиденциальность» > «Основные» и выберите «Разрешить » в нижней части вкладки.
  2. Кроме того, разрешите Filigree доступ к файлам в меню Apple > «Системные настройки» > «Безопасность и конфиденциальность» > «Конфиденциальность », выбрав «Файлы и папки » в меню слева, а затем выбрав « Филигрань » в меню справа.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Чтобы проиллюстрировать использование CorrelationCalculator, мы построили сеть частичной корреляции, используя подмножество данных метаболомики из популяционного исследования KURA, описанного в Krumsiek et al.24. Набор данных содержал 151 метаболит и 240 образцов. На рисунке 1 показана результирующая частичная корреляционная сеть, которая была визуализирована в Cytoscape. Сеть содержит 148 узлов и 272 ребра. Цвет узлов представляет метаболиты, принадлежащие к разным химическим классам, в то время как ребра представляют скорректированное p-значение коэффициентов частичной корреляции (скорректированное p-значение < 0,05). Примечательно, что, несмотря на то, что CorrelationCalculator не использовал никакой предварительной информации, он смог сгруппировать химически связанные метаболиты. Например, фосфатидилхолины и лизофосфатидилхолины тесно связаны в сети. Визуализация изменений метаболитов в контексте этого типа сети может облегчить генерацию гипотез, помочь в планировании будущих экспериментов и подготовке рукописи. Чтобы проиллюстрировать потенциальный рабочий процесс, использующий частичную корреляционную сеть метаболитов, мы выполнили кластеризацию консенсусной сети, как описано в Ma et al.22, в результате чего было идентифицировано 9 подсетей или метаболических модулей. Эти модули хорошо согласовывались с химическими классами, т.е. метаболиты, принадлежащие к одному и тому же химическому классу, как правило, были частью одного и того же метаболического модуля. Пользователь может получить доступ к инструменту кластеризации clusterNet по адресу https://github.com/Karnovsky-Lab/clusterNet.

Figure 1
Рисунок 1: Репрезентативный пример сети CorrelationCalculator. Сеть была построена на основе подмножества данных популяционного исследования KORA24 , состоящего из 151 метаболита у 240 субъектов. Узлы представляют собой метаболиты, а ребра, соединяющие их, взвешиваются по скорректированному p-значению частных коэффициентов корреляции (скорректированное p-значение < 0,05). Форма узлов представляет различные метаболические классы, а цвет — метаболические модули, полученные путем кластеризации сети методом консенсусной кластеризации. Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этого рисунка.

Мы иллюстрируем применение филиграни, анализируя набор данных мышиной модели диабета I типа (СД1)25,26. Измерения метаболитов в плазме крови мышей с СД1 и без диабета (NOD) были использованы для создания дифференциальной сети частичной корреляции (рис. 2). Примечательно, что мы наблюдаем более высокую степень сетевой связности в группе, не страдающей диабетом. На следующих этапах анализа было выявлено двенадцать метаболических модулей, девять из которых значительно различались между мышами с СД1 и мышами без диабета (FDR < 0,05). Мы отсылаем читателя к оригинальной публикации для дальнейшего понимания биологических выводов, которые могут быть сделаны изэтого анализа.

Figure 2
Рисунок 2: Репрезентативный пример филигранной сети. Дифференциальная сеть была построена с использованием уровней 163 метаболитов от 71 мыши (30 с СД1Д и 41 без СД1)25,26. Дифференциальные края между группами T1D и без T1D обозначены розовым и синим цветом соответственно. Узлы раскрашиваются в зависимости от изменения сгиба. В таблице приведены результаты обогащения, полученные с помощью филиграни. В девяти из двенадцати идентифицированных подсетей наблюдались существенные различия между СД1 и без СД1 (скорректированное p-значение < 0,05). Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этого рисунка.

Дополнительный рисунок 1: CorrCalc_InputTab. Снимок экрана вкладки Входные данные калькулятора корреляции. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 2: CorrCalc_DataNormTab. Снимок экрана вкладки Нормализация данных калькулятора корреляции. Установлены флажки Log-2 Transform Data (Преобразование данных) и Autoscale Data (Автомасштабирование данных ). Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 3: CorrCalc_DataAnalTab. Снимок экрана вкладки «Анализ данных » калькулятора корреляции, показывающий фильтрацию по корреляции Пирсона 0-0,8. Кроме того, был выбран метод DSPC . Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 4: Filigree_DataTab. Скриншот вкладки «Данные » Филиграни. Указаны столбцы, строки и группы. Метод Вычислить группы объектов (Calculate Feature Groups ) был выбран с уменьшением отношения признаков к выборке на 1,25. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 5: Filigree_AnalysisTab. Снимок экрана вкладки «Анализ » в Filigree, показывающий ход выполнения различных компонентов анализа. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 6: Filigree_Subnetwork1. Подсеть, сгенерированная из Filigree. Цвет узла представляет собой регулирование вверх/вниз, а непрозрачность цвета — изменение сгиба в большем/нижнем направлении. Цвет кромки представляет собой дифференциальное состояние между группами. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 7: Filigree_Subnetwork_SampleGroup. Подсеть, разделенная по группам. Левая сеть представляет диабетические образцы, а правая — недиабетические образцы. Цвет узла представляет собой уровень выражения, пропорциональный среднему значению группы. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Методы сетевого анализа, основанные на частичной корреляции, реализованные в CorrelationCalculator и Filigree, помогают преодолеть некоторые ограничения анализа метаболических путей, основанных на знаниях, особенно для наборов данных с высокой распространенностью неизвестных метаболитов и ограниченным охватом метаболических путей (например, данные липидомики). Эти инструменты широко используются научным сообществом для анализа широкого спектра данных метаболомики и липидомики 14,22,27,28,29,30. Например, CorrelationCalculator был использован для анализа данных по многим биологическим системам, начиная от микробиома и растений и заканчивая болезнями человека31,32,33,34. В этой статье мы продемонстрируем, как сетевой анализ на основе данных, поддерживаемый нашими инструментами, может быть объединен с кластеризацией и регрессионным анализом для определения метаболических модулей, связанных с интересующим фенотипом.

Частичные корреляционные сети, сгенерированные с помощью CorrelationCalculator и Filigree, могут быть кластеризованы с помощью алгоритмов кластеризации графов для получения метаболических модулей. Эти модули, как правило, содержат метаболиты, которые химически или функционально связаны друг с другом. Такие модули очень полезны не только с точки зрения визуализации, но и с точки зрения биологической значимости. Изучение взаимосвязей между метаболическими модулями и фенотипическими исходами, представляющими интерес (например, исход выживаемости), может обеспечить большую статистическую мощность и дать дополнительные биологические представления по сравнению с тестированием отдельных метаболитов.

Метаболические модули, идентифицированные с помощью подходов сетевой кластеризации, также могут быть использованы в анализе обогащения. Филигрань использует метаболические модули, идентифицированные с помощью консенсусной кластеризации, а не предопределенные биологические пути. Несмотря на то, что метаболические модули, основанные на частичной корреляции, не идентичны путям, они последовательно группируют химически и биохимически сходные метаболиты (например, аминокислоты, ацилкарнитины, липиды одного класса и т. д.). Далее Филигрань проверяет значимость этих модулей с помощью алгоритма NetGSA22,35. В дополнение к дифференциальным узлам, NetGSA учитывает специфические для заболевания различия в структуре сети.

Одним из вопросов, которые следует учитывать при использовании CorrelationCalculator и Filigree для анализа данных метаболомики и липидомики в реальной жизни, является связь между количеством метаболитов и количеством образцов в данном эксперименте. В то время как крупномасштабные эпидемиологические исследования с участием тысяч образцов становятся все более распространенными, размер выборки в большинстве экспериментов по метаболомике остается скромным. Это особенно верно для механистических исследований, включающих системы, в которых ожидается низкая биологическая изменчивость (т.е. клеточные линии или генетически однородные животные модели). Статистические алгоритмы, реализованные в обоих инструментах, могут быть применены в ситуациях, когда количество метаболитов превышает количество образцов, но увеличение этого соотношения приводит к более разреженным сетям.

Еще одно важное соображение для применения описанных здесь инструментов касается анализа нецелевых метаболомных данных, которые, как известно, содержат большое количество избыточных или вырожденных признаков36, которые могут включать изотопы, химические аддукты, фрагменты в источнике и загрязняющие вещества. Поскольку многие вырожденные признаки происходят из одного и того же метаболита, они, как правило, имеют высокую степень корреляции. Частичный корреляционный анализ таких данных может потребовать тщательного аннотирования и удаления вырожденных признаков.

В заключение, представленные здесь инструменты представляют собой жизнеспособную альтернативу инструментам анализа путей, основанным на знаниях, для интерпретации данных метаболомики.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

У авторов нет конкурирующих финансовых интересов.

Acknowledgments

Работа выполнена при поддержке гранта NIH 1U01CA235487.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Биология выпуск 201
CorrelationCalculator и филигрань: инструменты для сетевого анализа метаболомных данных на основе данных
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter