Biochemistry

Крупномасштабные мультиомные исследования геномных ассоциаций (Mo-GWAS): руководство по подготовке и нормализации образцов

Published: July 27, 2021 doi: 10.3791/62732

Mustafa Bulut¹, Alisdair R. Fernie^1,2, Saleh Alseekh^1,2

¹Max-Planck-Institute of Molecular Plant Physiology, ²Center of Plant Systems Biology and Biotechnology

Summary

В этом протоколе мы представляем оптимизированный рабочий процесс, который сочетает в себе эффективную и быструю пробоподготовку многих образцов. Кроме того, мы предоставляем пошаговое руководство по сокращению аналитических вариаций для высокопроизводительной оценки метаболических исследований GWAS.

Abstract

Как газовая хроматография-масс-спектрометрия (GC-MS), так и жидкостная хроматография-масс-спектрометрия (LC-MS) являются широко используемыми метаболомическими подходами для обнаружения и количественной оценки сотен тысяч признаков метаболитов. Однако применение этих методов к большому количеству образцов подвержено более сложным взаимодействиям, особенно для общегеномных ассоциативных исследований (GWAS). Этот протокол описывает оптимизированный метаболический рабочий процесс, который сочетает в себе эффективную и быструю пробоподготовку с анализом большого количества образцов на бобовые культуры. Этот слегка модифицированный метод экстракции был первоначально разработан для анализа тканей растений и животных и основан на экстракции в метил-трет-бутиловый эфир: растворитель метанола, позволяющий захватывать полярные и липидные метаболиты. Кроме того, мы предоставляем пошаговое руководство по сокращению аналитических вариаций, которые необходимы для высокопроизводительной оценки метаболической дисперсии в GWAS.

Introduction

Крупномасштабные «омические» подходы позволили проанализировать сложные биологические системы ^1,2,3 и понять связь между генотипами и результирующими фенотипами⁴. Метаболомика с использованием сверхвысокоэффективной жидкостной хроматографии-масс-спектрометрии (UHPLC-MS) и GC-MS позволила обнаружить множество признаков метаболитов, из которых только некоторые аннотированы в определенной степени, что приводит к высокой доле неизвестных метаболитов. Сложные взаимодействия могут быть изучены путем объединения крупномасштабной метаболомики с лежащей в основе генотипической вариацией разнообразной популяции⁵. Однако обработка больших наборов образцов по своей сути связана с аналитическими вариациями, искажающими оценку метаболической дисперсии для дальнейших последующих процессов. В частности, основные проблемы, приводящие к аналитическим изменениям, основаны на производительности машины и инструментальном дрейфе во времени⁶. Интеграция вариантов от партии к партии является сложной и особенно проблематичной при анализе крупномасштабных структурированных популяций растений. Было предложено несколько процедур нормализации для исправления небиологических вариаций, например, использование внутренних, внешних и изотопных внутренних стандартов для исправления аналитических ошибок, каждая из которых по своей сути связана с известными проблемами и подводными камнями 7,8,9,10.

В дополнение к аналитическим вариациям, выбор протоколов экстракции обычно варьируется в зависимости от аналитического метода. В конечном счете, желательно снизить материальные и трудовые затраты, а также необходимость использования нескольких аликвот одного и того же образца для различных аналитических процессов путем выполнения методов экстракции на основе разделения фаз. Эти методы были впервые введены с использованием хлороформа: метанола/водных растворителей для фракционирования полярных и гидрофобных соединений¹¹.

Этот протокол описывает быстрый высокопроизводительный конвейер для мультиомической платформы для профилирования как полярных метаболитов, так и липидов в бобовых видах. Кроме того, он показывает, как эти наборы данных могут быть соответствующим образом скорректированы для аналитического изменения и нормализованы перед интеграцией генотипической информации для обнаружения локусов количественных признаков метаболитов (QTL) путем выполнения GWAS.

Protocol

1. Экспериментальное проектирование и растениеводство

ПРИМЕЧАНИЕ: Постановка эксперимента в зависимости от экспериментальной гипотезы, например, использование крупномасштабной популяции GWAS снижает потребность в множественных репликах, так как статистическое тестирование будет проводиться на основе гаплотипов всех отдельных SNP, а не присоединения. Напротив, множественные реплики незаменимы в других экспериментальных подходах. При подготовке эксперимента необходимо учитывать следующие моменты.

Включите достаточное количество биологических реплик, в зависимости от экспериментальной гипотезы.
Рандомизируйте биологические реплики по блокам, чтобы уменьшить локальное смещение окружающей среды во время выращивания, например, теплицы, поля.
Обеспечьте правильное содержание растения во время роста. Обрабатывайте растения однородно, чтобы уменьшить смещение.

2. Подготовка биологического растительного сырья

Подготовка урожая
1. Этикеточные уборочные трубы (20 мл), содержащие два металлических шарика диаметром 5 мм и два диаметра 8 мм для гомогенизации. Наполните дьюар жидким азотом.
  ПРИМЕЧАНИЕ: Растения должны находиться в вегетативной стадии для сбора свежих листьев и корневых тканей.
Собирайте биологические образцы путем мгновенного замораживания в жидком азоте. Сбор урожая как можно быстрее исключить влияние циркадных колебаний на обмен веществ при длительной продолжительности сбора^{урожая 12,13}. Хранить собранные свежие листья и корневые ткани для дальнейшей обработки при -80 °C.
ПРИМЕЧАНИЕ: Срезание листьев до мгновенного замораживания не должно занимать более нескольких секунд, так как после расщепления листьев активные биологические процессы изменят метаболические профили из-за ранирования. Для корней предварительно очистите корни, промыв водой перед мгновенной заморозкой в жидком азоте. Лишнюю воду на поверхности корня следует запитать бумажной салфеткой. Высушенные семена можно хранить при комнатной температуре; не требуется замораживание в жидком азоте.
Измельчите ткань с помощью мельницы для смешивания тканей.
1. Предварительно охладить держатели трубки в жидком азоте в течение нескольких минут для поддержания низкой температуры при измельчении ткани.
2. Транспортируйте биологические образцы в азотсодержащем дьюаре после извлечения их из морозильной камеры с температурой -80 °C.
3. Измельчить ткани до получения однородного порошка; использовать 25 Гц в течение 1 мин и повторить после замораживания в жидком азоте, если ткань не однородно измельчена.
Для измельчения высушенных семян поместите семена в шлифовальную банку с металлическим шариком диаметром 15 мм. Используйте те же частоты и время, что и в разделе 2.3.3.
ПРИМЕЧАНИЕ: Чистые и предварительно охлажденные растворы и пестики можно использовать, если мельница для смешивания тканей недоступна.
Предварительно промаркированные микроцентрифужные трубки объемом 2 мл с безопасным замком. Взвешивают 50 мг с погрешностью ±5 мг свежего растительного материала с помощью аналитических весов. Предварительно охладить инструменты, используемые для переноса растительного материала в жидкий азот. Убедитесь, что растительный материал остается замороженным во время процесса взвешивания.
ПРИМЕЧАНИЕ: Не подвергайте свежий растительный материал слишком долго воздействию комнатной температуры, так как биологические процессы активируются повышением температуры, изменяя метаболические профили¹⁴.
Создание дополнительных образцов контроля качества (QC) путем объединения части каждого образца и взвешивания 50 мг с погрешностью ±5 мг объединенного свежего растительного материала в предварительно охлажденные микроцентрифужные трубки с безопасным замком 2 мл.
ПРИМЕЧАНИЕ: Рекомендуется по крайней мере три образца QC для каждых 60 образцов. Образцы контроля качества необходимы для последующей коррекции, нормализации и анализа.

3. Экстракционные реагенты

Свежие ткани, например, листья и корни
ПРИМЕЧАНИЕ: Извлечение образца основано на ранее описанном протоколе¹⁵. Этот протокол был модифицирован на основе текущих потребностей, например, нескольких тканей, различных внутренних стандартов и крупномасштабных экспериментов. Кроме того, все объемы и настройки приборов, упомянутые ниже, корректируются для внутренних аналитических блоков. Пользователи протокола должны корректировать их в соответствии со своим аналитическим блоком и биологическими образцами на основе тестовых образцов.
1. Экстракционная смесь 1 (EM1): метил-трет-бутиловый эфир (МТБЭ)/метанол (MeOH) (3:1 об/об)
  1. Приготовьте смесь МТБЭ/МеОГ в соотношении 3:1. Для 100 мл экстракционного растворителя смешайте 75 мл МТБЭ с 25 мл MeOH в чистой стеклянной бутылке.
    ПРИМЕЧАНИЕ: С растворителями следует обращаться осторожно в вытяжном шкафу с надлежащим предохранительным оборудованием.
  2. Добавьте 45 мкл 1,2-дигептадеканоил-sn-глицеро-3-фосфохолина (1 мг/мл в хлороформе) в качестве внутреннего стандарта для липидного анализа на основе UHPLC-MS, 400 мкл рибитола (1 мг/мл в воде) в качестве внутреннего стандарта для анализа на основе GC-MS и 125 мкл изовитексина (1 мг/мл в MeOH/воде (1:1 в/об)) для анализа метаболитов на основе UHPLC-MS.
    ПРИМЕЧАНИЕ: Добавление внутренних стандартов необходимо для нормализации после анализа в соответствии с аналитическими потребностями. Поскольку для каждого образца необходимо 1 мл EM1, подготовьте запасной раствор в соответствии с размером экспериментальной выборки, который следует использовать для всего эксперимента. EM1 необходимо хранить при температуре -20 °C. Проверьте на отсутствие используемого внутреннего стандарта и перекрытия с другими соединениями в исследуемых видах. Можно использовать несколько стандартов; выбор внутренних стандартов в этом протоколе был основан на предыдущих тестах с использованием экстрактов бобов¹⁶.
2. Экстракционная смесь 2 (EM2) воды/ метанола (MeOH) (3:1 об/об)
  1. Для 100 мл EM2 добавьте 75 мл двойной дистиллированной воды и 25 мл MeOH в чистую стеклянную бутылку.
  2. Добавьте 500 мкл ЭМ2 на образец и подготовьте запасной раствор в соответствии с размером экспериментальной выборки, который следует использовать для всего эксперимента. Хранить EM2 при температуре 4 °C.
Сушеные семена
1. Экстракционная смесь 3 (EM3) метанола (MeOH)/вода (7:3 v/v)
  1. Для 100 мл EM3 добавьте 70 мл MeOH и 30 мл двойной дистиллированной воды в чистую стеклянную бутылку. Подготовьте 1 мл EM3 для каждого образца.
  2. Добавьте 400 мкл рибитола (1 мг/мл в воде) в качестве внутренних стандартов для анализа на основе GC-MS и 125 мкл изовитексина (1 мг/мл в MeOH/воде (1:1 в/об)) для анализа метаболитов на основе UHPLC-MS.
    ПРИМЕЧАНИЕ: Подготовьте запасной раствор в соответствии с размером экспериментальной выборки и используйте его для всего эксперимента. Хранить EM3 при температуре 4 °C.

4. Извлечение проб

Свежие ткани, например, листья и корни
1. Подготовьте три микроцентрифужные трубки с безопасным замком объемом 1,5 мл для каждого образца. Держите EM1 в системе жидкостного охлаждения при температуре -20 °C. Перенесите свежие образцы из морозильной камеры с температурой -80 °C в сухой лед или жидкий азот для транспортировки. Добавьте 1 мл предварительно охлажденного EM1 к каждому 50 мг аликвоты и кратковременно вихрь перед тем, как держать на льду.
2. Инкубируйте образцы на орбитальном шейкере при 800 × г в течение 10 мин при 4 °C.
3. Обжаривайте образцы ультразвуком в охлаждаемой льдом ванне для обработки ультразвуком в течение 10 минут.
4. Добавьте 500 мкл EM2 с помощью многоканальной пипетки, чтобы избежать изменения добавленных объемов.
5. Вращайте образцы кратковременно, чтобы перемешать экстракционные смеси перед центрифугированием при 11 200 × г в течение 5 мин при 4 °C.
6. После разделения фаз переносят 500 мкл верхней липидсодержащей фазы в предварительно маркированную микроцентрифужную трубку с безопасным замком объемом 1,5 мл. Удалите остальную часть верхней фазы.
  ПРИМЕЧАНИЕ: Будьте осторожны при переносе, так как эта верхняя фаза имеет высокое давление пара и имеет тенденцию вытекать из пипетки.
7. Перенос 150 мкл и 300 мкл нижних полярных и полуполярных метаболитсодержащих фаз в две микроцентрифужные трубки с безопасным замком по 1,5 мл, используемые для анализа GC-MS и UHPLC-MS соответственно.
8. Сконцентрируйте все экстрагированные фракции, давая растворителям испариться без нагревания с помощью вакуумного концентратора, и храните при -80 °C.
Сушеные семена
1. Подготовьте для каждого образца две микроцентрифужные трубки с безопасным замком объемом 1,5 мл. Держите EM3 на льду. Поместите металлический шарик диаметром 5 мм в образцы аликвоты.
2. Добавьте 1 мл EM3 в каждую аликвоту 50 мг и гомогенизируйте образцы при 25 Гц в течение 2-3 мин, прежде чем положить их на лед.
3. Обжаривайте образцы ультразвуком в охлаждаемой льдом ванне для обработки ультразвуком в течение 10 минут.
4. Вращайте образцы ненадолго перед центрифугированием при 11 200 × г в течение 5 мин при 4 °C.
5. Перенос 150 мкл и 300 мкл супернатанта в две микроцентрифужные трубки с безопасным замком по 1,5 мл, используемые для анализа GC-MS и UHPLC-MS соответственно.
6. Сконцентрируйте все экстрагированные фракции, позволяя растворителям испаряться без нагревания с помощью вакуумного концентратора, и храните при -80 °C.
  ПРИМЕЧАНИЕ: Исходя из опыта, пользователям рекомендуется выполнить этап 4.2 для полуполярных метаболитов и анализ производных метаболитов в сушеных семенах. Выполните этап экстракции 4.1 для анализа липидов высушенных семян.

5. Анализ липидов с помощью UHPLC-MS

Повторно суспендировать высушенные липидные фракции в 250 мкл ацетонитрила:2-пропанола (7:3, об/об).
Ультразвуком липидную фазу в течение 5 мин, центрифугу по 11 200 × г в течение 1 мин.
Переложите 90 мкл супернатанта в стеклянный флакон для LC-MS.
Вводят 2 мкл экстрактов в LC-MS.
Выполняют липидное фракционирование на колонне с обратной фазой_С8, удерживаемой при 60 °С, работающей с потоком 400 мкл/мин с постепенным изменением элюентов А и В, как показано в таблице 1. Получить масс-спектры в режиме положительной ионизации с диапазоном масс 150-1 500 м/з.
Включите несколько образцов контроля качества во все ежедневные партии и заготовку, чтобы обеспечить коррекцию аналитических изменений. Рандомизация выборок по блокам в последовательном порядке.

6. Анализ полярных и полуполярных метаболитов с использованием UHPLC-MS

Повторно суспендировать высушенную полярную фазу в 180 мкл метанола uhPLC: воды (1:1 v/v).
Обрабатывают ультразвуком полярную фазу в течение 2 мин, центрифугу при 11 200 × г в течение 1 мин.
Переложите 90 мкл супернатанта в стеклянный флакон для LC-MS.
Вводят 3 мкл экстрактов в LC-MS.
Производят фракционирование метаболитов на обратной фазе_С18 колонки, удерживаемой при 40 °С, работающей с течением 400 мкл/мин с постепенным изменением элюентов А и В, как показано в таблице 1. Получите масс-спектры в диапазоне масс 100-1 500 м/з при полном ms-сканировании и всех ионных фрагментациях (AIF), индуцированных высокоэнергетической коллизионной диссоциацией (HCD) 40 кэВ.
ПРИМЕЧАНИЕ: Используйте оба режима ионизации. Однако из-за ограниченной емкости при работе с большим количеством образцов запускайте тестовые образцы в обоих режимах ионизации для определения предпочтительного режима ионизации.
Включите несколько образцов контроля качества во все ежедневные партии и заготовку, чтобы обеспечить коррекцию аналитических изменений. Рандомизация выборок по блокам в последовательном порядке.
Запустите объединенный QC в зависящем от данных MS² как в отрицательном, так и в положительном режимах ионизации. Используйте полученные масс-спектры на более позднем этапе (8.5) для аннотации.

7. Анализ дериватизированных метаболитов с использованием GC-MS^17,18

ПРИМЕЧАНИЕ: Анализ дериватизированных метаболитов основан на ранее описанном^{протоколе 17}. Обрабатывайте все реагенты дериватизации в вытяжном шкафу. Убедитесь, что N-метил-N-(триметилсилил)трифторацетамид (MSTFA) не контактирует с водой и влажностью.

Реагент дериватизации 1 (DR1)
1. Растворить метоксиамина гидрохлорид в пиридине до получения концентрации 30 мг/мл DR1. Используйте 40 мкл DR1 для каждого образца. Подготовьте запасной раствор в соответствии с размером образца и храните при комнатной температуре.
Реагент дериватизации 2 (DR2)
1. Растворите MSTFA с 20 мкл метиловых эфиров жирных кислот (FAME) на 1 мл MSTFA. Используйте 70 мкл DR2 для каждого образца. Подготовьте запасной раствор в соответствии с размером выборки. Храните MSTFA при температуре 4 °C и FAME при -20 °C.
  ПРИМЕЧАНИЕ: ФАЭ включают метилкаприлат, метилпеларгонат, метилкапрат, метиллаурат, метилмиристат, метилпальмитат, метилстеарат, метилэйкозаноат, метилдокозаноат, метиловый эфир лигноцериновой кислоты, метилгексакозаноат, метилоктакосаноат и метилэстер триаконтановой кислоты, которые растворяются в CHCl₃в концентрации 0,8 мкл/мл или 0,4 мг/мл для жидких или твердых стандартов, соответственно.
Повторно высушите гранулу из полярной фазы (хранящуюся при -80 °C) с использованием вакуумного концентратора в течение 30 мин, чтобы избежать каких-либо помех_H2O, возникающих во время хранения с растворителями, используемыми для последующей дериватизации.
Добавьте 40 мкл DR1.
Встряхните образцы при 950 × г в течение 2 ч при 37 °C с помощью орбитального шейкера с последующим коротким вращением жидкости.
Добавьте 70 мкл DR2.
Снова встряхните при 950 × г в течение 30 мин при 37 °C с помощью орбитального шейкера.
Центрифуг ненадолго при комнатной температуре перед переносом 90 мкл в стеклянные флаконы для анализа GC-MS.
Впрыскивание 1 мкл в бесплитный режим GC-MS, в зависимости от концентрации метаболита, с постоянным потоком газа-носителя гелия 2 мл/мин. Температура впрыска устанавливается на уровне 230 °C с помощью 30-метровой капиллярной колонны MDN-35.
ПРИМЕЧАНИЕ: Дополнительную информацию, например о градиенте температуры, можно найти в таблице 1. Диапазон масс установлен на уровне 70-600 м/з при 20 сканировании/мин. Включите режимы разделения, чтобы обеспечить количественную оценку предполагаемых перегружающих соединений, экономя затраты и время на редириватизацию экстракта в таких случаях.
Включите несколько образцов контроля качества во все ежедневные партии и заготовку, чтобы обеспечить коррекцию аналитических изменений. Правильно рандомизируйте выборки по блокам в последовательном порядке.

8. Обработка хроматограммы и аннотация соединений

Фильтрация химического шума путем определения пороговых значений интенсивности. Включите все образцы QC при обработке хроматограмм.
ПРИМЕЧАНИЕ: Для крупномасштабных данных фильтрация шума имеет решающее значение для сокращения вычислительного времени и вычислительной мощности.
Выровняйте хроматограммы, определив окно сдвига времени удержания. Проверьте хроматограммы из каждой партии, чтобы оценить внутри- и межсерийные вариации.
Выполняйте обнаружение пиков в зависимости от формы пика, например, высоты и ширины для полной ширины при полумаксимальных вычислениях (FWHM).
Кластерные изотопы для уменьшения избыточных сигналов и фильтрации синглтонов.
ПРИМЕЧАНИЕ: Смотрите Таблицу материалов для получения подробной информации о программном обеспечении, используемом для обработки хроматограммы. Предоставляются подробные протоколы обработки хроматограмм с использованием различных свободно доступных программных средств, например, MS-DIAL, MetAlign, MzMine и Xcalibur 19,20,21.
Используйте данные ddMS² объединенного образца контроля качества для создания аннотации соединения. Оценить молекулярную структуру путем определения моноизотопной массы и наблюдения общих нейтральных потерь, известных заряженных агликонов и различных типов расщеплений, например, гомолитических или гетеролитических^16,22.
Для представления данных метаболитов следуйте рекомендации, описанной в Fernie et al. 2011²³.
ПРИМЕЧАНИЕ: Различные вычислительные подходы к метаболомике могут быть использованы для анализа метаболомических данных 24,25,26.

9. Нормализация массива данных крупномасштабной метаболомики

Проверьте распределение внутреннего стандарта (стандартов) и нормализуйте, исправив для ответа один или несколько внутренних стандартов.
Скорректируйте пиковые интенсивности, полученные из хроматограммы, по точному весу образца, разделив пиковые интенсивности на аликвотированный гомогенизированный вес образца с шага 2.5.
Корректируется для дрейфа интенсивности между многосерийными сериями. Выполнение методов коррекции на основе КК, таких как локально оцененное сглаживание диаграмм рассеяния (LOESS)²⁷ с использованием R.
ПРИМЕЧАНИЕ: Доступно несколько инструментов и пакетов для решения проблемы дрейфа производительности MS при приобретении целых партий^28,29.
Обеспечить нормальное распределение признаков путем преобразования данных, например, преобразования Box-Cox³⁰ с помощью функции boxcox () из пакета R MASS для выполнения GWAS.
Выполнение масштабирования данных, например, масштабирование Парето, для многомерного анализа для обеспечения надлежащего взвешивания низкообильных соединений³¹.
ПРИМЕЧАНИЕ: Если возможно, выполните восстановительный анализ, чтобы избежать матричных эффектов, например, подавления ионов¹⁴.

10. Общегеномные ассоциативные исследования (GWAS)³²

Назовем однонуклеотидный полиморфизм (SNP) или структурные варианты (SV) из данных секвенирования^33,34.
Фильтр генотипических данных для частоты малых аллелей (MAF) < 5% и недостающей частоты >10%, чтобы избежать низкочастотного смещения с помощью Tassel³⁵.
Рассчитайте лучшие линейные непредвзятые прогнозы (BLUP) для каждого нормализованного признака в течение экспериментальных повторений, чтобы устранить смещение, исходящее от факторов окружающей среды (случайных эффектов), используя пакет R Ime4³⁶.
Используйте BLUP каждого компонента по отдельности для выполнения GWAS с использованием пакета rMVP в R³⁷.
ПРИМЕЧАНИЕ: Каждый признак метаболомики рассматривается здесь как индивидуальный автономный фенотип.
При выполнении GWAS корректируйте структуру популяции с использованием анализа главных компонентов (PCA) и идентичности по штатам (IBS) или vanRaden, чтобы свести к минимуму смешанные эффекты. Кроме того, рассмотрите возможность использования смешанной линейной модели (MLM) или смешанной модели с несколькими локусами (MLMM), поскольку смешанные модели содержат фиксированные и случайные эффекты.

11. Обнаружение QTL

Проверьте SNP, показывающие значительную ассоциацию, принимая во внимание графики Манхэттена, для расчетов неравновесия связей (LD) для определения базовой генетической области. Выполняйте вычисления LD с помощью тепловой карты LD пакета R или Tassel 5.
Проверьте ассоциированные SNP на величину эффекта над признаком, изучив уровни признаков для статистических изменений между гаплотипами, чтобы найти потенциальные причинные SNP, например, SNP, приводящие к изменению аминокислот в кодирующей белок последовательности, что может объяснить фенотипическую вариацию.
ПРИМЕЧАНИЕ: Поскольку ассоциации SNP-признаков не обязательно дают причинно-следственную связь, крайне важно определить геномную область. Компаундная идентичность по аннотации признаков может очень помочь в поиске правильных генов-кандидатов в определенной геномной области. Мы предлагаем объединить все обнаруженные QTL, связанные с определенными соединениями, в плейотропной карте, чтобы подчеркнуть генетические области³⁸, как показано на рисунке 4. Для валидации генов-кандидатов может быть выполнено несколько подходов (см. обсуждение).

Representative Results

Успешные эксперименты по метаболомике GWAS должны начинаться с правильного экспериментального проектирования, за которым следует сбор образцов, извлечение, сбор и обработка данных, как показано на рисунке 1. В этом протоколе метод¹⁵ МТБЭ использовался для извлечения и анализа сотен метаболитов, принадлежащих к нескольким классам соединений. Хроматография сильно зависит от свойств используемой колонки, а также элюционных буферных смесей. На рисунке 2 показаны хроматограммы образцов QC, указывающие на картину элюирования некоторых основных классов липидов в этой аналитической системе. Применяемые градиенты для каждой платформы приведены в таблице 1. Большое внимание уделялось обработке системных ошибок в крупномасштабных экспериментах. Выполнение крупномасштабной метаболомики по своей сути связано с системными ошибками. Для демонстрации мы проанализировали липидомические данные по нескольким распространенным видам бобов. В дополнительной таблице 1 приведены извлеченные необработанные липидомные данные, полученные после обработки хроматограммы с использованием программного обеспечения, указанного в Таблице материалов. Следование этому протоколу позволило нам обойти основные проблемы при работе с омическими данными, особенно при обработке больших наборов выборок. Процедура нормализации приводит к точной коррекции пакетных аналитических ошибок, как показано на рисунке 3. Хотя увеличение количества образцов контроля качества увеличит мощность нормализации, это не всегда осуществимо из-за ограничений по стоимости и времени. Для высокопроизводительной метаболомики GWAS с нецелевыми метаболическими особенностями важно соответствующим образом проиллюстрировать более высокое количество ассоциаций признаков-маркеров. Плейотропная карта³⁸, объединяющая несколько результатов GWAS, может быть использована для выделения геномных областей, с которыми связаны несколько признаков (рисунок 4).

Рисунок 1: Блок-схема ГВАС на основе метаболомики в растениях. Несколько шагов, начиная от экспериментального проектирования до обнаружения QTL, показаны на левой панели. На правой панели показано несколько рисунков, поддерживающих несколько шагов, упомянутых на левой панели. Начиная с правого верха, (1) показана предложенная последовательность образцов для LC-MS, (2) графики PCA до и после нормализации, включая репрезентативное распределение признаков до и после обработки, с красным цветом, указывающим интенсивность выборки QC, и (3) манхэттенский график со значительными ассоциациями, к которым были сгенерированы распределения LD и гаплотипов. Сокращения: GWAS = общегеномные ассоциативные исследования; QTL = количественные локусы признаков; PCA = анализ главных компонентов; QC = контроль качества; LD = неравновесие связи; MS = масс-спектрометрия; LC-MS = жидкостная хроматография-масс-спектрометрия; GC-MS = газовая хроматография-масс-спектрометрия; LOESS = локально оцененное сглаживание диаграммы рассеяния; MLM/MLMM = смешанная линейная модель/мультилокусная смешанная модель. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 2: Обработка хроматограммы. Две хроматограммы КК (базовый пик; липидные данные) из разных партий демонстрируют вариации по партиям для определенных классов липидов в объединенных образцах КК. Четыре основных класса липидов обозначены соответствующими элюционными окнами в собственной системе LC-MS. Хроматограммы были экспортированы из MzMine²¹. Сокращения: QC = контроль качества; LC-MS = жидкостная хроматография-масс-спектрометрия. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 3: Исправление систематической ошибки. Принципиально-компонентный анализ полученных липидомных данных, пре- (левые, необработанные данные) и посткоррекция системных ошибок (правый, пакетный лёсс). Нижние панели иллюстрируют распределение признаков (Cluster_00005) по образцам (n=650) и партиям (n=10) до (слева) и после (справа) для аналитического изменения. Сокращения: PCA = анализ главных компонентов; QC = контроль качества; LOESS = локально оцененное сглаживание диаграммы рассеяния. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 4: Плейотропная карта, иллюстрирующая объединенные результаты GWAS. Плейотропная карта выделяет области во всем геноме, которые связаны с несколькими признаками. Цифры на внешних кольцах указывают на соответствующие хромосомы. Каждый круг представляет собой индивидуальную черту со своими значительно связанными SNP. Цвета представляют различные составные классы (серый = составной класс 1; зеленый = составной класс 2; фиолетовый = составной класс 3; желтый = составной класс 4). В случае межсоединенных классовых ассоциаций с одной и той же геномной областью выделяют гены. Внутренний серый круг показывает сумму всех значимых SNP, связанных с определенным геномным положением. Ассоциации, показанные на этом рисунке, искусственно генерируются только для иллюстрации. Сокращения: GWAS = общегеномные ассоциативные исследования; SNP = однонуклеотидные полиморфизмы. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Настройки UHPLC-MS для липидов
Время [мин]	Элюент от А до В [%]*	Информация
0 - 1.00	45% А	Элюент A: 1% 1M NH 4-ацетат, 0,1% уксусной кислоты в воде (марка UHPLC)
1.00 - 4.00	lg 45% - 25% A	Элюент B: 1% 1M NH 4-ацетат, 0,1% уксусной кислоты в ацетонитриле / 2-пропаноле 7: 3 (класс UHPLC)
4.00 - 12.00	lg 25% - 11% A	Расход: 400 мкл/мин
12.00 - 15.00	lg 11% - 0% A	Объем впрыска: 2 мкл
15.00 - 19.50	cw 0% A
19.50-19.51	0% - 45% А
19.51-24.00	экв. 45%
Настройки UHPLC-MS/MS для полярных и полуполярных метаболитов
Время [мин]	Элюенты A и B [%]*	Информация
0 - 1.00	99% А	Элюент А: 0,1% муравьиной кислоты в воде (класс UHPLC)
1.00 - 11.00	lg 99% -60% A	Элюент B: 0,1% муравьиной кислоты в ацетонитриле (класс UHPLC)
11.00 - 13.00	lg 60% - 30% A	Расход: 400 мкл/мин
13.00 - 15.00	lg 30% - 1% A	Объем впрыска: 3 мкл
15.00 - 16.00	cw 1% A
16.00 - 17.00	lg 1% - 99% A
17.00 - 20.00	экв. 99% А
Настройки GC-MS для производных метаболитов
Время [мин]	Температура [°C]	Информация
0 - 2.00	85	Газ-носитель: Гелий
2.00 - 18.66	лг 80 - 330	Расход: 2 мл/мин
18.66 - 24.66	cw 330	Температурный градиент: 15 °C/мин
24.66	быстрое охлаждение	Объем впрыска: 1 мкл

Таблица 1: Градиентные настройки для каждой из аналитических платформ⁷. Сокращения: lg = линейный градиент; cw = мойка колонны; eq = равновесие; UHPLC-MS = сверхвысокоэффективная жидкостная хроматография-масс-спектрометрия; UHPLC-MS/MS = сверхвысокоэффективная жидкостная хроматография-тандемная масс-спектрометрия; GC-MS = газовая хроматография-масс-спектрометрия. * = процентное значение соответствует элюенту А; оставшееся процентное значение соответствует элюенту B.

Дополнительная таблица 1: Необработанные липидомические данные. Указывает пиковые интенсивности для каждого из обнаруженных кластеров над каждым образцом. Пожалуйста, нажмите здесь, чтобы загрузить эту таблицу.

Discussion

Как GC-MS, так и LC-MS являются широко используемыми инструментами для профилирования сложных смесей различных классов метаболитов. Обработка больших наборов данных с помощью этих инструментов по своей сути связана с небиологической вариацией, например, аналитической вариацией, которая мешает и искажает интерпретацию результатов. Этот протокол представляет собой надежный и высокопроизводительный экстракционный конвейер для всестороннего метаболического профилирования для устранения вариаций небиологического происхождения и проведения крупномасштабных исследований «омики». Объемы и концентрации, используемые в этом протоколе, были скорректированы для видов бобовых в различных тканях. Однако эти параметры могут быть слегка изменены и использованы для крупномасштабных метаболических образцов других видов растений.

Ранее¹⁵ описанных экстракций на основе МТБЭ могут быть использованы для анализа дериватизированных метаболитов, полуполярных метаболитов и липидов. Это может быть расширено для экстракции белка и растительных гормонов³⁹, которые были вне сферы действия этого протокола. Другие протоколы экстракции основаны на смесях дихлорметана:этанола^40,41. Из этих протоколов экстракции протокол МТБЭ:метанол обеспечивает благоприятную и менее опасную альтернативу существующим протоколам экстракции⁴² на основе хлороформа и не приводит к образованию белковой гранулы в виде интерфазы между полярной и липидной фазами. Кроме того, методы МТБЭ уже использовались в нескольких исследованиях для различных биологических образцов 43,44,45.

В этом протоколе обсуждается несколько важных шагов, которые могут привести к потенциальному изменению при обработке большого количества образцов, например, во время сбора^12,13, экстракции¹⁴, а также рандомизации⁴⁶. Кроме того, существуют дополнительные вопросы, которые не обсуждались в настоящем протоколе, которые должны быть рассмотрены для обеспечения высококачественных метаболомных данных, например, матричный эффект и подавление ионов¹⁴.

Мощность методов нормализации на основе КК по своей сути зависит от количества образцов КК в каждой партии. Как упоминалось ранее, хотя увеличение числа увеличит мощность, внутрисерийное изменение КК относительно незначительно по сравнению с межсерийным изменением в этих аналитических системах, как показано на рисунке 3. В целом, существуют и другие методы нормализации на основе контроля качества, такие как системное удаление ошибок с использованием случайного леса (SERRF), которые, как было показано, превосходят большинство других методов нормализации, таких как пакетное соотношение, нормализация с использованием оптимального выбора нескольких внутренних стандартов (NOMIS) и вероятностная нормализация коэффициентов (PQN)^47. . Тем не менее, SERRF полагается на несколько образцов QC в каждой партии, например, каждый десятый образец, что неосуществимо при обработке большого количества образцов. Основное преимущество нормализации на основе КК по сравнению с другими методами, основанными на данных или внутренними стандартами, заключается в том, что она сохраняет существенные биологические вариации, приспосабливаясь к нежелательным техническим вариациям²⁸. Читатели могут обратиться к этому обзору по обращению с вариантом²⁸.

Одной из основных проблем в GWAS является частота ложных срабатываний, которые возникают в основном из-за связи причинно-следственных и непричинных сайтов^48,49. Во-вторых, консервативные подходы статистической коррекции, например, Бонферрони и Рузвельта, корректируют количество независимых тестов, которое не равно количеству анализируемых SNP в GWAS из-за связи между ближайшими SNP ^50,51 Поэтому фактическое количество независимых тестов часто ниже. Другим способом снижения консервативного статистического порога могло бы стать уменьшение числа тестируемых SNP, используемых для GWAS, на основе распада связей над определенными геномными^{областями 52}. GwAS-интегрированная высокопроизводительная метаболомическая платформа, описанная в этом протоколе, имеет широкий спектр применений. В частности, это будет способствовать улучшению селекции сельскохозяйственных культур путем изменения состава метаболитов/липидов в соответствии с промышленными и питательными потребностями. В целом, метаболомика дала глубокое понимание генетической архитектуры множества метаболитов и метаболической диверсификации, которые произошли во время одомашнивания сельскохозяйственных культур за последние десятилетия, что указывает на огромный потенциал метаболомики-ассоциированной селекции⁵³. Молекулярно-биологические подходы к последующей валидации QTL включают генерацию мутантных линий⁵⁴ CRISPR/Cas9, линий вставки^{Т-ДНК 55}, стабильных и/или преходящих линий сверхэкспрессии⁵⁶, VIGS, подходов ex vivo метаболомики⁵⁷ рядом с традиционным подходом к генерации кросс-популяций F2, а также перекрестную валидацию в разных популяциях.

Выполняя необходимую коррекцию аналитических вариаций, как описано выше, в дополнение к GWAS может быть выполнено несколько интегрированных подходов, таких как метаболит-метаболит, метаболит-липидный корреляционный анализ, корреляционный анализ к феномическим данным, чтобы пролить свет на более сложные признаки, и/или анализ коэкспрессии для дальнейшего разгадывания основы биологических систем⁵⁸.

Disclosures

У авторов нет конфликта интересов, о которых можно было бы заявить.

Acknowledgments

M.B. поддерживается IMPRS-PMPG «Первичный метаболизм и рост растений». A.R.F. и S.A. признают финансовую поддержку Программы исследований и инноваций ЕС Horizon 2020, проекта PlantaSYST (SGA-CSA No 739582 под FPA No 664620) и проекта INCREASE (GA 862862).

Materials

Name	Company	Catalog Number	Comments
Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC)	Avanti Polar Lipids	850360P	Internal standard for lipids
Chloroform	Supleco	67-66-3	FAME solvent
Isovitexin	Sigma Aldrich	38953-85-4	Internal standard for metabolites
Lignoceric Acid Methylester	Sigma Aldrich	2442-49-1	FAME
Methanol (MeOH)	Biosolve Chemicals	13684102	ULC-MS grade
Methoxyamin -hydrochlorid	Sigma Aldrich	593-56-6	Metabolite deriviatization
Methyl laurate	Sigma Aldrich	111-82-0	FAME
Methyl myristate	Sigma Aldrich	124-10-7	FAME
Methyl palmitate	Sigma Aldrich	112-39-0	FAME
Methyl stearate	Sigma Aldrich	112-61-8	FAME
Methyl tert-butyl ether (MTBE)	Biosolve Chemicals	13890602	HPLC grade
Methyl-caprat	Sigma Aldrich	110-42-9	FAME
Methylcaprylat	Sigma Aldrich	111-11-5	FAME
Methyldocosanoat	Sigma Aldrich	929-77-1	FAME
Methyleicosanoat	Sigma Aldrich	1120-28-1	FAME
Methyl-hexacosanoat	Sigma Aldrich	5802-82-4	FAME
Methyl-octacosanoat	Sigma Aldrich	55682-92-3	FAME
Methyl-pelargonate	Sigma Aldrich	1731-84-6	FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA)	Macherey-Nagel	24589-78-4	Metabolite deriviatization
Pyridine	Supleco	110-86-1	Metabolite deriviatization
Ribitol	Supleco	22566-17-2	Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester	TCI Chemicals	629-83-4	FAME
Water	Biosolve Chemicals	23214102	ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes	Eppendorf	3120086
2 mL Safe-lock microcentrifuge tubes	Eppendorf	3120094
Balance	Sartorius Corporation	14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm	Aglient	123-3832	Analysis of derivatized metabolites
GC-MS system	Leco Pegasus HT TOF-MS (LECO Corporation)		Analysis of derivatized metabolites
Grinding Balls, Stainless Steel	OPS DIAGNOSTICS	GBSS 196-2500-10
MS system	Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific)		Analysis of lipids
MS system	Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific)		Analysis of metabolites
Refrigerated microcentrifuge	Eppendorf, model 5427R	22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles)	Waters	186002878	Analysis of lipids
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles)	Waters	186003539	Analysis of metabolites
Shaker	Eppendorf Thermomixer 5436	2050-100-05
Sonicator	USC 300 TH	142-0084
Tissue grinding mixer mill	Retsch, Mixer Mill MM 300	20.746.0001
UPLC system	Waters Acquity UPLC system (Waters)
Vacuum concentrator	Scan Speed Maxi Vac Alpha Evaporators	7.008.500.002
Vortex mixer	Vortex-Genie 2, Model G560	SI-0236
Software
MetAlign			Chromatogram processing
MzMine			Chromatogram processing
R package "data.table"
R package "fujiplot"			pleiotrpoic map
R package "genetics"
R package "Ime4"			BLUPs calculation
R package "LDheatmap"			LD plots
R package "MASS"			transformation
R package "rMVP"			GWAS
R version 4.0.4
RefinerMS			Chromatogram processing
RefinerMS Genedata	Expressionist		Chromatogram processing
Tassel 5			Genotype filtering
Xcalibur	Thermo Fisher Scientific	OPTON-30965	Chromatogram processing