Method Article

Интеллектуальный анализ наборов данных по пространственной транскриптомике с помощью DeepSpaceDB

DOI:

10.3791/68892

September 5th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

В этой статье представлен протокол использования DeepSpaceDB, динамической интерактивной базы данных для пространственной транскриптомики, предлагающей рабочие процессы анализа и примеры для изучения организации тканей и экспрессии генов, связанных с заболеванием.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Пространственная транскриптомика — это быстро развивающаяся технология, которая позволяет улавливать паттерны экспрессии генов в образцах тканей с сохранением позиционной информации. Он имеет широкий спектр применений в биологических исследованиях и биоинформатике, позволяя исследователям исследовать и отслеживать пространственные вариации экспрессии генов в различных тканях, условиях и заболеваниях. По мере того, как анализ данных пространственной транскриптомики набирает обороты, количество общедоступных наборов данных растет. Тем не менее, пространственная транскриптомика остается узкоспециализированным экспериментальным методом, имеющим значительные технические и финансовые ограничения. Чтобы облегчить доступ к пространственным данным, мы недавно разработали DeepSpaceDB, всеобъемлющую и динамическую базу данных для исследования пространственных транскриптомических данных. В этой статье представлены подробные рабочие процессы с описанием компонентов базы данных и навигации по ней с помощью нескольких примеров. Во-первых, демонстрируется анализ образца мозга мыши, в котором исследуются показатели качества, пространственно изменчивые гены и пути, а также вариации экспрессии генов между гиппокампом и гипоталамусом. Далее изучается идентификация и аннотация дифференциально экспрессируемых генов, связанных с иммунной активностью, путем сравнения метастатических областей колоректального происхождения с отдаленными участками здоровой ткани в печени мышей. DeepSpaceDB с ее передовыми инструментами и интерактивными функциями служит ценным ресурсом для исследований в области пространственной транскриптомики, позволяя глубже изучить организацию тканей и биологию заболеваний.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Пространственная транскриптомика — это новая технология, которая позволяет исследователям анализировать экспрессию генов, сохраняя при этом пространственную информацию внутри участка ткани, что позволяет изучать архитектуру тканей, клеточную гетерогенность и влияние микросреды с беспрецедентным разрешением 1,2. Однако, несмотря на потенциал этой технологии, доступ и анализ остаются ограниченными, пространственная транскриптомика непомерно дорога для многих лабораторий, а анализ данных требует продвинутых навыков в области биоинформатики.

Разработка общедоступных баз данных является одним из способов расширения доступа к этой новой экспериментальной модели. Создано несколько баз данных по пространственной транскриптомике. Первым был SpatialDB, но он содержит только ограниченное количество сэмплов и не обновлялся3. Базы данных SODB, SOAR и STOmicsDB включают большое количество образцов с различных платформ и играют большую роль в качестве репозиториев данных 4,5,6. Однако инструменты анализа ограничены и им не хватает интерактивности. Чтобы решить эту проблему, мы недавно разработали DeepSpaceDB, курируемую, удобную для пользователя базу данных общедоступных наборов данных по пространственной транскриптомике, предназначенную для снижения технических барьеров и расширения доступности7. В этой статье представлены несколько инструментов в этой базе данных, включая поиск в базе данных, проверку качества образцов, инструменты визуализации и сравнение интерактивно выбранных областей в срезах ткани. В нем представлены подробные протоколы с использованием двух репрезентативных примеров: анализа образца мозга мыши и печени мыши с колоректальными метастазами для демонстрации этих инструментов в практическом контексте. С помощью этих инструментов DeepSpaceDB позволяет более широкому кругу исследователей использовать пространственную транскриптомику без необходимости в собственных данных или собственных биоинформационных мощностях. Всестороннее описание процесса сбора данных, контроля качества, обработки данных, а также данных и функций, включенных в DeepSpaceDB, подробно представлено Гончаруком и др.7.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Пример 1: Анализ образца мозга мыши

ПРИМЕЧАНИЕ: В этом разделе проиллюстрирован анализ образца мозга мыши, с переходом по различным функциям и графикам, доступным в DeepSpaceDB (ссылка на базу данных доступна в Таблице материалов).

  1. Отбор образцов
    1. Нажмите на вкладку «База данных » и используйте фильтр, чтобы выбрать мышь организма, орган мозга и источник zenodo. Пройдитесь по полученным образцам и выберите образцы DSID001557. Кроме того, используйте поле поиска для поиска в базе данных термина "DSID001557" и выберите этот пример.
    2. Нажмите на образец и подтвердите описание как 2 × 106 клеток в 100 мкл физиологического раствора-NK-элемента (внутривенное введение один раз в неделю, всего 5 раз).
  2. Анализ качества
    1. Нажмите на вкладку «Качество », чтобы оценить качество выбранного образца. В раскрывающемся меню «Показатели качества » выберите различные параметры, такие как «Обнаруженные гены » (рисунок 1A), «Количество прочтений » (рисунок 1B) и «Mito» (рисунок 1C), чтобы визуализировать соответствующие параметры в каждом месте на срезе образца.
  3. Аннотация к изображению
    1. Перейдите на вкладку Аннотации к изображению для определения различных областей среза образца.
    2. Наведите курсор мыши на образец среза. Аннотации, предсказанные большой языковой моделью (LLM), отображаются для частей образца изображения в виде сетки с информацией об анатомии и связанном с ней условии8.
  4. Кластерный анализ
    1. Для более глубокого понимания кластеров типов ячеек в образце среза перейдите на вкладку Кластеры . Будет отображено 2D-встраивание кластеров вместе с изображением кластеров с цветовой кодировкой в точках на срезе образца (рисунок 1E).
  5. Пространственно изменчивые гены и пути
    1. Перейдите на вкладку «Гены» и обратите внимание на пространственно изменчивые гены (SVG; гены, уровни экспрессии которых различаются в зависимости от расположения тканей) в образце 9,10. Эти SVG прогнозируются с помощью функции singleCellHaystack, которая использует меру дивергенции Кульбака-Лейблера (D_KL в таблице) для оценки того, насколько паттерн экспрессии каждого гена отличается от того, что можно было бы ожидать случайным образом (рис. 2). Гены с низким p-значением (большое отрицательное значение log.p.adj в таблице) перечислены как SVG.
      ПРИМЕЧАНИЕ: Данные об экспрессии генов были нормализованы с использованием стандартных параметров, используемых в пакете Seurat R (версия 5)11. На практике количество прочтений для каждого гена в каждом месте делили на общее количество прочтений в этом месте и умножали на масштабный коэффициент 10 000. Далее натуральный логарифм вычислялся после сложения 1, чтобы избежать проблем с log(0). График, показанный на вкладке Гены, показывает эти нормализованные данные.
    2. Нажмите на некоторые из основных генов в списке. Это создает пространственный график для генов на срезе ткани с пятнами, закодированными цветом для уровня экспрессии (рис. 2). Гены, набравшие наибольшее количество баллов, имеют четко выраженные пространственные паттерны экспрессии.
    3. Перейдите на вкладку «Пути», чтобы проверить активность наборов генов (например, генов, связанных с общим биологическим путем), а не отдельных генов. Пространственно изменяемые пути перечислены таким же образом, как и SVG, рассмотренные выше (рис. 3). Активность путей оценивается на основе уровней экспрессии генов, связанных с ними 7,11.
      ПРИМЕЧАНИЕ: Активность пути была оценена с помощью функции пакета Seurat R addModuleScore11. Вкратце, эта функция принимает в качестве входных данных набор генов (например, набор генов, участвующих в общем пути) и возвращает их средние уровни экспрессии после нескольких этапов обработки. На практике положительные значения подразумевают активность выше среднего, а отрицательные — активность ниже средней. График, показанный на вкладке Пути, показывает данные оценки этого модуля.
    4. Нажмите на некоторые из верхних путей в списке. Это создает пространственный график для путей через срез ткани с пятнами, обозначенными цветом для уровня активности. Некоторые пути имеют различные пространственные паттерны активности (рис. 3).
  6. Внутривыборочное сравнение экспрессии генов
    1. Перейдите на вкладку «Проводник тканей » и выберите «Выбор вручную » (если он еще не выбран). Далее с помощью курсора мыши выделите места в области гиппокампа среза мозга мыши, с левой стороны. Нажмите на набор 1 и выберите «Добавить в набор». Таким образом, будут выделены все выбранные места на срезе с правой стороны (рисунок 4A).
    2. Теперь нажмите на набор 2 и с помощью курсора мыши выделите точки в гипоталамической области среза мозга мыши. Нажмите на кнопку «Добавить в набор», которая выделит все выбранные места на срезе с правой стороны (рисунок 4A).
    3. После завершения процесса выбора пятна нажмите на кнопку «Сравнить экспрессию генов ». В результате будет создана таблица со средними значениями экспрессии генов выбранных пятен между обеими областями, а также представление диаграммы рассеяния. Наведите курсор на отдельные точки, чтобы подтвердить названия генов и среднюю экспрессию генов в обеих областях.
    4. Основываясь на результатах сравнения экспрессии генов, определите дифференциально экспрессируемые гены и повторно перейдите на вкладку «Гены », чтобы визуализировать их экспрессию в образце (рис. 4B, C).
      ПРИМЕЧАНИЕ: С помощью описанных выше шагов DeepSpaceDB может быть использована для исследования особенностей образца пространственной транскриптомики мозга мыши.

2. Пример 2: Идентификация и аннотация дифференциально экспрессируемых генов, ассоциированных с иммунной активностью в метастатических областях колоректального происхождения в печени мышей

ПРИМЕЧАНИЕ: Внутривыборочное сравнение рассматривается в настоящем разделе. Это иллюстрируется идентификацией и аннотацией дифференциально экспрессируемых генов между метастатическими областями колоректального происхождения и отдаленными областями здоровой ткани в пределах участка печени на основе двух различных образцов. Пространственная экспрессия специфических нерегулируемых генов, имеющих отношение к иммунной активности, далее визуализируется в срезах тканей.

  1. Навигация по базе данных и выбор образцов
    1. Нажмите на вкладку «База данных » и используйте фильтр для выбора микроорганизма мыши, органа печени и состояния рака. Из полученных образцов выберите образец DSID001005. Нажмите на образец и подтвердите описание, в котором указано, что образец взят из печени мыши, содержащей метастазы колоректального рака.
    2. Перейдите на вкладку «Проводник тканей » и выберите «Выбор вручную». Далее с помощью курсора мыши выделите пятна в области опухоли (колоректальные метастазы) DSID001005 образца печени, выявленные на основании положительной экспрессии маркера Epcam (рисунок 5А). Нажмите на набор 1 и выберите «Добавить в набор». Это выделит все выбранные места на срезе с правой стороны (Рисунок 5C).
    3. Теперь кликните по набору 2 и с помощью курсора мыши выделите пятна в отдаленной неопухолевой области образца печени. Нажмите на кнопку «Добавить в набор», которая выделит все выбранные места на срезе с правой стороны (рисунок 5C).
  2. Сравнение экспрессии генов между выбранными пятнами
    1. После завершения процесса выбора пятна нажмите на кнопку «Сравнить экспрессию генов ». В результате будет создана таблица со средними значениями экспрессии генов выбранных точек между обеими областями, а также представление диаграммы рассеяния. Наведите курсор мыши на отдельные точки и изучите названия генов и среднюю экспрессию генов в обеих областях.
    2. Чтобы провести более глубокий анализ данных об экспрессии генов, выберите опцию «Скачать CSV ». При этом создается файл с разделителями-запятыми (CSV) с данными экспрессии генов для двух областей образца.
    3. Повторите шаги 2.1.1-2.1.3 и 2.2.1-2.2.2 для образца "DSID001007". Подтвердите его описание как еще один срез печени мыши, содержащий метастазы колоректального происхождения.
  3. Анализ данных с помощью программирования R
    1. Убедитесь, что в результате описанных выше действий было создано 2 файла CSV, один из образца DSID001005 и один из образца DSID001007. Оба файла содержат 2 столбца, представляющие среднюю экспрессию генов в двух выборках (опухолевая ткань и неопухолевая ткань), которые были сделаны в каждом образце.
    2. Считайте CSV-файлы в R и объедините их для дальнейшего анализа с двумя репликациями на каждое состояние (т.е. область опухоли с метастазами колоректального рака и отдаленные здоровые ткани в печени). Обратитесь к скрипту R и файлам данных в Дополнительных материалах.
    3. Используйте пакет limma (версия 3.62.2) в R (версия 4.4.2)12 для проведения дифференциального анализа экспрессии данных, классифицируя колоректальные метастазы обоих образцов как рак, а отдаленные, здоровые участки обоих образцов — как контрольные. Получите повышенные гены с фильтром logFC > 0,5 и скорректированным p-значением < 0,05. Аналогично получают пониженные гены с фильтром logFC < -0,5 и скорректированным p-значением < 0,05.
      Примечание: Эти наборы генов используются для идентификации биологических путей, которые поражаются опухолью на следующем этапе (рис. 6A, B).
    4. Используйте пакет clusterProfiler (версия 4.14.6) в R13 для проведения анализа путей Киотской энциклопедии генов и геномов (KEGG)14 для пониженных и повышенных генов. Основываясь на строгом фильтре q-значения < 0,05, определите значимые пути, связанные с подавленными и повышенными генами. Сосредоточьтесь на генах, связанных с иммунологическими путями, иммунной активностью или соответствующими сигнатурами (рисунок 6B).
  4. Интеллектуальный анализ генно-специфических данных
    1. Затем выполните поиск названий генов в разделе «Пространственно изменчивые гены », чтобы подтвердить пространственную экспрессию генов-мишеней. Щелкните по названию гена, чтобы создать пространственный график для гена на срезе ткани с пятнами, закодированными цветом для уровня экспрессии (рис. 7).
    2. Идентификация специфических генов с пространственными паттернами экспрессии в месте колоректальных метастазов, в отличие от отдаленной, здоровой ткани печени. Функциональная значимость генов или их экспрессия в других органах или состояниях может быть дополнительно изучена в базе данных.
    3. Выберите вкладку Поиск и выберите вид в качестве мыши. Нажмите на опцию поиска по гену и введите название гена. Будет отображен обзор распределения генов по органу и состоянию, который может быть дополнительно проанализирован.
      ПРИМЕЧАНИЕ: С помощью описанных выше шагов DeepSpaceDB может быть использована для исследования паттернов экспрессии генов между метастатическими и неметастатическими областями в образцах пространственной транскриптомики печени мыши.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

В примере 1 был продемонстрирован анализ образца мозга мыши, подтверждающий такие параметры, как количество прочтений, пространственно изменчивые гены и пути, а также вариации экспрессии генов между гиппокампом и корой головного мозга. Во-первых, качество образца DSID001557 мозга мыши оценивалось по нескольким показателям качества: «Обнаруженные гены» (рисунок 1A), «Количество прочтений» (рисунок 1B) и «Mito» (процент митохондриальных прочтений; Рисунок 1С). Это ясно выявило область с более низким качеством в левой части образца мозга, основанную на низком количестве обнаруженных генов и низком количестве прочтений. Чтобы понять относительное качество выборки по сравнению со всеми другими выборками, был нажат на вкладку «Относительное качество выборки » в базе данных, на которой отобразился график соотношения «Количество» и «Нет». генов обнаружено на пятно (Среднее). В анализируемом образце было обнаружено от 3500 до 4000 генов на одно пятно (рисунок 1D). Анатомические особенности образца были дополнительно проанализированы с помощью вкладки Аннотация изображения . В качестве общего примечания, эти аннотации были созданы путем разрезания изображений тканей на более мелкие части и просьбы к LLM описать наблюдаемые особенности8. Они являются приблизительными указаниями, помогающими в интерпретации образца, и должны быть интерпретированы с осторожностью. Для подмножества образцов (особенно образцов рака молочной железы человека) также доступны аннотации, сделанные специалистом-человеком. Однако, учитывая более низкое качество изображений Visium H&E по сравнению с изображениями, используемыми для рутинной диагностики, предоставленные аннотации предназначены только для исследовательских целей. Для DSID001557 образца наведите курсор на отображаемый фрагмент аннотаций различных областей мозга мыши, таких как область гиппокампа, корковые слои, плотные клеточные слои с глиозом и т. д. Исходя из понимания основных анатомических особенностей среза образца, были дополнительно изучены такие детали, как кластеры типов клеток и пространственно изменчивые гены и пути. Образец мозга мыши имел в общей сложности 15 кластеров, которые были представлены цветовой кодировкой по всему срезу образца (рис. 1E). Некоторые из основных пространственно вариабельных генов, связанных с образцом, — Nrgn, Slc17a7, Ly6h и Ddn (рис. 2). Nrgn продемонстрировал высокую экспрессию в области гиппокампа, в соответствии с литературными данными, указывающими на роль Nrgn-кодируемого белка (нейрогранина) в опосредовании синаптической пластичности и пространственного обучения15. Slc17a7, ген, кодирующий везикулярный транспортер глутамата, имеющий решающее значение для нейротрансмиссии в глутаминергических нейронах16, и Ddn, ген, кодирующий белок, модулирующий структуру постсинаптического цитоскелета17, также были высоко экспрессированы в области гиппокампа. Напротив, экспрессия гена Ly6h была локализована в корковой области, в соответствии с литературой, указывающей на рестриктивную синаптическую роль Ly6h в мембранах корковых клеток18. Аналогичным образом, активность путей визуализировалась по всему срезу образца (рис. 3). Было обнаружено, что пространственно вариабельные пути активируются в соответствии с функциональными ролями пространственно вариабельных генов, с регуляцией синаптической пластичности и активности нейротрансмиттеров в области гиппокампа, а также с нейропептидной сигнализацией в корковой области.

Наконец, для идентификации дифференциально экспрессируемых генов между областью гиппокампа и гипоталамусом образца мозга мыши была использована вкладка Tissue Explorer. Пятна, связанные с областями интереса, были выбраны с помощью аннотации к изображению (рис. 4A). Из сгенерированной диаграммы рассеяния видно, что некоторые из идентифицированных дифференциально экспрессируемых генов были среди ведущих пространственно изменчивых генов (Nrgn, Slc17a7, Ddn), в дополнение к некоторым другим, таким как Pmch и Ttr. Экспрессия этих генов была визуализирована в образце среза. Pmch был специфически сверхэкспрессирован в латеральной области гипоталамуса (Рисунок 4B; сравните с выбранной зеленой областью на Рисунке 4A). Этот ген кодирует предшественник гормона, концентрирующего меланин, и участвует в поддержании энергетического гомеостаза19. Напротив, ген Ttr был специфически экспрессирован в области гиппокампа (рисунок 4C; сравните с красной выбранной областью на рисунке 4A), в соответствии с его функциональной ролью в обучении и пространственной памяти20. Проводя внутривыборочные сравнения между различными областями мозга мышей с использованием этой базы данных, мы смогли выделить функциональные особенности, специфичные для региона, на основе пространственной экспрессии генов и активности путей.

В примере 2 база данных была использована для идентификации иммунных сигнатур, связанных с колоректальными метастазами в печени. Внутривыборочное сравнение проводилось между областью опухоли с колоректальными метастазами и отдаленной здоровой тканью печени путем выбора соответствующего пятна для двух образцов: DSID001005 (рисунок 5A-C) и DSID001007 (рисунок 5D-F). Данные были повторно проанализированы с двумя повторами на каждое состояние с использованием R. Дифференциальный экспрессионный анализ, проведенный между областью опухоли с колоректальным метастазированием и здоровой тканью печени, выявил подавление 138 генов и повышение регуляции 115 генов на основе выбранных параметров (рис. 6A, B). Анализ путей KEGG продемонстрировал обогащение пониженных генов' таких путей, как метаболизм лекарств и химический канцерогенез (рисунок 6C), в то время как активированные гены продемонстрировали сигнатуры, соответствующие трансэндотелиальной миграции лейкоцитов, фокальной адгезии и клеточному циклу, среди прочего (рисунок 6D). Сосредоточив внимание на значимости трансэндотелиальной миграции лейкоцитов для иммунной активности, были идентифицированы основные гены, обнаруженные в категории, и их пространственная экспрессия наблюдалась в DeepSpaceDB. Интересно, что гены Cldn7, Cldn4 и Actg1, обнаруженные в категории трансэндотелиальной миграции лейкоцитов, проявляли повышенную регуляцию в опухолевой области (сайт Epcam+) образцов, а не в отдаленной области со здоровой тканью печени (рис. 7). Это дало представление о природе иммунной активности, вызванной опухолевым участком печени, с активным набором лейкоцитов. Таким образом, внутрипробный анализ с использованием DeepSpaceDB позволяет извлекать различные биологические данные. Сравнивая пространственные транскриптомные данные с помощью интерактивных инструментов и рабочих процессов повторного анализа, исследователи могут генерировать и проверять гипотезы относительно тканеспецифической экспрессии генов и функциональной гетерогенности.

figure-results-1
Рисунок 1: Показатели качества образца. (A) Количество обнаруженных генов, (B) количество прочтений и (C) процент митохондриальных прочтений на пятно. (D) Среднее количество обнаруженных генов на пятно в этой выборке по сравнению с распределением всех других образцов в базе данных. (E) Точечные скопления на срезе ткани. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-results-2
Рисунок 2: Экспрессия ведущих пространственно изменчивых генов. (a) nrgn, (b) slc17a7, (c) ly6h и (d) ddn. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-results-3
Рисунок 3: Активность верхних пространственно изменчивых путей. (А) Нейропептидная сигнализация, (Б) Регуляция синаптической пластичности, (В) Транспорт нейротрансмиттеров. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-results-4
Рисунок 4: Сравнение паттернов экспрессии генов между двумя выбранными областями мозга мыши. (A) Выбор пятен в гипоталамусе и гиппокампе для внутривыборочного сравнения. Выбранная область 1 отображается красным цветом, а область 2 — зеленым. Пространственные паттерны экспрессии дифференциально экспрессируемых генов (B) Pmch и (C) Ttr между гипоталамическим и гиппокампальным областями. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-results-5
Рисунок 5: Свойства двух метастатических образцов печени мыши. Для образца DSID001005: (A) экспрессия маркеров Epcam , (B) кластеры пятен и (C) выбранные области в раковых и отдаленных областях для внутривыборочного сравнения. Для образца DSID001007: (D) экспрессия маркера Epcam , (E) кластеры пятен и (F) выбранные области в раковых и отдаленных областях для внутривыборочного сравнения. Для обоих образцов опухолевые пятна находятся в областях, показанных красным цветом, а неопухолевые пятна — в областях, показанных зеленым. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-results-6
Рисунок 6: Результаты повторного анализа. (A) Схематическое резюме рабочего процесса, используемого при повторном анализе. (B) Вулканический график, представляющий дифференциально экспрессируемые гены между раковыми и отдаленными областями. Обогащение пути KEGG (C) активированными генами и (D) подавленными генами. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-results-7
Рисунок 7: Пространственная экспрессия генов. (A) Cldn7, (B) Cldn4 и (C) Actg1 в срезе ткани DSID001005. Пространственная экспрессия генов. (D) Cldn7, (E) Cldn4 и (F) Actg1 в срезе ткани DSID001007. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

Дополнительные файлы 1-4: Файлы данных и скрипт R для примера метастазирования в печень. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

В этой статье мы представили два комплексных протокола, описывающих навигацию, извлечение и анализ пространственных транскриптомных данных в DeepSpaceDB. В то время как большинство баз данных пространственных омиксов сосредоточены на сборе данных из большого количества образцов, сгенерированных с использованием различных платформ 3,4,5,6, DeepSpaceDB фокусируется на разработке интерактивных инструментов, которые позволяют пользователям глубоко и эффективно исследовать пространственные транскриптомные особенности. Чтобы обеспечить такой уровень функциональности, в текущем выпуске основное внимание уделяется исключительно платформе Visium. С появлением платформ с высоким разрешением мы планируем соответствующим образом расширять DeepSpaceDB, разрабатывая новые стратегии обработки и интеграции таких данных в удобной для пользователя форме.

DeepSpaceDB позволяет пользователям оценивать показатели качества выборки (например, количество генов, глубину чтения) и сравнивать их с наборами данных. База данных включает в себя многоуровневые аннотации: неконтролируемая кластеризация по всей базе данных с присвоенными метками, обнаружение структурных и патологических особенностей на основе LLM на гистологическом изображении, а также экспертные гистологические аннотации для растущего подмножества образцов. Кроме того, пользователи могут интерактивно выбирать интересующие области внутри или между образцами для сравнения экспрессии генов, что позволяет изучать пространственные контрасты между такими областями, как опухоль против стромы или больные и здоровые области. Такие возможности вообще отсутствуют в других базах данных 3,4,5,6. Также доступны другие функции, такие как пространственно изменчивые гены и пути, предсказания типов клеток и результаты кластеризации. В совокупности эта база данных значительно снижает барьеры для изучения пространственных транскриптомических данных. Образцы из широкого спектра тканей и состояний находятся в свободном доступе, и пользователи могут перемещаться по ним с помощью простых взаимодействий типа «укажи и щелкни»; Никаких глубоких знаний в области биоинформатики не требуется. Тем не менее, некоторые предварительные знания о генах-маркерах и архитектуре тканей, вероятно, необходимы для точной интерпретации паттернов экспрессии и выбора областей, представляющих интерес в инструменте Tissue Explorer.

Несмотря на то, что это не представлено здесь, пользователи также могут загружать свои собственные образцы и применять многие из тех же инструментов для их анализа. База данных также поддерживает межвыборочное сравнение между 2 различными срезами тканей, позволяя, например, сравнивать больные ткани и здоровые контрольные ткани. Наконец, необработанные и обработанные данные, а также все производные результаты анализа доступны для загрузки, что поддерживает последующие рабочие процессы и пользовательский анализ. Для некоторых из этих инструментов короткие обучающие видеоролики доступны на обучающей странице базы данных.

Все еще есть аспекты базы данных, которые требуют доработки. Одним из них является точное прогнозирование типов клеток и состава клеток в каждом месте в срезах ткани. В текущей версии DeepSpaceDB (версия 1.0) мы предсказали состав каждого места Visium с помощью метода, называемого робастным разложением типа клеток (RCTD)21. РКТД показал относительно хорошие результаты в недавнем сравнительном исследовании22. Прогнозы, сделанные в ходе РКИ, также могут быть экспериментально подтверждены в нашем недавнем исследовании печени мышей-носителей рака23. Тем не менее, всесторонняя оценка точности предсказаний типов клеток не проводилась. Связанная с этим проблема заключается в том, что RCTD и другие методы прогнозирования типов ячеек требуют эталонного набора данных с аннотированными типами ячеек. В целом, типы клеток (или композиции типов клеток) в каждом пространственном местоположении прогнозируются путем сравнения с паттернами экспрессии генов в этом базовом наборе данных. Однако выбор подходящего образца для каждого образца Visium не всегда прост. В ссылках могут отсутствовать ключевые типы клеток или, наоборот, могут отсутствовать типы клеток, которые отсутствуют в тканевом срезе24. Более того, в пределах одного типа клеток клетки могут находиться в совершенно разных состояниях, например, неактивные и активированные иммунные клетки. Состояния клеток, присутствующие в эталонных наборах данных, не обязательно совпадают с состояниями пространственных выборок, которые часто получаются из моделей заболеваний пациентов. Обе проблемы могут привести к неточным прогнозам. Мы надеемся решить этот вопрос в будущем.

Поскольку область пространственной транскриптомики продолжает быстро развиваться, разрабатывается все большее число вычислительных инструментов для анализа различных аспектов пространственных данных, включая межклеточные взаимодействия, пространственные домены и прогнозирование пространственно изменчивых генов (см., например, 26,27,28). Несмотря на то, что такое распространение отражает динамизм в этой области, оно также представляет собой проблему для курирования и интеграции инструментов в эту базу данных. Для того чтобы обеспечить включение наиболее надежных и широко применимых методов, существует острая потребность в систематических сравнительных исследованиях, которые оценивают производительность инструментов в наборах данных и задачах анализа 22,29,30. Такие усилия будут иметь важное значение для обоснованного выбора и определения приоритетности инструментов для включения в базу данных.

В то время как другие базы данных пространственной транскриптомики пытаются собрать большое количество образцов различных платформ, в DeepSpaceDB мы решили использовать другую стратегию: сосредоточиться на нескольких популярных платформах и внедрить интерактивные и интуитивно понятные инструменты, которые позволяют пользователю легко изучить данные более подробно. Несмотря на то, что в текущей версии 1.0 наша база данных содержит только примеры Visium, в будущем обновлении мы планируем включить в нее и примеры с других платформ.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Авторам нечего раскрывать.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Авторы выражают благодарность Ю. Хараде за секретарскую помощь. Эта работа была поддержана JST NBDC (грант No JPMJND2303, A.V.) и AMED (грант номер JP24gm2010003, A.V.) Эта работа также была поддержана JSPS KAKENHI (20H03451, 24K02236 и 24KK0147; С.К.), JST FOREST (JPMJFR2062; S.K.), JST Moonshot (JPMJMS2011-61; С.К.). Спонсоры не играли никакой роли в дизайне исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
clusterProfilerПакет R - версия 4.14.6
База данных DeepSpaceDBВерсия > 1.0Ссылка на базу данных: www.deepspacedb.com
ЛиммаПакет R - версия 3.62.2
RВерсия 4.4.2
RStudioПостулироватьВерсия 2024.12

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).">Tian, L., Chen, F., Macosko, E. Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).
  2. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).">Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  3. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).">Fan, Z., Chen, R., Chen, X. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).
  4. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).">Yuan, Z., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).
  5. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).">Xu, Z., et al. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).
  6. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).">Li, Y., et al. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).
  7. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).">Honcharuk, V., et al. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).
  8. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).">GPT-4 technical report. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).
  9. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).">Vandenbon, A., Diez, D. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).
  10. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).">Vandenbon, A., Diez, D. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).
  11. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).">Hao, Y., et al. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).
  12. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).">Ritchie, M. E., et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).
  13. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).">Yu, G., Wang, L. G., Han, Y., He, Q. Y. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).
  14. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).">Kanehisa, M., et al. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).
  15. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).">Zhang, Y., et al. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).
  16. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).">Sreedharan, S., et al. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).
  17. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).">Twine, N. A., Janitz, C., Wilkins, M. R., Janitz, M. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).
  18. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).">Thomsen, M. S., et al. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).
  19. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).">Li, N., Nattie, E., Li, A. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).
  20. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).">Iqbal, J. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).
  21. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).">Cable, D. M., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).
  22. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).">Li, B., et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).
  23. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).">Vandenbon, A., et al. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).
  24. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).">Ivich, A., et al. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).
  25. A periodic table of cell types. Development. 146 (12), dev169854(2019).">Xia, B., Yanai, I. A periodic table of cell types. Development. 146 (12), dev169854(2019).
  26. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).">Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).
  27. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).">Zhu, J., et al. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).
  28. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).">Dries, R., et al. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).
  29. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).">Yuan, Z., et al. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).
  30. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).">Chen, X., et al. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Spatial TranscriptomicsGene Expression PatternsDeepSpaceDB DatabaseTissue Slice AnalysisSpatially Variable GenesDifferential Gene ExpressionTumor MicroenvironmentMouse Brain SampleColorectal Cancer MetastasisBioinformatics Tools

Related Articles