September 5th, 2025
В этой статье представлен протокол использования DeepSpaceDB, динамической интерактивной базы данных для пространственной транскриптомики, предлагающей рабочие процессы анализа и примеры для изучения организации тканей и экспрессии генов, связанных с заболеванием.
Мы создаем базу данных пространственной транскриптомики под названием DeepSpaceDB. Задача состоит в том, чтобы сделать данные пространственной транскриптомики более доступными для биологов и биоинформатиков. Было разработано несколько платформ пространственной транскриптомики.
Они позволяют исследователям изучать паттерны экспрессии генов в срезах тканей. Но эта технология дорогая, а анализ данных требует высокого уровня навыков биоинформатики. Мы использовали ритм и пространственную платформу Xenium, Our Cancer CEX Research.
Эта платформа позволяет нам определять опухоль, отек и даже отдаленную ткань хозяина в контексте одного и того же органа. Это может помочь нам разрешить изменения в экспрессии и клеточных вычислениях в каждом отсеке отдельно. Одной из основных проблем для биологов является собственно проведение анализа данных.
Таким образом, многие исследователи не обладают необходимыми программными и вычислительными навыками, чтобы иметь возможность полностью интерпретировать все большее количество наборов пространственных транскриптомных данных, которые в настоящее время становятся доступными. Делая наборы данных по пространственной транскриптомике более доступными, база данных позволяет пользователям генерировать новые гипотезы, исследуя механизмы, лежащие в основе различных заболеваний. Так, например, мы можем оценить пространственные паттерны экспрессии генов, связанные с микроокружением опухоли.
Для начала нажмите на вкладку базы данных и выберите организм в качестве мыши, орган в качестве мозга и источник в качестве Зенодо. Прокрутите полученные образцы и выберите образец с маркировкой DSID001557. Затем нажмите на выбранный образец и подтвердите, что в описании считывается 2 миллиона клеток в 100 микролитрах физиологического раствора NK-клетки.
Нажмите на вкладку «Качество», чтобы оценить качество образца. В раскрывающемся меню «Показатели качества» выберите такие параметры, как «Обнаруженные гены», «Количество прочтений» и «MITO», чтобы просмотреть соответствующие распределения параметров по срезу образца. Теперь перейдите на вкладку аннотаций к изображению, чтобы определить различные области в образце среза.
Наведите курсор мыши на образец среза, чтобы отобразить аннотации. Просматривайте сетчатые аннотации, созданные большой языковой моделью, которые показывают анатомические особенности и связанные с ними условия. Затем перейдите на вкладку кластеров, чтобы изучить кластеры типов ячеек в образце среза.
Просмотрите двумерное вложение кластеров и соответствующее цветовое представление в точках на срезе образца. Затем перейдите на вкладку генов, чтобы изучить пространственно изменчивые гены в образце. Нажмите на некоторые из верхних генов в списке, чтобы построить пространственные графики их экспрессии на срезе ткани.
Наблюдайте за цветовыми кодированными паттернами экспрессии, которые ясно показывают отчетливое пространственное распределение для генов с наивысшей оценкой. Затем перейдите на вкладку «Пути», чтобы изучить активность наборов генов, связанных с общими биологическими путями. Просмотрите список пространственно изменчивых путей с оценкой активности путей на основе уровней экспрессии родственных генов.
Нажмите на некоторые из верхних путей в списке, чтобы построить пространственные графики их активности на срезе ткани. Наблюдайте за цветовой кодировкой паттернов активности путей в различных областях тканей. Теперь перейдите на вкладку проводника тканей, которая позволяет пользователям свободно выбирать интересующие области и сравнивать паттерны экспрессии генов между ними.
Убедитесь, что выбран вручную. С помощью курсора мыши выделите точки в области гиппокампа с левой стороны среза мозга мыши. Нажмите на первый набор, а затем добавьте в набор, чтобы выделить выбранные места на правой панели.
Затем нажмите на второй набор и с помощью курсора мыши выделите точки в гипоталамической области среза мозга. Нажмите «Добавить», чтобы выделить эти выбранные места с правой стороны. После завершения выбора пятна нажмите на кнопку сравнения экспрессии генов.
В результате создается таблица, отображающая средние значения экспрессии генов для каждой выбранной области, а также представление точечной диаграммы. Наведите курсор на отдельные точки на точечной диаграмме, чтобы подтвердить названия генов и средние значения экспрессии в обеих областях. На основе результатов сравнения выявить дифференциально экспрессируемые гены.
Вернитесь на вкладку «Гены» и визуализируйте экспрессию этих генов на срезе ткани. Нажмите на вкладку базы данных и используйте фильтр, чтобы выбрать организм как мышь, орган как печень и заболевание как рак. Из полученного списка образцов выберите образцы DSID001005.
Нажмите на выбранный образец и убедитесь, что в описании указано, что образец взят из печени мыши, содержащей метастазы колоректального рака. Затем перейдите на вкладку проводника тканей и активируйте режим ручного выбора. С помощью курсора мыши выделите пятна, соответствующие опухолевому участку, идентифицированному по положительной экспрессии маркера EpCAM в образце DSID001005.
Нажмите на первый набор. Затем нажмите кнопку Добавить в набор, чтобы выделить выбранные опухолевые пятна с правой стороны. Теперь нажмите на второй набор и с помощью курсора выделите точки в отдаленной неопухолевой области образца печени.
Нажмите «Добавить», чтобы выделить выбранные неопухолевые пятна в правой части дисплея. Чтобы выполнить дальнейший анализ данных об экспрессии генов, нажмите на опцию «Загрузить CSV», создав файл значений через запятую с данными об экспрессии генов для двух областей образца. Повторив шаги навигации по базе данных в течение DSID001007, убедитесь, что в описании указано, что это еще один срез печени мыши, содержащий метастазы колоректального рака.
Затем убедитесь, что были сгенерированы два файла CSV, по одному из образцов DSID001005 и DSID001007, содержащие два столбца, представляющие среднюю экспрессию генов в опухолевых и неопухолевых областях. Загрузите оба CSV-файла в среду программирования R. Объедините наборы данных для выполнения нисходящего анализа с использованием двух репликаций для каждого условия.
В R используйте пакет limma для выполнения дифференциального анализа экспрессии генов в объединенном наборе данных. Отнесите участки колоректальных метастазов из обоих образцов к группе рака, а отдаленные здоровые участки — к контрольной группе. Отфильтруйте результаты, чтобы выявить повышенные гены с логарифмическим изменением кратности более 0,5 и скорректированным значением P менее 0,05.
Аналогичным образом извлекают пониженные гены с логарифмическим кратным изменением менее минус 0,5 и скорректированным значением P менее 0,05. Отчетливая область низкого качества наблюдалась на левой стороне образца мозга мыши, характеризующаяся уменьшенным количеством обнаруженных генов и меньшим количеством прочтений. Образец показал в среднем около 4000 генов, обнаруженных на пятно, что хорошо согласуется с распределением других образцов в базе данных.
В образце мозга мыши было идентифицировано 15 пространственных кластеров с четкими границами, представляющими анатомические различия. Гены NRGN, SLC17A7 и DDN показали сильную экспрессию в области гиппокампа. Напротив, экспрессия LY6H была локализована в корковых областях, в частности, в нижнем левом и правом внешних краях среза.
Сигнальная активность нейропептидов была заметно повышена в нижних корковых областях среза образца. Регуляция синаптической пластичности активировалась во всей области гиппокампа, особенно в верхних средних зонах. Транспортная активность нейротрансмиттеров была повышена в среднем и верхнем правом отделах гиппокампа.
Гены CLDN7, CLDN4 и ACTG1 продемонстрировали четкую апрегуляцию в области опухоли с колоректальным метастазированием в образце DSID 001005 печени. Напротив, экспрессия CLDN7, CLDN4 и ACTG1 была заметно ниже в отдаленных здоровых тканях печени образца DSID001007.
Эта статья описывает DeepSpaceDB, интерактивную базу данных, предназначенную для повышения доступности к данным пространственной транскриптомики. Она предоставляет рабочие процессы анализа для исследователей, чтобы исследовать организацию тканей и экспрессию генов, связанную с различными заболеваниями.