Method Article

DeepSpaceDB를 사용한 공간 전사체학 데이터 세트 마이닝

DOI:

10.3791/68892

September 5th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

이 기사에서는 공간 전사체학을 위한 동적 대화형 데이터베이스인 DeepSpaceDB를 사용하기 위한 프로토콜을 소개하고 조직 구성 및 질병 관련 유전자 발현을 탐색하기 위한 분석 워크플로와 예제를 제공합니다.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

공간 전사체학은 위치 정보를 보존하면서 조직 샘플에서 유전자 발현 패턴을 캡처할 수 있는 빠르게 발전하는 기술입니다. 이는 생물학적 연구 및 생물정보학에 광범위하게 응용되어 연구자들이 다양한 조직, 상태 및 질병에 걸쳐 유전자 발현의 공간적 변화를 조사하고 추적할 수 있도록 합니다. 공간 전사체학 데이터 분석이 주목을 받으면서 공개적으로 사용 가능한 데이터 세트의 수가 증가하고 있습니다. 그러나 공간 전사체학은 상당한 기술적, 재정적 제약이 있는 고도로 전문화된 실험 기술로 남아 있습니다. 공간 데이터에 대한 접근을 용이하게 하기 위해 우리는 최근 공간 전사체학 데이터 탐색을 위한 포괄적이고 동적인 데이터베이스인 DeepSpaceDB를 개발했습니다. 이 문서에서는 몇 가지 예제를 통해 데이터베이스의 구성 요소와 탐색을 간략하게 설명하는 자세한 워크플로를 제공합니다. 먼저, 마우스 뇌 샘플의 분석을 시연하여 품질 지표, 공간적으로 가변적인 유전자 및 경로, 해마와 시상하부 사이의 유전자 발현 변이를 탐색합니다. 다음으로, 면역 활성과 관련된 차등적으로 발현되는 유전자의 식별 및 주석은 쥐 간에서 결장직장 기원의 전이 영역과 건강한 조직의 먼 영역을 비교하여 추가로 탐구됩니다. 고급 도구와 대화형 기능을 갖춘 DeepSpaceDB는 공간 전사체학 연구를 위한 귀중한 리소스 역할을 하여 조직 조직 및 질병 생물학에 대한 심층적인 탐구를 가능하게 합니다.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

공간 전사체학은 연구자들이 조직 절편 내부의 공간 정보를 유지하면서 유전자 발현을 분석할 수 있도록 하는 새로운 기술로, 전례 없는 해상도로 조직 구조, 세포 이질성 및 미세 환경 영향을 연구할 수 있습니다 1,2. 그러나 이 기술의 잠재력에도 불구하고 접근과 분석은 여전히 제한적이며, 공간 전사체학은 많은 실험실에서 비용이 많이 들며, 데이터 분석에는 고급 생물정보학 기술이 필요합니다.

공개 데이터베이스를 개발하는 것은 이 새로운 실험 양식에 대한 접근을 넓히는 한 가지 방법입니다. 여러 공간 전사체학 데이터베이스가 생성되었습니다. 첫 번째는 SpatialDB였지만 제한된 수의 샘플만 포함되어 있으며 업데이트되지 않았습니다3. SODB, SOAR 및 STOmicsDB 데이터베이스에는 다양한 플랫폼의 많은 수의 샘플이 포함되어 있으며 데이터 저장소 4,5,6으로서 큰 역할을 합니다. 그러나 분석 도구는 제한적이고 상호 작용이 부족합니다. 이 문제를 해결하기 위해 우리는 최근 기술적 장벽을 낮추고 접근성을 확장하도록 설계된 공개적으로 사용 가능한 공간 전사체학 데이터 세트의 선별되고 사용자 친화적인 데이터베이스인 DeepSpaceDB를 개발했습니다7. 이 기사에서는 데이터베이스 검색, 샘플 품질 검사, 시각화 도구 및 조직 슬라이스 내에서 대화식으로 선택된 영역의 비교를 포함하여 이 데이터베이스의 여러 도구를 설명합니다. 실제 맥락에서 이러한 도구를 입증하기 위해 마우스 뇌 샘플과 결장직장 전이가 있는 쥐 간의 분석이라는 두 가지 대표적인 예를 사용하여 자세한 프로토콜을 제시합니다. 이러한 도구를 통해 DeepSpaceDB는 더 광범위한 연구자가 자체 데이터나 사내 생물정보학 역량 없이도 공간 전사체학을 활용할 수 있도록 지원합니다. 데이터 수집, 품질 관리, 처리 워크플로우, DeepSpaceDB에 포함된 데이터 및 기능에 대한 포괄적인 설명은 Honcharuk etal 7에 의해 자세히 제공됩니다.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. 실시예 1: 마우스 뇌 샘플의 분석

참고: 이 섹션에서는 DeepSpaceDB에서 사용할 수 있는 다양한 기능과 플롯을 탐색하면서 마우스 뇌 샘플의 분석을 설명합니다(데이터베이스에 대한 링크는 재료 표에서 사용할 수 있음).

  1. 샘플 선택
    1. 데이터베이스 탭을 클릭하고 필터를 사용하여 유기체 마우스, 장기 및 소스 zenodo를 선택합니다. 결과 샘플을 이동하고 샘플 DSID001557를 선택합니다. 또는 검색 상자를 사용하여 데이터베이스에서 "DSID001557"라는 용어를 검색하고 이 샘플을 선택합니다.
    2. 샘플을 클릭하고 100μL 식염수-NK 세포에 2 × 106개 세포로 설명을 확인합니다(i.v. 일주일에 한 번 총 5회 주사).
  2. 품질 분석
    1. 품질 탭을 클릭하여 선택한 샘플의 품질을 평가합니다. 품질 측정 드롭다운 메뉴에서 검출된 유전자(그림 1A), 판독 수(그림 1B) 및 Mito(그림 1C)와 같은 다양한 옵션을 선택하여 샘플 슬라이스의 각 지점에서 각 매개변수를 시각화합니다.
  3. 이미지 주석
    1. 이미지 주석 탭으로 이동하여 샘플 슬라이스의 다른 영역을 식별합니다.
    2. 샘플 슬라이스 위로 마우스 커서를 이동합니다. 대규모 언어 모델(LLM)에 의해 예측된 주석은 해부학적 구조 및 관련 조건에 대한 정보와 함께 그리드 기반 방식으로 샘플 이미지의 일부에 대해 표시됩니다8.
  4. 클러스터 분석
    1. 샘플 슬라이스의 셀 유형 클러스터에 대해 더 자세히 이해하려면 클러스터 탭으로 이동합니다. 클러스터의 2D 임베딩이 샘플 슬라이스의 스폿에 걸쳐 색상으로 구분된 클러스터의 표현과 함께 표시됩니다(그림 1E).
  5. 공간적으로 가변적인 유전자 및 경로
    1. 유전자 탭으로 이동하여 샘플 9,10에서 공간적으로 가변적인 유전자(SVG; 발현 수준이 조직 위치에 따라 다른 유전자)를 기록해 둡니다. 이러한 SVG는 Kullback-Leibler 발산 측정(표의 D_KL)을 채택하여 각 유전자의 발현 패턴이 무작위로 예상되는 것과 얼마나 차이가 있는지 평가하는 singleCellHaystack 함수를 사용하여 예측됩니다(그림 2). p-값이 낮은 유전자(표의 큰 음수 log.p.adj)는 SVG로 나열됩니다.
      참고: 유전자 발현 데이터는 Seurat R(버전 5) 패키지11에서 사용된 기본 매개변수를 사용하여 정규화되었습니다. 실제로 각 지점의 각 유전자에 대한 판독값을 해당 지점의 총 판독 수로 나누고 배율 계수 10,000을 곱했습니다. 다음으로, log(0) 문제를 피하기 위해 1을 더한 후 자연 로그를 계산했습니다. 유전자 탭에 표시된 그림은 이 정규화된 데이터를 보여줍니다.
    2. 목록에서 상위 유전자 중 일부를 클릭합니다. 이것은 발현 수준에 대해 색상으로 구분된 반점과 함께 조직 슬라이스를 가로지르는 유전자에 대한 공간 플롯을 생성합니다(그림 2). 최고 점수를 받은 유전자는 명확하게 뚜렷한 공간적 발현 패턴을 가지고 있습니다.
    3. 경로 탭으로 이동하여 개별 유전자가 아닌 유전자 세트(예: 공통 생물학적 경로와 관련된 유전자)의 활성을 검사합니다. 공간적으로 가변적인 경로는 위에서 설명한 SVG와 유사한 방식으로 나열됩니다(그림 3). 경로 활성은 이들과 관련된 유전자의 발현 수준을 기반으로 추정됩니다 7,11.
      참고: 경로 활동은 Seurat R 패키지 함수 addModuleScore11을 사용하여 추정되었습니다. 간단히 말해서, 이 함수는 유전자 세트(예를 들어, 공통 경로에 관여하는 유전자 세트)를 입력으로 받아들이고 여러 처리 단계 후에 평균 발현 수준을 반환합니다. 실제로 양수 값은 평균보다 높은 활동을 의미하고 음수 값은 평균보다 낮은 활동을 의미합니다. 경로 탭에 표시된 그림은 이 모듈 점수 데이터를 보여줍니다.
    4. 목록에서 상위 경로 중 일부를 클릭합니다. 이것은 조직 슬라이스를 가로지르는 경로에 대한 공간 플롯을 생성하며, 활동 수준에 따라 색상으로 구분된 스팟이 있습니다. 여러 경로는 뚜렷한 공간적 활동 패턴을 가지고 있습니다(그림 3).
  6. 샘플 내 유전자 발현 비교
    1. Tissue Explorer 탭으로 이동하여 Manual Selection(수동 선택)을 선택합니다(아직 선택되지 않은 경우). 다음으로, 마우스 커서를 사용하여 왼쪽에 있는 마우스 뇌 조각의 해마 영역에서 지점을 선택합니다. 세트 1을 클릭하고 세트에 추가를 선택합니다. 이렇게 하면 오른쪽의 슬라이스에서 선택한 모든 지점이 강조 표시됩니다(그림 4A).
    2. 이제 세트 2를 클릭하고 마우스 커서를 사용하여 마우스 뇌 슬라이스의 시상하부 영역에서 지점을 선택합니다. 세트에 추가를 클릭하면 오른쪽의 슬라이스에서 선택한 모든 지점이 강조 표시됩니다(그림 4A).
    3. 스팟 선택 프로세스를 완료한 후 유전자 발현 비교 버튼을 클릭합니다. 이렇게 하면 산점도 표현과 함께 두 영역 사이에서 선택한 지점의 평균 유전자 발현 값이 포함된 테이블이 생성됩니다. 커서를 개별 지점 위로 이동하여 유전자 이름과 두 영역의 유전자 평균 발현을 확인합니다.
    4. 유전자 발현 비교 결과를 기반으로 차등적으로 발현된 유전자를 식별하고 유전자 탭으로 다시 이동하여 샘플 슬라이스 전체에서 발현을 시각화합니다(그림 4B,C).
      참고: 위에서 자세히 설명한 단계를 통해 DeepSpaceDB를 사용하여 마우스 뇌 공간 전사체학 샘플의 특징을 조사할 수 있습니다.

2. 실시예 2: 마우스 간에서 대장 기원의 전이성 영역에서 면역 활성과 관련된 차등발현 유전자의 동정 및 주석

참고: 샘플 내 비교는 현재 섹션에서 살펴봅니다. 이것은 두 개의 서로 다른 샘플을 기반으로 결장직장 기원의 전이성 영역과 간 절편 내 건강한 조직의 먼 영역 사이에 차등적으로 발현되는 유전자의 식별 및 주석을 통해 설명됩니다. 면역 활동과 관련된 특정 조절 장애 유전자의 공간적 발현은 조직 절편에서 추가로 시각화됩니다.

  1. 데이터베이스 탐색 및 샘플 선택
    1. 데이터베이스 탭을 클릭하고 필터를 사용하여 유기체 마우스, 장기 상태 암을 선택합니다. 결과 샘플에서 샘플 DSID001005를 선택합니다. 샘플을 클릭하고 샘플이 대장암 기원의 전이가 포함된 마우스 간에서 가져온 것이라는 설명을 확인합니다.
    2. Tissue Explorer 탭으로 이동하여 Manual Selection을 선택합니다. 다음으로, 마우스 커서를 사용하여 Epcam 마커의 양성 발현을 기반으로 식별된 간 샘플 DSID001005의 종양 영역(결장직장 전이)의 반점을 선택합니다(그림 5A). 세트 1을 클릭하고 세트에 추가를 선택합니다. 이렇게 하면 오른쪽의 슬라이스에서 선택한 모든 지점이 강조 표시됩니다(그림 5C).
    3. 이제 세트 2를 클릭하고 마우스 커서를 사용하여 간 샘플의 먼 비종양 영역에서 지점을 선택합니다. 세트에 추가를 클릭하면 오른쪽의 슬라이스에서 선택한 모든 지점이 강조 표시됩니다(그림 5C).
  2. 선택된 스팟 간의 유전자 발현 비교
    1. 스팟 선택 프로세스를 완료한 후 유전자 발현 비교 버튼을 클릭합니다. 이렇게 하면 산점도 표현과 함께 두 영역 사이에 선택된 지점의 평균 유전자 발현 값이 포함된 테이블이 생성됩니다. 마우스 커서를 개별 지점 위로 이동하고 유전자 이름과 두 영역에서 유전자의 평균 발현을 검사합니다.
    2. 유전자 발현 데이터로 심층 분석을 수행하려면 CSV 다운로드 옵션을 선택합니다. 이렇게 하면 샘플의 두 영역에 대한 유전자 발현 데이터의 쉼표로 구분된 값(CSV) 파일이 생성됩니다.
    3. 샘플 "DSID001007"에 대해 2.1.1-2.1.3 및 2.2.1-2.2.2단계를 반복합니다. 대장암 기원의 전이를 포함하는 마우스 간의 또 다른 절편으로 설명을 확인하십시오.
  3. R 프로그래밍을 사용한 데이터 분석
    1. 위의 단계를 수행하여 샘플 DSID001005와 샘플 DSID001007에서 하나씩 2개의 CSV 파일이 생성되었는지 확인합니다. 두 파일 모두 각 샘플에서 만들어진 2가지 선택(종양 조직 및 비종양 조직)에서 평균 유전자 발현을 나타내는 2개의 열을 포함합니다.
    2. CSV 파일을 R로 읽고 조건당 두 번의 반복으로 추가 다운스트림 분석을 위해 병합합니다(즉, 대장암 전이가 있는 종양 영역 및 간의 먼 건강한 조직). 보충 자료의 R 스크립트 및 데이터 파일을 참조하십시오.
    3. R(버전 4.4.2)12 의 limma 패키지(버전 3.62.2)를 사용하여 데이터에 대한 차등 발현 분석을 수행하여 두 샘플의 결장직장 전이 영역을 으로, 두 샘플의 멀고 건강한 영역을 대조군으로 분류합니다. logFC > 0.5 필터와 조정된 p-값 < 0.05로 상향 조절된 유전자를 얻습니다. 유사하게, logFC < -0.5의 필터와 조정된 p-값 < 0.05로 하향 조절된 유전자를 얻습니다.
      참고: 이러한 유전자 세트는 다음 단계에서 종양의 영향을 받는 생물학적 경로를 식별하는 데 사용됩니다(그림 6A,B).
    4. R13의 clusterProfiler 패키지(버전 4.14.6)를 사용하여 하향 조절 및 상향 조절된 유전자에 대한 교토 유전자 및 게놈 백과사전(KEGG)14의 경로 분석을 수행합니다. 0.05< q-값의 엄격한 필터를 기반으로 하향 조절 및 상향 조절된 유전자와 관련된 중요한 경로를 식별합니다. 면역학적 경로, 면역 활성 또는 관련 시그니처와 관련된 유전자에 초점을 맞춥니다(그림 6B).
  4. 유전자 특이적 데이터 마이닝
    1. 다음으로, 공간적으로 가변적인 유전자 섹션에서 유전자 이름을 검색하여 표적 유전자의 공간적 발현을 확인합니다. 유전자 이름을 클릭하여 발현 수준에 따라 색상으로 구분된 반점과 함께 조직 슬라이스를 가로질러 유전자에 대한 공간 플롯을 생성합니다(그림 7).
    2. 멀리 떨어져 있는 건강한 간 조직과 비교하여 결장직장 전이 부위에서 공간적 발현 패턴을 가진 특정 유전자를 식별합니다. 유전자의 기능적 관련성 또는 다른 기관이나 조건에서의 발현은 데이터베이스에서 추가로 탐색할 수 있습니다.
    3. 검색 탭을 선택하고 마우스로 종을 선택합니다. 유전자로 검색 옵션을 클릭하고 유전자 이름을 입력합니다. 유전자의 장기 및 상태 분포에 대한 개요가 표시되며 추가 분석이 가능합니다.
      참고: 위에서 설명한 단계를 통해 DeepSpaceDB를 사용하여 마우스 간 공간 전사체학 샘플에서 전이성 영역과 비전이성 영역 사이의 유전자 발현 패턴을 조사할 수 있습니다.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

실시예 1은 쥐 뇌 샘플의 분석을 시연하여 판독 횟수, 공간적으로 가변적인 유전자 및 경로, 해마와 피질 사이의 유전자 발현 변이와 같은 매개변수를 검증했습니다. 첫째, 마우스 뇌 샘플 DSID001557의 품질을 여러 품질 측정에 대해 평가했습니다: "검출된 유전자"(그림 1A), "읽기 수"(그림 1B) 및 "Mito"(미토콘드리아 판독 비율; 그림 1C). 이는 검출된 유전자 수가 적고 판독 횟수가 낮기 때문에 뇌 샘플의 왼쪽에서 품질이 낮은 영역을 명확하게 강조했습니다. 다른 모든 표본에 대한 표본의 상대적 품질을 이해하기 위해 데이터베이스에서 표본의 상대적 품질 탭을 클릭하면 개수 대 아니오의 그래프가 표시되었습니다. 스팟당 검출된 유전자의 수(평균). 분석 중인 샘플의 경우 스팟당 3500-4000개의 유전자가 검출되었습니다(그림 1D). 샘플의 해부학적 특징은 이미지 주석 탭을 사용하여 추가로 분석되었습니다. 일반적으로 이러한 주석은 조직 이미지를 더 작은 부분으로 자르고 LLM에게 관찰가능한 특징을 설명하도록 요청하여 생성되었습니다8. 이는 샘플의 해석을 돕기 위한 대략적인 표시이며 주의해서 해석해야 합니다. 샘플의 하위 집합(특히 인간 유방암 샘플)의 경우 인간 전문가의 주석도 사용할 수 있습니다. 그러나 일상적인 진단에 사용되는 이미지에 비해 Visium H&E 이미지의 품질이 낮다는 점을 고려하여 제공된 주석은 연구 목적으로만 사용됩니다. 샘플 DSID001557의 경우 해마 영역, 피질층, 신경교증이 있는 조밀한 세포층 등과 같은 마우스 뇌의 다양한 영역에 대한 주석이 표시된 슬라이스 위로 커서를 이동합니다. 샘플 슬라이스의 기본 해부학적 특징을 이해함으로써 세포 유형 클러스터, 공간적으로 가변적인 유전자 및 경로와 같은 세부 특징을 추가로 탐구했습니다. 마우스 뇌 샘플에는 총 15개의 클러스터가 있었으며, 이는 샘플 슬라이스 전체에 걸쳐 색상 코딩으로 표시되었습니다(그림 1E). 샘플과 관련된 가장 높은 공간적으로 가변적인 유전자 중 일부는 Nrgn, Slc17a7, Ly6hDdn 입니다(그림 2). Nrgn 은 시냅스 가소성 및 공간 학습을 매개하는 데 있어 Nrgn 암호화 단백질(뉴로그라닌)의 역할을 나타내는 문헌적 증거에 따라 해마 영역에서 높은 발현을 나타냈습니다15. 글루타민성 뉴런의 신경전달에 중요한 소포성 글루타메이트 수송체를 코딩하는 유전자인 Slc17a7(16)과 시냅스 후 세포골격의 구조를 조절하는 단백질을 암호화하는 유전자인 Ddn(17)도 해마 영역에서 높게 발현되었습니다. 대조적으로, 유전자 Ly6h 의 발현은 피질 세포의 막에서 Ly6h 의 제한적인 시냅스 역할을 나타내는 문헌에 따라 피질 영역에 국한되었습니다18. 유사한 방식으로 경로의 활동이 샘플 슬라이스 전반에 걸쳐 시각화되었습니다(그림 3). 공간적으로 가변적인 경로는 해마 영역의 시냅스 가소성 및 신경 전달 물질 활성의 조절과 피질 영역의 신경펩티드 신호 전달과 함께 공간적으로 가변 유전자의 기능적 역할과 일치하여 활성화되는 것으로 관찰되었습니다.

마지막으로, 마우스 뇌 샘플의 해마 영역과 시상하부 사이에 차등적으로 발현된 유전자를 식별하기 위해 Tissue Explorer 탭을 활용했습니다. 관심 영역과 관련된 지점은 이미지 주석의 지침에 따라 선택되었습니다(그림 4A). 생성된 산점도에서 확인된 차등적으로 발현된 유전자 중 일부는 PmchTtr과 같은 몇 가지 다른 유전자 외에도 공간적으로 가변적인 상위 유전자(Nrgn, Slc17a7, Ddn) 중 하나였습니다. 이러한 유전자의 발현은 샘플 슬라이스에서 시각화되었습니다. Pmch는 외측 시상하부 영역에서 특이적으로 과발현되었습니다(그림 4B; 그림 4A에서 녹색 선택 영역과 비교). 이 유전자는 멜라닌 농축 호르몬의 전구체를 암호화하며 에너지 항상성의 유지에 관여합니다19. 대조적으로, 유전자 Ttr은 학습 및 공간 기억20에서의 기능적 역할에 따라 해마 영역(그림 4C; 그림 4A에서 빨간색 선택 영역과 비교)에서 특이적으로 발현되었습니다. 이 데이터베이스를 사용하여 서로 다른 마우스 뇌 영역 간의 샘플 내 비교를 수행함으로써 공간 유전자 발현 및 경로 활동을 기반으로 영역별 기능적 특징을 강조할 수 있었습니다.

실시예 2에서, 데이터베이스는 간에서 결장직장 전이와 관련된 면역 시그니처의 식별을 위해 활용되었다. 결장직장 전이가 있는 종양 영역과 멀리 있는 건강한 간 조직 사이에서 DSID001005(그림 5A-C) 및 DSID001007(그림 5D-F)의 두 샘플에 대한 적절한 지점 선택을 통해 샘플 내 비교를 수행했습니다. 데이터는 R을 사용하여 조건당 2회 반복으로 재분석되었습니다. 결장직장 전이가 있는 종양 영역과 건강한 간 조직 사이에서 수행된 차등 발현 분석은 선택된 매개변수를 기반으로 138개 유전자의 하향 조절과 115개 유전자의 상향 조절을 나타냈습니다(그림 6A,B). KEGG 경로 분석은 약물 대사 및 화학적 발암과 같은 하향 조절된 유전자의 경로의 농축을 입증한 반면(그림 6C), 상향 조절된 유전자는 무엇보다도 백혈구 경-내피 이동, 초점 접착 및 세포 주기에 해당하는 시그니처를 나타냈습니다(그림 6D). 면역 활성에 대한 백혈구 경-내피 이동의 관련성에 초점을 맞춰 해당 범주에서 검출된 상위 유전자를 식별하고 DeepSpaceDB에서 공간 발현을 관찰했습니다. 흥미롭게도, 백혈구 경-내피 이동 범주에서 검출된 유전자 Cldn7, Cldn4Actg1은 건강한 간 조직이 있는 먼 영역이 아닌 샘플의 종양 영역(Epcam+ 부위)에서 상향 조절을 나타냈습니다(그림 7). 이것은 백혈구의 활발한 모집과 함께 간의 종양 부위에서 구동되는 면역 활동의 특성에 대한 통찰력을 제공했습니다. 요약하자면, DeepSpaceDB를 사용한 샘플 내 분석을 통해 다양한 생물학적 통찰력을 추출할 수 있습니다. 대화형 도구와 재분석 워크플로를 통해 공간 전사체 데이터를 비교함으로써 연구자들은 조직 특이적 유전자 발현 및 기능적 이질성에 관한 가설을 생성하고 검증할 수 있습니다.

figure-results-1
그림 1: 샘플의 품질 측정. (A) 검출된 유전자의 수, (B) 판독 횟수 및 (C) 지점당 미토콘드리아 판독 백분율. (D) 데이터베이스의 다른 모든 샘플의 분포와 비교하여 이 샘플에서 스팟당 검출된 유전자의 평균 수. (E) 조직 절편을 가로질러 군집을 발견합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-results-2
그림 2: 상위 공간적으로 가변적인 유전자의 발현. (a) nrgn, (b) slc17a7, (c) ly6h 및 (d) ddn. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-results-3
그림 3: 상위 공간적으로 가변적인 경로의 활동. (A) 신경펩티드 신호 전달, (B) 시냅스 가소성 조절, (C) 신경 전달 물질 수송. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-results-4
그림 4: 마우스 뇌의 선택된 두 영역 간의 유전자 발현 패턴 비교. (A) 샘플 내 비교를 위한 시상하부 및 해마 영역의 스팟 선택. 선택한 영역 1은 빨간색으로 표시되고 영역 2는 녹색으로 표시됩니다. 시상하부와 해마 부위 사이의 차등적으로 발현된 유전자 (B) Pmch 및 (C) Ttr 의 공간적 발현 패턴. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-results-5
그림 5: 두 개의 전이성 마우스 간 샘플의 특성. 샘플 DSID001005의 경우: (A) Epcam 마커 발현, (B) 스팟 클러스터 및 (C) 샘플 내 비교를 위해 암성 및 원격 영역에서 선택된 영역. 샘플 DSID001007의 경우: (D) Epcam 마커 발현, (E) 스폿 클러스터 및 (F) 샘플 내 비교를 위해 암성 및 원격 영역에서 선택된 영역. 두 샘플 모두에서 종양 반점은 빨간색으로 표시된 영역에 있고 비종양 반점은 녹색으로 표시된 영역에 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-results-6
그림 6: 재분석 결과. (A) 재분석에 사용된 워크플로의 개략적 요약. (B) 암성 영역과 먼 영역 사이에서 차등적으로 발현되는 유전자를 나타내는 화산 플롯. (C) 상향 조절된 유전자와 (D) 하향 조절된 유전자의 KEGG 경로 농축. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-results-7
그림 7: 유전자의 공간적 발현. (A) Cldn7, (B) Cldn4 및 (C) 조직 절편 DSID001005의 Actg1 . 유전자의 공간적 발현. (D) Cldn7, (E) Cldn4 및 (F) 조직 절편 DSID001007의 Actg1 . 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

보충 파일 1-4: 간 전이에 대한 데이터 파일 및 R 스크립트 예. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

여기에서는 DeepSpaceDB에서 공간 전사체학 데이터의 탐색, 검색 및 분석을 설명하는 두 가지 포괄적인 프로토콜을 소개했습니다. 대부분의 공간 오믹스 데이터베이스는 다양한 플랫폼 3,4,5,6을 사용하여 생성된 많은 수의 샘플에서 데이터 수집에 중점을 두는 반면, DeepSpaceDB는 사용자가 공간 전사체 특징을 심층적이고 효율적으로 탐색할 수 있는 대화형 도구 개발에 중점을 둡니다. 이러한 수준의 기능을 활성화하기 위해 현재 릴리스는 Visium 플랫폼에만 중점을 둡니다. 고해상도 플랫폼의 출현으로 우리는 그에 따라 DeepSpaceDB를 확장하여 이러한 데이터를 사용자 친화적인 방식으로 처리하고 통합하기 위한 새로운 전략을 개발할 계획입니다.

DeepSpaceDB를 사용하면 샘플 품질 지표(예: 유전자 수, 판독 깊이)를 평가하고 데이터 세트 간에 비교할 수 있습니다. 데이터베이스에는 할당된 레이블이 있는 전체 데이터베이스에 대한 비지도 클러스터링, 조직학적 이미지에서 구조적 및 병리학적 특징에 대한 LLM 기반 감지, 증가하는 샘플 하위 집합에 대한 전문가 조직학 주석 등 다층 주석이 포함되어 있습니다. 또한 사용자는 샘플 내부 또는 샘플 간에 관심 영역을 대화식으로 선택하여 유전자 발현을 비교할 수 있으므로 종양 대 간질 또는 질병 영역과 건강한 영역과 같은 영역 간의 공간적 대비를 연구할 수 있습니다. 이러한 기능은 일반적으로 다른 데이터베이스 3,4,5,6에서 부족하다. 공간적으로 가변적인 유전자 및 경로, 세포 유형 예측, 클러스터링 결과 등의 다른 기능도 사용할 수 있습니다. 종합하면, 이 데이터베이스는 공간 전사체학 데이터를 탐색하는 데 대한 장벽을 크게 낮춥니다. 다양한 조직과 상태의 샘플에 자유롭게 액세스할 수 있으며 사용자는 간단한 포인트 앤 클릭 상호 작용을 통해 샘플을 탐색할 수 있습니다. 고급 생물정보학 전문 지식이 필요하지 않습니다. 즉, 발현 패턴을 정확하게 해석하고 Tissue Explorer 도구에서 관심 영역을 선택하려면 마커 유전자 및 조직 구조에 대한 사전 지식이 필요할 수 있습니다.

여기에 소개되지는 않았지만 사용자는 자신의 샘플을 업로드하고 동일한 도구를 많이 적용하여 분석할 수도 있습니다. 데이터베이스는 또한 2개의 서로 다른 조직 절편 간의 샘플 간 비교를 지원하여 예를 들어 병든 조직과 건강한 대조군 조직 간의 비교를 허용합니다. 마지막으로, 모든 파생 분석 출력과 함께 원시 및 처리된 데이터를 다운로드할 수 있으며 다운스트림 워크플로 및 사용자 지정 분석을 지원합니다. 이러한 도구 중 일부에 대해 데이터베이스의 튜토리얼 페이지에서 짧은 튜토리얼 비디오를 사용할 수 있습니다.

데이터베이스에는 여전히 개선이 필요한 측면이 있습니다. 하나는 조직 절편 내의 각 위치에서 세포 유형 및 세포 유형 구성을 정확하게 예측하는 것입니다. DeepSpaceDB(버전 1.0)의 현재 버전에서는 RCTD(Robust Cell Type Decomposition)21라는 방법을 사용하여 각 Visium 스팟의 세포 유형 구성을 예측했습니다. RCTD는 최근 벤치마크 연구에서 비교적 좋은 성과를 거두었습니다22. RCTD에 의한 예측은 암 보유 마우스의 간에 대한 최근 연구에서도 실험적으로 검증될 수 있습니다23. 그러나 세포 유형 예측의 정확도에 대한 포괄적인 평가는 수행되지 않았습니다. 관련 문제는 RCTD 및 기타 세포 유형 예측 방법에는 주석이 달린 세포 유형이 있는 참조 데이터 세트가 필요하다는 것입니다. 일반적으로 각 공간 위치에서의 세포 유형(또는 세포 유형 구성)은 이 참조 데이터 세트의 유전자 발현 패턴과의 비교를 통해 예측됩니다. 그러나 각 Visium 샘플에 적합한 참조를 선택하는 것이 항상 간단한 것은 아닙니다. 참고 문헌은 주요 세포 유형을 결여할 수 있거나, 반대로, 조직 슬라이스(24)에 존재하지 않는 세포 유형을 포함할 수 있다. 더욱이, 하나의 세포 유형 내에서 세포는 비활성 면역 세포와 활성화된 면역 세포와 같이 크게 다른 상태에 있을 수 있습니다25. 참조 데이터 세트에 존재하는 세포 상태가 환자의 질병 모델에서 얻는 경우가 많은 공간 샘플의 세포 상태와 반드시 일치하는 것은 아닙니다. 두 문제 모두 부정확한 예측을 초래할 수 있습니다. 우리는 앞으로 이 문제를 해결하기를 희망합니다.

공간 전사체학 분야가 계속 빠르게 발전함에 따라 세포-세포 상호 작용, 공간 도메인 및 공간적으로 가변적인 유전자 예측을 포함하여 공간 데이터의 다양한 측면을 분석하기 위한 점점 더 많은 계산 도구가 개발되고 있습니다(예: 26,27,28 참조). 이러한 확산은 이 분야의 역동성을 반영하는 동시에 도구를 큐레이팅하고 이 데이터베이스에 통합하는 데 어려움을 안겨주기도 합니다. 가장 강력하고 광범위하게 적용 가능한 방법이 포함되도록 하기 위해 데이터 세트 및 분석 작업 전반에 걸쳐 도구 성능을 평가하는 체계적인 벤치마크 연구가 절실히 필요합니다 22,29,30. 이러한 노력은 데이터베이스에 포함할 도구의 정보에 입각한 선택 및 우선 순위 지정을 안내하는 데 필수적입니다.

다른 공간 전사체학 데이터베이스는 다양한 플랫폼의 많은 샘플을 수집하려고 시도하는 반면, DeepSpaceDB에서는 몇 가지 인기 있는 플랫폼에 초점을 맞추고 사용자가 데이터를 더 자세히 쉽게 탐색할 수 있는 대화형 직관적 도구를 구현하는 다른 전략을 사용하기로 결정했습니다. 우리 데이터베이스에는 현재 버전 1.0의 Visium 샘플만 포함되어 있지만 향후 업데이트에는 다른 플랫폼의 샘플도 포함될 계획입니다.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자는 공개할 것이 없습니다.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자는 비서 도움을 준 Y. Harada에게 감사를 표하고 싶습니다. 본 연구는 JST NBDC(보조금 번호 JPMJND2303, A.V.)와 AMED(보조금 번호 JP24gm2010003, A.V.)의 지원을 받았습니다. 이 작업은 JSPS KAKENHI(20H03451, 24K02236 및 24KK0147; SK), JST 포레스트(JPMJFR2062; SK), JST 문샷(JPMJMS2011-61; SK)를 참조하십시오. 자금 제공자는 연구 설계, 데이터 수집 및 분석, 출판 결정 또는 원고 준비에 아무런 역할도 하지 않았습니다.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
cluster프로파일러R 패키지 - 버전 4.14.6
딥스페이스DB버전 > 1.0데이터베이스에 대한 링크: www.deepspacedb.com
리마R 패키지 - 버전 3.62.2
R버전 4.4.2
RS투디오포지션버전 2024.12

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).">Tian, L., Chen, F., Macosko, E. Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).
  2. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).">Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  3. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).">Fan, Z., Chen, R., Chen, X. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).
  4. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).">Yuan, Z., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).
  5. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).">Xu, Z., et al. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).
  6. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).">Li, Y., et al. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).
  7. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).">Honcharuk, V., et al. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).
  8. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).">GPT-4 technical report. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).
  9. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).">Vandenbon, A., Diez, D. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).
  10. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).">Vandenbon, A., Diez, D. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).
  11. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).">Hao, Y., et al. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).
  12. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).">Ritchie, M. E., et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).
  13. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).">Yu, G., Wang, L. G., Han, Y., He, Q. Y. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).
  14. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).">Kanehisa, M., et al. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).
  15. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).">Zhang, Y., et al. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).
  16. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).">Sreedharan, S., et al. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).
  17. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).">Twine, N. A., Janitz, C., Wilkins, M. R., Janitz, M. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).
  18. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).">Thomsen, M. S., et al. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).
  19. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).">Li, N., Nattie, E., Li, A. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).
  20. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).">Iqbal, J. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).
  21. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).">Cable, D. M., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).
  22. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).">Li, B., et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).
  23. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).">Vandenbon, A., et al. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).
  24. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).">Ivich, A., et al. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).
  25. A periodic table of cell types. Development. 146 (12), dev169854(2019).">Xia, B., Yanai, I. A periodic table of cell types. Development. 146 (12), dev169854(2019).
  26. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).">Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).
  27. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).">Zhu, J., et al. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).
  28. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).">Dries, R., et al. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).
  29. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).">Yuan, Z., et al. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).
  30. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).">Chen, X., et al. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Spatial TranscriptomicsGene Expression PatternsDeepSpaceDB DatabaseTissue Slice AnalysisSpatially Variable GenesDifferential Gene ExpressionTumor MicroenvironmentMouse Brain SampleColorectal Cancer MetastasisBioinformatics Tools

Related Articles