이 기사에서는 공간 전사체학을 위한 동적 대화형 데이터베이스인 DeepSpaceDB를 사용하기 위한 프로토콜을 소개하고 조직 구성 및 질병 관련 유전자 발현을 탐색하기 위한 분석 워크플로와 예제를 제공합니다.
Method Article
이 기사에서는 공간 전사체학을 위한 동적 대화형 데이터베이스인 DeepSpaceDB를 사용하기 위한 프로토콜을 소개하고 조직 구성 및 질병 관련 유전자 발현을 탐색하기 위한 분석 워크플로와 예제를 제공합니다.
공간 전사체학은 위치 정보를 보존하면서 조직 샘플에서 유전자 발현 패턴을 캡처할 수 있는 빠르게 발전하는 기술입니다. 이는 생물학적 연구 및 생물정보학에 광범위하게 응용되어 연구자들이 다양한 조직, 상태 및 질병에 걸쳐 유전자 발현의 공간적 변화를 조사하고 추적할 수 있도록 합니다. 공간 전사체학 데이터 분석이 주목을 받으면서 공개적으로 사용 가능한 데이터 세트의 수가 증가하고 있습니다. 그러나 공간 전사체학은 상당한 기술적, 재정적 제약이 있는 고도로 전문화된 실험 기술로 남아 있습니다. 공간 데이터에 대한 접근을 용이하게 하기 위해 우리는 최근 공간 전사체학 데이터 탐색을 위한 포괄적이고 동적인 데이터베이스인 DeepSpaceDB를 개발했습니다. 이 문서에서는 몇 가지 예제를 통해 데이터베이스의 구성 요소와 탐색을 간략하게 설명하는 자세한 워크플로를 제공합니다. 먼저, 마우스 뇌 샘플의 분석을 시연하여 품질 지표, 공간적으로 가변적인 유전자 및 경로, 해마와 시상하부 사이의 유전자 발현 변이를 탐색합니다. 다음으로, 면역 활성과 관련된 차등적으로 발현되는 유전자의 식별 및 주석은 쥐 간에서 결장직장 기원의 전이 영역과 건강한 조직의 먼 영역을 비교하여 추가로 탐구됩니다. 고급 도구와 대화형 기능을 갖춘 DeepSpaceDB는 공간 전사체학 연구를 위한 귀중한 리소스 역할을 하여 조직 조직 및 질병 생물학에 대한 심층적인 탐구를 가능하게 합니다.
공간 전사체학은 연구자들이 조직 절편 내부의 공간 정보를 유지하면서 유전자 발현을 분석할 수 있도록 하는 새로운 기술로, 전례 없는 해상도로 조직 구조, 세포 이질성 및 미세 환경 영향을 연구할 수 있습니다 1,2. 그러나 이 기술의 잠재력에도 불구하고 접근과 분석은 여전히 제한적이며, 공간 전사체학은 많은 실험실에서 비용이 많이 들며, 데이터 분석에는 고급 생물정보학 기술이 필요합니다.
공개 데이터베이스를 개발하는 것은 이 새로운 실험 양식에 대한 접근을 넓히는 한 가지 방법입니다. 여러 공간 전사체학 데이터베이스가 생성되었습니다. 첫 번째는 SpatialDB였지만 제한된 수의 샘플만 포함되어 있으며 업데이트되지 않았습니다3. SODB, SOAR 및 STOmicsDB 데이터베이스에는 다양한 플랫폼의 많은 수의 샘플이 포함되어 있으며 데이터 저장소 4,5,6으로서 큰 역할을 합니다. 그러나 분석 도구는 제한적이고 상호 작용이 부족합니다. 이 문제를 해결하기 위해 우리는 최근 기술적 장벽을 낮추고 접근성을 확장하도록 설계된 공개적으로 사용 가능한 공간 전사체학 데이터 세트의 선별되고 사용자 친화적인 데이터베이스인 DeepSpaceDB를 개발했습니다7. 이 기사에서는 데이터베이스 검색, 샘플 품질 검사, 시각화 도구 및 조직 슬라이스 내에서 대화식으로 선택된 영역의 비교를 포함하여 이 데이터베이스의 여러 도구를 설명합니다. 실제 맥락에서 이러한 도구를 입증하기 위해 마우스 뇌 샘플과 결장직장 전이가 있는 쥐 간의 분석이라는 두 가지 대표적인 예를 사용하여 자세한 프로토콜을 제시합니다. 이러한 도구를 통해 DeepSpaceDB는 더 광범위한 연구자가 자체 데이터나 사내 생물정보학 역량 없이도 공간 전사체학을 활용할 수 있도록 지원합니다. 데이터 수집, 품질 관리, 처리 워크플로우, DeepSpaceDB에 포함된 데이터 및 기능에 대한 포괄적인 설명은 Honcharuk etal 7에 의해 자세히 제공됩니다.
1. 실시예 1: 마우스 뇌 샘플의 분석
참고: 이 섹션에서는 DeepSpaceDB에서 사용할 수 있는 다양한 기능과 플롯을 탐색하면서 마우스 뇌 샘플의 분석을 설명합니다(데이터베이스에 대한 링크는 재료 표에서 사용할 수 있음).
2. 실시예 2: 마우스 간에서 대장 기원의 전이성 영역에서 면역 활성과 관련된 차등발현 유전자의 동정 및 주석
참고: 샘플 내 비교는 현재 섹션에서 살펴봅니다. 이것은 두 개의 서로 다른 샘플을 기반으로 결장직장 기원의 전이성 영역과 간 절편 내 건강한 조직의 먼 영역 사이에 차등적으로 발현되는 유전자의 식별 및 주석을 통해 설명됩니다. 면역 활동과 관련된 특정 조절 장애 유전자의 공간적 발현은 조직 절편에서 추가로 시각화됩니다.
실시예 1은 쥐 뇌 샘플의 분석을 시연하여 판독 횟수, 공간적으로 가변적인 유전자 및 경로, 해마와 피질 사이의 유전자 발현 변이와 같은 매개변수를 검증했습니다. 첫째, 마우스 뇌 샘플 DSID001557의 품질을 여러 품질 측정에 대해 평가했습니다: "검출된 유전자"(그림 1A), "읽기 수"(그림 1B) 및 "Mito"(미토콘드리아 판독 비율; 그림 1C). 이는 검출된 유전자 수가 적고 판독 횟수가 낮기 때문에 뇌 샘플의 왼쪽에서 품질이 낮은 영역을 명확하게 강조했습니다. 다른 모든 표본에 대한 표본의 상대적 품질을 이해하기 위해 데이터베이스에서 표본의 상대적 품질 탭을 클릭하면 개수 대 아니오의 그래프가 표시되었습니다. 스팟당 검출된 유전자의 수(평균). 분석 중인 샘플의 경우 스팟당 3500-4000개의 유전자가 검출되었습니다(그림 1D). 샘플의 해부학적 특징은 이미지 주석 탭을 사용하여 추가로 분석되었습니다. 일반적으로 이러한 주석은 조직 이미지를 더 작은 부분으로 자르고 LLM에게 관찰가능한 특징을 설명하도록 요청하여 생성되었습니다8. 이는 샘플의 해석을 돕기 위한 대략적인 표시이며 주의해서 해석해야 합니다. 샘플의 하위 집합(특히 인간 유방암 샘플)의 경우 인간 전문가의 주석도 사용할 수 있습니다. 그러나 일상적인 진단에 사용되는 이미지에 비해 Visium H&E 이미지의 품질이 낮다는 점을 고려하여 제공된 주석은 연구 목적으로만 사용됩니다. 샘플 DSID001557의 경우 해마 영역, 피질층, 신경교증이 있는 조밀한 세포층 등과 같은 마우스 뇌의 다양한 영역에 대한 주석이 표시된 슬라이스 위로 커서를 이동합니다. 샘플 슬라이스의 기본 해부학적 특징을 이해함으로써 세포 유형 클러스터, 공간적으로 가변적인 유전자 및 경로와 같은 세부 특징을 추가로 탐구했습니다. 마우스 뇌 샘플에는 총 15개의 클러스터가 있었으며, 이는 샘플 슬라이스 전체에 걸쳐 색상 코딩으로 표시되었습니다(그림 1E). 샘플과 관련된 가장 높은 공간적으로 가변적인 유전자 중 일부는 Nrgn, Slc17a7, Ly6h 및 Ddn 입니다(그림 2). Nrgn 은 시냅스 가소성 및 공간 학습을 매개하는 데 있어 Nrgn 암호화 단백질(뉴로그라닌)의 역할을 나타내는 문헌적 증거에 따라 해마 영역에서 높은 발현을 나타냈습니다15. 글루타민성 뉴런의 신경전달에 중요한 소포성 글루타메이트 수송체를 코딩하는 유전자인 Slc17a7(16)과 시냅스 후 세포골격의 구조를 조절하는 단백질을 암호화하는 유전자인 Ddn(17)도 해마 영역에서 높게 발현되었습니다. 대조적으로, 유전자 Ly6h 의 발현은 피질 세포의 막에서 Ly6h 의 제한적인 시냅스 역할을 나타내는 문헌에 따라 피질 영역에 국한되었습니다18. 유사한 방식으로 경로의 활동이 샘플 슬라이스 전반에 걸쳐 시각화되었습니다(그림 3). 공간적으로 가변적인 경로는 해마 영역의 시냅스 가소성 및 신경 전달 물질 활성의 조절과 피질 영역의 신경펩티드 신호 전달과 함께 공간적으로 가변 유전자의 기능적 역할과 일치하여 활성화되는 것으로 관찰되었습니다.
마지막으로, 마우스 뇌 샘플의 해마 영역과 시상하부 사이에 차등적으로 발현된 유전자를 식별하기 위해 Tissue Explorer 탭을 활용했습니다. 관심 영역과 관련된 지점은 이미지 주석의 지침에 따라 선택되었습니다(그림 4A). 생성된 산점도에서 확인된 차등적으로 발현된 유전자 중 일부는 Pmch 및 Ttr과 같은 몇 가지 다른 유전자 외에도 공간적으로 가변적인 상위 유전자(Nrgn, Slc17a7, Ddn) 중 하나였습니다. 이러한 유전자의 발현은 샘플 슬라이스에서 시각화되었습니다. Pmch는 외측 시상하부 영역에서 특이적으로 과발현되었습니다(그림 4B; 그림 4A에서 녹색 선택 영역과 비교). 이 유전자는 멜라닌 농축 호르몬의 전구체를 암호화하며 에너지 항상성의 유지에 관여합니다19. 대조적으로, 유전자 Ttr은 학습 및 공간 기억20에서의 기능적 역할에 따라 해마 영역(그림 4C; 그림 4A에서 빨간색 선택 영역과 비교)에서 특이적으로 발현되었습니다. 이 데이터베이스를 사용하여 서로 다른 마우스 뇌 영역 간의 샘플 내 비교를 수행함으로써 공간 유전자 발현 및 경로 활동을 기반으로 영역별 기능적 특징을 강조할 수 있었습니다.
실시예 2에서, 데이터베이스는 간에서 결장직장 전이와 관련된 면역 시그니처의 식별을 위해 활용되었다. 결장직장 전이가 있는 종양 영역과 멀리 있는 건강한 간 조직 사이에서 DSID001005(그림 5A-C) 및 DSID001007(그림 5D-F)의 두 샘플에 대한 적절한 지점 선택을 통해 샘플 내 비교를 수행했습니다. 데이터는 R을 사용하여 조건당 2회 반복으로 재분석되었습니다. 결장직장 전이가 있는 종양 영역과 건강한 간 조직 사이에서 수행된 차등 발현 분석은 선택된 매개변수를 기반으로 138개 유전자의 하향 조절과 115개 유전자의 상향 조절을 나타냈습니다(그림 6A,B). KEGG 경로 분석은 약물 대사 및 화학적 발암과 같은 하향 조절된 유전자의 경로의 농축을 입증한 반면(그림 6C), 상향 조절된 유전자는 무엇보다도 백혈구 경-내피 이동, 초점 접착 및 세포 주기에 해당하는 시그니처를 나타냈습니다(그림 6D). 면역 활성에 대한 백혈구 경-내피 이동의 관련성에 초점을 맞춰 해당 범주에서 검출된 상위 유전자를 식별하고 DeepSpaceDB에서 공간 발현을 관찰했습니다. 흥미롭게도, 백혈구 경-내피 이동 범주에서 검출된 유전자 Cldn7, Cldn4 및 Actg1은 건강한 간 조직이 있는 먼 영역이 아닌 샘플의 종양 영역(Epcam+ 부위)에서 상향 조절을 나타냈습니다(그림 7). 이것은 백혈구의 활발한 모집과 함께 간의 종양 부위에서 구동되는 면역 활동의 특성에 대한 통찰력을 제공했습니다. 요약하자면, DeepSpaceDB를 사용한 샘플 내 분석을 통해 다양한 생물학적 통찰력을 추출할 수 있습니다. 대화형 도구와 재분석 워크플로를 통해 공간 전사체 데이터를 비교함으로써 연구자들은 조직 특이적 유전자 발현 및 기능적 이질성에 관한 가설을 생성하고 검증할 수 있습니다.

그림 1: 샘플의 품질 측정. (A) 검출된 유전자의 수, (B) 판독 횟수 및 (C) 지점당 미토콘드리아 판독 백분율. (D) 데이터베이스의 다른 모든 샘플의 분포와 비교하여 이 샘플에서 스팟당 검출된 유전자의 평균 수. (E) 조직 절편을 가로질러 군집을 발견합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 2: 상위 공간적으로 가변적인 유전자의 발현. (a) nrgn, (b) slc17a7, (c) ly6h 및 (d) ddn. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 3: 상위 공간적으로 가변적인 경로의 활동. (A) 신경펩티드 신호 전달, (B) 시냅스 가소성 조절, (C) 신경 전달 물질 수송. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 4: 마우스 뇌의 선택된 두 영역 간의 유전자 발현 패턴 비교. (A) 샘플 내 비교를 위한 시상하부 및 해마 영역의 스팟 선택. 선택한 영역 1은 빨간색으로 표시되고 영역 2는 녹색으로 표시됩니다. 시상하부와 해마 부위 사이의 차등적으로 발현된 유전자 (B) Pmch 및 (C) Ttr 의 공간적 발현 패턴. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 5: 두 개의 전이성 마우스 간 샘플의 특성. 샘플 DSID001005의 경우: (A) Epcam 마커 발현, (B) 스팟 클러스터 및 (C) 샘플 내 비교를 위해 암성 및 원격 영역에서 선택된 영역. 샘플 DSID001007의 경우: (D) Epcam 마커 발현, (E) 스폿 클러스터 및 (F) 샘플 내 비교를 위해 암성 및 원격 영역에서 선택된 영역. 두 샘플 모두에서 종양 반점은 빨간색으로 표시된 영역에 있고 비종양 반점은 녹색으로 표시된 영역에 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 6: 재분석 결과. (A) 재분석에 사용된 워크플로의 개략적 요약. (B) 암성 영역과 먼 영역 사이에서 차등적으로 발현되는 유전자를 나타내는 화산 플롯. (C) 상향 조절된 유전자와 (D) 하향 조절된 유전자의 KEGG 경로 농축. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 7: 유전자의 공간적 발현. (A) Cldn7, (B) Cldn4 및 (C) 조직 절편 DSID001005의 Actg1 . 유전자의 공간적 발현. (D) Cldn7, (E) Cldn4 및 (F) 조직 절편 DSID001007의 Actg1 . 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
보충 파일 1-4: 간 전이에 대한 데이터 파일 및 R 스크립트 예. 이 파일을 다운로드하려면 여기를 클릭하십시오.
여기에서는 DeepSpaceDB에서 공간 전사체학 데이터의 탐색, 검색 및 분석을 설명하는 두 가지 포괄적인 프로토콜을 소개했습니다. 대부분의 공간 오믹스 데이터베이스는 다양한 플랫폼 3,4,5,6을 사용하여 생성된 많은 수의 샘플에서 데이터 수집에 중점을 두는 반면, DeepSpaceDB는 사용자가 공간 전사체 특징을 심층적이고 효율적으로 탐색할 수 있는 대화형 도구 개발에 중점을 둡니다. 이러한 수준의 기능을 활성화하기 위해 현재 릴리스는 Visium 플랫폼에만 중점을 둡니다. 고해상도 플랫폼의 출현으로 우리는 그에 따라 DeepSpaceDB를 확장하여 이러한 데이터를 사용자 친화적인 방식으로 처리하고 통합하기 위한 새로운 전략을 개발할 계획입니다.
DeepSpaceDB를 사용하면 샘플 품질 지표(예: 유전자 수, 판독 깊이)를 평가하고 데이터 세트 간에 비교할 수 있습니다. 데이터베이스에는 할당된 레이블이 있는 전체 데이터베이스에 대한 비지도 클러스터링, 조직학적 이미지에서 구조적 및 병리학적 특징에 대한 LLM 기반 감지, 증가하는 샘플 하위 집합에 대한 전문가 조직학 주석 등 다층 주석이 포함되어 있습니다. 또한 사용자는 샘플 내부 또는 샘플 간에 관심 영역을 대화식으로 선택하여 유전자 발현을 비교할 수 있으므로 종양 대 간질 또는 질병 영역과 건강한 영역과 같은 영역 간의 공간적 대비를 연구할 수 있습니다. 이러한 기능은 일반적으로 다른 데이터베이스 3,4,5,6에서 부족하다. 공간적으로 가변적인 유전자 및 경로, 세포 유형 예측, 클러스터링 결과 등의 다른 기능도 사용할 수 있습니다. 종합하면, 이 데이터베이스는 공간 전사체학 데이터를 탐색하는 데 대한 장벽을 크게 낮춥니다. 다양한 조직과 상태의 샘플에 자유롭게 액세스할 수 있으며 사용자는 간단한 포인트 앤 클릭 상호 작용을 통해 샘플을 탐색할 수 있습니다. 고급 생물정보학 전문 지식이 필요하지 않습니다. 즉, 발현 패턴을 정확하게 해석하고 Tissue Explorer 도구에서 관심 영역을 선택하려면 마커 유전자 및 조직 구조에 대한 사전 지식이 필요할 수 있습니다.
여기에 소개되지는 않았지만 사용자는 자신의 샘플을 업로드하고 동일한 도구를 많이 적용하여 분석할 수도 있습니다. 데이터베이스는 또한 2개의 서로 다른 조직 절편 간의 샘플 간 비교를 지원하여 예를 들어 병든 조직과 건강한 대조군 조직 간의 비교를 허용합니다. 마지막으로, 모든 파생 분석 출력과 함께 원시 및 처리된 데이터를 다운로드할 수 있으며 다운스트림 워크플로 및 사용자 지정 분석을 지원합니다. 이러한 도구 중 일부에 대해 데이터베이스의 튜토리얼 페이지에서 짧은 튜토리얼 비디오를 사용할 수 있습니다.
데이터베이스에는 여전히 개선이 필요한 측면이 있습니다. 하나는 조직 절편 내의 각 위치에서 세포 유형 및 세포 유형 구성을 정확하게 예측하는 것입니다. DeepSpaceDB(버전 1.0)의 현재 버전에서는 RCTD(Robust Cell Type Decomposition)21라는 방법을 사용하여 각 Visium 스팟의 세포 유형 구성을 예측했습니다. RCTD는 최근 벤치마크 연구에서 비교적 좋은 성과를 거두었습니다22. RCTD에 의한 예측은 암 보유 마우스의 간에 대한 최근 연구에서도 실험적으로 검증될 수 있습니다23. 그러나 세포 유형 예측의 정확도에 대한 포괄적인 평가는 수행되지 않았습니다. 관련 문제는 RCTD 및 기타 세포 유형 예측 방법에는 주석이 달린 세포 유형이 있는 참조 데이터 세트가 필요하다는 것입니다. 일반적으로 각 공간 위치에서의 세포 유형(또는 세포 유형 구성)은 이 참조 데이터 세트의 유전자 발현 패턴과의 비교를 통해 예측됩니다. 그러나 각 Visium 샘플에 적합한 참조를 선택하는 것이 항상 간단한 것은 아닙니다. 참고 문헌은 주요 세포 유형을 결여할 수 있거나, 반대로, 조직 슬라이스(24)에 존재하지 않는 세포 유형을 포함할 수 있다. 더욱이, 하나의 세포 유형 내에서 세포는 비활성 면역 세포와 활성화된 면역 세포와 같이 크게 다른 상태에 있을 수 있습니다25. 참조 데이터 세트에 존재하는 세포 상태가 환자의 질병 모델에서 얻는 경우가 많은 공간 샘플의 세포 상태와 반드시 일치하는 것은 아닙니다. 두 문제 모두 부정확한 예측을 초래할 수 있습니다. 우리는 앞으로 이 문제를 해결하기를 희망합니다.
공간 전사체학 분야가 계속 빠르게 발전함에 따라 세포-세포 상호 작용, 공간 도메인 및 공간적으로 가변적인 유전자 예측을 포함하여 공간 데이터의 다양한 측면을 분석하기 위한 점점 더 많은 계산 도구가 개발되고 있습니다(예: 26,27,28 참조). 이러한 확산은 이 분야의 역동성을 반영하는 동시에 도구를 큐레이팅하고 이 데이터베이스에 통합하는 데 어려움을 안겨주기도 합니다. 가장 강력하고 광범위하게 적용 가능한 방법이 포함되도록 하기 위해 데이터 세트 및 분석 작업 전반에 걸쳐 도구 성능을 평가하는 체계적인 벤치마크 연구가 절실히 필요합니다 22,29,30. 이러한 노력은 데이터베이스에 포함할 도구의 정보에 입각한 선택 및 우선 순위 지정을 안내하는 데 필수적입니다.
다른 공간 전사체학 데이터베이스는 다양한 플랫폼의 많은 샘플을 수집하려고 시도하는 반면, DeepSpaceDB에서는 몇 가지 인기 있는 플랫폼에 초점을 맞추고 사용자가 데이터를 더 자세히 쉽게 탐색할 수 있는 대화형 직관적 도구를 구현하는 다른 전략을 사용하기로 결정했습니다. 우리 데이터베이스에는 현재 버전 1.0의 Visium 샘플만 포함되어 있지만 향후 업데이트에는 다른 플랫폼의 샘플도 포함될 계획입니다.
저자는 공개할 것이 없습니다.
저자는 비서 도움을 준 Y. Harada에게 감사를 표하고 싶습니다. 본 연구는 JST NBDC(보조금 번호 JPMJND2303, A.V.)와 AMED(보조금 번호 JP24gm2010003, A.V.)의 지원을 받았습니다. 이 작업은 JSPS KAKENHI(20H03451, 24K02236 및 24KK0147; SK), JST 포레스트(JPMJFR2062; SK), JST 문샷(JPMJMS2011-61; SK)를 참조하십시오. 자금 제공자는 연구 설계, 데이터 수집 및 분석, 출판 결정 또는 원고 준비에 아무런 역할도 하지 않았습니다.
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| cluster프로파일러 | R 패키지 - 버전 4.14.6 | ||
| 딥스페이스DB | 버전 > 1.0 | 데이터베이스에 대한 링크: www.deepspacedb.com | |
| 리마 | R 패키지 - 버전 3.62.2 | ||
| R | 버전 4.4.2 | ||
| RS투디오 | 포지션 | 버전 2024.12 |
Request permission to reuse the text or figures of this JoVE article
Request Permission