September 5th, 2025
이 기사에서는 공간 전사체학을 위한 동적 대화형 데이터베이스인 DeepSpaceDB를 사용하기 위한 프로토콜을 소개하고 조직 구성 및 질병 관련 유전자 발현을 탐색하기 위한 분석 워크플로와 예제를 제공합니다.
우리는 DeepSpaceDB라는 공간 전사체학 데이터베이스를 만들고 있습니다. 생물학자와 생물정보학자가 공간 전사체학 데이터에 더 쉽게 접근할 수 있도록 하는 것이 중요합니다. 여러 공간 전사체학 플랫폼이 개발되었습니다.
이를 통해 연구자들은 조직 절편 내의 유전자 발현 패턴을 연구할 수 있습니다. 그러나 이 기술은 비용이 많이 들고 데이터 분석에는 높은 수준의 생물정보학 기술이 필요합니다. 우리는 리듬과 Xenium 공간 플랫폼인 Our Cancer CEX Research를 사용해 왔습니다.
이 플랫폼을 통해 동일한 장기 맥락 내에서 종양, 부종 및 멀리 있는 숙주 조직까지 결정할 수 있습니다. 각 구획의 발현 및 세포 계산의 변화를 개별적으로 해결하는 데 도움이 될 수 있습니다. 생물학자의 주요 과제 중 하나는 실제로 데이터 분석을 수행하는 것입니다.
따라서 현재 점점 더 많은 수의 공간 전사체학 데이터 세트를 완전히 해석할 수 있는 데 필요한 프로그래밍 및 계산 기술이 부족한 연구자가 많이 있습니다. 공간 전사체학 데이터 세트에 보다 쉽게 접근할 수 있도록 함으로써 데이터베이스를 통해 사용자는 새로운 가설을 생성하고 다양한 질병의 기본 메커니즘을 탐색할 수 있습니다. 예를 들어, 종양 미세 환경과 관련된 공간적 유전자 발현 패턴을 평가할 수 있습니다.
시작하려면 데이터베이스 탭을 클릭하고 유기체를 마우스로, 장기를 뇌로, 소스를 Zenodo로 선택합니다. 결과 샘플을 스크롤하여 DSID001557라고 표시된 샘플을 선택합니다. 그런 다음 선택한 샘플을 클릭하고 설명이 100마이크로리터 식염수 NK 세포에서 200만 개의 세포를 읽는지 확인합니다.
품질 탭을 클릭하여 샘플 품질을 평가합니다. 품질 측정 드롭다운 메뉴에서 검출된 유전자, 판독 횟수 및 mito와 같은 옵션을 선택하여 샘플 슬라이스 전체의 각 매개변수 분포를 확인합니다. 이제 이미지 주석 탭으로 이동하여 샘플 슬라이스의 다른 영역을 식별합니다.
샘플 슬라이스 위로 마우스 커서를 이동하여 주석을 표시합니다. 해부학적 특징 및 관련 조건을 표시하는 대규모 언어 모델에서 생성된 그리드 기반 주석을 봅니다. 그런 다음 클러스터 탭으로 이동하여 샘플 슬라이스의 셀 유형 클러스터를 검사합니다.
클러스터의 2차원 임베딩과 샘플 슬라이스의 스폿에 대한 해당 색상 코드 표현을 봅니다. 그런 다음 유전자 탭으로 이동하여 샘플의 공간적으로 가변적인 유전자를 검사합니다. 목록에서 상위 유전자 중 일부를 클릭하여 조직 슬라이스에 걸쳐 발현에 대한 공간 플롯을 생성합니다.
가장 높은 점수를 받은 유전자에 대한 뚜렷한 공간 분포를 명확하게 보여주는 색상으로 구분된 발현 패턴을 관찰하십시오. 그런 다음 경로 탭으로 이동하여 일반적인 생물학적 경로와 관련된 유전자 세트의 활성을 조사합니다. 관련 유전자의 발현 수준을 기반으로 추정된 경로 활성이 있는 공간적으로 가변적인 경로 목록을 봅니다.
목록에서 상위 경로 중 일부를 클릭하여 조직 슬라이스를 가로지르는 활동의 공간 플롯을 생성합니다. 다양한 조직 영역에 걸쳐 경로 활동의 색상으로 구분된 패턴을 관찰합니다. 이제 조직 탐색기 탭으로 이동하여 사용자가 관심 영역을 자유롭게 선택하고 이들 간의 유전자 발현 패턴을 비교할 수 있습니다.
수동 선택이 활성화되어 있는지 확인합니다. 마우스 커서를 사용하여 마우스 뇌 슬라이스의 왼쪽에 있는 해마 영역의 지점을 선택합니다. set one을 클릭한 다음 add to set를 클릭하여 오른쪽 패널에서 선택한 지점을 강조 표시합니다.
그런 다음 세트 2를 클릭하고 마우스 커서를 사용하여 뇌 슬라이스의 시상하부 영역에 있는 지점을 선택합니다. 추가를 클릭하여 오른쪽에서 선택한 지점을 강조 표시합니다. 스팟 선택을 완료한 후 유전자 발현 비교 버튼을 클릭합니다.
이렇게 하면 산점도 표현과 함께 선택한 각 영역의 평균 유전자 발현 값을 표시하는 테이블이 생성됩니다. 산점도의 개별 점 위로 커서를 이동하여 두 영역의 유전자 이름과 평균 발현 값을 확인합니다. 비교 결과를 바탕으로 차등적으로 발현되는 유전자를 식별합니다.
유전자 탭으로 돌아가서 조직 조각 전체에서 이러한 유전자의 발현을 시각화합니다. 데이터베이스 탭을 클릭하고 필터를 사용하여 유기체를 마우스로, 장기를 간으로, 상태를 암으로 선택합니다. 결과 샘플 목록에서 샘플 DSID001005를 선택합니다.
선택한 샘플을 클릭하고 설명에 샘플이 대장암 기원의 전이를 포함하는 마우스 간에서 나온 것임을 나타내는지 확인합니다. 그런 다음 조직 탐색기 탭으로 이동하여 수동 선택 모드를 활성화합니다. 마우스 커서를 사용하여 샘플 DSID001005에서 EpCAM 마커의 양성 발현으로 식별된 종양 영역에 해당하는 스팟을 선택합니다.
세트 1을 클릭합니다. 그런 다음 추가를 선택하여 오른쪽에서 선택한 종양 반점을 강조 표시합니다. 이제 세트 2를 클릭하고 커서를 사용하여 간 샘플의 먼 비종양 영역에서 지점을 선택합니다.
디스플레이 오른쪽에서 선택한 비종양 반점을 강조 표시하도록 설정하려면 추가를 클릭합니다. 유전자 발현 데이터의 추가 분석을 수행하려면 CSV 다운로드 옵션을 클릭하여 샘플의 두 영역에 대한 유전자 발현 데이터의 쉼표로 구분된 값 파일을 생성합니다. DSID001007에 대한 데이터베이스 탐색 단계를 반복한 후, 설명에 대장암 기원의 전이를 포함하는 마우스 간의 또 다른 절편이라고 명시되어 있는지 확인합니다.
다음으로, 종양 및 비종양 영역에서 평균 유전자 발현을 나타내는 두 개의 열을 포함하는 두 개의 CSV 파일(DSID001005 및 DSID001007 샘플에서 각각 하나씩)이 생성되었는지 확인합니다. 두 CSV 파일을 모두 R 프로그래밍 환경에 로드합니다. 데이터 세트를 병합하여 조건당 두 개의 반복실험을 사용하여 다운스트림 분석을 수행합니다.
R에서 limma 패키지를 사용하여 병합 데이터 세트에 대한 차등 유전자 발현 분석을 수행합니다. 두 샘플의 결장직장 전이 영역을 암 그룹에 할당하고 먼 건강한 영역을 대조군에 할당합니다. 결과를 필터링하여 로그 배수 변화가 0.5보다 크고 조정된 P 값이 0.05 미만인 상향 조절된 유전자를 식별합니다.
유사하게, 로그 배수 변화가 마이너스 0.5 미만이고 조정된 P 값이 0.05 미만인 하향 조절된 유전자를 추출합니다. 마우스 뇌 샘플의 왼쪽에서 검출된 유전자 수가 감소하고 판독 횟수가 감소하는 것을 특징으로 하는 뚜렷한 저품질 영역이 관찰되었습니다. 샘플은 스팟당 평균 약 4, 000개의 유전자가 검출된 것으로 나타났으며, 이는 데이터베이스의 다른 샘플의 분포와 잘 일치합니다.
해부학적 차이를 나타내는 뚜렷한 경계가 있는 마우스 뇌 샘플 전체에서 15개의 공간 클러스터가 확인되었습니다. 유전자 NRGN, SLC17A7 및 DDN은 해마 영역에서 강한 발현을 보였습니다. 대조적으로, LY6H 발현은 피질 영역, 특히 슬라이스의 왼쪽 및 오른쪽 하단 바깥쪽 가장자리에 국한되었습니다.
신경펩티드 신호 전달 활성은 샘플 슬라이스의 하부 피질 영역에서 현저하게 증가했습니다. 시냅스 가소성의 조절은 해마 영역, 특히 중간 상부 영역에서 활성화되었습니다. 신경 전달 물질 수송 활동은 해마의 오른쪽 중간 및 상단 부분에서 증가했습니다.
유전자 CLDN7, CLDN4 및 ACTG1은 간 샘플 DSID 001005에서 결장직장 전이가 있는 종양 영역에서 명확한 상향 조절을 나타냈습니다. 대조적으로, CLDN7, CLDN4 및 ACTG1의 발현은 샘플 DSID001007의 먼 건강한 간 조직에서 현저히 낮았습니다.
이 기사는 공간 전사체학 데이터의 접근성을 향상시키기 위해 설계된 대화형 데이터베이스인 DeepSpaceDB를 설명합니다. 다양한 질병과 관련된 조직 구조 및 유전자 발현을 조사할 수 있는 분석 워크플로우를 연구자에게 제공합니다.