July 18th, 2025
생물학자가 브라우저 기반 도구만을 사용하여 조직 특이적 유전자 증강제를 식별할 수 있도록 코딩 없는 워크플로우를 제시합니다. 당사의 프로토콜은 공개 H3K4me1/H3K27ac 히스톤 마크 및 Hi-C 데이터를 활용하여 프로그래밍 전문 지식이 없는 연구자가 관심 유전자와 관련된 잠재적 조절 요소에 액세스, 분석 및 식별할 수 있도록 합니다.
우리는 유전자가 어떻게 조절되고 적절한 시간과 적절한 장소에서 발현되는지 이해하기 위해 비코딩 게놈을 해독하는 데 관심이 있습니다. 우리는 모든 생물학자가 향상된 발견에 접근할 수 있도록 웹 기반 유전체학 도구를 사용하여 사용자 친화적인 프로토콜을 개발합니다. 인핸서의 위치를 좁히는 데 도움이 되는 다중 모드 데이터의 광범위한 가용성과 오픈 소스 웹 인터페이스를 통해 이 데이터에 쉽게 액세스할 수 있습니다.
이를 통해 연구자의 프로그래밍 전문 지식 없이도 포괄적인 인핸서 식별이 가능합니다. 이 프로토콜은 인핸서 생물학에 대한 배경 지식이 없는 사람이라면 누구나 관심 유전자에 대한 인핸서를 검색하기 위해 공개적으로 사용 가능한 데이터 세트를 탐색할 수 있는 기반을 제공합니다. 우리는 심장 생물학 분야에서 잘 알려진 TBX5를 사례 연구로 사용합니다.
우리의 워크플로는 심장 발달 메커니즘과 선천성 심장병을 밝힐 수 있는 21개의 강화제를 확인했습니다. 우리는 공간 유전체학을 포함한 새로운 데이터 소스로 프로토콜을 확장하는 동시에 생물학자를 위한 사용자 친화적인 추가 도구를 개발할 것입니다. 시작하려면 Ensembl Genome Browser를 엽니다.
관심 있는 종 및 버전과 일치하는 게놈 어셈블리를 선택합니다. 검색 필드에 관심 유전자를 입력하고 이동을 클릭합니다.결과에서 적절한 앙상블 유전자 ID를 클릭합니다.그런 다음 요약" 섹션으로 스크롤하고 세부 영역" 링크를 클릭하여 관심 유전자의 주변 영역을 시각화합니다. 이제 Gene Legend 트랙을 사용하여 관심 유전자 옆에 있는 두 개의 유전자를 검색합니다.
이러한 유전자는 GENCODE 트랙의 기본 유전자 주석 내에서 병합된 Ensembl 및 Havana 주석을 나타내는 시각적 요소로 나타납니다. 유전자 이름 옆에 있는 보다 크거나 작은 기호를 관찰하여 관심 유전자의 방향성을 결정합니다. 이러한 유전자 사이의 유전자 간 영역을 가로질러 커서를 클릭하고 드래그한 다음 팝업 상자에서 영역으로 이동"을 클릭하여 선택한 영역을 봅니다.
트랙 뷰어 상단의 "추가 또는 트랙 제거"를 클릭하여 디스플레이를 사용자 지정합니다. 확대/축소 및 탐색 컨트롤을 사용하여 영역의 향상된 시각화를 위해 보기를 조정합니다. Region in Detail"탭 뷰어에서 사이드바에서 Configure This Page"를 클릭합니다.
Configure Region Image(지역 이미지 구성) 사이드바의 Regulation(규정)에서 Activity by Cell or Tissue(세포별 또는 조직별 활동)를 선택합니다. 세포 또는 조직 검색 표시줄을 사용하여 원하는 조직을 찾아 선택하거나 막대 아래의 알파벳 색인을 사용합니다. 세포 또는 조직" 옵션 옆에 있는 실험"탭을 클릭합니다.
H3K4me1 및 H3K27ac를 인핸서의 마커로, H3K4me3을 프로모터의 마커로 선택하고 트랙 디스플레이 구성을 클릭합니다. 그런 다음 트랙 보기"를 선택하여 인핸서 검출 영역 내에서 H3K4me1로 표시된 영역과 관심 유전자의 업스트림에서 H3K4me3로 표시된 영역을 시각화합니다. H3K4me1 트랙에서 컬러 시각 자료 또는 상자 요소를 클릭하여 정의된 검출 영역 내에 표시된 영역의 게놈 좌표를 검색합니다.
그러면 요소의 게놈 위치를 염기쌍으로 표시하는 Hists 및 Pols 팝업이 열립니다. 또는 트랙을 클릭하고 드래그하여 각 게놈 특징에 대한 관심 영역을 수동으로 정의하여 H3K4me1 또는 H3K27ac 트랙 아래에 그래프 피크를 둘러쌉니다. 그런 다음 게놈 위치 좌표를 텍스트 파일로 복사하고 파일을 BED 형식으로 저장합니다.
4DN 데이터 포털에 액세스합니다. 홈페이지에서 기본 누적 막대의 Y축으로 실험 세트"가 선택되고, X축으로 실험 유형"이 선택되어 있으며, 플롯이 유기체별로 그룹화되어 있는지 확인합니다. X축을 따라 In Situ Hi-C 막대를 찾아 인체 실험 세트를 나타내는 부분을 클릭합니다.
팝업에서 찾아보기"버튼을 클릭하고 심장 근육 근모세포"와 심장 기관 형성과 관련된 관심 유전자인 TBX5를 선택합니다. 관심 있는 조직에 해당하는 관련 생체 샘플의 제목" 열에 있는 링크를 클릭합니다. 그런 다음 처리된 파일" 탭에서 데이터 탐색"을 클릭하여 Hi-C 데이터 세트를 더 자세히 검사합니다.
관심 조직에서 식별된 프로모터의 좌표를 입력하고 히트 맵을 마우스 오른쪽 버튼으로 클릭하여 영역을 수평으로 표시합니다. 이 선을 사용하면 히트 맵에서 프로모터 영역을 시각적으로 추적할 수 있습니다. 필요한 경우 검색 창의 Y 좌표에 있는 상한 및 하한이 관심 영역의 경계와 정렬될 때까지 뷰를 세로로 끌어 뷰를 조정합니다.
원하지 않는 선을 제거하려면 선을 마우스 오른쪽 버튼으로 클릭하고 수평" 또는 수직 규칙을 선택한 다음 시리즈 닫기를 클릭합니다. 실험적으로 검증된 모든 제어 강화제의 좌표를 입력하여 최소 교호작용 값을 기반으로 교호작용 임계값을 계산합니다. 미리 준비된 보기를 사용하여 Ensembl의 프로모터 영역과 함께 문헌의 세 가지 제어 강화제를 표시합니다.
그런 다음 히트 맵 행렬의 오른쪽에 있는 색상 키로 표시된 대로 0이 아닌 가장 낮은 상호 작용 점수를 선택하여 이러한 제어 인핸서를 사용하여 프로모터 인핸서 임계값을 정의합니다. 모든 H3K4me1 관련 인핸서 영역의 게놈 좌표를 입력하고 Hi-C 히트 맵에 세로로 표시합니다. H3K4me3로 표시된 영역의 상호 작용 점수를 상호 작용 임계값과 비교하여 약하게 상호 작용하는 영역을 필터링합니다.
히트 맵에서 더 집중되거나 더 어두운 신호로 나타나는 이 임계값 이상의 상호 작용 빈도를 나타내는 게놈 좌표를 선택하고 BED 형식으로 저장합니다. VISTA Cardiac Enhancer Browser에서 확인된 4개의 심장 강화제 중 3개인 HS2329, mm1282 및 mm370은 웹 기반 강화제 검출 프로토콜에 의해 예측된 영역과 겹쳤습니다. 인핸서 2는 인핸서 검출 프로토콜에 의해 예측된 영역과 실험적으로 검증된 인핸서와 겹쳤습니다.
인핸서 16은 예측된 인핸서 영역 및 이전 실험 데이터 모두와 겹치는 것을 보였습니다. Enhancer Nine은 파이프라인에서 예측된 인핸서와 겹치지 않았지만 부분적인 H3K4me1 신호 농축을 보여주었습니다.
이 기사는 브라우저 기반 도구를 사용하여 조직 특이적 유전자 증강자를 식별하기 위한 코딩 없는 워크플로를 제시합니다. 이 프로토콜은 공개 히스톤 마크와 Hi-C 데이터를 활용하여 프로그래밍 기술이 없는 생물학자들도 이용할 수 있게 합니다.