우리는 3차원 염색질 상호 작용을 사용하여 게놈 전체 협회 연구 (GWAS)에 의해 확인된 비 코딩 이체의 기능적인 연루를 확인하기 위하여 프로토콜을 제시합니다.
게놈 전체 협회 연구 (GWAS)는 성공적으로 인간의 특성 및 질병과 관련된 게놈 loci의 수백을 확인했습니다. 그러나, 대부분의 게놈 전체 유의한(GWS) loci가 비코딩 게놈상에 빠지기 때문에, 많은 사람들의 기능적 영향은 알려지지 않았다. Hi-C 또는 그 유도체에 의해 확인된 3차원 염색질 상호 작용은 그들의 실행 가능한 유전자에 비 코딩 이체를 연결하여 이 loci를 비기술하는 유용한 공구를 제공할 수 있습니다. 여기에서, 우리는 인간 적인 성인 두뇌 조직에서 알츠하이머 병 (AD) GWAS 및 Hi-C 데이터 세트를 사용하여 그들의 putative 유전자에 GWAS 비 코딩 이체를 지도로 하는 프로토콜을 개략적으로 설명합니다. 가부장적 인플루엔자 단일 뉴클레오티드 다형성(SNPs)은 미세 매핑 알고리즘의 적용에 의해 식별됩니다. SNPs는 Hi-C에 근거를 둔 증강 프로모터 상호 작용을 사용하여 그들의 putative 표적 유전자에 그 때 매핑됩니다. 결과 유전자 세트는 AD 위험 이체에 의해 잠재적으로 통제되기 때문에 AD 위험 유전자를 나타냅니다. AD의 근본적인 분자 메커니즘에 대한 생물학적 통찰력을 더 얻기 위해, 우리는 발달 뇌 발현 데이터와 뇌 단세포 발현 프로필을 사용하여 AD 위험 유전자를 특성화합니다. 이 프로토콜은 다양한 인간의 특성과 질병의 근간이 되는 가양성 표적 유전자 및 분자 메커니즘을 식별하기 위해 모든 GWAS 및 Hi-C 데이터 세트로 확장될 수 있습니다.
게놈 전체 협회 연구 (GWAS)는 인간 적인 특성 및 질병의 범위의 유전 기초를 드러내는에 있는 중추적인 역할을 했습니다. 이 대규모 유전형질은 고도에서 정신 분열증 리스크에 구역 수색하는 표현형과 관련되었던 게놈 이체의 수천을 밝혔습니다. 그러나, 질병과 특성 관련 loci를 확인하는 GWAS의 엄청난 성공에도 불구하고, 대부분의 표현형 관련 이체가 비 코딩에 상주하기 때문에 이 변이체가 표현형에 기여하는 방법의 기계론적인 이해는 도전적이었습니다 인간 게놈의 분수. 이 이체는 수시로 예측한 규정하는 요소와 겹치기 때문에, 가까운 유전자의 전사 통제를 바꾸기 위하여 확률이 높습니다. 그러나, 비 코딩 loci는 1메가베이스를 초과하는 선형 거리에서 유전자의 전사에 영향을 미칠 수 있어 각 변이체에 의해 영향을 받는 유전자를 식별하기 어렵게 만듭니다. 3차원 (3D) 염색질 구조는 먼 조절 성 궤체와 유전자 프로모터 사이의 연결을 중재하는 데 중요한 역할을하며 표현형 관련 단일 뉴클레오티드 다형성 (SNPs)에 의해 영향을받는 유전자를 식별하는 데 사용할 수 있습니다.
유전자 조절은 인핸서 활성화 및 염색질 루프 형성을 수반하는 복잡한 과정에 의해 매개되며, 이는 전사 기계가1,2,3으로지시될 수 있는 유전자 프로모터에 인핸서를 물리적으로 연결한다. 염색질 루프는 종종 수백 킬로베이스 (kb)에 걸쳐 있기 때문에, 3D 크로마틴 아키텍처의 상세한지도는 유전자 조절 메커니즘을 해독하는 데 필요합니다. 3D 크로마틴 아키텍처4를식별하기 위해 여러 크로마틴 형태 캡처 기술이 개발되었습니다. 이러한 기술 중 Hi-C는 게놈 전체의 3D 크로마틴 상호작용 프로파일을 캡처하므로 가장 포괄적인 아키텍처를 제공합니다. Hi-C 데이터세트는 염색질 상호작용 프로파일에 기초한 비코딩 변이체를 그들의 가양성 표적 유전자에 연결할 수 있기 때문에 비코딩 게놈 전체 유의한(GWS) loci5,6,7,8,9,11,11,13을해석하기 위하여 신속하게 적응되었습니다.
이 문서에서는, 우리는 염색질 상호 작용 단면도를 사용하여 GWAS 리스크 이체의 putative 표적 유전자를 계산적으로 예측하는 프로토콜을 개략적으로 설명합니다. 우리는 성인 인간의 두뇌에 있는 Hi-C 데이터 세트를 사용하여 그들의 표적 유전자에 AD GWS loci14를 지도로 이프로토콜을 적용합니다 9. 생성된 AD 위험 유전자는 단일 세포 전사체 및 발달 발현 프로파일을 포함하는 다른 기능적 게놈 데이터 세트를 특징으로 한다.
여기서는 위치 매핑 및 크로마틴 상호 작용을 기반으로 GWS loci에 기능적으로 추가하는 데 사용할 수 있는 분석 프레임워크를 설명합니다. 이 프로세스에는 여러 단계가 포함됩니다(자세한 내용은 이 검토13참조). 첫째, 염색질 상호 작용 단면도가 높게 세포 모형 특정인 것을 감안할 때, 무질서의 근본적인 생물학을 가장 잘 붙잡는 적당한 세포/조직 모형에서 장악된 Hi-C 데이터는 이용될 필요가 있습니다. AD가 신경 퇴행성 질환이라는 점을 감안할 때, 우리는 성인 뇌 Hi-C 데이터9를 사용하여 GWS 상소에 추가했습니다. 둘째, 각 GWS 궤적에는 종종 연결 불균형 (LD)으로 인해 특성과 관련된 수백 개의 SP가 있으므로 인과 관계를 계산적으로 예측하여 가산 (‘신뢰할 수있는’) SNP를 얻는 것이 중요합니다. 정밀 매핑알고리즘(21,22)의 사용을 통한 정밀도 또는 실험적으로 테스트된 규제 활동은 대규모 병렬 리포터 분석(MPRA)23 또는 자체 전사 활성 규제 영역 시퀀싱과 같은 높은 처리량 접근법을 사용하여 STARR-seq)24. 여기에 설명된 작업을 위해 Jansen 등14에보고된 신뢰할 수 있는 SNPs를 사용했습니다. 셋째, 프로모터 및 엑소닉 SP는 위치 매핑에 기초하여 비고를 낸다. 우리는 SP가 프로모터 (전사 시작 사이트의 2 kb 상류로 정의) 또는 엑소와 겹칠 때 유전자에 매핑되는 간단한 위치 매핑 전략을 사용했습니다. 그러나, 이러한 접근법은 SNP가 말도 안되는 매개 부패, 오해의 변형 또는 말도 안되는 변화를 유도하는지 여부와 같은 엑소닉 SNP의 기능적 결과를 평가함으로써 더욱 정교해질 수 있다. 넷째, 적절한 조직/세포 유형으로부터의 염색질 상호작용 프로파일은 물리적 근접성에 기초하여 그들의 가양성 표적 유전자에 SNPs를 할당하는데 사용될 수 있다. 우리는 프로모터에 고정 된 상호 작용 프로필을 사용, 하지만 우리는 더 구체화 하거나 증강 활동을 복용 하 여 상호 작용 프로필을 확장할 수 있습니다 (histone H3 K27 아 세 틸 화 또는 크로 마틴 접근성에 의해 유도) 또는 외향성 상호 작용 계정. 이 프로세스에서 중요한 고려 사항 중 하나는 일관된 인간 게놈 빌드를 사용하는 것입니다. 예를 들어, 요약 통계의 게놈 위치가 hg19(즉, hg18 또는 hg38)를 기반으로 하지 않는 경우, 적절한 버전의 기준 게놈을 획득하거나 요약 통계를 리프트오버25를사용하여 hg19로 변환해야 합니다.
우리는 AD GWAS를 위한 putative 표적 유전자를 확인하기 위하여 이 틀을 적용했습니다, 112AD 리스크 유전자에 284의 SNPs를 할당하. 발달 발현 단면도26 및 세포 형 특이적 발현 프로파일9를사용하여, 우리는 이 유전자 세트가 AD 병리학에 대해 알려진 것과 일치한다는 것을 입증하고, 세포 유형 (microglia), 생물학적 기능 (면역 반응 및 아밀로이드 베타) 및 나이에 따른 위험도상승하였다.
우리는 AD와 그것의 근본적인 생물학의 잠재적인 표적 유전자를 기술하는 틀을 제시하는 동안, Hi-C 기지를 둔 항추가 어떤 비 코딩 변이든지 추가하기 위하여 확장될 수 있다는 것을 주의합니다. 더 많은 전체 게놈 시퀀싱 데이터가 사용 가능해지고 비코딩 희귀 변형에 대한 이해가 증가함에 따라 Hi-C는 질병 관련 유전 적 변이체의 해석을위한 핵심 리소스를 제공 할 것입니다. 따라서 여러 조직 및 세포 유형에서 얻은 Hi-C 자원의 보상은 다양한 인간의 특성과 질병에 대한 생물학적 통찰력을 얻기 위해이 프레임 워크의 광범위한 응용 프로그램을 촉진하는 데 중요합니다.
The authors have nothing to disclose.
이 작품은 NIH 교부금 R00MH113823 (H.W.에) 및 R35GM128645 (D.H.P.), 나르사드 젊은 구도자 상 (H.W.에), 그리고 사이먼스 재단 자폐증 연구 이니셔티브 (SFARI, N.M. 및 H.W.)에서 SPARK 교부금에 의해 지원되었다.
10 kb resolution Hi-C interaction profiles in the adult brain from psychencode | http://adult.psychencode.org/ | ||
Developmental expression datasets | http://www.brainspan.org/ | ||
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) | https://static-content.springer.com/ | ||
HOMER | http://homer.ucsd.edu/ | ||
R (version 3.5.0) | https://www.r-project.org/ | ||
RStudio Desktop | https://www.rstudio.com/ | ||
Single cell expression datasets | http://adult.psychencode.org/ |