Genetics

Kromatin Konfigürasyonunun Hesaplamalı Analizini Kullanarak Alzheimer Hastalığı Varyantlarının Hedef Genlerine Haritalanması

Published: January 9, 2020 doi: 10.3791/60428

Nana Matoba^1,2, Ivana Y. Quiroga³, Douglas H. Phanstiel*^3,4, Hyejung Won*^1,2

¹Department of Genetics, University of North Carolina, ²Neuroscience Center, University of North Carolina, ³Thurston Arthritis Research Center, University of North Carolina, ⁴Department of Cell Biology and Physiology, University of North Carolina

* These authors contributed equally

Summary

Genom çapında ilişkilendirme çalışmaları (GWAS) tarafından tanımlanan kodlamayan varyantların işlevsel etkilerini üç boyutlu kromatin etkileşimleri kullanarak belirlemek için bir protokol sayılmiyoruz.

Abstract

Genom çapında yapılan ilişkilendirme çalışmaları (GWAS), insan özellikleri ve hastalıklarıyla ilişkili yüzlerce genomik lokusu başarıyla tanımlayabilmiştir. Ancak, genom çapında önemli (GWS) loci çoğunluğu kodlamayan genom üzerine düşmek çünkü, birçok fonksiyonel etkisi bilinmemektedir. Hi-C veya türevleri tarafından tanımlanan üç boyutlu kromatin etkileşimleri, kodlamayan varyantları eyleme geçirilebilir genlerine bağlayarak bu loci'ye açıklama eklemek için yararlı araçlar sağlayabilir. Burada, Insan yetişkin beyin dokusundan Alzheimer hastalığı (AD) GWAS ve Hi-C veri setleri kullanarak putatif genleri için GWAS olmayan kodlama varyantları haritaiçin bir protokol anahat. Putatif nedensel tek nükleotid polimorfizmler (SNP' ler) ince haritalama algoritmaları uygulaması ile tanımlanır. SNP'ler daha sonra Hi-C'ye dayalı arttırıcı-promotör etkileşimleri kullanılarak putatif hedef genlerine eşlenirler. Ortaya çıkan gen kümesi, AD risk varyantları tarafından potansiyel olarak düzenlendiğinden, AD risk genlerini temsil eder. AD'nin altında yatan moleküler mekanizmalar hakkında daha fazla biyolojik bilgi edinmek için, gelişimsel beyin ekspresyonu verileri ve beyin tek hücreli ifade profilleri kullanarak AD risk genlerini karakterize ediyoruz. Bu protokol, çeşitli insan özellikleri ve hastalıklarının altında yatan putatif hedef genleri ve moleküler mekanizmaları belirlemek için herhangi bir GWAS ve Hi-C veri kümelerine genişletilebilir.

Introduction

Genom çapında ilişki çalışmaları (GWAS) insan özellikleri ve hastalıkların bir dizi genetik temelini ortaya önemli bir rol oynamıştır. Bu büyük ölçekli genotipleme, yükseklikten şizofreni riskine kadar değişen fenotiplerle ilişkili binlerce genomik varyantı ortaya çıkarmıştır. Ancak, GWAS'ın hastalık ve ilişkili loci özelliğinin belirlenmesindeki muazzam başarısına rağmen, bu varyantların fenotiplere nasıl katkıda bulunduğunun mekanistik bir anlayışı zor olmuştur, çünkü fenotip ilişkili varyantların çoğu kodlamazda bulunur. insan genomunun bir kısmını. Bu varyantlar genellikle öngörülen düzenleyici unsurlarla örtüştüğünden, yakındaki bir genin transkripsiyonel kontrolünü değiştirmeleri olasıdır. Ancak, kodlamayan loci, bir megatabanı aşan doğrusal mesafelerde genlerin transkripsiyonunu etkileyerek her varyanttan etkilenen genlerin tanımlanmasını zorlaştırır. Üç boyutlu (3D) kromatin yapısı uzak düzenleyici loci ve gen organizatörleri arasındaki bağlantıların arabuluculukta önemli bir rol oynar ve tek nükleotit polimorfizmleri (SNP) ile ilişkili fenotipten etkilenen genleri tanımlamak için kullanılabilir.

Gen regülasyonu, güçlendirici aktivasyon ve renklendirici döngü oluşumunu içeren ve güçlendirici lerin transkripsiyon ellerine bağlanabildiği gen organizatörleri^içingüçlendiricileri 1 ,²^,³. Kromatin döngüleri genellikle birkaç yüz kilobazlara (kb) yayıldığı için, gen düzenleme mekanizmalarını çözmek için 3D kromatin mimarisinin ayrıntılı haritaları gereklidir. Birden fazla kromatin konformasyon yakalama teknolojileri 3D kromatin mimarisi⁴tanımlamak için icat edilmiştir. Bu teknolojiler arasında Hi-C, genom çapındaki 3D kromatin etkileşim profillerini yakaladığı için en kapsamlı mimariyi sağlar. Hi-C veri setleri hızlı bir şekilde olmayan kodlama genom çapında önemli yorumlamak için uyarlanmıştır (GWS) loci⁵^,⁶^,⁷^,⁸^,⁹^,¹⁰^,¹¹,¹²^,¹³, kromatin etkileşim profilleridayalı onların putatif hedef genleri için kodlamayan varyantları bağlayabilirsiniz gibi.

Bu makalede, kromatin etkileşim profilleri kullanarak GWAS risk varyantlarının putatif hedef genlerini hesaplamak için bir protokol anahat. Bu protokolü, yetişkin insan beynindeki Hi-C veri kümelerini kullanarak HEDEF GENLER İçİn AD GWS loci¹⁴ haritalamak için uyguluyoruz⁹. Ortaya çıkan AD risk genleri tek hücreli transkripsiyon ve gelişimsel ifade profillerini içeren diğer fonksiyonel genomik veri kümeleri ile karakterizedir.

Protocol

1. İş İstasyonu Kurulumu

R (sürüm 3.5.0) ve RStudio Desktop'ı yükleyin. RStudio'u aç.
Aşağıdaki kodu RStudio'daki konsol penceresine yazarak Aşağıdaki kitaplıkları R'ye yükleyin.
eğer (!" BiocManager" %%satır adlarında(installed.packages()))
install.packages("BiocManager", repos="https://cran.r-project.org")
BiocManager::install("Genomik Aralıklar")
BiocManager::install("biomaRt")
BiocManager::install("WGCNA")
install.packages("yeniden şekillendirme")
install.packages("ggplot2")
install.packages("corrplot")
install.packages("gProfileR")
install.packages("tidyverse")
install.packages("ggpubr")
Dosyaları indirin.
NOT: Bu protokolde, tüm dosyaların ~/iş dizinine indirilmesi gerekmektedir.
1. Malzeme Tablosu'nda verilen linkleri tıklayarak aşağıdaki dosyaları indirin.
  1. AD için ince eşlenmiş güvenilir SNP'leri indirin (Ek Tablo 8, Jansen ve ark.^14).
    NOT: Analizden önce, 41588_2018_311_MOESM3_ESM.xlsx'teki sekiz sayfayı açın, ilk üç satırı kaldırın ve sayfayı sekme ayrılmış biçimli Supplementary_Table_8_Jansen.txt olarak kaydedin.
  2. Psychencode yetişkin beyinde 10 kb çözünürlük Hi-C etkileşim profilleri indirin (aşağıda Promoter-anchored_chromatin_loops.bed olarak tanımlanır).
    NOT: Bu dosya aşağıdaki biçime sahiptir: kromozom, TSS_start, TSS_end, Enhancer_start ve Enhancer_end. Diğer Hi-C veri kümelerinin kullanılması durumunda, bu protokol yüksek çözünürlükte (5−20 kb) işlenmiş Hi-C veri kümelerini gerektirir.
  3. PsychENCODE'dan tek hücreli ifade veri kümelerini indirin.
    NOT: Bunlar nörotipik kontrol örneklerinden dir.
  4. BrainSpan'dan gelişimsel ifade veri kümelerini indirin (aşağıda devExpr.rda olarak tanımlanır).
    NOT: 267666527 sıkıştırılmış bir dosya, bu yüzden "columns_metadata.csv", "expression_matrix.csv" ve "rows_metadata.csv" devExpr.rda oluşturmak için ayıklamak için 267666527 unzip (bölüm 3 bakınız).
2. Gencode sürüm 19'dan exonic koordinatları indirin (bkz. Gencode19_exon.bed ve Gencode19_promoter.bed aşağıda) olarak tanımlanan Ek Dosyalar.
  NOT: Organizatörler transkripsiyon başlangıç sitesi (TSS) 2 kb upstream olarak tanımlanır. Bu dosyalar aşağıdaki biçime sahiptir: kromozom, başlangıç, bitiş ve gen.
3. Biomart'tan gen ek açıklama dosyasını indirin (bkz. ek dosyalar, aşağıdaki geneAnno.rda olarak tanımlanan).
  NOT: Bu dosya, Ensembl gen iD'leri ve HUGO Gen Adlandırma Komitesi (HGNC) sembolüne dayalı genleri eşleştirmek için kullanılabilir.

2. Güvenilir SNP'ler için GRanges Nesne üretimi

RStudio konsol penceresine aşağıdaki kodu yazarak R ayarlayın.
kütüphane (Genomik Ranges)
seçenekler(stringsAsFactors = F)
setwd("~/work") # Bu çalışma dizinine giden yoldur.
credSNP = read.delim("Supplementary_Table_8_Jansen.txt", üstbilgi=T)
credSNP = credSNP[credSNP$Credible.Causal=="Evet",]
RStudio konsol penceresine aşağıdaki kodu yazarak bir GRanges nesnesi olun.
credranges = GRanges(credSNP$Chr, IRanges(credSNP$bp, credSNP$bp), rsid=credSNP$SNP, P=credSNP$P)
kaydet(credranges, file="AD_credibleSNP.rda")

3. Konumsal Haritalama

NOT: Her adım için, RStudio konsol penceresine karşılık gelen kodu yazın.

R'de kuruldu.
seçenekler(stringsAsFactors=F)
kütüphane (Genomik Ranges)
yük("AD_credibleSNP.rda") # (bkz. 2)
Promotör/eksonik SNP'lerin genlere konumsal haritalaması
1. Yük organizatörü ve eksonik bölge ve bir GRange nesnesi oluşturmak.
  exon = read.table("Gencode19_exon.bed")
  exonranges = GRanges(ekson[,1],IRanges(ekson[,2],ekson[,3]), gene=ekson[,4])
  promoter = read.table("Gencode19_promoter.bed")
  promoterranges = GRanges(promoter[,1], IRanges(promotör[,2], promotör[,3]), gene=promoter[,4])
2. Eksonik bölgelerle güvenilir SNP'leri örtüşün.
  olap = findOverlaps(credranges, exonranges)
  credexon = credranges[queryHits(olap)]
  mcols(credexon) = cbind(mcols(credexon), mcols(exonranges[subjectHits(olap))))
3. Güvenilir SNP'leri destekleyici bölgelerle çakıştırın.
  olap = findOverlaps(credranges, promoterranges)
  credpromoter = credranges[queryHits(olap)]
  mcols(credpromoter) = cbind(mcols(credpromoter), mcols(promoterranges[subjectHits(olap))))
KROMatin etkileşimlerini kullanarak KOatif hedef genlerine snp'leri bağla.
1. Hi-C veri kümesini yükleyin ve bir GRange nesnesi oluşturun.
  hic = read.table("Promoter-anchored_chromatin_loops.bed ", skip=1)
  colnames(hic) = c("chr", "TSS_start", "TSS_end", "Enhancer_start", "Enhancer_end")
  hicranges = GRanges (hic$chr, IRanges(hic$TSS_start, hic$TSS_end), enhancer=hic$Enhancer_start)
  olap = findOverlaps(hicranges, promoterranges)
  hicpromoter = hicranges[queryHits(olap)]
  mcols(hicpromoter) = cbind(mcols(hicpromoter), mcols(promotrranges[subjectHits(olap)]))
  hicenhancer = GRanges(seqnames(hicpromoter), IRanges(hicpromoter$arttırıcı, hicpromoter$arttırıcı+10000), gene=hicpromoter$gene)
2. Hi-C GRange nesnesi ile güvenilir SNP'leri çakıştın.
  olap = findOverlaps(credranges, hicenhancer)
  credhic = credranges[queryHits(olap)]
  mcols(credhic) = cbind(mcols(credhic), mcols(hicenhancer[subjectHits(olap)]))
Pozisyonel haritalama ve kromatin etkileşim profilleri ile tanımlanan AD aday genlerini derle.
### AD için ortaya çıkan aday genler:
ADgenes = Reduce(birlik, liste(credhic$gene, credexon$gene, credpromoter$gene))
### Ensembl Gen Kimliğini HGNC simgesine dönüştürmek için
yük("geneAnno.rda")
ADhgnc = geneAnno1[match(ADgenes, geneAnno1$ensembl_gene_id), "hgnc_symbol"]
ADhgnc = ADhgnc[ADhgnc!=""]
kaydet(ADgenes, ADhgnc, dosya="ADgenes.rda")
write.table(ADhgnc, file="ADgenes.txt", row.names=F, col.names=F, quote=F, sep="\t")

4. Gelişimsel İfade Yörüngeleri

NOT: Her adım için, RStudio konsol penceresine karşılık gelen kodu yazın.

R'de kuruldu.
kütüphane(yeniden şekillendirme); kütüphane(ggplot2); kütüphane (Genomik Ranges); kütüphane(biomaRt)
kütüphane("WGCNA")
seçenekler(stringsAsFactors=F)
İfade ve meta verileri işleme.
datExpr = read.csv("expression_matrix.csv", üstbilgi = YANLIŞ)
datExpr = datExpr[,-1]
datMeta = read.csv("columns_metadata.csv")
datProbes = read.csv("rows_metadata.csv")
datExpr = datExpr[datProbes$ensembl_gene_id!="",]
datProbes = datProbes[datProbes$ensembl_gene_id!="",]
datExpr.cr= collapseRows(datExpr, rowGroup = datProbes$ensembl_gene_id, rowID= rownames(datExpr))
datExpr = datExpr.cr$datETcollapsed
gename = data.frame(datExpr.cr$group2row)
rownames(datExpr) = gename$grup
1. Gelişim aşamalarını belirtin.
  datMeta$Birimi = "Doğum sonrası"
  idx = grep("pcw", datMeta$yaş)
  datMeta$Birim[idx] = "Prenatal"
  idx = grep("yıl", datMeta$yaş)
  datMeta$Birim[idx] = "Postnatal"
  datMeta$Birim = faktör(datMeta$Birim, levels=c("Prenatal", "Postnatal"))
2. Kortikal bölgeleri seçin.
  datMeta$Bölge = "SubCTX"
  r = c("A1C", "STC", "ITC", "TCx", "OFC", "DFC", "VFC", "MFC", "M1C", "S1C", "IPC", "M1C-S1C", "PCx", "V1C", "Ocx")
  datMeta$Region[datMeta$%structure_acronym in r] = "CTX"
  datExpr = datExpr[,hangi(datMeta$Region=="CTX")]
  datMeta = datMeta[hangi(datMeta$Region=="CTX"),]
  kaydet(datExpr, datMeta, dosya="devExpr.rda")
AD risk genlerinin gelişimsel ekspresyon profillerini ayıklayın.
yük("ADgenes.rda")
exprdat = apply(datExpr[match(ADgenes, rownames(datExpr))],2,mean,na.rm=T)
dat = data.frame(Region=datMeta$Region, Unit=datMeta$Unit, Expr=exprdat)
AD risk genlerinin prenatal ile postnatal ekspresyon düzeylerini karşılaştırın.
pdf(file="developmental_expression.pdf")
ggplot(dat,aes(x=Birim, y=Expr, fill=Unit, alpha=Unit)) + ylab("Normalleştirilmiş ifade") + geom_boxplot(outlier.size = NA) + ggtitle("Beyin İfadesi") + xlab(") + scale_alpha_manual(values=c(0.2, 1)) + theme_classic() + tema(legend.position="na" )
dev.off()

5. Hücre Tipi İfade Profilleri

NOT: Her adım için, RStudio konsol penceresine karşılık gelen kodu yazın.

R'de kuruldu.
seçenekler(stringsAsFactors=F)
yük("ADgenes.rda")
yük("geneAnno.rda")
targetname = "AD"
targetgene = ADhgnc
cellexp = read.table("DER-20_Single_cell_expression_processed_TPM_backup.tsv",header=T,fill=T)
cellexp[1121,1] = cellexp[1120,1]
cellexp = cellexp[-1120,]
rownames(cellexp) = cellexp[,1]
cellexp = cellexp[,-1]
datExpr = ölçek(cellexp,center=T, ölçek=F)
datExpr = datExpr[,789:ncol(datExpr)]
AD risk genlerinin hücresel ekspresyon profillerini ayıklayın.
exprdat = apply(datExpr[match(targetgene, rownames(datExpr))],2,mean,na.rm=T)
dat = data.frame(Grup=targetname, cell=names(exprdat), Expr=exprdat)
dat$celltype = unlist(lapply(strsplit(dat$cell, split="[.]"),'[',1))
dat = dat[-grep("Örn| In",dat$celltype),]
dat$celltype = gsub("Dev","Fetal",dat$celltype)
dat$celltype = factor(dat$celltype, levels=c("Neurons","Astrosit","Microglia","Endotel",
Oligodendrocytes","OPC","Fetal"))
pdf(file="singlecell_expression_ADgenes.pdf")
ggplot(dat,aes(x=celltype, y=Expr, fill=celltype)) +
ylab("Normalleştirilmiş ifade") + xlab("") + geom_violin() + tema(axis.text.x=element_text(açı = 90, hjust=1)) + tema(legend.position="none") +
ggtitle(paste0("AD risk genlerinin hücresel ifade profilleri"))
dev.off()

6. AD Risk Genlerinin Gen Ek Gösterimi Zenginleştirme Analizi

Terminaldeki aşağıdaki komutları yazarak HOMER'ı indirin ve yapılandırın.
mkdir homer
cd homer
wget http://homer.ucsd.edu/homer/configureHomer.pl
perl ./configureHomer.pl -yükle
perl ./configureHomer.pl -insan-p yükleyin
perl ./configureHomer.pl -insan-o yükleyin
Terminaldeki aşağıdaki komutları yazarak HOMER'ı çalıştırın.
dışa aktarma YOLU=$PATH:~/iş/homer/bin
findMotifs.pl ~/iş/ADgenes.txt insan ~/iş/
RStudio konsol penceresine aşağıdaki kodu yazarak zenginleştirilmiş terimleri çizin.
kütüphane(ggpubr)
seçenekler(stringsAsFactors=F)
pdf("GO_enrichment.pdf",genişlik=15,yükseklik=8)
plot_barplot = fonksiyon(dbname,name,color){
input = read.delim(paste0(dbname,".txt"), üstbilgi=T)
input = giriş[,c(-1,-10,-11)]
input = benzersiz(giriş)
input$FDR = p.adjust(exp(input$logP))
input_sig = giriş[giriş$FDR < 0,1,]
input_sig$FDR = -log10(input_sig$FDR)
input_sig = input_sig[order(input_sig$FDR)]
p = ggbarplot(input_sig, x = "Terim", y = "FDR", dolgu = renk, renk = "beyaz", sort.val = "asc", ylab = expression(-log[10](italic(FDR)), xlab = paste0(name,"Terms"), rotate = TRUE, label = paste0(input_sig$Target.Genes.in.Term,"/",input_sig$Genes.in.Term), font.label = list(color = "white", size = 9), lab.vjust = 0.5, lab.hjust =
p = p+geom_hline(yintercept = -log10(0.05), linetype = 2, renk = "açık gri")
dönüş(p)
}
p1 = plot_barplot("biological_process","GO Biyolojik Süreç","#00AFBB")
p2 = plot_barplot("kegg","KEGG","#E7B800")
p3 = plot_barplot("reactome","Reactome"," #FC4E07")
ggarrange(p1, p2, p3, etiketler = c("A", "B", "C"), ncol = 2, nrow = 2)
dev.off()

Representative Results

Burada açıklanan süreç orijinal çalışma¹⁴tarafından tanımlanan 800 güvenilir SNPs bir dizi uygulanmıştır. Konumsal haritalama, 103 SNP'nin organizatörlerle (43 benzersiz gen) ve 42 SNP'nin eksonlarla (27 benzersiz gen) örtüştüldettiğini ortaya çıkardı. Konumsal haritalamadan sonra% 84 (669) SNP'ler unannotated kaldı. Yetişkin beynindeki Hi-C veri kümelerini kullanarak, fiziksel yakınlığa dayalı 64 genle 208 snps daha bağlayabildik. Toplamda, 284 AD güvenilir SNP'leri 112 AD risk genine eşledik(Şekil 1A). AD risk genleri amiloid öncüproteinleri ile ilişkili, amiloid-beta oluşumu, ve immün yanıt, AD bilinen biyoloji yansıtan¹⁵^,¹⁶^,¹⁷^,¹⁸ ( Şekil1B-D). AD risk genlerinin gelişimsel ekspresyon profillerinde belirgin postnatal zenginleştirme, yaşla ilişkili yüksek AD riskinin göstergesi olarak gösterilmektedir(Şekil 2A). Son olarak, AD risk genleri yüksek mikroglia ifade edildi, beyinde primer bağışıklık hücreleri(Şekil 2B). Bu AD güçlü bir bağışıklık temeli vardır ve mikroglia AD patogenezi^14,^19,²⁰merkezi oyuncu olduğunu tekrarlayan bulgular ile anlaşma içindedir.

Şekil 1: AD GWS loci putatif hedef genlerinin tanımlanması. (A) En iyi 29 AD loci'den türetilen güvenilir SNP'ler, promotör SNP'ler ve kodlamayan snp'ler olarak sınıflandırıldı. (B-D) GO (B), KEGG (C) ve Reactome (D)terimlerinin AD risk genlerinde zenginleştirme protokolü bölüm 6'da açıklandığı gibi HOMEROS kullanılarak yapılmıştır. X ekseni yanlış bulma oranını (FDR) düzeltilmiş -log10 (P-değeri) temsil eder. FDR < 0.1 ile zenginleştirilmiş terimler çizildi. Gri dikey çizgiler FDR = 0,05'i temsil ediyor. APP amiloid öncüprotein. Numerator, her dönemde temsil edilen AD risk genlerinin sayısı; payda, her dönemde genlerin sayısı. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Şekil 2: AD risk genlerinin karakterizasyonu. (A) AD risk genleri prenatal kortekse göre postnatal kortekste yüksek oranda ifade edilir. (B) Korteksten farklı hücre tiplerinde gen ekspresyonu değerlerinin (normalleştirilmiş ifade) dağılımlarını gösteren keman çizimleri. Bu sonuçlar, AD risk genlerinin yüksek oranda mikroglia ile ifade olduğunu göstermektedir, önceki çalışmalarla tutarlı¹⁴. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Ek Dosya 1. Bu dosyayı görüntülemek için lütfen buraya tıklayın (İndirmek için sağ tıklatın).

Ek Dosya 2. Bu dosyayı görüntülemek için lütfen buraya tıklayın (İndirmek için sağ tıklatın).

Ek Dosya 3. Bu dosyayı görüntülemek için lütfen buraya tıklayın (İndirmek için sağ tıklatın).

Discussion

Burada, konumsal haritalama ve kromatin etkileşimlerine dayalı olarak GWS loci'ni işlevsel olarak açıklama yapmak için kullanılabilecek bir analitik çerçeve yi tanımlıyoruz. Bu işlem birden çok adım içerir (daha fazla ayrıntı için bu gözden geçirmeye bakın^13). İlk olarak, kromatin etkileşim profilleri nin hücre tipine özgü olduğu göz önüne alındığında, bozukluğun altta yatan biyolojisini en iyi yakalayan uygun hücre/doku tiplerinden elde edilen Hi-C verilerinin kullanılması gerekmektedir. AD nörodejeneratif bir bozukluk olduğu göz önüne alındığında, biz GWS loci açıklamalı yetişkin beyin Hi-C veri⁹ kullanılır. İkinci olarak, her GWS lokusu genellikle bağlantı disequilibrium (LD) nedeniyle özellik ile ilişkili snps yüzlerce kadar vardır, bu yüzden hesaplamalı tahmin ederek putatif nedensel ('güvenilir') SNP'ler elde etmek önemlidir ince haritalama algoritmaları^21,²² veya deneysel olarak büyük paralel muhabir tahlilleri (MPRA)²³ veya kendi kendine transkripsiyon aktif düzenleyici bölge sıralaması gibi yüksek iş gücü yaklaşımları kullanarak düzenleyici faaliyetleri test yoluyla nedensellik ( STARR-seq)²⁴. Burada açıklanan iş için, biz Jansen ve ark¹⁴bildirilen güvenilir SNPs kullanılır. Üçüncü olarak, organizatör ve eksonik SNP'ler konumsal haritalama dayalı açıklamalı. SNP'lerin organizatörlerle (transkripsiyon başlangıç sitesinin 2 kb yukarı sıcağı olarak tanımlanan) veya eksonlar ile çakıştığında genlerle eşlendiği basit bir konumsal haritalama stratejisi kullandık. Ancak, bu yaklaşım, SNP'nin saçma sapan çürümeye, yanlış algılama değişimine veya saçma varyasyona neden olup olmadığı gibi eksonik SNP'lerin işlevsel sonuçlarını değerlendirerek daha da ayrıntılı bir şekilde geliştirilebilir. Dördüncü olarak, uygun doku/hücre tipinden kromatin etkileşim profilleri, fiziksel yakınlığa dayalı putatif hedef genlerine SNP'ler atamak için kullanılabilir. Biz organizatörler için demirlemiş etkileşim profilleri kullanılır, ancak daha fazla rafine veya artırıcı faaliyetleri alarak etkileşim profilleri genişletmek (histon H3 K27 asetilasyon veya kromatin erişilebilirlik rehberliğinde) veya eksonik etkileşimleri dikkate. Bu süreçte dikkat edilmesi gereken önemli bir husus tutarlı insan genomu yapısı kullanmaktır. Örneğin, özet istatistiklerin genomik konumları hg19'a (yani hg18 veya hg38) dayanmıyorsa, referans genomun uygun bir sürümü elde edilmeli veya özet istatistiklerin liftover²⁵kullanılarak hg19'a dönüştürülmesi gerekmektedir.

Bu çerçeveyi, AD GWAS için putatif hedef genleri belirlemek için uyguladık ve 112 AD risk genine 284 SNP atadık. Gelişimsel ekspresyon profilleri²⁶ ve hücre tipi spesifik ekspresyon profilleri⁹kullanarak, daha sonra bu gen kümesinin AD patolojisi hakkında bilinenlerle tutarlı olduğunu, hücre tiplerini (mikroglia), biyolojik fonksiyonları (immün yanıt ve amiloid beta) ve yaşa göre yüksek risk ortaya koyduğunu gösterdik.

AD'nin potansiyel hedef genlerini ve onun temel biyolojisini gösteren bir çerçeve sunarken, Hi-C tabanlı ek açıklamanın kodlamayan varyasyonları açıklamaek üzere genişletilebildiği unutulmamalıdır. Daha fazla tam genom dizileme verisi kullanılabilir hale geldikçe ve kodlamayan nadir varyasyon hakkındaki anlayışımız arttıkça, Hi-C hastalıkla ilişkili genetik varyantların yorumlanması için önemli bir kaynak sağlayacaktır. Bu nedenle, birden fazla doku ve hücre tipinden elde edilen Hi-C kaynaklarının bir özeti, çeşitli insan özellikleri ve hastalıkları hakkında biyolojik bilgiler toplamak için bu çerçevenin geniş bir şekilde uygulanmasını kolaylaştırmak açısından kritik öneme sahiptir.

Disclosures

Yazarların açıklayacak bir şeyi yok.

Acknowledgments

Bu çalışma NIH hibe R00MH113823 (H.W.) ve R35GM128645 (D.H.P.' ye), NARSAD Genç Araştırmacı Ödülü (H.W.) ve Simons Vakfı Otizm Araştırma Girişimi'nden (SFARI, N.M. ve H.W.) SPARK hibesi ile desteklendi.

Materials

Name	Company	Catalog Number	Comments
10 kb resolution Hi-C interaction profiles in the adult brain from psychencode			http://adult.psychencode.org/
Developmental expression datasets			http://www.brainspan.org/
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.¹⁴)			https://static-content.springer.com/
HOMER			http://homer.ucsd.edu/
R (version 3.5.0)			https://www.r-project.org/
RStudio Desktop			https://www.rstudio.com/
Single cell expression datasets			http://adult.psychencode.org/