Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Картирование вариантов болезни Альцгеймера к их целевым генам с помощью вычислительного анализа конфигурации хроматина

Published: January 9, 2020 doi: 10.3791/60428
* These authors contributed equally

Summary

Мы представляем протокол для определения функциональных последствий некодирующих вариантов, выявленных в ходе общегеномных ассоциативных исследований (GWAS) с использованием трехмерных взаимодействий хроматина.

Abstract

Геном-широкие исследования ассоциации (GWAS) успешно определили сотни геномных локусов, которые связаны с человеческими чертами и болезнями. Однако, поскольку большинство значительных (GWS) локусов, не кодирующих геном, в целом по геному падают на геном, функциональное воздействие многих остаются неизвестными. Трехмерные взаимодействия хроматина, выявленные Hi-C или его производными, могут предоставить полезные инструменты для аннотирования этих локутов, связывая варианты некодирования с их действиями генов. Здесь мы намечаем протокол для картирования gWAS не кодирования вариантов их предполагая генов с использованием болезни Альцгеймера (AD) GWAS и Hi-C наборы данных из человеческой ткани мозга взрослого человека. Путевные причинно-причинные однонуклеотидные полиморфизмы (СНП) определяются с помощью алгоритмов точной картографии. SNPs затем отображаются на их целевых генов с помощью усилитель-промоутер взаимодействий на основе Hi-C. Полученный набор генов представляет гены риска АД, так как они потенциально регулируются вариантами риска АД. Чтобы получить дальнейшее биологическое понимание молекулярных механизмов, лежащих в основе АД, мы характеризуем гены риска АД, используя данные экспрессии мозга развития и профили одноклеточного выражения мозга. Этот протокол может быть расширен до любых наборов данных GWAS и Hi-C для определения целевых генов и молекулярных механизмов, лежащих в основе различных человеческих черт и заболеваний.

Introduction

Геномные ассоциативные исследования (GWAS) сыграли ключевую роль в выявлении генетической основы целого ряда человеческих черт и болезней. Этот крупномасштабный генотипирование обнаружил тысячи геномных вариантов, связанных с фенотипами, начиная от высоты до риска шизофрении. Однако, несмотря на огромный успех GWAS в выявлении заболеваний и черт связанных с локусов, механистическое понимание того, как эти варианты способствуют фенотип был сложным, потому что большинство фенотипов связанных вариантов находятся в не-кодирования фракции генома человека. Поскольку эти варианты часто пересекаются с прогнозируемыми регуляторными элементами, они могут изменить транскрипционный контроль соседнего гена. Тем не менее, не кодирование локусов может влиять на транскрипцию генов на линейных расстояниях, превышающих одну мегабазу, что делает гены, затронутые каждым вариантом трудно определить. Трехмерная (3D) структура хроматина играет важную роль в посредничестве связей между удаленными регуляторными локусами и генными промоторами и может быть использована для определения генов, пораженных фенотипными ассоциированными однонуклеотидными полиморфизмами (СпН).

Регуляция гена опосредовано сложным процессом, который включает в себя активацию усилителя и образование петли хроматина, которые физически подключают усилители к генным промоторикам, к которым транскрипционное оборудование может быть направлено1,2,3. Поскольку петли хроматина часто охватывают несколько сотен килобаз (кб), для расшифровки механизмов регулятивного гена требуются подробные карты 3D-архитектуры хроматина. Для определения архитектуры 3D-хроматина4были изобретены технологии улавливания хроматина. Среди этих технологий Hi-C обеспечивает наиболее полную архитектуру, так как он фиксирует профили взаимодействия 3D хроматина по всему геному. Наборы данных Hi-C были быстро адаптированы для интерпретации некодирующего генома в целом значительные (GWS) loci5,6,7,8,9,10,11,12,13, как он может связать не-кодирования варианты их целевых генов на основе хроматина взаимодействия профилей.

В этой статье мы намечаем протокол для вычислительного прогнозирования целевых генов вариантов риска GWAS с использованием профилей взаимодействия хроматина. Мы применяем этот протокол для картирования AD GWS loci14 к их целевым генам с помощью наборов данных Hi-C во взрослом человеческом мозге9. Полученные гены риска АД характеризуются другими функциональными геномными наборами данных, которые включают профили экспрессомии одной клетки и развития.

Protocol

1. Настройка рабочей станции

  1. Установите R (версия 3.5.0) и RStudio Desktop. Открыть RStudio.
  2. Установите следующие библиотеки в R, введя следующий код в окне консоли в RStudio.
    если (! BiocManager" %in% rownames (установлены.packages()))
    install.packages ("BiocManager", repos'"https://cran.r-project.org")
    BiocManager::install ("GenomicRanges")
    BiocManager::install ("biomaRt")
    BiocManager::install ("WGCNA")
    install.packages ("изменить")
    install.packages ("ggplot2")
    install.packages ("corrplot")
    install.packages ("gProfileR")
    install.packages ("tidyverse")
    install.packages ("ggpubr")
  3. Скачать файлы.
    ПРИМЕЧАНИЕ: В этом протоколе все файлы должны быть загружены в каталог «Кью/работа».
    1. Скачать следующие файлы, нажав на ссылки, представленные в таблице материалов.
      1. Скачать тонкой отображены надежные SNPs для AD (Дополнительная таблица 8 от Jansen и др.14).
        ПРИМЕЧАНИЕ: Перед анализом, открытый лист восемь в 41588_2018_311_MOESM3_ESM.xlsx, удалить первые три строки и сохранить лист, как Supplementary_Table_8_Jansen.txt с вкладкой разделенного формата.
      2. Скачать 10 kb разрешение Hi-C взаимодействия профилей во взрослом мозге из психикода (описывается как Промоутер-anchored_chromatin_loops.bed ниже).
        ПРИМЕЧАНИЕ: Этот файл имеет следующий формат: хромосома, TSS_start, TSS_end, Enhancer_start и Enhancer_end. В случае использования других наборов данных Hi-C этот протокол требует наборов данных Hi-C, обработанных с высоким разрешением (5–20 кб).
      3. Скачать наборы данных выражения одной ячейки из PsychENCODE.
        ПРИМЕЧАНИЕ: Это из нейротипических контрольных образцов.
      4. Скачать наборы данных выражения развития с BrainSpan (описанный как devExpr.rda ниже).
        ПРИМЕЧАНИЕ: 267666527 является молния файл, так распаковать 267666527 для извлечения "columns_metadata.csv", "expression_matrix.csv", и "rows_metadata.csv" для создания devExpr.rda (см. раздел 3).
    2. Скачать экзонические координаты (см. Дополнительные файлы, описанные как Gencode19_exon.bed и Gencode19_promoter.bed ниже) из версии Gencode 19.
      ПРИМЕЧАНИЕ: Промоутеры определяются как 2 кб вверх по течению транскрипции начала сайта (TSS). Эти файлы имеют следующий формат: хромосома, начало, конец и ген.
    3. Скачать файл аннотации гена (см. Дополнительные файлы, описанные как geneAnno.rda ниже) из biomart.
      ПРИМЕЧАНИЕ: Этот файл может быть использован для сопоставления генов на основе идентиверий генов Ensembl и символа Комитета по номенклатуре HUGO Gene Nomenclature Committee (HGNC).

2. Генерация объекта GRanges для достоверных SNPs

  1. Настройка в R, введя следующий код в окне консоли в RStudio.
    библиотека (GenomicRanges)
    варианты (строкиAsFactors и F)
    setwd ("Я/работа") - это путь к рабочему каталогу.
    credSNP - read.delim ("Supplementary_Table_8_Jansen.txt", заголовок
    credSNP и credSNP.credSNP$Credible.Causal »Да»,
  2. Сделайте объект GRanges, введя следующий код в окне консоли в RStudio.
    credranges - GRanges (credSNP$Chr, IRanges (credSNP$bp, credSNP$bp), rsid-credSNP$SNP, P'credSNP$P)
    сохранить (credranges, файла "AD_credibleSNP.rda")

3. Позиционное картирование

ПРИМЕЧАНИЕ: Для каждого шага введите соответствующий код в окне консоли в RStudio.

  1. Настройка в R.
    варианты (строкиAsFactors-F)
    библиотека (GenomicRanges)
    нагрузка ("AD_credibleSNP.rda") (см. 2)
  2. Позиционное отображение промоутер/экзонических SNPs к генам
    1. Нагрузка промоутер и экзонический регион и генерировать объект GRange.
      exon и read.table ("Gencode19_exon.bed")
      exonranges ( GRanges (экзон,1', IRanges (экзон,2,,,3),-гене»exon,4))
      промоутер и читать.таблица ("Gencode19_promoter.bed")
      промоутеры - GRanges (промоутер, IRanges (промоутер, промоутер, промоутер, 3), ген-промоутер.
    2. Перекрытие надежных SNPs с exonic регионов.
      olap - findOverlaps (кредрандж, экзонранжи)
      credexon - credranges (queryHits (olap)
      mcols (кредексон) - cbind (mcols(кредексон), mcols (экзонранги (exonranges(subjectHits(olap))))
    3. Перекрытие надежных SNPs с промоутер регионов.
      olap - findOverlaps (кредрандж, промоутеры)
      credpromoter - credranges (queryHits (olap)
      mcols (кредпромоутер) - cbind (mcols(credpromoter), mcols (промоутеры (промоутеры (олап)))
  3. Ссылка SNPs их целевых генов с использованием хроматина взаимодействий.
    1. Загрузите набор данных Hi-C и создайте объект GRange.
      икс и читать.стол ("Промоутер-anchored_chromatin_loops.bed ", скип-1)
      colnames (hic) c ("chr", "TSS_start", "TSS_end", "Enhancer_start", "Enhancer_end")
      hicranges - GRanges (hic$chr, IRanges (hic$TSS_start, hic$TSS_end), enhancer'hic$Enhancer_start)
      olap - findOverlaps (hicranges, promoterranges)
      hicpromoter - hicranges (queryHits (olap)
      mcols (hicpromoter) - cbind (mcols(hicpromoter), mcols (promoterranges (subjectHits (olap)))
      hicenhancer - GRanges (seqnames (hicpromoter), IRanges (hicpromoter$enhancer, hicpromoter$enhancer-10000), гене-hicpromoter$gene)
    2. Перекрывай надежные SNPs с помощью объекта Hi-C GRange.
      olap - findOverlaps (кредрандж, хикамермер)
      credhic - credranges (queryHits (olap)
      mcols (кредhic) - cbind (mcols(credhic), mcols (hicenhancer -subjectHits (olap)))
  4. Составить гены кандидатов AD, определяемые позиционными профилями отображения и взаимодействия хроматина.
    В результате кандидат генов для AD:
    ADgenes - Уменьшить (союз, список (credhic$ген, credexon$ген, credpromoter$gene))
    Для преобразования Ensembl Gene ID в символ HGNC
    нагрузка ("geneAnno.rda")
    ADhgnc - генанно1 -см(ADgenes, geneAnno1$ensembl_gene_id), "hgnc_symbol"
    Адхгнки - Адхгнкия!»
    сохранить (ADgenes, ADhgnc, файла "ADgenes.rda")
    write.table (ADhgnc, файла"ADgenes.txt", row.names-F, col.names-F, quote-F, sep'"t")

4. Траектории выражения развития

ПРИМЕЧАНИЕ: Для каждого шага введите соответствующий код в окне консоли в RStudio.

  1. Настройка в R.
    библиотека (изменить); библиотека (ggplot2); библиотека (GenomicRanges); библиотека (биомарт)
    библиотека ("WGCNA")
    варианты (строкиAsFactors-F)
  2. Обработка выражения и метаданных.
    datExpr и read.csv ("expression_matrix.csv", заголовок и FALSE)
    datExpr - datExpr,-1
    datMeta и read.csv ("columns_metadata.csv")
    datПрояды и read.csv ("rows_metadata.csv")
    datExpr - datExpr'datProbes$ensembl_gene_id!""""
    datProbes - datProbes'datProbes$ensembl_gene_id!»"
    datExpr.cr' collapseRows (datExpr, rowGroup - datProbes$ensembl_gene_id, rowID' rownames (datExpr))
    datExpr - datExpr.cr$datETcollapsed
    gename - data.frame(datExpr.cr$group2row)
    rownames (datExpr) - gename$group
    1. Укажите этапы развития.
      datMeta$Unit - "Постнатальный"
      idx и grep ("pcw", datMeta$age)
      datMeta$Unit -idx - "Пренатальный"
      idx и grep ("yrs", datMeta$age)
      datMeta$Unit -IDX - "Postnatal"
      datMeta$Unit - фактор (datMeta$Unit, уровень ("Пренатальный", "Постнатальный"))
    2. Выберите корковые области.
      datMeta$Регион - "SubCTX"
      г к ("А1С", "СТК", "ИТК", "ТКК", "ОФК", "DFC", "VFC", "MFC", "M1C", "S1C", "IPC", "M1C-S1C", "PCx", "V1C", "Ocx")
      datMeta$Регион-datMeta$structure_acronym% в% р.
      datExpr - datExpr, который (datMeta$Регион»"CTX")
      datMeta - datMeta, который (datMeta$Регион»"CTX"))
      сохранить(datExpr, datMeta, файла "devExpr.rda")
  3. Извлекайте профили экспрессии развития генов риска АД.
    нагрузка ("ADgenes.rda")
    exprdat - применить (datExpr'match (ADgenes, rownames (datExpr))))
    dAT - data.frame (Регион-датмета $Регион, Unit'datMeta$Unit, Expr'exprdat)
  4. Сравните уровни пренатальной и послеродовой экспрессии генов риска АД.
    pdf (файл"developmental_expression.pdf")
    ggplot (dat,aes (x'Unit, y'Expr, fill-Unit, alpha-Unit)) - ylab ("Normalized expression") - geom_boxplot (outlier.size - NA) - ggtitle ("Brain Expression") - xlab (") - scale_alpha_manual (значения с"0.2, 1)theme_classic) )
    dev.off()

5. Профили выражения типа ячейки

ПРИМЕЧАНИЕ: Для каждого шага введите соответствующий код в окне консоли в RStudio.

  1. Настройка в R.
    варианты (строкиAsFactors-F)
    нагрузка ("ADgenes.rda")
    нагрузка ("geneAnno.rda")
    целевое имя - "AD"
    целевой ген - ADhgnc
    cellexp - читать.таблицу ("DER-20_Single_cell_expression_processed_TPM_backup.tsv", заголовок,fill-T)
    cellexp (1121,1) - cellexp (1120,1)
    cellexp - cellexp-1120,
    rownames (cellexp) - cellexp,1
    cellexp и cellexp,-1
    datExpr - масштаб (cellexp,center-T, масштаб
    datExpr - datExpr,789:ncol (datExpr)
  2. Извлекайте клеточные профили экспрессии генов риска AD.
    exprdat - применить (datExpr'match (таргетген, rownames (datExpr)))),,2,средний, na.rm'T)
    dAT - data.frame (Группа-целевое имя, клеточные имена (exprdat), Expr'exprdat)
    dat$celltype - unlist (lapply (strsplit(dat$cell, split'".))))
    dAT - dat-grep("Ex" В", dat$celltype)
    dat'celltype - gsub ("Dev","Фетал", dat$celltype)
    dat'celltype - фактор (dat$celltype, уровни ("Нейроны","Астроциты","Микроглия", "Эндотелия",
    Олигодендроциты", "ОЗК", "Фетал"))
    pdf (файл"singlecell_expression_ADgenes.pdf")
    ggplot (dat,aes(x'celltype, y'Expr, fill-celltype))
    ylab ("Нормализованное выражение") - xlab ("") - geom_violin() - тема (axis.text.x'element_text (угол No 90, hjust-1)) - тема (legend.position)
    ggtitle (paste0("Клеточные профили экспрессии генов риска АД"))
    dev.off()

6. Анализ аннотации генов генов генов генов риска АД

  1. Скачать и настроить HOMER, введя команды ниже в терминале.
    Мкдир Гомер
    cd Гомер
    wget http://homer.ucsd.edu/homer/configureHomer.pl
    perl ./configureHomer.pl -установить
    perl ./configureHomer.pl -установить человек-p
    perl ./configureHomer.pl -установить человек-o
  2. Выполнить HOMER, введя команды ниже в терминале.
    экспорт ПАГИ-$PATH:/работа/гомер/бин
    findMotifs.pl /работа/ADgenes.txt человека /работа/
  3. Участок обогащенных терминов, введя следующий код в окне консоли в RStudio.
    библиотека (ggpubr)
    варианты (строкиAsFactors-F)
    pdf("GO_enrichment.pdf", ширина 15,высота No8)
    plot_barplot функция (dbname,name,color)
    ввода - read.delim (paste0(dbname,".txt"),header-T)
    входные входные входные ввода, c(-1,-10,-11)
    ввод - уникальный (вход)
    вхотология$FDR - p.adjust (exp (вхотозай $logP))
    input_sig (входные ввода$FDR)
    input_sig$FDR -log10(input_sig$FDR)
    input_sig - input_sig заказ (input_sig$FDR)
    р- ggbarplot (input_sig, х х "Срок", у "FDR", заполнить цвет, цвет и "белый", sort.val - "asc", ylab - выражение (-лог10) (курсив (FDR))), xlab s paste0 (имя,""Термины"), вращайте правду, этикетку no paste0(input_sig$Target.Genes.in.Term,"/","input_sig$Genes.in.Term"), шрифт.)
    р- geom_hline (yintercept - log10 (0,05), линейный тип No 2, цвет и "лайтгрей")
    возвращение (p)
    }
    p1 plot_barplot ("biological_process", "Go Биологический процесс","#00AFBB")
    р2 plot_barplot ("кегг", "KEGG", "#E7B800")
    p3 - plot_barplot ("реактив","Реном", "#FC4E07")
    ggarrange (p1, p2, p3, этикетки с ("А", "B", "C"), ncol 2, nrow 2)
    dev.off()

Representative Results

Описанный здесь процесс был применен к набору из 800 надежных SNPs, которые были определены в первоначальном исследовании14. Позиционное картирование показало, что 103 SNPs пересекались с промоутерами (43 уникальных генов) и 42 SNPs перекрывались экзонами (27 уникальных генов). После позиционного отображения, 84% (669) SNPs остались unannotated. Используя наборы данных Hi-C во взрослом мозге, мы смогли связать дополнительные 208 SNPs с 64 генами на основе физической близости. В общей сложности, мы нанесли на карту 284 AD надежных SNPs до 112 генов риска н.г.(рисунок 1A). Гены риска АД были связаны с белками-предшественниками амилоидов, амилоидно-бета-образованием и иммунным ответом, отражающим известную биологиюАД 15,16,17,18 (Рисунок 1B-D). Профили экспрессии развития генов риска АД показали заметное послеродовое обогащение, что свидетельствует о возрастном повышенном риске АД(рисунок 2А). Наконец, гены риска АД были высоко выражены в микроглии, первичных иммунных клетках в головном мозге(рисунок 2B). Это в согласии с периодическими выводами, что АД имеет сильную иммунную основу и микроглии являются центральным игроком в aD патогенеза14,19,20.

Figure 1
Рисунок 1: Определение целевых генов AD GWS loci. (A) Достоверные SNPs, полученные из топ-29 AD loci были классифицированы в промоутер SNPs, экзонические SNPs, и unannotated некодирования SNPs. Промоутер и exonic SNPs были непосредственно назначены их целевых генов позиционным отображением, в то время как хроматин взаимодействия профилей во взрослом мозге были дополнительно использованы для картографирования SNPs на основе физического взаимодействия. (B-D) Обогащение GO (B), KEGG (C), и Reactome (D) термины в генах риска АД была выполнена с использованием HOMER, как описано в разделе протокола 6. Ось x представляет собой исправленную частоту ложных обнаружений (FDR) -log10 (P-значение). Обогащенные термины с ФДР Злт; 0,1 были построены. Серые вертикальные линии представляют ФДР 0,05. АПП амилоидный белок-предшественник. Нумератор, количество генов риска АД, представленных в каждом семестре; знаменатель, количество генов в каждом семестре. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Figure 2
Рисунок 2: Характеристика генов риска АД. (A) Гены риска АД высоко выражены в послеродовой коре по сравнению с пренатальной коры. (B) Скрипичные участки, изображающие распределение значений экспрессии генов (нормализованное выражение) в различных типах клеток из коры. Эти результаты показывают, что гены риска АД высоко выражены в микроглии, в соответствии с предыдущими исследованиями14. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Дополнительный файл 1. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать).

Дополнительный файл 2. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать).

Дополнительный файл 3. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать).

Discussion

Здесь мы описываем аналитическую структуру, которая может быть использована для функциональной аннотации loci GWS на основе позиционного отображения и взаимодействия хроматина. Этот процесс включает в себя несколько шагов (для более подробной информации см. этот обзор13). Во-первых, учитывая, что профили взаимодействия хроматина являются высоко клеточными конкретными, Hi-C данные, полученные из соответствующих типов клеток / тканей, которые лучше всего захватить основные биологии расстройства должны быть использованы. Учитывая, что АД является нейродегенеративным расстройством, мы использовали данные hi-C взрослого мозга9 для аннотации loci GWS. Во-вторых, каждый locus GWS часто имеет до сотни SNPs которые связаны с чертой из-за disequirium соединения (LD), поэтому важно получить побудительные причинно-следственные связи ('credible') SNPs путем вычисленионно предсказывать причину использование алгоритмов точного отображения21,22 или экспериментальное тестирование регулятивных мероприятий с использованием высокопроизводительных подходов, таких как массово параллельные анализы репортеров (MPRA)23 или самотранскрицирование активного регулятивного секвенирования региона ( STARR-seq)24. Для работы, описанной здесь, мы использовали надежные SNPs сообщили в Jansen и др.14. В-третьих, промоутер и экзонические SNPs аннотируются на основе позиционного отображения. Мы использовали простую позиционную стратегию отображения, в которой SNPs были отображены на гены, когда они перекрываются с промоутерами (определяется как 2 кб вверх по течению транскрипции начала сайта) или экзонов. Тем не менее, этот подход может быть дополнительно разработан путем оценки функциональных последствий экзонических SNPs, таких, как ли SNP вызывает нонсенс опосредоченный распад, неправильное изменение, или ерунда вариации. В-четвертых, профили взаимодействия хроматина от соответствующего типа ткани/клетки могут быть использованы для присвоения SNPs их целевым генам на основе физической близости. Мы использовали профили взаимодействия, закрепленные на промоутерах, но мы можем дополнительно уточнить или расширить профили взаимодействия, принимая во внимание более активную деятельность (руководствуясь ацетилированием гистон h3 K27 или доступностьх хроматина) или экзоническими взаимодействиями во внимание. Одним из важных соображений в этом процессе является использование последовательной построения генома человека. Например, если геномные позиции сводной статистики не основаны на hg19 (т.е. hg18 или hg38), то должна быть получена соответствующая версия эталонного генома или сводная статистика должна быть преобразована в hg19 с помощью подъема25.

Мы применили эту структуру для определения целевых генов для AD GWAS, присвоив 284 SNPs 112 генам риска АД. Используя профили экспрессии развития26 и клеточного типа специфических профилей выражения9, мы затем продемонстрировали, что этот набор генов согласуется с тем, что известно о патологии АД, выявление типов клеток (микроглии), биологические функции (иммунный ответ и амилоидная бета- версия), и повышенный риск по возрасту.

В то время как мы представили рамки, которые разграничают потенциальные гены цели АД и лежащие в его основе биологии, следует отметить, что Hi-C на основе аннотации может быть расширена, чтобы аннотировать любые некодирования вариации. По мере того, как становится доступными все больше данных о секвенировании всего генома и растет наше понимание редкой вариации, не кодирующее, Hi-C станет ключевым ресурсом для интерпретации связанных с болезнью генетических вариантов. Поэтому компендиум ресурсов Hi-C, полученных из нескольких типов тканей и клеток, будет иметь решающее значение для содействия широкому применению этой структуры для получения биологического понимания различных человеческих черт и болезней.

Disclosures

Авторам нечего раскрывать.

Acknowledgments

Эта работа была поддержана грантом NIH R00MH113823 (h.W.) и R35GM128645 (D.H.P.), премией «Молодой следователь» NARSAD (до H.W.) и грантом СПАРК от Фонда Симонса «Инициатива по исследованию аутизма» (SFARI, N.M. и H.W.).

Materials

Name Company Catalog Number Comments
10 kb resolution Hi-C interaction profiles in the adult brain from psychencode http://adult.psychencode.org/
Developmental expression datasets http://www.brainspan.org/
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) https://static-content.springer.com/
HOMER http://homer.ucsd.edu/
R (version 3.5.0) https://www.r-project.org/
RStudio Desktop https://www.rstudio.com/
Single cell expression datasets http://adult.psychencode.org/

DOWNLOAD MATERIALS LIST

References

  1. Dekker, J., Misteli, T. Long-Range Chromatin Interactions. Cold Spring Harbor Perspectives in Biology. 7 (10), a019356 (2015).
  2. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  3. Plank, J. L., Dean, A. Enhancer function: mechanistic and genome-wide insights come together. Molecular Cell. 55 (1), 5-14 (2014).
  4. Dekker, J., Marti-Renom, M. A., Mirny, L. A. Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data. Nature Reviews Genetics. 14 (6), 390-403 (2013).
  5. Martin, P., et al. Capture Hi-C reveals novel candidate genes and complex long-range interactions with related autoimmune risk loci. Nature Communications. 6, 10069 (2015).
  6. Won, H., et al. Chromosome conformation elucidates regulatory relationships in developing human brain. Nature. 538 (7626), 523-527 (2016).
  7. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nature Communications. 6, 6178 (2015).
  8. Chen, J. A. A., et al. Joint genome-wide association study of progressive supranuclear palsy identifies novel susceptibility loci and genetic correlation to neurodegenerative diseases. Molecular Neurodegeneration. 13 (1), 41 (2018).
  9. Wang, D., et al. Comprehensive functional genomic resource and integrative model for the adult brain. Science. 362 (6420), eaat8464 (2018).
  10. Demontis, D., et al. Discovery of the first genome-wide significant risk loci for attention deficit/hyperactivity disorder. Nature Genetics. 51 (1), 63-75 (2019).
  11. Grove, J., et al. Identification of common genetic risk variants for autism spectrum disorder. Nature Genetics. 51 (3), 431-444 (2019).
  12. Lee, P. H., et al. Genome wide meta-analysis identifies genomic relationships, novel loci, and pleiotropic mechanisms across eight psychiatric disorders. bioRxiv. , 528117 (2019).
  13. Mah, W., Won, H. The three-dimensional landscape of the genome in human brain tissue unveils regulatory mechanisms leading to schizophrenia risk. Schizophrenia Research. , In press (2019).
  14. Jansen, I. E., et al. Genome-wide meta-analysis identifies new loci and functional pathways influencing Alzheimer's disease risk. Nature Genetics. 51 (3), 404-413 (2019).
  15. Viola, K. L., Klein, W. L. Amyloid β oligomers in Alzheimer's disease pathogenesis, treatment, and diagnosis. Acta Neuropathologica. 129 (2), 183-206 (2015).
  16. Mroczko, B., Groblewska, M., Litman-Zawadzka, A., Kornhuber, J., Lewczuk, P. Amyloid β oligomers (AβOs) in Alzheimer's disease. Journal of Neural Transmission. 125 (2), 177-191 (2018).
  17. Heneka, M. T., et al. Neuroinflammation in Alzheimer's disease. Lancet Neurology. 14 (4), 388-405 (2015).
  18. Minter, M. R., Taylor, J. M., Crack, P. J. The contribution of neuroinflammation to amyloid toxicity in Alzheimer's disease. Journal of Neurochemistry. 136 (3), 457-474 (2016).
  19. Hansen, D. V., Hanson, J. E., Sheng, M. Microglia in Alzheimer's disease. The Journal of Cell Biology. 217 (2), 459-472 (2018).
  20. Gjoneska, E., et al. Conserved epigenomic signals in mice and humans reveal immune basis of Alzheimer's disease. Nature. 518 (7539), 365-369 (2015).
  21. Benner, C., et al. FINEMAP: efficient variable selection using summary data from genome-wide association studies. Bioinformatics. 32 (10), 1493-1501 (2016).
  22. Hormozdiari, F., Kostem, E., Kang, E. Y., Pasaniuc, B., Eskin, E. Identifying causal variants at loci with multiple signals of association. Genetics. 198 (2), 497-508 (2014).
  23. Tewhey, R., et al. Direct Identification of Hundreds of Expression-Modulating Variants using a Multiplexed Reporter Assay. Cell. 165 (6), 1519-1529 (2016).
  24. Arnold, C. D., et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq. Science. 339 (6123), 1074-1077 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. Kang, H. J., et al. Spatio-temporal transcriptome of the human brain. Nature. 478 (7370), 483-489 (2011).

Tags

Генетика Выпуск 155 Hi-C GWAS варианты некодирования генное картирование функциональная геномика болезнь Альцгеймера
Картирование вариантов болезни Альцгеймера к их целевым генам с помощью вычислительного анализа конфигурации хроматина
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Matoba, N., Quiroga, I. Y.,More

Matoba, N., Quiroga, I. Y., Phanstiel, D. H., Won, H. Mapping Alzheimer's Disease Variants to Their Target Genes Using Computational Analysis of Chromatin Configuration. J. Vis. Exp. (155), e60428, doi:10.3791/60428 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter