Kartlägga Alzheimers sjukdom varianter till sina målgener med hjälp av Computational analys av kromatin konfiguration

* These authors contributed equally
Genetics
 

Summary

Vi presenterar ett protokoll för att identifiera funktionella implikationer av icke-kodningsvarianter identifierade genom genomomfattande Associations studier (GWAS) med hjälp av tredimensionella kromatininteraktioner.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Matoba, N., Quiroga, I. Y., Phanstiel, D. H., Won, H. Mapping Alzheimer's Disease Variants to Their Target Genes Using Computational Analysis of Chromatin Configuration. J. Vis. Exp. (155), e60428, doi:10.3791/60428 (2020).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Genomomfattande Associations studier (GWAS) har framgångsrikt identifierat hundratals genomiska loci som är förknippade med mänskliga egenskaper och sjukdom. Men eftersom majoriteten av arvsmassan betydande (GWS) loci falla på icke-kodning arvsmassan, den funktionella effekten av många förbli okända. Tredimensionella kromatin interaktioner som identifierats av Hi-C eller dess derivat kan ge användbara verktyg för att kommentera dessa loci genom att länka icke-kodning varianter till deras angriplande gener. Här, vi skissera en protokoll till karta GWAS inte-kodande varianten till deras förmodade generna användande Alzheimers ' sjukdom (annons) GWAS och Hej-C datamängder från mänsklig vuxen hjärna vävnad. Den förmodade kausala ennukleotidpolymorfismer (SNP) identifieras genom tillämpning av finkartningsalgoritmer. SNPs mappas sedan till sina förmodade målgener med hjälp av förstärkare-promotor interaktioner baserade på HI-C. Den resulterande gen uppsättningen representerar AD-riskgener, eftersom de kan regleras av annonsriskvarianter. För att samla ytterligare biologiska insikter om molekylära mekanismer bakom AD, karaktäriserar vi annonsriskgener med hjälp av utvecklingsmässiga hjärn uttrycks data och hjärnans encellig uttrycks profiler. Detta protokoll kan utökas till alla GWAS-och Hi-C-dataset för att identifiera förmodade målgener och molekylära mekanismer bakom olika mänskliga egenskaper och sjukdomar.

Introduction

Genomomfattande Associations studier (GWAS) har spelat en central roll i att avslöja den genetiska grunden för en rad mänskliga egenskaper och sjukdomar. Denna storskaliga genotypning har avslöjat tusentals genomiska varianter i samband med fenotyper som sträcker sig från höjd till schizofreni risk. Men trots den enorma framgången med GWAS att identifiera sjukdom och drag associerade loci, en mekanistisk förståelse för hur dessa varianter bidrar till fenotyp har varit utmanande eftersom de flesta fenotyp associerade varianter bor i icke-kodning del av människans arvsmassa. Eftersom dessa varianter ofta överlappar med förutsedda regulatoriska element, kommer de sannolikt att förändra transkriptionell kontroll av en närliggande gen. Icke-kodning loci kan dock påverka transkription av gener på linjära avstånd som överskrider en megabas, vilket gör att gener som påverkas av varje variant svårt att identifiera. Tredimensionell (3D) kromatinstruktur spelar en viktig roll i att förmedla kopplingar mellan avlägset reglerande loci och gen initiativtagare och kan användas för att identifiera gener som påverkas av fenotyp associerade single-nucleotide polymorfismer (SNP).

Genreglering förmedlas av en komplicerad process, som innebär förstärkare aktivering och kromatin loop formation som fysiskt ansluta förstärkare till gen initiativtagare som transkriptionella maskiner kan riktas1,2,3. Eftersom kromatin slingor ofta spänner över flera hundra kilobaser (KB), detaljerade kartor över 3D kromatin arkitektur krävs för att tyda genreglerande mekanismer. Flera kromatin conformations Capture Technologies har uppfunnits för att identifiera 3D-kromatin arkitektur4. Bland dessa tekniker, Hi-C ger den mest omfattande arkitekturen, eftersom den fångar genomhela 3D kromatin interaktions profiler. Hi-C-datauppsättningar har snabbt anpassats för att tolka icke-kodande genombrett signifikanta (GWS) loci5,6,7,8,9,10,11,12,13, eftersom det kan länka icke-kodning varianter till deras förmodade målgener baserat på kromatin interaktions profiler.

I denna artikel, vi skissera ett protokoll till beräkningsmässigt förutsäga förmodade målgener av GWAS riskvarianter med hjälp av kromatin interaktions profiler. Vi tillämpar detta protokoll för att kartlägga AD GWS loci14 till deras målgener med hjälp av Hi-C-dataset i den vuxna mänskliga hjärnan9. De resulterande AD-riskgenerna kännetecknas av andra funktionella genomiska dataset som inkluderar encellig transcriptomic och utvecklingsmässiga uttrycks profiler.

Protocol

1. inställning av arbetsstation

  1. Installera R (version 3.5.0) och RStudio Desktop. Öppna RStudio.
  2. Installera följande bibliotek i R genom att skriva följande kod i konsolfönstret i RStudio.
    om (! " BiocManager "% i% rownames (installerat. packages ()))
    install. packages ("BiocManager", Repos = "https://cran.r-Project.org")
    BiocManager:: installera ("GenomicRanges")
    BiocManager:: installera ("biomaRt")
    BiocManager:: installera ("WGCNA")
    install. packages ("omforma")
    install. packages ("ggplot2")
    install. packages ("corrplot")
    install. packages ("gProfileR")
    install. packages ("tidyverse")
    install. packages ("ggpubr")
  3. Ladda ner filer.
    ANMÄRKNINGAR: i detta protokoll måste alla filer laddas ner till ~/Work Directory.
    1. Hämta följande filer genom att klicka på länkarna i tabell över material.
      1. Hämta finmappade trovärdiga SNPs för AD (kompletterande tabell 8 från Jansen et al.14).
        ANMÄRKNINGAR: före analys, öppna ark åtta i 41588_2018_311_MOESM3_ESM. xlsx, ta bort de första tre raderna och spara arket som Supplementary_Table_8_Jansen. txt med tabbavgränsat format.
      2. Ladda ner 10 kB upplösning Hi-C interaktions profiler i den vuxna hjärnan från psychencode (beskrivs som promotor-anchored_chromatin_loops. Bed nedan).
        ANMÄRKNINGAR: den här filen har följande format: kromosom, TSS_start, TSS_end, Enhancer_start och Enhancer_end. Om andra Hi-C-datauppsättningar används kräver detta protokoll Hi-C-datauppsättningar som bearbetas med hög upplösning (5 − 20 KB).
      3. Data överför enkel cell yttranden datamängder från PsychENCODE.
        Anmärkning: dessa är från Neurotypisk kontrollprover.
      4. Hämta utvecklingsmässiga uttrycks datauppsättningar från BrainSpan (beskrivs som Devexpr. rda nedan).
        Anmärkning: 267666527 är en zippad fil, så packa upp 267666527 för att extrahera "columns_metadata. csv", "expression_matrix. csv" och "rows_metadata. csv" för att generera devExpr. rda (se avsnitt 3).
    2. Ladda ner exonic koordinater (se kompletterande filer, beskrivna som Gencode19_exon. Bed och Gencode19_promoter. Bed nedan) från GenCode version 19.
      Anmärkning: projektansvariga definieras som 2 KB uppströms för transkription startplats (TSS). Dessa filer har följande format: kromosom, start,, och Gene.
    3. Ladda ner Gene Annotation fil (se kompletterande filer, beskrivs som geneanno. rda nedan) från biomart.
      Obs: denna fil kan användas för att matcha gener baserade på Ensembl gen IDs och HUGO Gene nomenklatur Committee (HGNC) symbol.

2. generering av ett GRanges objekt för trovärdiga SNPs

  1. Ställ in i R genom att skriva följande kod i konsolfönstret i RStudio.
    bibliotek (GenomicRanges)
    alternativ (stringsAsFactors = F)
    setwd ("~/Work") # Detta är sökvägen till arbetskatalogen.
    credSNP = Läs. delim ("Supplementary_Table_8_Jansen. txt", header = T)
    credSNP = credSNP [credSNP $ trovärdig. causal = = "Ja",]
  2. Gör ett GRanges-objekt genom att skriva följande kod i konsolfönstret i RStudio.
    credranges = GRanges (credSNP $ Chr, IRanges (credSNP $ BP, credSNP $ BP), rsid = credSNP $ SNP, P = credSNP $ P)
    Spara (credranges, fil = "AD_credibleSNP. rda")

3. positionell mappning

ANMÄRKNINGAR: för varje steg, skriv motsvarande kod i konsolfönstret i RStudio.

  1. Ställ in i R.
    alternativ (stringsAsFactors = F)
    bibliotek (GenomicRanges)
    load ("AD_credibleSNP. rda") # (se 2)
  2. Positionell kartläggning av promotorn/exonic SNPs till gener
    1. Ladda promotor och exonic region och generera ett GRange-objekt.
      exon = Läs. Table ("Gencode19_exon. Bed")
      exonranges = GRanges (exon [, 1], IRanges (exon [, 2], exon [, 3]), gen = exon [, 4])
      promotor = Läs. tabell ("Gencode19_promoter. Bed")
      promoterranges = GRanges (promotor [, 1], IRanges (promotor [, 2], promotor [, 3]), Gene = promotor [, 4])
    2. Överlappa trovärdiga SNP med exoniska områden.
      OLAP = findOverlaps (credranges, exonranges)
      credexon = credranges [queryHits (OLAP)]
      mcols (credexon) = cbind (mcols (credexon), mcols (exonranges [subjectHits (OLAP)]))
    3. Överlappa trovärdiga SNPs med promotorn regioner.
      OLAP = findOverlaps (credranges, promoterranges)
      credpromotor = credranges [queryHits (OLAP)]
      mcols (Credpromotor) = cbind (mcols (credpromotorn), mcols (promoterranges [subjectHits (OLAP)]))
  3. Länka SNPs till deras förmodade målgener med hjälp av kromatin interaktioner.
    1. Ladda Hi-C dataset och generera ett GRange-objekt.
      HIC = Läs. Table ("promotorn-anchored_chromatin_loops. Bed ", Skip = 1)
      colnames (HIC) = c ("Chr", "TSS_start", "TSS_end", "Enhancer_start", "Enhancer_end")
      hicranges = GRanges (HIC $ Chr, IRanges (HIC $ TSS_start, HIC $ TSS_end), Enhancer = HIC $ Enhancer_start)
      OLAP = findOverlaps (hicranges, promoterranges)
      hicpromotor = hicranges [queryHits (OLAP)]
      mcols (hicpromotorn) = cbind (mcols (Hicpromotor), mcols (promoterranges [subjectHits (OLAP)]))
      hicenhancer = GRanges (seqnames (hicpromotor), IRanges (hicpromotor $ Enhancer, hicpromotor $ Enhancer + 10000), genen = hicpromotor $-genen)
    2. Överlappa trovärdiga SNPs med Hi-C GRange-objekt.
      OLAP = findOverlaps (credranges, hicenhancer)
      credhic = credranges [queryHits (OLAP)]
      mcols (credhic) = cbind (mcols (credhic), mcols (hicenhancer [subjectHits (OLAP)]))
  4. Sammanställa AD Candidate gener definieras av positionella kartläggning och kromatin interaktions profiler.
    # # # De resulterande kandidatgener för AD:
    ADgenes = förminska (Union, lista (den credhic $ genen, credexon $ genen, credpromotorn $ gen))
    # # # för att konvertera Ensembl gen ID till HGNC symbol
    Ladda ("geneAnno. rda")
    Ansluta = geneAnno1 [match (ADgenes, geneAnno1 $ ensembl_gene_id), "hgnc_symbol"]
    Hålla fast GNC = följa [följa] = ""]
    Spara (ADgenes, följa, File = "ADgenes. rda")
    skriva. Table (följa, arkivera = "ADgenes. txt", rad. names = F, Col. namnen = F, citera = F, sep = "\t")

4. utvecklingsrelaterade uttrycks banor

ANMÄRKNINGAR: för varje steg, skriv motsvarande kod i konsolfönstret i RStudio.

  1. Ställ in i R.
    bibliotek (omforma); bibliotek (ggplot2); bibliotek (GenomicRanges); bibliotek (biomaRt)
    bibliotek ("WGCNA")
    alternativ (stringsAsFactors = F)
  2. Process uttryck och meta-data.
    datExpr = Read. csv ("expression_matrix. csv", sidhuvud = falskt)
    datExpr = datExpr [,-1]
    datMeta = Read. csv ("columns_metadata. csv")
    datProbes = Läs. csv ("rows_metadata. csv")
    datExpr = datExpr [datProbes $ ensembl_gene_id! = "",]
    datProbes = Datsonder [datProbes $ ensembl_gene_id! = "",]
    datExpr.cr = Kollapserows (datExpr, rowGroup = Datsonder $ ensembl_gene_id, rowID = rownames (datExpr))
    datExpr = datExpr. CR $ Datetkollapsade
    gename = data. Frame (datExpr. CR $ group2row)
    rownames (datExpr) = gename $ grupp
    1. Ange utvecklingsstadier.
      datMeta $ Unit = "postnatal"
      IDX = grep ("PCW", datMeta $ ålder)
      datMeta $ enhet [IDX] = "prenatal"
      IDX = grep ("yrs", datMeta $ ålder)
      datMeta $ Unit [IDX] = "postnatal"
      datMeta $ Unit = faktor (datMeta $ enhet, nivåer = c ("prenatal", "postnatal"))
    2. Välj kortikala regioner.
      datMeta $ region = "SubCTX"
      r = c ("A1C", "STC", "ITC", "TCx", "OFC", "DFC", "VFC", "MFC", "M1C", "S1C", "IPC", "M1C-S1C", "PCx", "V1C", "OCX")
      datMeta $ region [datMeta $ structure_acronym% i% r] = "CTX"
      datExpr = datExpr [, som (datMeta $ region = = "CTX")]
      datMeta = datMeta [som (datMeta $ region = = "CTX"),]
      Spara (datExpr, datMeta, fil = "devExpr. rda")
  3. Extrahera utvecklingsmässiga uttrycks profiler för AD-riskgener.
    Ladda ("ADgenes. rda")
    exprdat = Apply (datExpr [match (Adgener, rownames (datExpr)),], 2, medelvärde, na. RM = T)
    dat = data. Frame (region = datMeta $ region, enhet = datMeta $ enhet, expr = exprdat)
  4. Jämför prenatal kontra postnatal uttrycks nivåer av AD-riskgener.
    PDF (fil = "developmental_expression. pdf")
    ggplot (DAT, AES (x = enhet, y = expr, Fill = enhet, alfa = enhet)) + Ylab ("normaliserat uttryck") + geom_boxplot (outlier. size = NA) + ggtitle ("hjärn uttryck") + xlab ("") + scale_alpha_manual (värden = c (0.2, 1)) + theme_classic () + Theme (legend. position = "na" )
    dev. off ()

5. profiler av cell typs uttryck

ANMÄRKNINGAR: för varje steg, skriv motsvarande kod i konsolfönstret i RStudio.

  1. Ställ in i R.
    alternativ (stringsAsFactors = F)
    Ladda ("ADgenes. rda")
    Ladda ("geneAnno. rda")
    målnamn = "annons"
    targetgene = följa
    cellexp = Läs. Table ("DER-20_Single_cell_expression_processed_TPM_backup. tsv", huvud = T, fyllning = T)
    cellexp [1121, 1] = cellexp [1120, 1]
    cellexp = cellexp [-1120,]
    rownames (cellexp) = cellexp [, 1]
    cellexp = cellexp [,-1]
    datExpr = skala (cellexp, Center = T, skala = F)
    datExpr = datExpr [, 789: ncol (datExpr)]
  2. Extrahera cellulära uttrycks profiler av AD-riskgener.
    exprdat = Verkställ (datExpr [match (targetgene, rownames (datExpr)),], 2, medelvärde, na. RM = T)
    dat = data. Frame (grupp = targetname, cell = namn (exprdat), uttr = exprdat)
    dat $ CellType = unlist (lapply (strsplit (DAT $ cell, Split = "[.]"), ' [[', 1))
    dat = dat [-grep ("ex | I ", DAT $ CellType),]
    dat $ CellType = gsub ("dev", "foster", DAT $ CellType)
    dat $ CellType = faktor (DAT $ CellType, nivåer = c ("neuroner", "astrocyter", "Microglia", "endothelial",
    Oligodendrocyter "," OPC "," foster "))
    PDF (fil = "singlecell_expression_ADgenes. pdf")
    ggplot (DAT, AES (x = CellType, y = expr, Fyll = CellType)) +
    Ylab ("normaliserat uttryck") + xlab ("") + geom_violin () + tema (Axis. text. x = element_text (Angle = 90, hjust = 1)) + tema (legend. position = "ingen") +
    ggtitle (paste0 ("cellulära uttrycks profiler för AD-riskgener"))
    dev. off ()

6. anrikning av gen anteckning analys av AD-riskgener

  1. Ladda ner och konfigurera HOMER genom att skriva in kommandona nedan i Terminal.
    mkdir Homer
    CD Homer
    wget http://homer.ucsd.edu/homer/configureHomer.pl
    perl./configureHomer.pl-installera
    perl./configureHomer.pl-installera Human-p
    perl./configureHomer.pl-installera Human-o
  2. Kör HOMER genom att skriva in kommandona nedan i terminalen.
    Exportera sökväg = $PATH: ~/Work/Homer/bin
    findMotifs.pl ~/work/ADgenes.txt mänsklig ~/Work/
  3. Rita de berikade termerna genom att skriva följande kod i konsolfönstret i RStudio.
    bibliotek (ggpubr)
    alternativ (stringsAsFactors = F)
    PDF ("GO_enrichment. pdf", bredd = 15, höjd = 8)
    plot_barplot = funktion (dbname, namn, färg) {
    input = Read. delim (paste0 (dbnamn, ". txt"), header = T)
    input = ingång [, c (-1,-10,-11)]
    input = unik (input)
    input $ FDR = p. ADJUST (exp (input $ logP))
    input_sig = ingång [input $ FDR < 0,1,]
    input_sig $ FDR =-log10 (input_sig $ FDR)
    input_sig = input_sig [Beställ (input_sig $ FDR)]
    p = ggbarplot (input_sig, x = "term", y = "FDR", Fyll = färg, färg = "vit", sortera. val = "ASC", Ylab = uttryck (-log [10] (kursiv (FDR))), xlab = paste0 (namn, "termer"), rotera = TRUE, etikett = paste0 (input_sig $ Target. gener. in. term, "/", input_sig $ gener. in. term), Font. label = lista (Color = "vit", storlek = 9), Lab. vjust = 0,5, Lab. hjust = 1)
    p = p + geom_hline (yintercept =-log10 (0,05), och linjetyp = 2, Color = "ljusgrå")
    avkastning (p)
    }
    P1 = plot_barplot ("biological_process", "gå biologisk process", "#00AFBB")
    P2 = plot_barplot ("KEGG", "KEGG", "#E7B800")
    P3 = plot_barplot ("reactome", "Reactome", "#FC4E07")
    ggarrange (P1, P2, P3, etiketter = c ("A", "B", "C"), ncol = 2, NROW = 2)
    dev. off ()

Representative Results

Den process som beskrivs här tillämpades på en uppsättning av 800 trovärdiga SNPs som definierades av den ursprungliga studien14. Positional Mapping avslöjade att 103 SNPs överlappade med initiativtagare (43 unika gener) och 42 SNPs överlappade med exonerna (27 unika gener). Efter positions Mapping, 84% (669) SNPs förblev okommenterade. Med hjälp av Hi-C datauppsättningar i den vuxna hjärnan, kunde vi länka ytterligare 208 SNPs till 64 gener baserade på fysisk närhet. Totalt kartlade vi 284 AD trovärdiga SNPs till 112 AD riskgener (figur 1A). AD-riskgener förknippades med amyloid föregångare proteiner, amyloid-beta bildas, och immunsvar, vilket återspeglar den kända biologi av AD15,16,17,18 (figur 1B-D). Utvecklingsmässiga uttrycks profiler av AD-riskgener visade uttalad postnatal anrikning, vilket indikerar den åldersrelaterade förhöjda risken för AD (figur 2A). Slutligen, ANNONSENS riskgener uttrycktes mycket i mikroglia, primära immunceller i hjärnan (figur 2B). Detta är i samförstånd med de återkommande fynd som AD har en stark immun bas och mikroglia är den centrala aktören i AD patogenes14,19,20.

Figure 1
Figur 1: definiera förmodade målgener av AD GWS loci. (A) trovärdiga SNP som härrör från topp 29 AD loci kategoriserades i promotorn SNPs, exonic SNPs, och unannotated icke-kodning SNPs. Promotorn och exonic SNPs tilldelades direkt till sina målgener genom positions mappning, medan kromatin interaktions profiler i den vuxna hjärnan dessutom användes för att kartlägga SNPs baserat på fysiska interaktioner. (B-D) Berikning av GO (B), KEGG (C), och Reactome (D) termer i AD RISKGENER utfördes med hjälp av HOMER som beskrivs i protokoll avsnitt 6. X-axeln representerar false Discovery Rate (FDR) korrigerat-log10 (P-värde). Berikade termer med FDR < 0,1 plottas. Grå lodräta linjer representerar FDR = 0,05. APP amyloid prekursorer protein. Täljare, antalet AD-riskgener som representeras i varje termin. nämnare, antalet gener i varje termin. Vänligen klicka här för att se en större version av denna siffra.

Figure 2
Figur 2: karakterisering av AD-riskgener. (A) AD-riskgener uttrycks starkt i postnatal cortex jämfört med prenatal cortex. B) violin tomter som skildrar fördelningen av gen uttrycksvärden (normaliserat uttryck) i olika celltyper från cortex. Dessa resultat visar att AD-riskgener uttrycks högt i mikroglia, i enlighet med tidigare studier14. Vänligen klicka här för att se en större version av denna siffra.

Kompletterande fil 1. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner).

Kompletterande fil 2. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner).

Kompletterande fil 3. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner).

Discussion

Här beskriver vi en analytisk ram som kan användas för att funktionellt kommentera GWS loci baserat på positionella kartläggning och kromatin interaktioner. Denna process omfattar flera steg (för mer information se denna recension13). Först, med tanke på att kromatin interaktions profiler är mycket celltyp specifika, Hi-C-data som erhållits från lämpliga cell/vävnadstyper som bäst fångar underliggande biologi av sjukdomen måste användas. Med tanke på att annonsen är en neurodegenerativ sjukdom, använde vi Adult Brain Hi-C data9 för att kommentera GWS loci. För det andra har varje GWS Locus ofta upp till hundratals SNPs som är förknippade med drag på grund av länkage obalans (LD), så det är viktigt att få förmodade kausala ("trovärdiga") SNPs genom beräkningsmässigt förutsäga kausalitet genom användning av fin-Mapping algoritmer21,22 eller experimentellt testa reglerande aktiviteter med hjälp av högt dataflöde metoder såsom massivt parallella reporter analyser (mpra)23 eller självtranskribera aktiva reglerande region sekvensering ( STARR-SEQ)24. För det arbete som beskrivs här använde vi trovärdiga SNPs rapporterade i Jansen et al.14. Tredje, promotor och exonic SNPs är kommenterade baserat på positionella kartläggning. Vi använde en enkel positions kartläggnings strategi där SNPs kartlades till gener när de överlappade med initiativtagare (definierad som 2 KB uppströms för transkription startplats) eller Exons. Detta tillvägagångssätt kan dock vidareutvecklas genom att bedöma de funktionella konsekvenserna av exonic SNPs, till exempel om SNP inducerar nonsens medierad förfall, genom variation, eller nonsens variation. Fjärde, kromatin interaktions profiler från lämplig vävnad/celltyp kan användas för att tilldela SNPs till deras förmodade målgener baserat på fysisk närhet. Vi använde interaktions profiler förankrade till initiativtagare, men vi kan ytterligare förfina eller utöka interaktions profilerna genom att ta förstärkare aktiviteter (guidad av Histon H3 K27 acetylering eller kromatin tillgänglighet) eller exonic interaktioner beaktas. En viktig faktor i denna process är att använda konsekventa mänskliga arvsmassan. Om den sammanfattande statistikens genomiska positioner inte baseras på hg19 (dvs. hg18 eller hg38), bör en lämplig version av referensgenomet erhållas, eller så måste den sammanfattande statistiken konverteras till hg19 med hjälp av liftover25.

Vi tillämpade denna ram för att identifiera förmodade målgener för AD GWAS, tilldela 284 SNPs till 112 AD riskgener. Använda utvecklingsmässiga uttrycks profiler26 och celltypspecifika uttrycks profiler9, vi visade då att denna genuppsättning överensstämde med vad som är känt om AD patologi, avslöjar celltyper (microglia), biologiska funktioner (immunsvar och amyloid beta), och förhöjd risk på ålder.

Medan vi presenterade en ram som avgräntar potentiella målgener av AD och dess underliggande biologi, är det att notera att Hi-C-baserad anteckning kan utökas för att kommentera alla icke-kodning variation. Eftersom mer hela-Genomsekvensering data blir tillgänglig och vår förståelse om den icke-kodning sällsynt variation växer, Hi-C kommer att ge en viktig resurs för tolkning av sjukdomsassocierade genetiska varianter. Ett kompendium av Hi-C-resurser som erhållits från flera vävnads-och celltyper kommer därför att vara avgörande för att underlätta en bred tillämpning av denna ram för att samla biologiska insikter i olika mänskliga egenskaper och sjukdomar.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Detta arbete stöddes av NIH Grant R00MH113823 (till H.W.) och R35GM128645 (till D.H.P.), NARSAD Young Investigator Award (till H.W.), och SPARK Grant från Simons Foundation autism Research Initiative (SFARI, till nm och H.W.).

Materials

Name Company Catalog Number Comments
10 kb resolution Hi-C interaction profiles in the adult brain from psychencode http://adult.psychencode.org/
Developmental expression datasets http://www.brainspan.org/
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) https://static-content.springer.com/
HOMER http://homer.ucsd.edu/
R (version 3.5.0) https://www.r-project.org/
RStudio Desktop https://www.rstudio.com/
Single cell expression datasets http://adult.psychencode.org/

DOWNLOAD MATERIALS LIST

References

  1. Dekker, J., Misteli, T. Long-Range Chromatin Interactions. Cold Spring Harbor Perspectives in Biology. 7, (10), a019356 (2015).
  2. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489, (7414), 109-113 (2012).
  3. Plank, J. L., Dean, A. Enhancer function: mechanistic and genome-wide insights come together. Molecular Cell. 55, (1), 5-14 (2014).
  4. Dekker, J., Marti-Renom, M. A., Mirny, L. A. Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data. Nature Reviews Genetics. 14, (6), 390-403 (2013).
  5. Martin, P., et al. Capture Hi-C reveals novel candidate genes and complex long-range interactions with related autoimmune risk loci. Nature Communications. 6, 10069 (2015).
  6. Won, H., et al. Chromosome conformation elucidates regulatory relationships in developing human brain. Nature. 538, (7626), 523-527 (2016).
  7. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nature Communications. 6, 6178 (2015).
  8. Chen, J. A. A., et al. Joint genome-wide association study of progressive supranuclear palsy identifies novel susceptibility loci and genetic correlation to neurodegenerative diseases. Molecular Neurodegeneration. 13, (1), 41 (2018).
  9. Wang, D., et al. Comprehensive functional genomic resource and integrative model for the adult brain. Science. 362, (6420), eaat8464 (2018).
  10. Demontis, D., et al. Discovery of the first genome-wide significant risk loci for attention deficit/hyperactivity disorder. Nature Genetics. 51, (1), 63-75 (2019).
  11. Grove, J., et al. Identification of common genetic risk variants for autism spectrum disorder. Nature Genetics. 51, (3), 431-444 (2019).
  12. Lee, P. H., et al. Genome wide meta-analysis identifies genomic relationships, novel loci, and pleiotropic mechanisms across eight psychiatric disorders. bioRxiv. 528117 (2019).
  13. Mah, W., Won, H. The three-dimensional landscape of the genome in human brain tissue unveils regulatory mechanisms leading to schizophrenia risk. Schizophrenia Research. In press (2019).
  14. Jansen, I. E., et al. Genome-wide meta-analysis identifies new loci and functional pathways influencing Alzheimer's disease risk. Nature Genetics. 51, (3), 404-413 (2019).
  15. Viola, K. L., Klein, W. L. Amyloid β oligomers in Alzheimer's disease pathogenesis, treatment, and diagnosis. Acta Neuropathologica. 129, (2), 183-206 (2015).
  16. Mroczko, B., Groblewska, M., Litman-Zawadzka, A., Kornhuber, J., Lewczuk, P. Amyloid β oligomers (AβOs) in Alzheimer's disease. Journal of Neural Transmission. 125, (2), 177-191 (2018).
  17. Heneka, M. T., et al. Neuroinflammation in Alzheimer's disease. Lancet Neurology. 14, (4), 388-405 (2015).
  18. Minter, M. R., Taylor, J. M., Crack, P. J. The contribution of neuroinflammation to amyloid toxicity in Alzheimer's disease. Journal of Neurochemistry. 136, (3), 457-474 (2016).
  19. Hansen, D. V., Hanson, J. E., Sheng, M. Microglia in Alzheimer's disease. The Journal of Cell Biology. 217, (2), 459-472 (2018).
  20. Gjoneska, E., et al. Conserved epigenomic signals in mice and humans reveal immune basis of Alzheimer's disease. Nature. 518, (7539), 365-369 (2015).
  21. Benner, C., et al. FINEMAP: efficient variable selection using summary data from genome-wide association studies. Bioinformatics. 32, (10), 1493-1501 (2016).
  22. Hormozdiari, F., Kostem, E., Kang, E. Y., Pasaniuc, B., Eskin, E. Identifying causal variants at loci with multiple signals of association. Genetics. 198, (2), 497-508 (2014).
  23. Tewhey, R., et al. Direct Identification of Hundreds of Expression-Modulating Variants using a Multiplexed Reporter Assay. Cell. 165, (6), 1519-1529 (2016).
  24. Arnold, C. D., et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq. Science. 339, (6123), 1074-1077 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12, (6), 996-1006 (2002).
  26. Kang, H. J., et al. Spatio-temporal transcriptome of the human brain. Nature. 478, (7370), 483-489 (2011).

Comments

2 Comments

  1. Hello Nana Matoba et al, can you please tell me what is the geneAnno1 object? I can't figure it out. I will be waiting for your kind response, below is the error message. Thank you
    > load("geneAnno.rda")
    > ADhgnc = geneAnno1[match(ADgenes, geneAnno1$ensembl_gene_id), "hgnc_symbol"]
    Error: object 'geneAnno1' not found

    Reply
    Posted by: Aamir F.
    February 3, 2020 - 6:03 PM
  2. Thank you for pointing this out!
    We noticed that the original Supplementary file 3 (geneAnno.rda) did not have the right object, so we replaced it with a new file (geneAnno2.rda; https://www.jove.com/files/ftp_upload/60428/geneAnno2.rda).
    This file should contain geneAnno1.

    Reply
    Posted by: Nana M.
    February 7, 2020 - 9:44 AM

Post a Question / Comment / Request

You must be signed in to post a comment. Please or create an account.

Usage Statistics