Genetics

מיפוי מחלת אלצהיימר משתנים גנים היעד שלהם באמצעות ניתוח חישובית של תצורת כרומטין

Published: January 9, 2020 doi: 10.3791/60428

Nana Matoba^1,2, Ivana Y. Quiroga³, Douglas H. Phanstiel*^3,4, Hyejung Won*^1,2

¹Department of Genetics, University of North Carolina, ²Neuroscience Center, University of North Carolina, ³Thurston Arthritis Research Center, University of North Carolina, ⁴Department of Cell Biology and Physiology, University of North Carolina

* These authors contributed equally

Summary

אנו מציגים פרוטוקול כדי לזהות השלכות פונקציונליות של משתנים שאינם קידוד המזוהים על ידי לימודי הגנום הרחב (GWAS) באמצעות אינטראקציות תלת ממדיות של כרומטין.

Abstract

הגנום-רחב לימודי התאגדות (GWAS) זיהו בהצלחה מאות גנומית הקשורים לתכונות ומחלות אנושיות. עם זאת, בגלל רוב הגנום-כולו משמעותי (GWS) ליפול על הגנום שאינו קידוד, ההשפעה הפונקציונלית של רבים נותרו לא ידועים. אינטראקציות תלת ממדיות שזוהו על-ידי Hi-C או הנגזרות שלה יכולות לספק כלים שימושיים להוסיף הערות לתוך הרוח האלה על ידי קישור משתנים שאינם קידוד לגנים שלהם שימושי. כאן, אנו לתאר פרוטוקול למפות GWAS שאינם קידוד משתנים לגנים שלהם באמצעות מחלת אלצהיימר (AD) GWAS ו-Hi-C הנתונים מרקמת המוח האנושי. המערכת מזוהה על ידי יישום של אלגוריתמים בעלי מיפוי עדין. SNPs ממופים מכן לגנים היעד שלהם באמצעות האינטראקציות משפר-יזם מבוסס על Hi-C. להגדיר את הגן שנוצר מייצג את הגנים סיכון לספירה, כפי שהם מוסדר על ידי משתני סיכון לספירה. כדי לנצל תובנות ביולוגיות נוספות לתוך מנגנונים מולקולריים הנמצאים בבסיס AD, אנו מאפיינים גנים הסיכון לספירה באמצעות התפתחות המוח התפתחותית נתונים ופרופילי ביטוי המוח תא יחיד. ניתן להרחיב פרוטוקול זה לכל מערכות הנתונים של GWAS ו-Hi-C כדי לזהות גנים מטרה ומנגנונים מולקולריים המשמשים כבסיס לתכונות ומחלות אנושיות שונות.

Introduction

לימודי הגנום הרחב (GWAS) שיחקו תפקיד מרכזי בחשיפת הבסיס הגנטי של מגוון רחב של תכונות ומחלות אנושיות. זה בקנה מידה גדול גנוהקלדה חשפה אלפי גרסאות גנומית הקשורים פנוטיפים החל מגובה לסיכון סכיזופרניה. עם זאת, למרות ההצלחה העצומה של GWAS לזהות מחלה ותכונה הקשורים הבית, הבנה מכניסטית של איך אלה משתנים לתרום לפנוטיפ כבר מאתגרת כי רוב המשתנים הקשורים ביותר האלה מתגוררים בלתי קידוד בריר של הגנום האנושי. מאחר שמשתנים אלה חופפים לעתים קרובות עם אלמנטים הרגולציה החזוי, הם עשויים לשנות את השליטה הטרנססקריפט של הגן הסמוך. עם זאת, האתר שאינו קידוד יכול להשפיע על תמלול של גנים על מרחקים ליניאריים העולה המגאז אחד, מה שהופך את הגנים המושפעים על ידי כל משתנה קשה לזהות. תלת מימדי (3d) מבנה כרומטין ממלא תפקיד חשוב בחיבורים תיווך בין מקום הרגולציה הרחוק היזמים גנים והוא יכול לשמש כדי לזהות גנים המושפעים על ידי פנוטיפ הקשורים בודדת-נוקלאוטיד (snps).

התקנה גנטית היא מתווכת על ידי תהליך מורכב, אשר כרוך הפעלת ומשפר היווצרות לולאה כרומטין כי להתחבר פיזית משפרי היזמים גנים שאליהם ניתן לכוון מכונות transcript¹^,²^,³. מכיוון לולאות כרומטין לעתים קרובות לאורך כמה מאות kb (kb), מפות מפורטות של אדריכלות כרומטין 3D נדרשים לפענח מנגנוני התקינה גנים. מספר טכנולוגיות לכידת כרומטין הומצאו כדי לזהות את ארכיטקטורת כרומטין 3D⁴. בין הטכנולוגיות הללו, Hi-C מספק את הארכיטקטורה המקיפה ביותר, כפי שהוא לוכדת את הגנום-כרומטין 3D פרופילים אינטראקציה. שמות הנתונים של Hi-C הותאמו במהירות לפענוח שאינו קידוד משמעותי הגנום-כולו (gws) הרוח⁵^,⁶^,⁷^,⁸^,⁹^,¹⁰^,¹¹^,¹²^,18^{, כפי}שהוא יכול לקשר משתנים שאינם קידוד לגנים היעד שלהם בהתבסס על פרופילים כרומטין אינטראקציה.

במאמר זה, אנו מתווה פרוטוקול לחזות מבצעית מבחינה חישובית גנים היעד של GWAS משתני סיכון באמצעות פרופילי כרומטין אינטראקציה. אנו להחיל את הפרוטוקול הזה כדי למפות AD GWS הרוח¹⁴ לגנים היעד שלהם באמצעות הנתונים Hi-C מגדיר במוח האנושי המבוגר⁹. הגנים המתקבלים לסיכוני AD מאופיינים בערכות נתונים גנומית פונקציונליות אחרות הכוללות תא בודד ופרופילי ביטוי התפתחותיים.

Protocol

1. התקנת תחנת עבודה

התקנת R (גירסה 3.5.0) ושולחן העבודה RStudio. פתח RStudio.
התקן את הספריות הבאות ב-R על-ידי הקלדת הקוד הבא בחלון המסוף ב-RStudio.
אם (! " BiocManager "% ב% rownames (מותקן. חבילות))
התקנת חבילות ("ביורוקנג", repos = "https://cran.r-project.org")
BiocManager:: התקנה ("GenomicRanges")
BiocManager:: התקנה ("ביוארט")
ביורוקנג:: התקנה ("WGCNA")
התקן. חבילות ("שינוי צורה")
התקנת חבילות ("ggplot2")
התקנת חבילות ("corrplot")
התקנת חבילות ("gProfileR")
התקנת חבילות ("תידיברס")
התקנת חבילות ("מתחת")
הורד קבצים.
הערה: בפרוטוקול זה, כל הקבצים נדרשים להורדה ל-~/mot.
1. הורד את הקבצים הבאים על-ידי לחיצה על הקישורים המסופקים ברשימת החומרים.
  1. הורד מיפוי מהימן ממופה למודעה (שולחן משלים 8 מתוך ג'נסן ואח '¹⁴).
    הערה: לפני הניתוח, פתח את גיליון שמונה ב-41588_2018_311_MOESM3_ESM. xlsx, הסר את שלוש השורות הראשונות ושמור את הגיליון כ-Supplementary_Table_8_Jansen. txt עם תבנית מופרדת באמצעות טאבים.
  2. הורד 10 kb רזולוציה Hi-C פרופילים אינטראקציה במוח המבוגר מן psychencode (מתוארת כיזם-anchored_chromatin_loops. מיטה להלן).
    הערה: קובץ זה כולל את התבנית הבאה: כרומוזום, TSS_start, TSS_end, Enhancer_start וEnhancer_end. במקרה של שימוש בערכות נתונים של Hi-C אחרות, פרוטוקול זה מחייב הערכות נתונים של Hi-C המעובדות ברזולוציה גבוהה (5-20 kb).
  3. הורד מערכות נתונים של ביטוי תא בודד מתוך הקובץ PsychENCODE.
    הערה: אלה מדגימות בקרה נוירוטיפוסיות.
  4. הורד ערכות נתונים של ביטויים התפתחותיים מתוך ה-BrainSpan (המתואר כ -Devexpr. rda להלן).
    הערה: 267666527 הוא קובץ מכווצות, כך לפתוח את 267666527 כדי לחלץ "columns_metadata. csv", "expression_matrix. csv", ו "rows_metadata. csv" כדי ליצור devExpr. rda (ראה סעיף 3).
2. הורד קואורדינטות exonic (ראה קבצים משלימים, שתוארו כ Gencode19_exon. bed ו Gencode19_promoter. bed למטה) מ-gencode גירסה 19.
  הערה: היזמים מוגדרים כ-2 קילו-במעלה של אתר התחלת התמלול (TSS). קבצים אלה כוללים את התבנית הבאה: כרומוזום, התחלה, סיום וגנים.
3. הורד קובץ ביאור גנטי (ראה קבצים משלימים, המתואר בשם גנאנו. rda להלן) מ ביוארט.
  הערה: ניתן להשתמש בקובץ זה כדי להתאים גנים בהתבסס על מזהי גנים Ensembl ו-HUGO ג'ין ועדת המינוח (HGNC) סמל.

2. הדור של אובייקט גרופרקי עבור SNPs אמין

הגדר ב-R על-ידי הקלדת הקוד הבא לתוך חלון המסוף ב-RStudio.
ספריה (GenomicRanges)
אפשרויות (מסתחת מקדמי = F)
setwd ("~/עבודה") זהו הנתיב לספריית העבודה.
credSNP = קרא. delim ("Supplementary_Table_8_Jansen. txt", כותרת = T)
המדריך הקיים [credsnp $ מהימן. סיבתי = = "כן",]
הפוך אובייקט גרופרקי באמצעות הקלדת הקוד הבא לתוך חלון המסוף ב-RStudio.
קרדרופרקי = גרופרקי (credsnp $ Chr, פרק שניה $ bp), rsid = credSNP $ SNP, P = credSNP $ P)
שמור (פרקי הורדה, קובץ = "AD_credibleSNP. rda")

3. מיפוי מיקומי

הערה: עבור כל שלב, הקלד את הקוד המתאים לחלון המסוף ב-RStudio.

. כוונן ב-ר'
אפשרויות (מססאסקטורים = F)
ספריה (GenomicRanges)
load ("AD_credibleSNP. rda") (ראה 2)
מיפוי מבוסס של יזם/exonic SNPs לגנים
1. טעינת אזור המקדם והexonic ויצירת אובייקט גראנג '.
  אקסון = קרא. טבלה ("Gencode19_exon. מיטה")
  אקסרגליטווחים = גרפרקי (exon [, 1], אירפרקי (אקסון [, 2], exon [, 3]), גן = exon [, 4])
  יזם = קרא. טבלה ("Gencode19_promoter. מיטה")
  פרקי מקדם (יזם [, 1], אירפרקי (יזם [, 2], יזם [, 3]), גן = יזם [, 4])
2. חופף SNPs אמין עם אזורים exonic.
  olap = findOverlaps (קרדרפרקי, אקסטווחים)
  credexon = פרקי הוראות [שאילכות (olap)]
  mcols (credexon) = cbind (mcols (credexon), mcols (הנושא (olap)])
3. חופף SNPs אמין עם אזורי היזם.
  olap = findOverlaps (קרפרקי, פרקי מקדם)
  credpromoter = שדרפרקי [שאילכות (olap)]
  mcols (credpromoter) = cbind (mcols (credpromoter), mcols (פרקי מקדם (olap)))
קישור SNPs לגנים היעד שלהם באמצעות אינטראקציות כרומטין.
1. טען ערכת נתונים של Hi-C וצור אובייקט גראנג '.
  היק = קרא. טבלה ("יזם-anchored_chromatin_loops. מיטה ", לדלג = 1)
  colnames מות (hic) = c ("chr", "TSS_start", "TSS_end", "Enhancer_start", "Enhancer_end")
  היקוטווחים = פרקי גרפרק (hic $ chr, רגפרקי (hic $ TSS_start, hic $ TSS_end), משפר = hic $ Enhancer_start)
  olap = findOverlaps (היקופות, פרקי מקדם)
  היקויזם = היקוטווחים [שאילכות (olap)]
  mcols (היקויזם) = cbind (mcols (היקויזם), mcols (פרקי מקדם (olap))
  הקני משפר = פרקי הניקוד (היקויזם), רגפרקי (היניזם $ משפר, היניזם $ משפר + 10000), ג'ין = היקויזם $ גן)
2. חופף SNPs אמין עם אובייקט ההיי-C גראנג.
  olap = findOverlaps (קרדורפרקי, הקני משפר)
  credhic = שדרפרקי [שאילכות (olap)]
  mcols (credhic) = cbind (mcols (credhic), mcols (משפר את הנושא (olap)))
הידור גנים של מועמדים לספירה שהוגדרו על-ידי מיפוי מיקומי ופרופילי אינטראקציה כרומטין.
הגנים המועמדים המתקבלים לספירה:
ADgenes = להפחית (איחוד, רשימה (credhic $ גן, credhic $ גן, credhic $ גן))
כדי להמיר מזהה Ensembl Gene לסמל HGNC
מטען ("גנאנו. rda")
ADhgnc = geneAnno1 [התאמה (Adגנס, geneAnno1 $ ensembl_gene_id), "hgnc_symbol"]
מיכל ברוג'י (המשך)
שמור (ADgenes, Adhסופהרב, קובץ = "ADgenes. rda")
כתוב. טבלה (ADhgnc, קובץ = "Adגנס. txt", שורה. שמות = F, col. name = F, הצעת מחיר = F, ספט = "\t")

4. מסלולי ביטוי התפתחותי

הערה: עבור כל שלב, הקלד את הקוד המתאים לחלון המסוף ב-RStudio.

. כוונן ב-ר'
ספריה (שינוי צורה); ספריה (ggplot2); ספריה (GenomicRanges); ספריה (ביוארט)
ספרייה ("WGCNA")
אפשרויות (מססאסקטורים = F)
תהליך ביטוי ומטא-נתונים.
datExpr = read. csv ("expression_matrix. csv", כותרת = FALSE)
datExpr = datExpr [, -1]
datMeta = read. csv ("columns_metadata. csv")
datProbes = read. csv ("rows_metadata. csv")
datExpr = datExpr [Datexpr $ ensembl_gene_id! = "",]
datProbes = datProbes [datProbes $ ensembl_gene_id! = "",]
datExpr.cr = collapseRows (datExpr, rowGroup = Datexpr $ ensembl_gene_id, Rowgroup = rownames (datExpr))
datExpr = datExpr. cr $ Dateta
gename = data. מסגרת (datExpr. cr $ group2row)
(datExpr) = קבוצת החברה
1. ציין שלבים התפתחותיים.
  datMeta $ Unit = "פוסטנטאל"
  idx = grep ("pcw", datMeta $ age)
  datMeta $ יחידה [idx] = "טרום לידתי"
  idx = grep ("בענף", datMeta $ age)
  יחידת datMeta $ [idx] = "פוסטנטאל"
  datMeta $ Unit = פקטור (יחידת datMeta $, רמות = c ("טרום לידה", "Postnatal"))
2. בחר אזורים קורטיקליים.
  datMeta $ Region = "תת-סי-אקס"
  r = c ("A1C", "אוטובוסים של STC", "ה," ה "," TCx "," OFC "," DFC "," המילה "," MFC "," M1C "," S1C "," IPC "," M1C-S1C "," PCx "," V1C "," Ocx ")
  datMeta $ Region [datMeta $ structure_acronym% בתוך% r] = "סי-אקס"
  datExpr = datExpr [, שבהם (Datexpr $ Region = "סי-אקס")]
  datMeta = datMeta [כאשר (datMeta $ Region = = "סי אקס"),]
  שמור (datExpr, Datexpr, file = "devExpr. rda")
לחלץ פרופילי ביטוי התפתחותי של גנים סיכון לספירה.
טען ("ADgenes. rda")
הפונקציה exprdat = החל (datExpr [התאם ביניהם, rownames (datExpr)),], 2, ממוצע, na. rm = T)
dat = נתונים. מסגרת (אזור = datMeta $ אזור, יחידה = datMeta $ יחידה, Expr = exprdat)
השוואת לידתי מול רמות ביטוי לפני הלידה של גנים הסיכון לספירה.
pdf (קובץ = "developmental_expression. pdf")
ggplot (dat, aes (x = יחידה, y = Expr, מילוי = יחידה, אלפא = יחידה) + ylab ("ביטוי מנורמל") + geom_boxplot (outlier. size = NA) + ggplot ("ביטוי המוח") + xlab ("") + מscale_alpha_manual (ערכים = c (0.2, 1)) + theme_classic () + ערכת נושא (מקרא). )
dev. off ()

5. פרופילי ביטויים מסוג תא

הערה: עבור כל שלב, הקלד את הקוד המתאים לחלון המסוף ב-RStudio.

. כוונן ב-ר'
אפשרויות (מססאסקטורים = F)
טען ("ADgenes. rda")
מטען ("גנאנו. rda")
targetname = "AD"
targetgene
cellexp = קרא. טבלה ("DER-20_Single_cell_expression_processed_TPM_backup. tsv", כותרת = T, מילוי = T)
cellexp [1121, 1] = cellexp [1120, 1]
cellexp = cellexp [-1120,]
(cellexp) = cellexp [, 1]
cellexp = cellexp [, -1]
datExpr = קנה מידה (cellexp, מרכז = T, קנה מידה = F)
datExpr = datExpr [, 789: ncol (datExpr)]
לחלץ פרופילי ביטוי סלולרי של גנים סיכון לספירה.
exprdat = החל (datExpr [התאמה (targetgene, rownames (datExpr)),], 2, ממוצע, na. rm = T)
dat = נתונים. מסגרת (קבוצה = targetname, תא = שמות (exprdat), Expr = exprdat)
dat $ celltype = unlist (lapply (סטרספליט (dat $ cell, לפצל = "[.]"), [[', 1))
dat = dat [-grep ("Ex" | בתוך ", dat $ celltype),]
dat $ celltype = gsub ("Dev", "העובר", dat $ celltype)
dat $ celltype = פקטור (dat $ celltype, רמות = c ("נוירונים", "אסטרוציטים", "Microglia", "אנדותל",
Oligodendrocytes הפוך "," OPC "," עוברית ")
pdf (קובץ = "singlecell_expression_ADgenes. pdf")
ggplot (dat, aes (x = celltype, y = Expr, מילוי = celltype) +
ylab ("ביטוי מנורמל") + xlab ("") + geom_violin () + ערכת נושא (ציר. text. x = element_text (זווית = 90, hjust = 1)) + ערכת נושא (מקרא. מיקום = "ללא") +
ggtitle (paste0 ("פרופילי ביטוי סלולארי של גנים של סיכוני לספירה"))
dev. off ()

6. ביאור גנטי ניתוח העשרה של גנים הסיכון לספירה

הורד והגדר את הומרוס על-ידי הקלדת הפקודות שלהלן במסוף.
mkdir הומר
הומר תקליטור
לhttp://homer.ucsd.edu/homer/configureHomer.pl
perl./configureHomer.pl-התקנת
perl./configureHomer.pl-התקנת אדם-p
perl./configureHomer.pl-התקנת אדם-o
הפעל את הומרוס על-ידי הקלדת הפקודות שלהלן במסוף.
ייצוא נתיב = $PATH: ~/work/הומר/bin
findMotifs.pl ~/B האדם/העובד/
התווה את התנאים המועשר על-ידי הקלדת הקוד הבא לתוך חלון המסוף ב-RStudio.
ספריה (בע)
אפשרויות (מססאסקטורים = F)
pdf ("GO_enrichment. pdf", רוחב = 15, גובה = 8)
plot_barplot = פונקציה (dbname, שם, צבע) {
קלט = קרא. delim (paste0 (dbname, ". txt"), כותרת = T)
קלט = קלט [, c ( -1, -10,-11)]
קלט = ייחודי (קלט)
קלט $ רוזוולט = p. כוונון (exp (קלט $ logP))
input_sig = קלט [קלט $ רוזוולט < 0.1,]
input_sig $ רוזוולט =-log10 (input_sig $ רוזוולט)
input_sig = input_sig [הזמנה (input_sig $ רוזוולט),]
p = ggbarplot (input_sig, x = "מונח", y = "רוזוולט", מילוי = צבע, צבע = "לבן", מיון. val = "עולה", ylab = ביטוי (-log [10] (נטוי)), xlab = paste0 (שם, "תנאים"), לסובב = TRUE, תווית = paste0 (input_sig $ היעד. גנים. ב. מונח, "/", input_sig $ גנים. ב. מונח), גופן. label = רשימה (צבע = "לבן", גודל = 9), lab. vjust = 0.5, מעבדה. hjust = 1)
p = p + geom_hline (yintercept =-log10 (0.05), linetype = 2, צבע = "lightgray")
חזרה (p)
}
p1 = plot_barplot ("biological_process", "המשך תהליך ביולוגי", "#00AFBB")
p2 = plot_barplot ("kegg", "KEGG", "#E7B800")
p3 = plot_barplot ("הגיב", "ה#FC4E07")
ggarrange (p1, p2, p3, תוויות = c ("A", "B", "C"), ncol = 2, ncol = 2
dev. off ()

Representative Results

התהליך המתואר כאן הוחל על קבוצה של 800 מהימן SNPs שהוגדרו על ידי המחקר המקורי¹⁴. מיפוי המיניה חשף כי 103 SNPs חופפים עם יזמים (43 גנים ייחודיים) ו 42 SNPs חופפים עם exons (27 גנים ייחודיים). לאחר מיפוי מיקומי, 84% (669) נותרו מכשולים בלתי מסומן. באמצעות מערכות הנתונים Hi-C במוח המבוגר, היינו מצליחים לקשר 208 נוספים SNPs ל 64 גנים מבוסס על קרבה פיזית. בסך הכל, מופו 284 לספירה מהימן SNPs כדי 112 לספירה גנים סיכון (איור 1א). לספירה גנים הסיכון היו קשורים חלבונים מקודמן עמילואיד, ביתא עמילואיד היווצרות, ואת התגובה החיסונית, המשקף את הביולוגיה הידועה של AD¹⁵^,¹⁶^,¹⁷^,¹⁸ (איור 1ב-D). ביטוי התפתחותי פרופילים של גנים סיכון לספירה הראו העשרה לאחר הלידה מסומן, מעיד על סיכון מוגבר לגיל הקשורים של AD (איור 2א). בסופו של דבר, גנים הסיכון לספירה היו ביטוי מאוד microglia, התאים החיסוניים העיקרי במוח (איור 2ב). זה בהסכמה עם ממצאים חוזרים כי למודעה יש בסיס חסין בפני המערכת החיסונית חזקה מיקרוגלייה הם הנגן המרכזי בבית לספירה פתוגנזה¹⁴^,¹⁹^,²⁰.

איור 1: הגדרת גנים מכוונים של המטה לספירה. (A) מהימן snps נגזר העליון 29 לספירה מסווגים לתוך מיזם snps, Exonic snps, ובלתי מסומן שאינו קידוד snps. יזם והקצאה exonic הוקצו ישירות לגנים היעד שלהם על ידי מיפוי המיניה, בעוד פרופילי כרומטין אינטראקציה במוח המבוגר השתמשו בנוסף למפות snps (B-D) העשרת המונחים של GO (ב), kegg (ג), ו מגיב (ד) בגנים הסיכון לספירה בוצעו באמצעות הומר כפי שמתואר בסעיףהקוד6. ציר x מייצג את קצב גילוי השקר (רוזוולט) תוקן-log10 (P-value). מונחים מועשרים עם רוזוולט < 0.1 הותוו. קווים אנכיים אפורים מייצגים את רוזוולט = 0.05. האפליקציה החלבון מקודמן. מונה, מספר גנים סיכון לספירה מיוצגים בכל מונח; , מספר הגנים בכל מונח. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

איור 2: אפיון גנים הסיכון לספירה. (א) לספירה גנים הסיכון מבוטאים מאוד בקליפת לידה לאחר הלידה לעומת קליפת המוח. (ב) מגרשים לכינור המתארים הפצות של ערכי ביטוי גנים (ביטוי מנורמל) בסוגי תאים שונים מקליפת המוח. תוצאות אלה מראות כי הגנים סיכון לספירה מבוטא מאוד microglia, עקבי עם מחקרים קודמים¹⁴. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

קובץ משלים 1. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

קובץ משלים 2. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

קובץ משלים 3. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

Discussion

כאן אנו מתארים מסגרת אנליטית שניתן להשתמש בה כדי להוסיף ביאורים למקום GWS בהתבסס על מיפוי מיקומי ואינטראקציות כרומטין. תהליך זה כרוך במספר שלבים (לפרטים נוספים ראו סקירה זו¹³). ראשית, בהינתן כי פרופילי אינטראקציה כרומטין הם מאוד מסוג תא מסוים, נתוני Hi-C המתקבלים מסוגי התא/רקמת המתאים הטוב ביותר ללכוד את הביולוגיה הבסיסית של ההפרעה צריך לשמש. בהינתן כי המודעה היא הפרעת ניווניות, השתמשנו המוח המבוגר Hi-C נתונים⁹ כדי להוסיף הערות gws הבית. שנית, כל לוקוס gws יש לעתים קרובות עד מאות snps הקשורים לתכונה בגלל הצמדה disequilibrium (LD), לכן חשוב להשיג הסיבתי ("אמין") snps מבחינה חישובית לניבוי סיבתיות באמצעות השימוש באלגוריתמים מיפוי עדין²¹^,²² או ניסויים בדיקות הרגולציה באמצעות תפוקה גבוהה כגון כתבת מקבילים בנפט (mpra)²³ או עצמית התעמועתבינג רצף הרגולציה הפעיל באזור ( סטאר-seq)²⁴. עבור העבודה המתוארת כאן, השתמשנו ב-SNPs אמין שדווחו ב-ג'נסן ואח '¹⁴. שלישית, יזם והיצרן מסומן על בסיס מיפוי מיקומי. השתמשנו באסטרטגיית מיפוי מניה פשוטה שבה SNPs מופו לגנים כאשר הם חופפים עם היזמים (מוגדר 2 kb במעלה הזרם של שעתוק האתר) או exons. עם זאת, גישה זו יכולה להיות הרחיב עוד על ידי הערכת ההשלכות הפונקציונליות של האקסון SNPs, כגון האם SNPS גורם שטויות בתיווך ריקבון, וריאציה מוטעית, או וריאציה שטויות. 4, האינטראקציה כרומטין פרופילים מסוג הרקמה/תא המתאים יכול לשמש כדי להקצות SNPs לגנים היעד שלהם בהתבסס על הקרבה פיזית. השתמשנו פרופילים אינטראקציה מעוגן יזמים, אבל אנחנו יכולים עוד לחדד או להרחיב את פרופילי אינטראקציה על ידי נטילת פעילויות משפר (מודרך על ידי היסטון H3 K27 מרחרחון או כרומטין נגישות) או אינטראקציות exonic לחשבון. אחד השיקול החשוב בתהליך זה הוא להשתמש עקבי הגנום האנושי לבנות. לדוגמה, אם עמדות גנומית של סטטיסטיקות סיכום אינן מבוססות על hg19 (כלומר, hg18 או hg38), יש להשיג גירסה מתאימה של גנום הייחוס או שסטטיסטיקת הסיכום צריכה להיות מומרת ל-hg19 באמצעות למידה²⁵.

התחלנו את המסגרת הזאת כדי לזהות את הגנים היעד הפוטוטיבית עבור AD GWAS, הקצאת 284 SNPs ל 112 גנים סיכון לספירה. באמצעות פרופילי ביטוי התפתחותי²⁶ ו-סוג תא פרופילי ביטוי ספציפיים⁹, אז הדגמנו כי זה מערכת גנים היה עקבי עם מה שידוע על פתולוגיה לספירה, חשיפת סוגי התא (microglia), פונקציות ביולוגיות (תגובה החיסונית עמילואיד ביתא), וסיכון גבוה עם גיל.

בעוד הצגנו מסגרת המהווה את הגנים היעד הפוטנציאלי של AD והביולוגיה הבסיסית שלה, הוא מציין כי הביאור Hi-C מבוסס ניתן להרחיב כדי להוסיף ביאורים כל וריאציה שאינה קידוד. כמו יותר שלמה-רצף הנתונים של הגנום הופך להיות זמין ההבנה שלנו על שאינם קידוד וריאציה נדירה גדל, היי-C יספק משאב מפתח עבור פרשנות של מחלות משויכות משתנים גנטיים. מידע של משאבי היי-C המתקבל מרקמות וסוגי תאים מרובים, ולכן יהיה קריטי להקל על יישום רחב של מסגרת זו כדי לקבל תובנות ביולוגיות לתכונות ומחלות אנושיות שונות.

Disclosures

. למחברים אין מה לגלות

Acknowledgments

עבודה זו נתמכת על ידי מענק NIH R00MH113823 (כדי H.W.) ו R35GM128645 (כדי D.H.P.), הפרס הצעיר NARSAD החוקר (כדי H.W.), ו ספארק מענק מיוזמת סימונס קרן המחקר אוטיזם (SFARI ספרי, ל N.M. ו H.W.).

Materials

Name	Company	Catalog Number	Comments
10 kb resolution Hi-C interaction profiles in the adult brain from psychencode			http://adult.psychencode.org/
Developmental expression datasets			http://www.brainspan.org/
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.¹⁴)			https://static-content.springer.com/
HOMER			http://homer.ucsd.edu/
R (version 3.5.0)			https://www.r-project.org/
RStudio Desktop			https://www.rstudio.com/
Single cell expression datasets			http://adult.psychencode.org/