RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
it_IT
Menu
Menu
Menu
Menu
Research Article
Nana Matoba1,2, Ivana Y. Quiroga3, Douglas H. Phanstiel*3,4, Hyejung Won*1,2
1Department of Genetics,University of North Carolina, 2Neuroscience Center,University of North Carolina, 3Thurston Arthritis Research Center,University of North Carolina, 4Department of Cell Biology and Physiology,University of North Carolina
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
Presentiamo un protocollo per identificare le implicazioni funzionali delle varianti non codificanti identificate dagli studi di associazione a livello di genoma (GWAS) utilizzando interazioni tridimensionali della cromatina.
Gli studi di associazione a livello di genoma (GWAS) hanno identificato con successo centinaia di loci genomici associati a i tratti umani e alle malattie. Tuttavia, poiché la maggior parte dei loci significativi a livello di genoma (GWS) ricadono sul genoma non codificante, l'impatto funzionale di molti rimane sconosciuto. Le interazioni tridimensionali della cromatina identificate da Hi-C o dai suoi derivati possono fornire strumenti utili per annotare questi loci collegando varianti non codificanti ai loro geni utilizzabili. Qui, delineamo un protocollo per mappare le varianti GWAS non codificanti ai loro geni putativi usando i set di dati GWAS e Hi-C del morbo di Alzheimer (AD) GWAS e Hi-C dal tessuto cerebrale umano adulto. I polimorfismi a singolo nucleotide causale putativo (SNP) sono identificati mediante l'applicazione di algoritmi di mappatura fine. Gli SNP vengono quindi mappati ai loro geni bersaglio putativi utilizzando interazioni potenziatore-promotore basate su Hi-C. Il set genico risultante rappresenta i geni a rischio di AD, in quanto sono potenzialmente regolati da varianti di rischio AD. Per ottenere ulteriori approfondimenti biologici sui meccanismi molecolari alla base dell'AD, caratterizzamo i geni del rischio di AD utilizzando i dati di espressione cerebrale dello sviluppo e i profili di espressione a cella singola del cervello. Questo protocollo può essere esteso a qualsiasi set di dati GWAS e Hi-C per identificare i geni bersaglio putativi e i meccanismi molecolari alla base di vari tratti e malattie umane.
Gli studi di associazione a livello di genoma (GWAS) hanno svolto un ruolo fondamentale nel rivelare la base genetica di una serie di tratti e malattie umane. Questa genotipizzazione su larga scala ha scoperto migliaia di varianti genomiche associate ai fenotipi che vanno dall'altezza al rischio di schizofrenia. Tuttavia, nonostante l'enorme successo di GWAS nell'identificare i loci associati alla malattia e ai tratti associati, una comprensione meccanicistica di come queste varianti contribuiscano al fenotipo è stata difficile perché la maggior parte delle varianti associate al fenotipo risiedono nella non codificazione frazione del genoma umano. Poiché queste varianti spesso si sovrappongono agli elementi regolatori previsti, è probabile che alterino il controllo trascrizionale di un gene vicino. Tuttavia, i loci non codificanti possono influenzare la trascrizione dei geni a distanze lineari superiori a una megabase, rendendo i geni colpiti da ogni variante difficili da identificare. La struttura della cromatina tridimensionale (3D) svolge un ruolo importante nella mediazione delle connessioni tra loci regolatori distanti e promotori genici e può essere utilizzata per identificare i geni colpiti dai polimorfismi mononucleotidi associati al fenotipo (SNP).
La regolazione genica è mediata da un processo complesso, che comporta l'attivazione dell'potenziatore e la formazione del loop della cromatina che collegano fisicamente gli esaltatori ai promotori genici a cui il macchinario trascrizionale può essere diretto1,2,3. Poiché i loop di cromatina spesso si estendono su diverse centinaia di kilobase (kb), sono necessarie mappe dettagliate dell'architettura della cromatina 3D per decifrare i meccanismi regolatori genici. Sono state inventate molteplici tecnologie di cattura della conformazione della cromatina per identificare l'architettura della cromatina 3D4. Tra queste tecnologie, Hi-C fornisce l'architettura più completa, in quanto cattura profili di interazione della cromatina 3D a livello di genoma. I set di dati Hi-C sono stati rapidamente adattati per interpretare le varianti non codificanti significative (GWS) significative (GWS)loci 5,6,7,8,9,10,11,12,13, in quanto possono collegare varianti non codificanti ai loro geni bersaglio putativi basati su profili di interazione cromatina.
In questo articolo viene descritto un protocollo per prevedere computazionalmente i geni bersaglio putativi delle varianti di rischio GWAS utilizzando profili di interazione della cromatina. Applichiamo questo protocollo per mappare AD GWS loci14 ai loro geni target utilizzando set di dati Hi-C nel cervello umano adulto9. I geni del rischio di AD risultanti sono caratterizzati da altri set di dati genomici funzionali che includono profili trascrittomici a singola cellula e di espressione dello sviluppo.
1. Configurazione workstation
2. Generazione di un oggetto GRanges per SNP credibili
3. Mappatura di posizione
NOTA: per ogni passaggio, digitare il codice corrispondente nella finestra della console in RStudio.
4. Traiettorie di espressione dello sviluppo
NOTA: per ogni passaggio, digitare il codice corrispondente nella finestra della console in RStudio.
5. Profili di espressione di tipo cella
NOTA: per ogni passaggio, digitare il codice corrispondente nella finestra della console in RStudio.
6. Analisi dell'arricchimento delle annotazioni genetiche dei geni del rischio AD
Il processo qui descritto è stato applicato a una serie di 800 SNP credibili definiti dallo studio originale14. La mappatura posizionale ha rivelato che 103 SNP si sovrapponevano ai promotori (43 geni unici) e 42 SNP sovrapposti a esoni (27 geni unici). Dopo la mappatura posizionale, l'84% (669) degli SNP è rimasto senza annotato. Utilizzando set di dati Hi-C nel cervello adulto, siamo stati in grado di collegare altri 208 SNP a 64 geni in base alla prossimità fisica. In totale, abbiamo mappato 284 SNP credibili AD a 112 geni a rischio AD (Figura 1A). I geni a rischio DI AD sono stati associati a proteine precursori dell'amiloide, formazione amiloide-beta e risposta immunitaria, riflettendo la biologia nota diAD 15,16,17,18 (Figura 1B-D). I profili di espressione dello sviluppo dei geni del rischio DI AD hanno mostrato un marcato arricchimento postnatale, indicativo del rischio elevato associato all'età di AD (Figura 2A). Infine, i geni a rischio di AD sono stati altamente espressi nelle microglia, cellule immunitarie primarie nel cervello (Figura 2B). Questo è in accordo con i risultati ricorrenti che l'AD ha una forte base immunitaria e microglia sono il giocatore centrale nella patogenesi AD14,19,20.

Figura 1: Definizione dei geni bersaglio putativi del Loci AD GWS. (A) Gli SNP credibili derivati dai primi 29 AD sono stati classificati in SNP promotori, SNP esonici e SNP non codificati. (B-D) L'arricchimento dei termini GO (B), KEGG (C) e Reactome (D) nei geni a rischio AD è stato eseguito utilizzando HOMER come descritto nella sezione di protocollo 6. L'asse x rappresenta il falso tasso di individuazione (FDR) corretto -log10 (P-value). Sono stati tracciati termini arricchiti con FDR < 0.1. Le linee verticali grigie rappresentano l'FDR : 0,05. Proteina precursore APP amiloide. Numeratore, il numero di geni a rischio DI AD rappresentati in ciascun termine; denominatore, il numero di geni in ogni termine. Fare clic qui per visualizzare una versione più grande di questa figura.

Figura 2: Caratterizzazione dei geni a rischio DI AD. (A) I geni del rischio di AD sono altamente espressi nella corteccia postnatale rispetto alla corteccia prenatale. (B) Le trame di violino raffiguranti distribuzioni di valori di espressione genica (espressione normalizzata) in diversi tipi di cellule dalla corteccia. Questi risultati mostrano che i geni del rischio di AD sono altamente espressi in microglia, in coerenza con studi precedenti14. Fare clic qui per visualizzare una versione più grande di questa figura.
File supplementare 1. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
File supplementare 2. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
File supplementare 3. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
Gli autori non hanno nulla da rivelare.
Presentiamo un protocollo per identificare le implicazioni funzionali delle varianti non codificanti identificate dagli studi di associazione a livello di genoma (GWAS) utilizzando interazioni tridimensionali della cromatina.
Questo lavoro è stato sostenuto dalla sovvenzione NIH R00MH113823 (a H.W.) e R35GM128645 (a D.H.P.), dal NARSAD Young Investigator Award (a H.W.) e dalla sovvenzione SPARK della Simons Autism Foundation Research Initiative (SFARI, a N.M. e H.W.).
| Risoluzione 10 kb Profili di interazione Hi-C nel cervello adulto da psychencode< | a target="_blank" href="http://adult.psychencode.org/Datasets/Integrative/Promoter-anchored_chromatin_loops.bed">http://adult.psychencode.org/ | ||
| Developmental expression datasets | http://www.brainspan.org/ | ||
| SNP credibili mappati finemente per AD (Tabella supplementare 8 da Jansen et al.14)< | a target="_blank" href="https://static-content.springer.com/esm/art%3A10.1038%2Fs41588-018-0311-9/MediaObjects/41588_2018_311_MOESM3_ESM.xlsx" >https://static-content.springer.com/ | ||
| HOMER | http://homer.ucsd.edu/ | ||
| R (version 3.5.0) | https://www.r-project.org/ | ||
| RStudio Desktop | https://www.rstudio.com/ | ||
| Set di | dati di espressioni a cella singola | http://adult.psychencode.org/ |