Il genoma è organizzato nello spazio nucleare in diverse strutture che possono essere rivelate attraverso tecnologie di cattura della conformazione cromosomica. Il metodo Hi-C in-nucleus fornisce una raccolta a livello di genoma di interazioni cromatiniche nelle linee cellulari di Drosophila, che genera mappe di contatto che possono essere esplorate a risoluzione megabase a livello di frammento di restrizione.
Il genoma è organizzato in domini topologicamente associanti (TAD) delimitati da confini che isolano le interazioni tra domini. In Drosophila, i meccanismi alla base della formazione e dei confini di TAD sono ancora in fase di studio. L’applicazione del metodo Hi-C nel nucleo qui descritto ha contribuito a sezionare la funzione dei siti di legame delle proteine architetturali (AP) ai confini TAD isolando il gene Notch. La modificazione genetica dei confini di dominio che causano la perdita di AP provoca la fusione TAD, difetti trascrizionali e alterazioni topologiche a lungo raggio. Questi risultati hanno fornito prove che dimostrano il contributo degli elementi genetici alla formazione dei confini del dominio e al controllo dell’espressione genica in Drosophila. Qui, il metodo Hi-C in-nucleus è stato descritto in dettaglio, che fornisce importanti punti di controllo per valutare la qualità dell’esperimento insieme al protocollo. Vengono inoltre mostrati i numeri richiesti di letture di sequenziamento e coppie Hi-C valide per analizzare le interazioni genomiche a diverse scale genomiche. L’editing genetico mediato da CRISPR/Cas9 di elementi regolatori e la profilazione ad alta risoluzione delle interazioni genomiche utilizzando questo protocollo Hi-C in-nucleus potrebbero essere una potente combinazione per lo studio della funzione strutturale degli elementi genetici.
Negli eucarioti, il genoma è diviso in cromosomi che occupano territori specifici nello spazio nucleare durante l’interfase1. La cromatina che forma i cromosomi può essere divisa in due stati principali: uno di cromatina accessibile che è trascrizionalmente permissiva e l’altro di cromatina compatta che è trascrizionalmente repressiva. Questi stati di cromatina si segregano e raramente si mescolano nello spazio nucleare, formando due compartimenti distinti nel nucleo2. Alla scala sub-megabase, i confini separano i domini delle interazioni cromatiniche ad alta frequenza, chiamati TAD, che segnano l’organizzazione cromosomica3,4,5. Nei mammiferi, i confini TAD sono occupati dalla coesina e dal fattore di legame CCCTC (CTCF)6,7,8. Il complesso della coesina estrude la cromatina e si ferma nei siti di legame CTCF che vengono disposti in un orientamento convergente nella sequenza genomica per formare anelli di cromatina stabili9,10,13,14. L’interruzione genetica del sito di legame del DNA CTCF ai confini o la riduzione dell’abbondanza di CTCF e della proteina coesina provoca interazioni anormali tra elementi regolatori, perdita di formazione di TAD e derregolazione dell’espressionegenica 9,10,11,13,14.
In Drosophila, i confini tra i TAD sono occupati da diversi AP, tra cui il fattore 32 kDa associato all’elemento limite (BEAF-32), la proteina legante Motif 1 (M1BP), la proteina centrosomiale 190 (CP190), soppressore dell’ala pelosa (SuHW) e CTCF, e sono arricchiti in modificazioni isoniche attive e polimerasi II16,17,18. È stato suggerito che in Drosophila, i TAD appaiono come conseguenza della trascrizione13,17, 19e l’esattoruolodegli AP indipendenti nella formazione dei confini e nelle proprietà di isolamento è ancora in fase di studio. Pertanto, se i domini in Drosophila sono l’unica conseguenza dell’aggregazione di regioni di stati trascrizionali simili o se gli AP, incluso il CTCF, contribuiscono alla formazione dei confini rimane da caratterizzare completamente. L’esplorazione dei contatti genomici ad alta risoluzione è stata possibile attraverso lo sviluppo di tecnologie di cattura della conformazione cromosomica abbinate al sequenziamento di nuova generazione. Il protocollo Hi-C è stato descritto per la prima volta con la fase di legatura eseguita “insoluzione” 2 nel tentativo di evitare prodotti di legatura spuri tra frammenti di cromatina. Tuttavia, diversi studi hanno indicato la realizzazione che il segnale utile nei dati proveniva da prodotti di legatura formati in nuclei parzialmente llysed che non erano insoluzione 20,21.
Il protocollo è stato quindi modificato per eseguire la legatura all’interno del nucleo come parte dell’esperimento Hi-C a cellula singola22. Il protocollo Hi-C in-nucleus è stato successivamente incorporato nella popolazione cellulare Hi-C per produrre una copertura più coerente su tutta la gamma di distanze genomiche e produrre dati con meno rumore tecnico23,24. Il protocollo, qui descritto in dettaglio, si basa sul protocollo Hi-C23, 24 in-nucleus di popolazione ed è stato utilizzato per studiare le conseguenze della rimozione genetica di motivi leganti il DNA per CTCF e M1BP da un confine di dominio al locus del gene Notch in Drosophila25. I risultati mostrano che l’alterazione dei motivi di legame del DNA per gli AP al confine ha conseguenze drastiche per la formazione del dominio di Notch, difetti topologici più grandi nelle regioni che circondano il locus di Notch e la derregolazione dell’espressione genica. Ciò indica che gli elementi genetici ai confini del dominio sono importanti per il mantenimento della topologia del genoma e dell’espressione genica in Drosophila25.
Il metodo Hi-C in-nucleus qui presentato ha permesso l’esplorazione dettagliata della topologia del genoma di Drosophila ad alta risoluzione, fornendo una visione delle interazioni genomiche a diverse scale genomiche, dai loop di cromatina tra elementi regolatori come promotori e potenziatori a TAD e identificazione di grandi compartimenti25. La stessa tecnologia è stata applicata in modo efficiente anche ai tessuti dei mammiferi con alcune modifiche33. Ad esempio, quando …
The authors have nothing to disclose.
Questo lavoro è stato supportato dal numero di sovvenzione DELL’UNAM Technology Innovation and Research Support Program (PAPIIT) IN207319 e dal numero di sovvenzione del Consiglio nazionale della scienza e della tecnologia (CONACyT-FORDECyT) 303068. A.E.-L. è uno studente di master supportato dal Consiglio Nazionale della Scienza e della Tecnologia (CONACyT) CVU numero 968128.
16% (vol/vol) paraformaldehyde solution | Agar Scientific | R1026 | |
Biotin-14-dATP | Invitrogen | CA1524-016 | |
ClaI enzyme | NEB | R0197S | |
COVARIS Ultrasonicator | Covaris | LE220-M220 | |
Cut Smart | NEB | B72002S | |
Dulbecco's Modified Eagle Medium (DMEM) 1x | Life Technologies | 41965-039 | |
Dynabeads MyOne Streptabidin C1 | Invitrogen | 65002 | |
Fetal bovine serum (FBS) sterile filtered | Sigma | F9665 | |
Klenow Dna PolI large fragment | NEB | M0210L | |
Klenow exo(-) | NEB | M0210S | |
Ligation Buffer | NEB | B020S | |
MboI enzyme | NEB | R0147M | |
NP40-Igepal | SIGMA | CA-420 | Non-ionic surfactant for addition in lysis buffer |
PE adapter 1.0 | Illumina | 5'-P-GATCGGAAGAGCGGTTCAGCAG GAATGCCGAG-3' |
|
PE adapter 2.0 | Illumina | 5'-ACACTCTTTCCCTACACGACGCT CTTCCGATCT-3' |
|
PE PCR primer 1.0 | Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACACTCTTTCCCTACACGACG CTCTTCCGATCT-3' |
|
PE PCR primer 2.0 | Illumina | 5'-CAAGCAGAAGACGGCATACGAG ATCGGTCTCGGCATTCCTGCTGA ACCGCTCTTCCGATCT-3' |
|
Phenol: Chloroform:Isoamyl Alcohol 25:24:1 | SIGMA | P2069 | |
Primer 1 (known interaction, Figure 2A) | Sigma | 5'-TCGCGGTAATTTTGCGTTTGA-3' | |
Primer 2 (known interactions, Figure 2A) | Sigma | 5'-CCTCCCTGCCAAAACGTTTT-3' | |
Protease inhibitor cocktail tablet | Roche | 4693132001 | |
Proteinase K | Roche | 3115879001 | |
Qubit | ThermoFisher | Q33327 | |
RNAse | Roche | 10109142001 | |
SPRI Beads | Beckman | B23318 | |
T4 DNA ligase | Invitrogen | 15224-025 | |
T4 DNA polymerase | NEB | M0203S | |
T4 polynucleotide kinase (PNK) | NEB | M0201L | |
TaqPhusion | NEB | M0530S | DNA polymerase |
Triton X-100 | Non-ionic surfactant for quenching of SDS |