O genoma é organizado no espaço nuclear em diferentes estruturas que podem ser reveladas através de tecnologias de captura de conformação cromossomos. O método Hi-C no núcleo fornece uma coleção de interações de cromatina em linhas celulares Drosophila, que gera mapas de contato que podem ser explorados em resolução de megabases em nível de fragmento de restrição.
O genoma é organizado em domínios topologicamente associando (TADs) delimitados por fronteiras que isolam interações entre domínios. Em Drosophila, os mecanismos subjacentes à formação e aos limites do TAD ainda estão sob investigação. A aplicação do método Hi-C em núcleo descrito aqui ajudou a dissecar a função de sítios de ligação de proteína arquitetônica (AP) nas fronteiras do TAD isolando o gene Notch. A modificação genética dos limites de domínio que causam a perda de APs resulta em fusão TAD, defeitos transcricionais e alterações topológicas de longo alcance. Esses resultados forneceram evidências demonstrando a contribuição de elementos genéticos para a formação de limites de domínio e controle da expressão genética em Drosophila. Aqui, o método Hi-C no núcleo foi descrito em detalhes, o que fornece importantes pontos de verificação para avaliar a qualidade do experimento juntamente com o protocolo. Também são mostrados os números necessários de leituras de sequenciamento e pares Hi-C válidos para analisar interações genômicas em diferentes escalas genômicas. A edição genética mediada pelo CRISPR/Cas9 de elementos regulatórios e o perfil de alta resolução das interações genômicas usando este protocolo Hi-C no núcleo pode ser uma combinação poderosa para a investigação da função estrutural dos elementos genéticos.
Nos eucariotes, o genoma é dividido em cromossomos que ocupam territórios específicos no espaço nuclear durante a interfase1. A cromatina formando os cromossomos pode ser dividida em dois estados principais: um de cromatina acessível que é transcritivamente permissivo, e o outro de cromatina compacta que é transcritivamente repressiva. Esses estados de cromatina segregam e raramente se misturam no espaço nuclear, formando dois compartimentos distintos no núcleo2. Na escala sub-megabase, os limites separam domínios de interações de cromatina de alta frequência, chamados TADs, que marcam a organização cromossômica3,4,5. Nos mamíferos, os limites do TAD são ocupados por cohesin e fator de ligação CCCTC (CTCF)6,7,8. O complexo de cohesina extruda a cromatina e para em locais de ligação CTCF que são dispostos em uma orientação convergente na sequência genômica para formar laços de cromatina estável9,10,13,14. A interrupção genética do local de ligação de DNA ctcf nos limites ou redução da densidade de proteínas de CTCF e cohesina resulta em interações anormais entre elementos regulatórios, perda da formação de TAD e desregulação da expressão genética9,10,11,13,14.
Em Drosophila, os limites entre os TADs são ocupados por vários APs, incluindo fator associado a elementos de fronteira 32 kDa (BEAF-32), Motif 1 proteína de ligação (M1BP), proteína centrosômica 190 (CP190), supressor de asa peluda (SuHW) e CTCF, e são enriquecidos em modificações de histona ativa e Polymerase II16,17,18. Tem sido sugerido que em Drosophila, os TADs aparecem como consequência da transcrição13,17,19, e o papel exato dos APs independentes na formação de limites e propriedades de isolamento ainda está sob investigação. Assim, se os domínios em Drosophila são uma consequência única da agregação de regiões de estados transcricionais semelhantes ou se as APs, incluindo a CTCF, contribuem para a formação de limites permanece totalmente caracterizada. A exploração de contatos genômicos em alta resolução tem sido possível através do desenvolvimento de tecnologias de captura de conformação de cromossomos, juntamente com o sequenciamento de próxima geração. O protocolo Hi-C foi descrito pela primeira vez com a etapa de ligadura realizada “em solução”2 na tentativa de evitar produtos de ligadura espúria entre fragmentos de cromatina. No entanto, vários estudos apontaram para a constatação de que o sinal útil nos dados veio de produtos de ligadura formados em núcleos parcialmente lysed que não estavam na solução20,21.
O protocolo foi então modificado para realizar a ligadura dentro do núcleo como parte do experimento Hi-C de célula única22. O protocolo Hi-C no núcleo foi posteriormente incorporado à população celular Hi-C para produzir uma cobertura mais consistente ao longo de toda a gama de distâncias genômicas e produzir dados com menos ruído técnico23,24. O protocolo, descrito em detalhes aqui, baseia-se no protocolo Hi-C da população no núcleo23,24 e foi usado para investigar as consequências da remoção genética de motivos de vinculação de DNA para CTCF e M1BP de um limite de domínio no lócus genético notch em Drosophila25. Os resultados mostram que alterar os motivos de vinculação de DNA para APs na fronteira tem consequências drásticas para a formação do domínio de Notch, defeitos topológicos maiores nas regiões ao redor do lócus notch e desregulamentação da expressão genética. Isso indica que elementos genéticos nos limites do domínio são importantes para a manutenção da topologia do genoma e expressão genética em Drosophila25.
O método Hi-C em núcleo apresentado aqui permitiu a exploração detalhada da topologia do genoma de Drosophila em alta resolução, proporcionando uma visão das interações genômicas em diferentes escalas genômicas, desde loops de cromatina entre elementos regulatórios, como promotores e melhoradores até TADs e identificação de compartimentos grandes25. A mesma tecnologia também foi aplicada eficientemente aos tecidos mamíferos com algumas modificações33. Por…
The authors have nothing to disclose.
Este trabalho foi apoiado pelo número de bolsas do PROGRAMA DE INOVAÇÃO E Amparo à Pesquisa (PAPIIT) da UNAM Technology Innovation and Research(PAPIIT) em 207319 e pelo número de bolsas do Conselho Nacional de Ciência e Tecnologia (CONACyT-FORDECyT) 303068. A.E.-L. é um aluno de mestrado apoiado pelo número de CVU do Conselho Nacional de Ciência e Tecnologia (CONACyT) 968128.
16% (vol/vol) paraformaldehyde solution | Agar Scientific | R1026 | |
Biotin-14-dATP | Invitrogen | CA1524-016 | |
ClaI enzyme | NEB | R0197S | |
COVARIS Ultrasonicator | Covaris | LE220-M220 | |
Cut Smart | NEB | B72002S | |
Dulbecco's Modified Eagle Medium (DMEM) 1x | Life Technologies | 41965-039 | |
Dynabeads MyOne Streptabidin C1 | Invitrogen | 65002 | |
Fetal bovine serum (FBS) sterile filtered | Sigma | F9665 | |
Klenow Dna PolI large fragment | NEB | M0210L | |
Klenow exo(-) | NEB | M0210S | |
Ligation Buffer | NEB | B020S | |
MboI enzyme | NEB | R0147M | |
NP40-Igepal | SIGMA | CA-420 | Non-ionic surfactant for addition in lysis buffer |
PE adapter 1.0 | Illumina | 5'-P-GATCGGAAGAGCGGTTCAGCAG GAATGCCGAG-3' |
|
PE adapter 2.0 | Illumina | 5'-ACACTCTTTCCCTACACGACGCT CTTCCGATCT-3' |
|
PE PCR primer 1.0 | Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACACTCTTTCCCTACACGACG CTCTTCCGATCT-3' |
|
PE PCR primer 2.0 | Illumina | 5'-CAAGCAGAAGACGGCATACGAG ATCGGTCTCGGCATTCCTGCTGA ACCGCTCTTCCGATCT-3' |
|
Phenol: Chloroform:Isoamyl Alcohol 25:24:1 | SIGMA | P2069 | |
Primer 1 (known interaction, Figure 2A) | Sigma | 5'-TCGCGGTAATTTTGCGTTTGA-3' | |
Primer 2 (known interactions, Figure 2A) | Sigma | 5'-CCTCCCTGCCAAAACGTTTT-3' | |
Protease inhibitor cocktail tablet | Roche | 4693132001 | |
Proteinase K | Roche | 3115879001 | |
Qubit | ThermoFisher | Q33327 | |
RNAse | Roche | 10109142001 | |
SPRI Beads | Beckman | B23318 | |
T4 DNA ligase | Invitrogen | 15224-025 | |
T4 DNA polymerase | NEB | M0203S | |
T4 polynucleotide kinase (PNK) | NEB | M0201L | |
TaqPhusion | NEB | M0530S | DNA polymerase |
Triton X-100 | Non-ionic surfactant for quenching of SDS |