Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Dekryptere høyoppløselig 3D-kromatinorganisasjon via Capture Hi-C

Published: October 14, 2022 doi: 10.3791/64166

Summary

Denne protokollen beskriver Capture Hi-C-metoden som brukes til å karakterisere 3D-organisasjonen av megabaserte målrettede genomiske regioner ved høy oppløsning, inkludert grenser for topologisk assosierende domener (TAD) og langdistansekromatininteraksjoner mellom regulatoriske og andre DNA-sekvenselementer.

Abstract

Den romlige organisasjonen av genomet bidrar til dets funksjon og regulering i mange sammenhenger, inkludert transkripsjon, replikering, rekombinasjon og reparasjon. Å forstå den eksakte årsakssammenhengen mellom genomtopologi og funksjon er derfor avgjørende og i økende grad gjenstand for intensiv forskning. Kromosomkonformasjonsfangstteknologier (3C) tillater utledning av kromatinets 3D-struktur ved å måle frekvensen av interaksjoner mellom en hvilken som helst region i genomet. Her beskriver vi en rask og enkel protokoll for å utføre Capture Hi-C, en 3C-basert målberikelsesmetode som karakteriserer den allelspesifikke 3D-organisasjonen av megabaserte genomiske mål ved høy oppløsning. I Capture Hi-C fanges målregioner opp av en rekke biotinylerte sonder før sekvensering av høy gjennomstrømning nedstrøms. Dermed oppnås høyere oppløsning og allelspesifisitet samtidig som teknologiens tidseffektivitet og overkommelige priser forbedres. For å demonstrere sine styrker ble Capture Hi-C-protokollen brukt på musens X-inaktiveringssenter (Xic), hovedreguleringsstedet for X-kromosominaktivering (XCI).

Introduction

Det lineære genomet inneholder all informasjon som er nødvendig for at en organisme skal gjennomgå embryonal utvikling og overleve gjennom voksen alder. Å instruere genetisk identiske celler til å utføre forskjellige funksjoner er imidlertid grunnleggende for nøyaktig å kontrollere hvilken informasjon som brukes i bestemte sammenhenger, inkludert forskjellige vev og / eller utviklingsstadier. Den tredimensjonale organisasjonen av genomet antas å delta i denne nøyaktige spatio-temporale reguleringen av genaktivitet ved å lette eller forhindre det fysiske samspillet mellom regulatoriske elementer som kan skilles med flere hundre kilobaser i det lineære genomet (for vurderinger 1,2,3). I løpet av de siste 20 årene har vår forståelse av samspillet mellom genomfolding og aktivitet økt raskt, hovedsakelig på grunn av utviklingen av kromosomkonformasjonsfangstteknologier (3C) (for gjennomgang 4,5,6,7). Disse metodene måler frekvensen av interaksjoner mellom noen regioner i genomet og stole på ligering av DNA-sekvenser som er i nær 3D-nærhet i kjernen. De vanligste 3C-protokollene starter med fiksering av cellepopulasjoner med et kryssbindingsmiddel som formaldehyd. Det tverrbundne kromatinet fordøyes deretter med et restriksjonsenzym, selv om MNase-fordøyelsen også har blitt brukt 8,9. Etter fordøyelsen blir frie DNA-ender i nær romlig nærhet re-ligert, og kryssbinding reverseres. Dette trinnet gir opphav til 3C 'bibliotek' eller 'mal', et blandet basseng av hybridfragmenter der sekvenser som var i 3D-nærhet til kjernen har høyere sjanser for å bli ligert i det samme DNA-fragmentet. Nedstrøms kvantifisering av disse hybridfragmentene gjør det mulig å utlede 3D-konformasjonen av genomiske regioner som ligger tusenvis av basepar fra hverandre i det lineære genomet, men kan samhandle i 3D-rommet.

Mange forskjellige tilnærminger er utviklet for å karakterisere 3C-biblioteket, forskjellig både når det gjelder hvilke delmengder av ligeringsfragmenter som analyseres og hvilken teknologi som brukes til nedstrøms kvantifisering. Den opprinnelige 3C-protokollen baserte seg på valg av to interesseregioner og kvantifisering av deres 'en mot en' interaksjonsfrekvens med PCR10,11. 4C-tilnærmingen (sirkulær kromosomkonformasjonsfangst) måler samspillet mellom et enkelt lokus av interesse (dvs. 'synspunktet') og resten av genomet ('en mot alle')12,13,14. I 4C gjennomgår 3C-biblioteket en andre runde med fordøyelse og re-ligering for å generere små sirkulære DNA-molekyler som er PCR-forsterket av synspunktsspesifikke primere15. 5C (chromosome conformation capture carbon copy) muliggjør karakterisering av 3D-interaksjoner på tvers av større interesseområder, noe som gir innsikt i høyere ordens kromatinfolding innenfor den regionen ('mange mot mange')16. I 5C hybridiseres 3C-biblioteket til en pool av oligonukleotider som overlapper restriksjonssteder som senere kan forsterkes ved multiplex PCR med universelle primere15. I både 4C og 5C ble de informative DNA-fragmentene først kvantifisert av mikromatriser og senere ved neste generasjons sekvensering (NGS) 17,18,19. Disse strategiene karakteriserer målrettede regioner av interesse, men kan ikke brukes til å kartlegge genom-brede interaksjoner. Dette siste målet oppnås med Hi-C, en 3C-basert strategi med høy gjennomstrømning der massivt parallell sekvensering av 3C-malen tillater objektiv karakterisering av kromatinfolding på genombredt nivå ('alle mot alle')20. Hi-C-protokollen inkluderer inkorporering av en biotinylert rest ved de fordøyede fragmentenes ender, som etterfølges av nedtrekk av ligeringsfragmenter med streptapavidinperler for å øke utvinningen av ligerte fragmenter20.

Hi-C avslørte at pattedyrgenomer er strukturelt organisert på flere skalaer i 3D-kjernen. På megabaseskalaen er genomet delt inn i regioner av aktivt og inaktivt kromatin, henholdsvis A- og B-rommene20,21. Eksistensen av ytterligere underavdelinger representert ved forskjellige kromatin- og aktivitetstilstander ble også senere vist22. Ved høyere oppløsning er genomet videre delt inn i sub-megabase selvinteragerende domener kalt topologisk assosierende domener (TAD), først avslørt av Hi-C og 5C-analyse av human- og musegenomene23,24. I motsetning til rom som varierer på en vevsspesifikk måte, har TAD en tendens til å være konstant (selv om det er mange unntak). Det er viktig at TAD-grensene bevares på tvers av arter25. I pattedyrceller omfatter TADs ofte gener som deler det samme regulatoriske landskapet og har vist seg å representere et strukturelt rammeverk som letter genregulering samtidig som samspillet med nærliggende regulatoriske domener begrenses (for gjennomgang 3,26,27,28). Videre, innen TAD, kan interaksjoner på grunn av CTCF-steder ved foten av kohesin-ekstruderte sløyfer øke sannsynligheten for promotorforsterker- eller forsterkerinteraksjoner (for gjennomgang29).

I Hi-C kan rom og TAD-er detekteres ved 1 Mb til 40 kb oppløsning, men høyere oppløsning kan oppnås for å karakterisere kontakter i mindre skala som looping-interaksjoner mellom distale elementer i skalaen 5-10 kb. Å øke oppløsningen for å kunne oppdage slike sløyfer effektivt ved HiC krever imidlertid en betydelig økning i sekvenseringsdybden og dermed sekvenseringskostnadene. Dette forverres dersom analysen må være allelspesifikk. Faktisk krever en X-fold økning i oppløsning en X2 økning i sekvenseringsdybde, noe som betyr at høyoppløselige og allel-spesifikke genom-brede tilnærminger kan være uoverkommelig dyre30.

For å forbedre kostnadseffektivitet og overkommelig pris samtidig som høy oppløsning opprettholdes, kan målområder av interesse fysisk trekkes ned fra genombrede 3C- eller Hi-C-biblioteker etter hybridisering med komplementære biotinmerkede oligonukleotidprober før nedstrøms sekvensering. Disse målberikelsesstrategiene blir referert til som Capture-C-metoder og tillater avhør av interaksjoner av hundrevis av målsteder spredt over genomet (dvs. Promoter Capture (PC) Hi-C; Neste generasjons (NG) Capture-C; Lav inngang (LI) Capture-C; Nukleærtitrert (NuTi) Capture-C; Tri-C)31,32,33,34,35,36,37,38,39,40, eller på tvers av regioner som spenner over flere megabaser (dvs. HYbrid Capture Hi-C (Hi-C2); Flislagt-C)41,42,43. To aspekter kan variere i fangstbaserte metoder: (1) naturen og utformingen av biotinylerte oligonukleotider (dvs. RNA eller DNA, enkle oligoer som fanger dispergerte genomiske mål eller flere oligoer som flislegger et område av interesse); og (2) malen som brukes til å trekke ned mål som kan være 3C- eller Hi-C-biblioteket, sistnevnte bestående av biotinylerte restriksjonsfragmenter trukket ned fra 3C-biblioteket.

Her beskrives en Capture Hi-C-protokoll basert på anrikning av målkontakter fra 3C-biblioteket. Protokollen er avhengig av utformingen av et skreddersydd flisleggingsutvalg av biotinylerte RNA-prober og kan utføres på 1 uke fra 3C-bibliotekets forberedelse til NGS-sekvensering. Protokollen er rask, enkel og gjør det mulig å karakterisere 3D-organisasjonen av høyere ordens 3D-organisasjon av megabase-store regioner av interesse ved 5 kb oppløsning, samtidig som tidseffektiviteten og overkommeligheten forbedres sammenlignet med andre 3C-metoder. Capture Hi-C-protokollen ble brukt på hovedreguleringsstedet for X-kromosominaktivering (XCI), X-inaktiveringssenteret (Xic), som er vert for Xist-ikke-kodende RNA. Xic har tidligere vært gjenstand for omfattende strukturelle og funksjonelle analyser (for gjennomgang44,45). Hos pattedyr kompenserer XCI for doseringen av X-bundne gener mellom hunner (XX) og hanner (XY) og involverer transkripsjonell deaktivering av nesten hele ett av de to X-kromosomene i hunnceller. Xic har representert et kraftig, gullstandardlokus for studier i 3D-genomtopologi og samspillet med genregulering44. 5C-analyse av Xic i embryonale stamceller fra mus (mESC) førte til oppdagelsen og navngivningen av TAD, og ga den første innsikten i den funksjonelle relevansen av topologisk partisjonering og genkoregulering24. Den topologiske organiseringen av Xic ble senere vist å være kritisk involvert i riktig utviklingstidspunkt for Xist-oppregulering og XCI 46, og intetanende cis-regulatoriske elementer som kan påvirke genaktivitet i og mellom TADs ble også nylig oppdaget i Xic47,48,49. Bruk av Capture Hi-C på 3 Mb av musen X-kromosomet som spenner over Xic, demonstrerer kraften i denne tilnærmingen ved å dissekere storskala kromatinfolding i høy oppløsning. En detaljert og enkel å følge protokoll er gitt, med utgangspunkt i utformingen av rekken av biotinylerte sonder på tvers av hvert DpnII-restriksjonssted innenfor regionen av interesse for genereringen av det genombrede 3C-biblioteket, hybridisering og fangst av målkontakter og nedstrøms dataanalyse. En oversikt over hensiktsmessige kvalitetskontroller og forventede resultater er også inkludert, og både styrker og begrensninger ved tilnærmingen diskuteres i lys av lignende eksisterende metoder.

Protocol

Musens embryonale stamceller (mESCs) som ble brukt i denne studien ble avledet fra et kryss av en TX / TX R26rtTA / rtTA kvinne50 med en Mus musculus castaneus hann i henhold til retningslinjene for dyrepleie fra Institut Curie (Paris) 51.

1. Sonde design

  1. Design en rekke biotinylerte prober (120-mer RNA oligonukleotider) som dekker målområdet av interesse.
    1. Flis interesseområdet med overlappende oligonukleotider slik at hver sekvens innenfor målet i gjennomsnitt dekkes av to unike prober (2x dekning) (figur 1).
    2. Utelat repeterende sekvenser fra sondedekning for å unngå berikelse av uspesifikke interaksjoner.
      MERK: For å maksimere anrikningen av informative ligeringsfragmenter ble regioner som spenner over 300 bp oppstrøms og nedstrøms for hvert DpnII-restriksjonssted over målet definert (ChrX: 102 475 000-105 475 000), og 28 913 biotinylerte sonder ble designet i henhold til SureSelect DNA-målberikelsesteknologi gjennom Sure Design-plattformen52. I følge denne strategien er opptil maksimalt 40 baser av repeterende sekvenser tillatt i hvert oligonukleotid for å minimere anrikningen av uspesifikke interaksjoner. Sondegruppen ble syntetisert av Agilent. Her brukes DpnII som et restriksjonsenzym av to grunner: (1) det er en firekutter som rutinemessig brukes i flere 3C-baserte metoder53; og (2) det maksimerer sjansene for å fange informative enkeltnukleotidpolymorfismer (SNPs) i nærheten av skjærestedene sammenlignet med andre restriksjonsenzymer som ble testet i silico i F1-hybridlinjer som ble brukt i denne studien (C57BL/6J x CASTEi/J).

2. Eksperimentell prosedyre

  1. Cell forberedelse
    1. Frø riktig antall celler på en eller flere cellekulturplater for å oppnå et totalt cellenummer på ≥ 5 x 107 celler på fikseringsdagen.
      MERK: Musembryonale stamceller (mESC) ble brukt i denne studien. mESC er belagt på gelatinisert (0,1% gelatin i 1x PBS - o/n ved 37 °C, 5% CO2-inkubator) cellekulturplater i mESCs medium inneholdende 2i + LIF og batchtestet føtalkalveserum (DMEM, 15% FBS, 0,1 mM β-merkaptoetanol, 1000 U/ml−1 leukemihemmende faktor (LIF), CHIR99021 (3 μM) og PD0325901 (1 μM)). For denne celletypen inneholder en 80% konfluent 10 cm plate ca. 2 x 107 celler.
    2. Forbered en ekstra cellekulturplate for celletelling.
      MERK: En mindre cellekulturplate kan brukes til å redusere mediebruken. I dette tilfellet må antall celler som skal frøes på den mindre tallerkenen justeres tilsvarende (f.eks. 3x færre celler på en 10 cm plate sammenlignet med en 15 cm plate).
  2. Formaldehydfiksering
    1. Beregn det totale antallet celler som skal krysskobles.
      1. Før du starter kryssbindingsreaksjonen, trypsiniserer og teller celler fra kontrollplaten som er utarbeidet spesielt for celletelling ved hjelp av en automatisert celleteller i henhold til produsentens instruksjoner.
      2. Inkluder en levedyktighetsfarging (f.eks. Trypan Blue) for å bestemme prosentandelen av levedyktige celler54. Fra denne celletellingen estimerer du det totale antallet celler i platen(e) som er klargjort for kryssbinding.
    2. Fjern kulturmediet fra platene som er tilberedt for tverrbinding, og erstatt det med riktig mengde fikseringsløsning (2% formaldehyd i cellekulturmedium). Bruk 10 ml på en 10 cm plate (f.eks. ~20 ml for en 15 cm plate).
      MERK: Legg til et nøyaktig volum fikseringsløsning. Hvis fiksering av adherente celler ikke er mulig, kan dette trinnet tilpasses trypsiniserte celler og utføres i 30 ml fikseringsløsning i 50 ml koniske sentrifugerør. Formaldehyd må ikke være mer enn 1 år gammel. Det er foretrukket å bruke hetteglass til engangsbruk. Fikseringsløsningen må bringes til romtemperatur (RT) før bruk.
      FORSIKTIG: Formaldehyd er farlig og må håndteres i henhold til passende helse- og sikkerhetsforskrifter.
    3. Fix i 10 min på RT under forsiktig blanding på en shaker.
    4. Slukk fikseringsreaksjonen ved tilsetning av 2,5 M glycin-1x PBS til en endelig konsentrasjon på 0,125 M. Tilsett 530 μL 2,5 M glycin-1x PBS til 10 ml på en 10 cm plate (f.eks. 1060 μL til 20 ml på en 15 cm plate).
      MERK: Hvis cellene ble fiksert i oppløsning, slukk fikseringsreaksjonen med 1590 μL av 2,5 M glycin-1x PBS.
    5. Inkuber i 5 min ved RT, bland forsiktig på en shaker.
    6. Overfør platene til is og rug i ytterligere 15 minutter på is mens du forsiktig blander på en shaker.
      MERK: Fra nå av må cellene holdes på is, og buffere må forkjøles for å unngå ytterligere tverrbinding. Flytt til et kaldt rom hvis mange plater må behandles.
    7. Fjern fikseringsløsningen fra cellene ved å helle den i et beger for å sikre rask håndtering.
      MERK: Sørg for å kaste det formaldehydholdige flytende avfallet i henhold til gjeldende helse- og sikkerhetsforskrifter.
    8. Skyll 10 cm-platen raskt to ganger med 5 ml kald 0,125 M glycin-1x PBS (8 ml for en 15 cm plate) for å vaske av rusk og døde celler. Fjern væsken fra platen ved å helle den i et beger for å sikre rask håndtering.
    9. Tilsett 5 ml kald 0,125 M glycin-1x PBS til 10 cm-platen (10 ml for en 15 cm plate) og skrap cellene raskt fra platen ved hjelp av en plastcelleskrape.
    10. Overfør cellesuspensjonen til et forkjølt 50 ml konisk sentrifugerør ved hjelp av en serologisk pipette.
    11. Skyll platen to ganger med 5 ml kald 0,125 M glycin-1x PBS og tilsett cellesuspensjonen til det koniske sentrifugerøret.
    12. Spinn ned ved 480 x g i 10 minutter ved 4 °C.
      MERK: Hvis cellene ble fiksert i oppløsning, overfør cellen til et forkjølt konisk sentrifugerør og spinn ned ved 480 x g i 10 minutter ved 4 ° C. Fjern fikseringsløsningen ved å helle den i et beger og vask tre ganger i 10 ml kald 0,125 M glycin-1x PBS. Sørg for å resuspendere cellene ved hvert vasketrinn.
    13. Fjern supernatanten ved å aspirere med et stasjonært aspirasjonssystem. Resuspender cellene i 500 μL 1x PBS per 1 x 107 celler ved å pipettere forsiktig opp og ned med en P1000-pipette. For å resuspendere celler i det nøyaktige volumet, se den totale cellenummerestimeringen oppnådd i 2.2.1.
    14. Aliquot 500 μL av cellesuspensjonen i det beregnet antall 1,5 ml mikrosentrifugerør (1 x 107 celler/rør).
    15. Spinn ned ved 480 x g i 10 minutter ved 4 °C.
    16. Fjern supernatanten med et stasjonært aspirasjonssystem og kneppfrys cellepelletsene i flytende nitrogen. Oppbevar tørrcellepellets ved -80 °C.
      MERK: Prøver kan lagres i minst 1 år.
  3. Cellelyse
    1. Tine de frosne pelletsene på is.
    2. Forbered 1,5 ml lysisbuffer i H 2 0 per prøve: Tilsett 10 mM Tris-HCl, pH 8,0, 10 mM NaCl og0,2% NP40.
    3. Tilsett 600 μL av den kalde lysisbufferen og resuspender brønnen på is.
    4. Inkuber på is i 15 minutter for å la cellene hovne opp.
    5. Spinn ned ved 2655 x g i 5 minutter ved 4 °C og fjern supernatanten ved hjelp av et stasjonært aspirasjonssystem.
    6. For å fjerne avfall, resuspender pelleten i 1 ml av den kalde lysisbufferen, sentrifugerer ved 2655 x g i 5 minutter ved 4 °C, og fjern supernatanten.
    7. Spinn igjen kort ved 2655 x g og 4 °C og fjern så mye av den gjenværende supernatanten som mulig ved hjelp av et stasjonært aspirasjonssystem utstyrt med en P200-spiss.
    8. Resuspender i 100 μL av 0,5% (vol/vol) SDS.
    9. Inkuber i en thermomixer ved 62 °C, virvle ved 1400 o / min i 10 minutter.
    10. Tilsett 290 μLH2O+ 50 μL 10% TritonX-100 og bland godt, unngå luftbobler.
    11. Inkuber i en termomikser ved 37 °C, virvle rundt ved 1400 o/min i 15 minutter.
    12. Tilsett 50 μL 10x Dpnll buffer og inverter røret for å blande.
    13. Ta 50 μL ufordøyd DNA for kvalitetskontroll i et eget rør. Ikke glem å ta den ufordøyde kontrollprøven.
  4. DpnII fordøyelse
    1. Tilsett 10 μL Dpnll høy konsentrasjon (500 U totalt) og bland ved å invertere.
    2. Inkuber prøvene og den ufordøyde kontrollen i en termomikser ved 37 °C, virvlende ved 1400 o / min i >4 timer.
    3. Tilsett 10 μL Dpnll høy konsentrasjon (500 U totalt) på slutten av dagen.
    4. Inkuber prøvene og den ufordøyde kontrollen ved 37 °C, virvlende ved 1400 o / min over natten.
    5. Tilsett 10 μL Dpnll høy konsentrasjon (500 U totalt) i begynnelsen av neste dag til prøvene.
    6. Inkuber prøvene og den ufordøyde kontrollen i en termomikser ved 37 °C, virvlende ved 1400 o / min i 4 timer.
  5. Ligering og reversering av tverrbinding
    1. Inkuber rørene ved 65 °C i 20 minutter ved 1400 o / min.
      MERK: Ikke legg til SDS på dette tidspunktet. Tanken er å bevare kjernefysisk integritet, slik at ligeringen utføres inne i kjernene, og omgår behovet for ekstrem fortynning.
    2. Kjøl ned prøvene på is i maksimalt 5-10 min. For å unngå SDS-nedbør må du ikke la prøvene ligge på is lenger enn dette.
    3. Ta 50 μL av det uligerte fordøyde DNA for kvalitetskontroll i et eget rør. Oppbevar de ufordøyde og ufordøyde kontrollene ved -20 °C.
      MERK: Ikke glem å ta den uligerte kontrollprøven.
    4. Tilsett 800 μL ligeringscocktail: 122 μL 10x ligasebuffer, 8 μL T4-ligase (30 U / μL) og 670 μL H20.
    5. Inkuber ved 16 °C, virvles rundt 1000 o/min over natten.
    6. Tilsett 7,5 μl proteinase K (20 mg/ml) til prøvene og 2 μL til kontrollene.
    7. Inkuber ved 65 °C i 4 timer ved 1000 o / min.
  6. DNA-rensing
    1. Overfør prøvene på is til forkjølte 15 ml koniske sentrifugerør og tilsett 2 ml vann, 10,5 ml iskald EtOH og 583 μL 3 M NaAC.
      MERK: Ekstra vann har som mål å forhindre overføring av DTT til pelleten.
    2. Tilsett 200 μL iskald EtOH, 10,8 μL NaAC og 1 μL av kobberet til de ufordøyde og uligerte kvalitetskontrollene.
    3. Inkuber ved -80 °C i minst 4 timer opp til over natten.
    4. Spinn 15 ml rørene ved 2200 x g ved 4 °C i 45 minutter.
    5. Spinn kontrollrørene på 1,5 ml ved 20 500 x g ved 4 °C i 30 minutter.
    6. Vask én gang med 3 ml (prøver) og 1 ml (kontroller) iskald 70 % EtOH.
    7. Spinn ved 2200 x g ( prøver) eller 20 500 x g (kontroller) ved 4 °C i 10 minutter.
    8. Fjern EtOH forsiktig og lufttørk ved RT i 10-15 min; Ikke overdry.
    9. Resuspender prøvene og kontrollene i henholdsvis 100 μL og 20 μL H20.
    10. Tilsett 1 μL RNAseA og inkuber ved 37 °C, virvling ved 1400 o / min i 30 minutter.
  7. Kvalitetskontroll av 3C mal forberedelse
    1. Kvantifiser hver prøve og kontroll ved hjelp av et fluorometersett for DNA-konsentrasjonsmålinger med høy følsomhet.
    2. Legg 100-200 ng av hver prøve og hver kontroll på en 1% agarose/1x TBE gel.
    3. Kontroller at gelbildet viser det forventede resultatet ved å sammenligne forskjellene i DNA-fragmentstørrelser på kontrollene og 3C-malen som vist i figur 2A.
    4. Oppbevar prøvene og kontrollene ved -20 °C.
  8. Hybridisering, fangst og prøvebehandling for multiplekset sekvensering
    1. For å hybridisere rekken av biotinylerte RNA-sonder til 3C-malen, fange de målrettede ligeringsfragmentene og forberede prøvene for multiplekset sekvensering i henhold til målanrikningssystemet som ble brukt i denne studien for sammenkoblet multiplekset sekvensering (se Tabell over materialer). Følg protokollen i henhold til produsentens instruksjoner mens du introduserer følgende mindre modifikasjoner:
      1. Seksjon 2 i produsentens protokoll: Prøveklargjøring
        1. Følg instruksjonene for målberikelse fra 3 μg gDNA-inngang.
        2. Skjær DNA i en sonikator ved å bruke følgende spesifikasjoner: 10% driftssyklus, 4 intensitet, 200 cyc / burst og 130 s. Start med 4 μg 3C-mal resuspendert i 130 μL vann for hver fangstreaksjon for å sikre nok materiale til å fortsette prøveprepareringen med 3 μg av det avskårne DNA.
        3. Vurder kvaliteten på skåret DNA. Kjør 1 μL av det avskårne DNA på en DNA-bioanalysator i henhold til høysensitivitetsprotokollen. Forvent en fordeling av fragmentstørrelse mellom 150-700 bp (figur 2).
        4. Rens prøven ved hjelp av fastfase reversibel immobilisering (SPRI) perler. Tilsett 124 μL SPRI-perler til 124 μL av DNA-prøven for å utføre et valg på 1: 1 venstre sidestørrelse i henhold til produsentens instruksjoner og eluer i 25 μL nukleasefritt vann. Dette rensetrinnet vil fjerne kortere fragmenter for å berike fragmenter på rundt 300 bp (figur 2).
          MERK: Mengden prøver og SPRI-perler som brukes på dette trinnet, tar hensyn til volumtapet som oppstod under overføring av prøvene til nye rør og kjøring av kvalitetskontrollene ved bioanalysatoren. Alle påfølgende trinn for valg av størrelse utføres i henhold til forholdene som anbefales av produsentens protokoll. DNA-eluering fra SPRI-perler utføres ved RT gjennom hele protokollen.
        5. Vurdere kvaliteten på størrelsesvalgt skjæret DNA. Kjør 1 μL av det avskårne DNA på DNA-bioanalysatoren i henhold til HS-protokollen (High Sensitivity). Forvent en fordeling av fragmentstørrelser med høyest anrikning ved 300 bp (figur 2). Gå videre med kvantifiseringen av det avskårne DNA-et hvis skjæringen var vellykket.
        6. Kvantifiser det avskårne DNA-et med et fluorometersett for HS DNA-konsentrasjonsmålinger.
          MERK: Hvis DNA-skjæring resulterer i et DNA-utbytte på <3 μg, utfør en andre runde med DNA-skjæring med ytterligere 4 μg DNA og kombiner de avskårne DNA-prøvene etter det første PRI-perlerensingstrinnet for å oppnå totalt 3 μg skåret DNA.
        7. Tilsett nukleasefritt vann til den valgte rensede DNA-prøven (3 μg totalt) til et endelig volum på 48 μL og fortsett med sluttreparasjonsreaksjonen i henhold til produsentens protokoll.
        8. Etter ligering av parede adaptere, forsterk biblioteket ved å utføre fem sykluser med forhåndsfangst-PCR i henhold til produsentens instruksjoner (betingelsene for PCR og primere er gitt i settet).
      2. Del 4 av produsentens protokoll: Hybridisering og fangst
        1. For å hybridisere de preparerte DNA-prøvene til de målspesifikke RNA-probene, fortynn 750 ng DNA-prøver i et endelig volum på 3,4 μL, noe som resulterer i en innledende konsentrasjon på 221 ng / μL. For DNA-prøver fortynnet i større volumer, bruk en hastighetsvakuumkonsentrator for å redusere til det endelige volumet. En hastighet-vakuumkonsentrasjon (250 x g; ≤45 °C) i 15-20 minutter er normalt tilstrekkelig for prøvene resuspendert i 10 μL. Sørg for å ha samme inngangsvolum for hver prøve før du starter hastighetsvakuumkonsentratoren.
        2. Inkuber hybridiseringsblandingen i 16-18 timer ved 65 °C med et oppvarmet lokk ved 105 °C i henhold til produsentens instruksjoner.
      3. Seksjon 5 i produsentens protokoll: Indeksering og prøvebehandling for multiplekset sekvensering
        1. For å forsterke de fangede bibliotekene med indekseringsprimere, utfør 12 sykluser med PCR etter fangst i henhold til produsentens instruksjoner (betingelsene for PCR og primere er gitt i settet).
  9. Neste generasjons sekvensering
    1. Hvis du vil kjøre flere Hi-C-biblioteker på samme flytcelle, klargjør du en ekvimolar blanding av opptaksbibliotekene og sekvenserer 100-120 M lesinger per bibliotek.
    2. Hvis allel-spesifikk analyse er nødvendig, sekvens 150 bp paret ende for å sikre tilstrekkelig SNP dekning.

3. Dataanalyse

  1. Bruk HiC-Pro-datasamlebåndet til å utføre Capture Hi-C-dataanalyse55. HiC-Pro tilbyr kvalitetskontroller på hvert trinn i behandlingen, inkludert (figur 3):
    (i) Justeringshastigheten på referansegenomet som spesifiserer brøkdelen av avlesninger som spenner over et ligeringssted, samt antall par og singletoner.
    (ii) Fraksjonen av gyldige ligeringsprodukter og ikke-informative lesepar (dinglende ende, selvligering osv.).
    (iii) Fraksjonen av korte/langdistanse og intra/interkromosomale kontakter.
    (iv) Andelen målkontakter for Capture Hi-C.
    (v) Brøkdelen av allel-spesifikk leser hvis spesifisert.
    MERK: HiC-Pro støtter et bredt spekter av protokoller, inkludert in situ Hi-C og Capture Hi-C. I sistnevnte tilfelle trenger brukeren bare å spesifisere målområdet (BED-format) i konfigurasjonsfilen. Når dataene er behandlet, kan HiC-Pro-utgangene enkelt konverteres til et kjøligere objekt for nedstrømsanalyse56. På dette trinnet normaliseres kontaktkartene ved ulike oppløsninger ved hjelp av ICE-metoden som tidligere er beskrevet av Imakaev og kolleger57. Flere analyser kan deretter kjøres for å kalle kromosomrom, TAD eller kromatinløkker (for gjennomgang58). Arbeidsflyten til protokollen er vist i figur 4. Her brukes "cooltools"-pakken for å beregne isolasjonsscore og TAD-grenser, som illustrert i figur 5 og figur 659.

Representative Results

Den beskrevne Capture Hi-C-protokollen er basert på fremstillingen av den genombrede 3C-malen ved bruk av en firebasekutter (DpnII). Den etterfølgende anrikningen av ligeringsfragmenter over det genomiske området av interesse oppnås ved hybridisering av en rekke flisleggings-RNA-prober og deres streptapavidinbaserte fangst i henhold til målanrikningssystemet som ble brukt i denne studien (figur 1). Biotinylerte RNA-prober ble valgt da de viser strammere bindingsaffinitet til sine mål sammenlignet med DNA-prober 52,60. Registrerte biblioteker blir deretter indeksert og samlet for multiplekset sekvensering av høy gjennomstrømning. Capture Hi-C-data kan visualiseres som høyoppløselige Hi-C-interaksjonskart, men også som 4C-lignende kontaktkart med enkelt synspunkt for spesifikt å visualisere samspillet mellom mindre sekvenser som promotorer eller forsterkere i hele den fangede regionen. Arbeidsflyten til protokollen er vist i figur 4. Kvalitetskontroller for sekvensering er vist i figur 2 og inkluderer vurdering av riktig fordøyelse og re-ligering av 3C-malen og dens effektive skjæring og rensing på tvers av de forskjellige trinnene i protokollen. Det avskårne 3C-mal-DNA-et forventes å løpe mellom 150 og 700 bp, og ingen anrikning av fragmenter >2 kb skal detekteres. Under de følgende trinnene utføres flere perlebaserte DNA-oppryddings- og størrelsesvalgstrinn, først etter skjæringen, deretter etter PCR-ene før fangst og etter fangst. Rengjorte biblioteker viser en distinkt fragmentberikelsesprofil som visualisert på en DNA-bioanalysator med høy følsomhet (figur 2). Den gjennomsnittlige fragmentstørrelsen øker i løpet av bibliotekforberedelsen på grunn av ligering av adaptere, sekvensering og indeksering av primere. Kvalitetskontroller etter sekvensering er innhentet via Hi-C Pro og vist i figur 3. Mange forskjellige bioinformatikk programvare har blitt foreslått for 3C-lignende databehandling og analyse. Blant dem er HiC-Pro-rørledningen en av de mest populære løsningene, som tillater behandling av rå sekvenseringsdata til de endelige kontaktkartene ved forskjellige oppløsninger55. HiC-Pro bruker en totrinns kartleggingsstrategi for å justere sekvenseringsavlesningene på referansegenomet. 3C-produktene blir deretter rekonstruert og filtrert ut for å fjerne ikke-informative kontaktpar og for å generere kontaktkartene. I tillegg er det i stand til å bruke en liste over kjente polymorfismer for å utføre allel-spesifikk analyse og å skille kontaktene som kommer fra de to foreldreallelene i forskjellige kontaktkart. Mer nylig har HiC-Pro blitt inkludert og utvidet til nf-core-rammeverket (nf-core-hic), noe som gir en svært skalerbar og reproduserbar fellesskapsdrevet pipeline61,62.

For å fange musen Xic ble en matrise med 28 913 RNA-sonder med 3 Mb av X-kromosomet designet. Denne regionen inkluderer nøkkelspilleren i XCI, det lange ikke-kodende genet Xist, og dets kjente ~ 800 kb regulatoriske landskap (figur 5). Denne ~ 800 kb-regionen er delt inn i to TADer: en inkludert Xist-promotoren og dens kjente positive regulatorer (dvs. de ikke-kodende transkripsjonene Ftx, Jpx og Xert og det proteinkodende genet Rnf12), og nabolandet TAD som omfatter de negative cis-regulatorene til Xist (dvs. dets antisense-transkripsjon Tsix, forsterkerelementet Xite og ikke-kodende transkripsjon Linx) (for gjennomgang44, 45).

Ved å anvende den beskrevne Capture Hi-C-protokollen på Xic, ble den topologiske organisasjonen av dette lokuset oppnådd ved enestående oppløsning (figur 6 og figur 7). Dette er spesielt tydelig når man sammenligner Capture Hi-C-profilen med tidligere publisert 5C47 (figur 6 og figur 7; Tilleggstabell 1) og Hi-C61 (figur 6 og figur 7; Tilleggstabell 1) Profiler. For eksempel er sub-TAD-strukturer tydeligere - TAD som inneholder Xist-promotoren (Xist-TAD) er tydelig delt inn i to mindre domener (figur 6A, blå pilspiss). Tidligere kunne dette bare visuelt "gjettes" fra 5C-profilen (figur 6B), om enn deteksjonen av en grense i denne regionen ved hjelp av isolasjonspoengalgoritmen. På samme måte tillater oppløsningen av Capture Hi-C-profilen identifisering av to mindre domener i nabolandet TAD (figur 6A, B), som inneholder promotoren av Tsix-lokuset (Tsix-TAD); Dette ble ikke tidligere oppnådd med 5C (figur 6B). Det er verdt å merke seg at topologiske grenser bestemt av isolasjonspoengsummen fra Capture Hi-C- og 5C-dataene generelt oppdages på litt forskjellige steder og med forskjellige relative styrker.

Videre er andre sub-TAD-strukturer som kontaktsløyfer tydelig synlige fra Capture Hi-C-dataene, for eksempel sløyfen mellom Xist og Ftx (figur 7A), tidligere identifisert med Capture-C63, og sløyfen mellom Xist og Xert (figur 7B), nylig identifisert ved hjelp av en lignende protokoll for Capture Hi-C48. Andre kontakter kan også kartlegges mer presist på grunn av den økte oppløsningen til Capture Hi-C-profilene, for eksempel de som danner de kjente kontaktpunktene i Tsix-TAD mellom Linx, Chic1 og Xite-lociene (figur 7A).

Sammenlignet med Hi-C-dataene vist i figur 7, tillot Capture Hi-C en firedobling i oppløsning, men det krevde bare en fjerdedel av sekvenseringsdybden (dvs. 126 M leser mot 571 M) (tilleggstabell 1). Denne økningen i oppløsning gjør det mulig å oppdage subTADer og looping-interaksjoner som ikke kunne oppdages av Hi-C ved sekvenseringsdybden vist i figur 6 og figur 7. Den beskrevne protokollen for Capture Hi-C tillater dermed en mye mer detaljert, høyoppløselig karakterisering av et stort genomisk område av interesse, sammenlignet med tidligere tilnærminger.

Figure 1
Figur 1: Sondedesign. Skjematisk fremstilling av strategien som brukes til sondedesign. Regioner på 300 bp oppstrøms og nedstrøms for hvert DpnII-restriksjonssted over målområdet på 3 Mb ble valgt og flislagt med overlappende biotinylerte RNA-sonder. Ett av disse utvalgte områdene vises, chrX: 102 474 805-102 475 500. Ikke mer enn 40 baser av repeterende sekvenser er tillatt i hver sonde. Klikk her for å se en større versjon av denne figuren.

Figure 2
Figur 2: Ta opp kvalitetskontroller for Hi-C-sekvensering . (A) Representativt eksempel på 3C-malkvalitetskontroller. 200 ng DNA ble lastet på en 1% agarosegel. Lane 1: 1 kb stige. Lane 2: Ufordøyd, tverrbundet og intakt kromatin går som et skarpt bånd på >10 kb. Lane 3: DpnII-fordøyd tverrbundet kromatin går som et smør mellom 1 kb til 3 kb i størrelse. Lane 4: Endelig 3C bibliotek eller mal; frie ender av fordøyde tverrbundne DNA-fragmenter blir re-ligert. DNA-smøret av lavere molekylær størrelse er nesten uoppdagelig, og ligeringsproduktet detekteres som et bånd på >10 kb. (B) Representative eksempler på høysensitiv bioanalysator DNA-profiler. Øverst til venstre: vellykket skåret 3C-bibliotek som viser en fordeling av fragmentstørrelse mellom 150 bp og 700 bp. Øverst til høyre: utilfredsstillende skåret 3C-bibliotek. Uskåret DNA påvises som bred anrikning av fragmenter >2 kb. (C) Nederst til venstre: skjæret DNA-prøve etter en 1: 1 venstre sidestørrelsesvalg ved hjelp av SPRI-perler. Fragmenter på ~ 300 bp er beriket. Nederst i midten: Forhåndsopptak av PCR-profil etter ligering av sammenkoblede adaptere i henhold til produsentens protokoll. Nederst til høyre: endelig Capture Hi-C-bibliotek inkludert adaptere, sekvensering og indeksering av primere for multiplekset sekvensering. Forkortelser: bp = basepar, FU = vilkårlig fluorescensenhet. Klikk her for å se en større versjon av denne figuren.

Figure 3
Figur 3: Ta opp Hi-C kvalitetskontroller etter sekvensering med HiC-Pro . (A) Eksempel på kartleggingshastighet på referansegenomet for førstekompis av sekvenseringsparene. Den lyseblå brøken representerer avlesningene justert av HiC-Pro og spenner over et ligeringskryss. Denne beregningen kan dermed brukes til å validere det eksperimentelle ligeringstrinnet. (B) Når sekvenseringskameratene er justert på genomet, holdes bare unikt justerte lesepar for analyse. (C) Ikke-gyldige par (i rødt) som dinglende, selvsirkel eller re-ligering forkastes fra analysen. Fraksjonen av gyldige par er en god indikator på ligering og nedtrekkseffektivitet. (D) De gyldige parene kan videre deles inn i intra/interkromosomale og korte/langdistansekontakter. Dupliserte lesepar som sannsynligvis representerer PCR-artefakter, forkastes fra analysen. (E) For allel-spesifikk analyse rapporterer HiC-Pro antall alleliske avlesninger støttet av enten en eller to kamerater for hvert foreldregenom (dvs. C57BL/6J x CASTEi/J). Den samme brøkdelen av lesningene som tilordnes mors- og farsalelen forventes. (F) Til slutt velges bare gyldige par som overlapper fangstområdet for å bygge kontaktkartene. Capture-capture-par representerer kontakter innenfor det målrettede området, mens capture-reporter-par involverer samhandling mellom målområdet og et utenfor målet. Klikk her for å se en større versjon av denne figuren.

Figure 4
Figur 4: Arbeidsflyt for Capture Hi-C-protokoll. Skjematisk fremstilling av ulike protokolltrinn. For å generere den genombrede 3C-malen, blir kromatin først kryssbundet med formaldehyd og deretter fordøyd med DpnII-restriksjonsenzymet. Frie DNA-ender blir deretter re-ligert, kryssbinding reverseres, og DNA renses. For å berike fragmenter som omfatter målområdet, hybridiseres en rekke biotinylerte RNA-sonder til 3C-malen og fanges opp av streptavidinmediert nedtrekk. Opptaksbiblioteker behandles for multiplekset sekvensering, og gyldige ligeringsfragmenter kvantifiseres for å utlede frekvensen av kromatinkontakter over målet, som visualiseres som samhandlingskart med høy oppløsning. Klikk her for å se en større versjon av denne figuren.

Figure 5
Figur 5: Oversikt over regionen som omfatter Xic på musens X-kromosom. Skjematisk fremstilling av musens X-kromosom og zoom inn på 3 Mb fanget region (ChrX: 102,475,000-105,475,000). Den målrettede regionen inkluderer ~ 800 kb DNA som tilsvarer Xic, hovedreguleringsstedet til XCI. Xic inkluderer de lange ikke-kodende genene, Xist, en nøkkelspiller i XCI, og dets regulatoriske landskap. Positive regulatorer av Xist er vist i grønt og negative regulatorer i lilla. Klikk her for å se en større versjon av denne figuren.

Figure 6
Figur 6: Ta opp Hi-C-, 5C- og Hi-C-interaksjonskart over området som er fanget med 3 Mb. (A) Ta Hi-C-interaksjonskart over 3 Mb-målet som omfatter musen Xic med 10 kb oppløsning (denne studien). (B) 5C interaksjonskart over samme målregion som i A ved 6 kb oppløsning (data reprosessert fra47). Repetitive regioner som ikke er inkludert i analysene er maskert i hvitt. 5C-dataene krever egen bioinformatikkbehandling (se47). Etter rengjøring og justering blir 5C-kartene ved primeroppløsningen binned ved hjelp av en løpende median (vindu = 30 kb, trinn = 5) for å nå en endelig oppløsning på 6 kb. (C) Hi-C interaksjonskart over samme genomiske region som i A og B ved 40 kb oppløsning (data reprosessert fra64). Alle interaksjonskart ble generert fra muse-ESC-er. Isolasjonsscoren ble beregnet ved hjelp av kjøleverktøy og er representert som histogrammer med isolasjonsminimer ved TAD-grenser. TAD-grenser vises som vertikale linjer under kartet. Høyden på hver linje indikerer grensestyrke. Gener vises som piler som peker i transkripsjonsretningen. Sub-TAD-grenser som registreres utelukkende eller mer presist i Capture Hi-C-kart, angis med magenta og blå pilspisser for sub-TAD-er i henholdsvis Tsix og Xist TAD. Klikk her for å se en større versjon av denne figuren.

Figure 7
Figur 7: Ta opp Hi-C-, 5C- og Hi-C-interaksjonskart over 1 Mb i det fangede området. (A) Ta Hi-C interaksjonskart over 1 Mb genomisk region som omfatter musen Xic ved 5 kb oppløsning (denne studien). (B) 5C interaksjonskart over samme genomiske region som i A. ved 6 kB oppløsning (data behandlet på nytt fra47). Repetitive regioner som ikke er inkludert i analysene er maskert i hvitt. Merk at 5C-dataene krever egen bioinformatikkbehandling (se47). Etter rengjøring og justering blir 5C-kartene ved primeroppløsningen binned ved hjelp av en løpende median (vindu = 30 kb, trinn = 5) for å nå en endelig oppløsning på 6 kb. (C) Hi-C interaksjonskart over samme genomiske region som i A og B av Hi-C ved 20 kb oppløsning (data reprosessert fra64). Alle interaksjonskart ble generert fra mESC-er. Isolasjonsscoren ble beregnet ved hjelp av kjøleverktøy og er representert som histogrammer med isolasjonsminimer ved TAD-grenser. TAD-grenser vises som vertikale linjer under kartet. Høyden på hver linje indikerer grensestyrke. Gener vises som piler som peker mot transkripsjonsretningen. Kontaktsløyfer som registreres utelukkende eller mer presist i Capture Hi-C, er indikert med magenta og blå stjerner for løkker i henholdsvis Tsix og Xist TAD. Klikk her for å se en større versjon av denne figuren.

Tilleggstabell 1: Postsekvenseringsstatistikk for datasettene som er brukt i dette manuskriptet: Capture Hi-C (denne studien), Hi-C64 og 5C47. Klikk her for å laste ned denne filen.

Discussion

Her beskriver vi en relativt rask og enkel Capture Hi-C-protokoll for å karakterisere den høyere ordens organisasjonen av megabase-størrelse genomiske regioner ved 5-10 kb oppløsning. Capture Hi-C tilhører familien av Capture-C-teknologier som er designet for å berike målrettede kromatininteraksjoner fra genombrede 3C- eller Hi-C-maler. Hittil har det store flertallet av Capture-C-applikasjoner blitt utnyttet til å kartlegge kromatinkontakter av relativt små regulatoriske elementer spredt over hele genomet. I den første Capture-C-protokollen ble flere overlappende RNA-biotinylerte sonder brukt til å fange >400 forhåndsvalgte promotorer i 3C-biblioteker fremstilt fra erytroide celler31. Den samme strategien ble senere forbedret i Next Generation (NG) og Nuclear Titrated (NuTi) Capture-C for å oppnå høyoppløselige interaksjonsprofiler på >8,000 promotorer ved å bruke enkle 120 bp DNA-agn som spenner over enkeltbegrensningssteder og to sekvensielle runder med Capture for å maksimere anrikningen av informative ligeringsfragmenter 32,40. Disse strategiene førte til funksjonell disseksjon av cis-virkende elementer i mange forskjellige sammenhenger, inkludert musembryonal utvikling, celledifferensiering, X-kromosominaktivering og genfeilregulering ved patologiske forhold 46,63,65,66,67,68,69,70,71.

I Promoter Capture Hi-C (PCHi-C) ble >22 000 kommenterte promotorer som inneholdt restriksjonsfragmenter trukket ned fra Hi-C-biblioteker ved hybridisering av enkelt RNA 120-mer biotinylerte sonder i en eller begge ender av restriksjonsfragmentet34,72. Denne metoden tillot disseksjon av interaktomet av tusenvis av promotorer i et raskt økende antall celletyper, inkludert musembryonale stamceller, føtale leverceller og adipocytter 34,35,72,73, men også humane lymfoblastoidlinjer, hematopoietiske forfedre, epidermale keratinocytter og pluripotente celler 37,74,75,76,77.

Sammenlignet med disse målberikelsesteknologiene, retter Capture Hi-C seg mot sammenhengende genomiske regioner opp til megabase-skalaen, og spenner dermed over en eller flere TAD-er og omfatter regulatoriske landskap av gener. Hele interesseområdet må flislegges med en rekke biotinylerte sonder som omfatter hvert DpnII-restriksjonssted innenfor målet. Hybridiseringen av den biotinylerte matrisen til 3C-malen, dens påfølgende streptavidinbaserte fangst og prosessering for multiplekset sekvensering utføres ved hjelp av et målanrikningssystem for Illumina Paired-End multiplekset sekvensering. Hele protokollen er rask, da den kan utføres på 1 uke fra klargjøring av 3C-bibliotek til NGS-sekvensering, og den krever bare mindre tilpasninger og/eller spesialspesifikk feilsøking.

Protokollen gir også fordeler sammenlignet med andre 3C-baserte metoder. For å få interaksjonskart med en oppløsning på 5-10 kb, sekvenserte vi 100-120 M parede endeavlesninger. Til sammenligning brukte vi her et Hi-C-datasett på 571 M-avlesninger for å nå en oppløsningpå 20 kb 64 (GSM2053973), og minst 1 milliard avlesninger ville være nødvendig for å nå en 5 kb-oppløsning med kromosombrede Hi-C22.

Capture Hi-C som brukt i denne studien oppnår en mye høyere oppløsning enn den tidligere publiserte 5C basert på et 6-bp kutterrestriksjonsenzym47 (tilleggstabell 1). Det er viktig at strategien som er utformet for å berike og forsterke målrettede interaksjoner i 5C, ikke tillater allelspesifikk analyse av kromatininteraksjoner. Tvert imot kan Capture Hi-C-data kartlegges allel-spesifikt, slik at disseksjon av 3D-strukturelle landskap av par homologe kromosomer, for eksempel i humane celler eller i F1-hybridcellelinjer avledet ved å krysse genetisk forskjellige musestammer78. For å generere allelspesifikke Capture Hi-C-interaksjonskart med en oppløsning på 5 kb, sekvenserte vi 150 bp parvise avlesninger for å øke SNP-dekningen. Lignende allel-spesifikke tilnærminger kan brukes på humane cellelinjer, for hvilke annotasjonen av SNPs er tilgjengelig22.

Det er viktig at selv om Capture Hi-C generelt sikrer høy oppløsning samtidig som de forbedrer overkommeligheten til sekvenseringskostnadene, har produksjonen av skreddersydde biotinylerte oligonukleotider innvirkning på den totale kostnaden for denne metoden. Derfor vil valget av den mest passende 3C-metoden variere for forskjellige applikasjoner, og vil avhenge av det biologiske spørsmålet som tas opp og oppløsningen som kreves, samt størrelsen på interesseområdet. Andre Capture Hi-C-protokoller utviklet deler viktige funksjoner med protokollen beskrevet her. For eksempel ble en Capture Hi-C-strategi brukt for å karakterisere ~ 50 kb til 1 Mb genomiske regioner som spenner over ikke-kodende varianter assosiert med bryst- og kolorektal kreftrisiko; i denne protokollen ble målregioner trukket ned fra Hi-C-biblioteker ved å hybridisere 120-mer RNA-agn som flislegger målregionene med en 3x dekning33,38,79. På samme måte ble HYbrid Capture Hi-C (Hi-C 2) brukt til å målrette interaksjoner innenfor interesseområder opp til2 Mb80. I begge protokollene økte bruken av en Hi-C-mal beriket for biotin-nedtrukne ligeringsfragmenter prosentandelen av totale informative avlesninger sammenlignet med protokollen vår. For eksempel, i Hi-C-datasettet vi brukte her for sammenligning64 (GSM2053973), er prosentandelen gyldige par etter fjerning av duplikater 4,8 ganger høyere enn de gyldige parene oppnådd i Capture Hi-C som beskrevet i figur 3 og tilleggstabell 1. Imidlertid gjør den påfølgende nedtrekkingen av biotinylerte ligerte fragmenter og hybridiserte sonder protokollen betydelig mer kompleks og tidkrevende, samtidig som den muligens reduserer kompleksiteten til den fangede regionen.

En annen tilgjengelig metode for å berike 3C-maler med flisleggingsprober er Tiled-C, som ble brukt til å studere kromatinarkitektur ved høy romlig og tidsmessig oppløsning under musens erytroide differensiering43. I Tiled-C brukes et panel med 70 bp biotinylerte sonder til å berike kontakter i store regioner i to påfølgende fangstrunder for å generere svært høyoppløselige kart over målrettede interaksjoner43,81. Den doble fangstberikelsen gjør også protokollen lengre og mer kompleks sammenlignet med Capture Hi-C. I motsetning til Capture-C-strategiene rettet mot enkeltrestriksjonslokaliteter, ser det imidlertid ikke ut til at andre fangstrunde i Tiled-C øker fangsteffektiviteten vesentlig, og kan derfor trolig utelates43. Til slutt ble en lignende flisleggingstilnærming basert på den samme målberikelsesstrategien som ble brukt i denne studien, anvendt på disseksjon av regulatoriske landskap som omfatter strukturelle varianter beskrevet hos pasienter med medfødte misdannelser og rekonstruert i transgene mus41,42. I dette tilfellet ble flisleggingsmatrisen av sonder designet over hele målet i stedet for i nærheten av DpnII-restriksjonssteder41. Ikke desto mindre var dette arbeidet avgjørende for å fremheve følsomheten og kraften i denne strategien for å oppnå høyoppløselig karakterisering av store genomiske regioner i forskjellige sammenhenger41,42,48.

Avslutningsvis representerer protokollen beskrevet her en enkel, robust og kraftig strategi for høyoppløselig 3D-karakterisering av alle genomiske regioner av interesse. Anvendelsen av denne tilnærmingen til forskjellige modellsystemer, celletyper, utviklingsregulerte kromatinlandskap og genregulering under sunne og patologiske forhold vil sannsynligvis lette vår forståelse av samspillet og kausaliteten mellom genomtopologi og genregulering, et av de grunnleggende åpne spørsmålene innen epigenetikkfeltet. Videre har bruk av Capture Hi-C for å kartlegge langdistanseinteraksjoner og høyere ordens kromatinfolding av risikovarianter identifisert av GWAS-studier potensialet til å avsløre den funksjonelle relevansen av ikke-kodende genomiske loci assosiert med menneskelige sykdommer i forskjellige sammenhenger, og dermed gi ny innsikt i prosessene som potensielt ligger til grunn for patogenesen.

Disclosures

Kai Hauschulz er Field Application Scientist ved Agilent Technologies - Diagnostic and Genomics Group. Alle andre forfattere erklærer ingen konkurrerende interesser.

Acknowledgments

Arbeidet i Heard-laboratoriet ble støttet av en European Research Council Advanced Investigator-pris (XPRESS - AdG671027). AL støttes av en EU Marie Skłodowska-Curie Actions Individual Fellowship (IF-838408). AH støttes av ITN Innovative and Interdisciplinary Network ChromDesign, under Marie Skłodowska-Curie Grant-avtalen 813327. Forfatterne er takknemlige til Daniel Ibrahim (MPI for Molecular Genetics, Berlin) for nyttige tekniske råd, til NGS-plattformen ved Institut Curie (Paris), og til Vladimir Benes og Genomics Core Facility ved EMBL (Heidelberg), for støtte og assistanse.

Materials

Name Company Catalog Number Comments
10x PBS pH 7.4 Gibco 10010-023
37% (vol/vol) paraformaldehyde solution Electron Microscopy Sciences 15686 single use glass-vials; do not reuse
50 mL PP conical tube Falcon 352070
Agarose Sigma A9539-500g
Bioanalyzer Agilent G2939BA
Cell Scrapers - 25 cm Handle and 3.0 cm Blade Falcon 353089
CHIR99021 Axon Medchem BV Axon 1386
cOmplete Mini, Protease inhibitor cocktail (EDTA-free) Merck 11836170001
Countess Cell Counting Chamber Slides Invitrogen C10228
Countess II FL Invitrogen ZGEXSCCOUNTESS2FL Automated cell counter
Covaris S2 Covaris 500217 Sonicator
DNA LoBind tube, 1.5 mL Eppendorf 30108051
DpnII (50000 units/mL) New England Biolabs R0543M
Dulbecco's Modified Eagle Medium (DMEM) Merck D6429
Ethanol (100%) Merck 1.00983.2500
Fetal Bovine Serum (FBS) Thermo Scientific 10270106
gelatine from porcine skin Sigma G1890
GeneRuler 1 kb Plus DNA Ladder Thermo Scientific SM0313
GlycoBlue Thermo Scientific AM9516 Coprecipitant
High-Sensitivity Bioanlayzer chips Agilent 5067-4626
Large Cooling Centrifuge 5920 R Eppendorf 5948000018
leukaemia inhibitory factor (LIF) Merck ESG1107
Liquiport KNF NF300 Benchtop aspiration system
Low-binding filter tips Biozym VT0260U, VT0240, VT0220, VT0200U
Molecular biology grade water Merck W3500-6x500ML
Next Seq 500 Illumina SY-415-1001
Next Seq 500 High Output v2 Kit (300 cycles) Illumina FC-404-2004
Nonidet P40 Substitute (NP40) Merck 11332473001
PD0325901 Axon Medchem BV Axon 1408
Protease inhibitor cocktail (EDTA-free) Merck 11873580001
Proteinase K - recombinant, PCR-grade (20 mg/mL) Thermo Scientific EO0491
Qubit 2.0 Thermo Scientific Q32871
Qubit assay tubes Thermo Scientific Q32856
Qubit dsDNA High Sensitivity kit Thermo Scientific Q32851
RNase A (10 mg/mL) Thermo Scientific EN0531
Sodium acetate pH 5.2 (3M) Merck S7899
speed vacuum concentrator Eppendorf EP5305000100-1EA
Agencourt AMPureXP Beckman Coulter A63881 SPRI beads
SureSelect Target Enrichment Box 1 Agilent 5190-8645
SureSelect Target Enrichment Kit ILM Indexing Hyb Module Box 2 Agilent 5190-4455
SureSelect XT Library Prep Kit ILM Agilent 5500-0132
T4 ligase (30 units/µL) Thermo Scientific EL0013
table-top Centrifuge 5427 R Eppendorf 5409000012
Triton-X-100 (500 mL) Merck X100-500ML
Trypan Blue Invitrogen T10282
Trypsine Thermo Scientific 25300054
UltraPure Glycine Thermo Scientific 15527013
β-mercaptoethanol Thermo Scientific 31350010

DOWNLOAD MATERIALS LIST

References

  1. Ibrahim, D. M., Mundlos, S. The role of 3D chromatin domains in gene regulation: a multi-facetted view on genome organization. Current Opinion in Genetics & Development. 61, 1-8 (2020).
  2. Bolt, C. C., Duboule, D. The regulatory landscapes of developmental genes. Development. 147 (3), (2020).
  3. Glaser, J., Mundlos, S. 3D or not 3D: Shaping the genome during development. Cold Spring Harbor Perspectives in Biology. 14 (5), 040188 (2021).
  4. Denker, A., De Laat, W. The second decade of 3C technologies: detailed insights into nuclear organization. Genes & Development. 30 (12), 1357-1382 (2016).
  5. Kempfer, R., Pombo, A. Methods for mapping 3D chromosome architecture. Nature Reviews Genetics. 21 (4), 207-226 (2020).
  6. McCord, R. P., Kaplan, N., Giorgetti, L. Chromosome conformation capture and beyond: Toward an integrative view of chromosome structure and function. Molecular Cell. 77 (4), 688-708 (2020).
  7. Jerkovic, I., Cavalli, G. Understanding 3D genome organization by multidisciplinary methods. Nature ReviewsMolecular Cell Biology. 22 (8), 511-528 (2021).
  8. Hsieh, T. -H. S., et al. Mapping nucleosome resolution chromosome folding in yeast by Micro-C. Cell. 162 (1), 108-119 (2015).
  9. Krietenstein, N., et al. Ultrastructural details of mammalian chromosome architecture. Molecular Cell. 78 (3), 554-565 (2020).
  10. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing chromosome conformation. Science. 295 (5558), 1306-1311 (2002).
  11. Naumova, N., Smith, E. M., Zhan, Y., Dekker, J. Analysis of long-range chromatin interactions using Chromosome Conformation Capture. Methods. 58 (3), 192-203 (2012).
  12. Simonis, M., et al. Nuclear organization of active and inactive chromatin domains uncovered by chromosome conformation capture-on-chip (4C). Nature Genetics. 38 (11), 1348-1354 (2006).
  13. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra-and interchromosomal interactions. Nature Genetics. 38 (11), 1341-1347 (2006).
  14. Würtele, H., Chartrand, P. Genome-wide scanning of HoxB1-associated loci in mouse ES cells using an open-ended Chromosome Conformation Capture methodology. Chromosome Research. 14 (5), 477-495 (2006).
  15. De Wit, E., De Laat, W. A decade of 3C technologies: insights into nuclear organization. Genes & Development. 26 (1), 11-24 (2012).
  16. Dostie, J., et al. Chromosome Conformation Capture Carbon Copy (5C): a massively parallel solution for mapping interactions between genomic elements. Genome Research. 16 (10), 1299-1309 (2006).
  17. Splinter, E., et al. The inactive X chromosome adopts a unique three-dimensional conformation that is dependent on Xist RNA. Genes & Development. 25 (13), 1371-1383 (2011).
  18. Ferraiuolo, M. A., Sanyal, A., Naumova, N., Dekker, J., Dostie, J. From cells to chromatin: capturing snapshots of genome organization with 5C technology. Methods. 58 (3), 255-267 (2012).
  19. Kim, J. H., et al. 5C-ID: Increased resolution Chromosome-Conformation-Capture-Carbon-Copy with in situ 3C and double alternating primer design. Methods. 142, 39-46 (2018).
  20. Lieberman-Aiden, E., et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science. 326 (5950), 289-293 (2009).
  21. Zhang, Y., et al. Spatial organization of the mouse genome and its role in recurrent chromosomal translocations. Cell. 148 (5), 908-921 (2012).
  22. Rao, S. S. P., et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell. 159 (7), 1665-1680 (2014).
  23. Dixon, J. R., et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature. 485 (7398), 376-380 (2012).
  24. Nora, E. P., et al. Spatial partitioning of the regulatory landscape of the X-inactivation centre. Nature. 485 (7398), 381-385 (2012).
  25. Krefting, J., Andrade-Navarro, M. A., Ibn-Salem, J. Evolutionary stability of topologically associating domains is associated with conserved gene regulation. BMC Biology. 16 (1), 87 (2018).
  26. Galupa, R., Heard, E. Topologically associating domains in chromosome architecture and gene regulatory landscapes during development, disease, and evolution. Cold Spring Harbor Symposia on Quantitative Biology. 82, 267-278 (2017).
  27. Tena, J. J., Santos-Pereira, J. M. Topologically associating domains and regulatory landscapes in development, evolution and disease. Frontiers in Cell and Developmental Biology. 9, 702787 (2021).
  28. Lupiáñez, D. G., Spielmann, M., Mundlos, S. Breaking TADs: How alterations of chromatin domains result in disease. Trends in Genetics. 32 (4), 225-237 (2016).
  29. Davidson, I. F., Peters, J. -M. Genome folding through loop extrusion by SMC complexes. Nature Reviews Molecular Cell Biology. 22 (7), 445-464 (2021).
  30. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  31. Hughes, J. R., et al. Analysis of hundreds of cis-regulatory landscapes at high resolution in a single, high-throughput experiment. Nature Genetics. 46 (2), 205-212 (2014).
  32. Davies, J. O. J., et al. Multiplexed analysis of chromosome conformation at vastly improved sensitivity. Nature Methods. 13 (1), 74-80 (2016).
  33. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nature Communications. 6, 6178 (2015).
  34. Schoenfelder, S., et al. The pluripotent regulatory circuitry connecting promoters to their long-range interacting elements. Genome Research. 25 (4), 582-597 (2015).
  35. Sahlén, P., et al. Genome-wide mapping of promoter-anchored interactions with close to single-enhancer resolution. Genome Biology. 16, 156 (2015).
  36. Joshi, O., et al. Dynamic reorganization of extremely long-range promoter-promoter interactions between two states of pluripotency. Cell Stem Cell. 17 (6), 748-757 (2015).
  37. Mifsud, B., et al. Mapping long-range promoter contacts in human cells with high-resolution capture Hi-C. Nature Genetics. 47 (6), 598-606 (2015).
  38. Dryden, N. H., et al. Unbiased analysis of potential targets of breast cancer susceptibility loci by Capture Hi-C. Genome Research. 24 (11), 1854-1868 (2014).
  39. Oudelaar, A. M., Davies, J. O. J., Downes, D. J., Higgs, D. R., Hughes, J. R. Robust detection of chromosomal interactions from small numbers of cells using low-input Capture-C. Nucleic Acids Research. 45 (22), 184 (2017).
  40. Oudelaar, A. M., et al. Single-allele chromatin interactions identify regulatory hubs in dynamic compartmentalized domains. Nature Genetics. 50 (12), 1744-1751 (2018).
  41. Franke, M., et al. Formation of new chromatin domains determines pathogenicity of genomic duplications. Nature. 538 (7624), 265-269 (2016).
  42. Despang, A., et al. Functional dissection of the Sox9-Kcnj2 locus identifies nonessential and instructive roles of TAD architecture. Nature Genetics. 51 (8), 1263-1271 (2019).
  43. Oudelaar, A. M., et al. Dynamics of the 4D genome during in vivo lineage specification and differentiation. Nature Communications. 11 (1), 1-12 (2020).
  44. Galupa, R., Heard, E. X-chromosome inactivation: A crossroads between chromosome architecture and gene regulation. Annual Review of Genetics. 52, 535-566 (2018).
  45. Loda, A., Collombet, S., Heard, E. Gene regulation in time and space during X-chromosome inactivation. Nature Reviews. Molecular Cell Biology. 23 (4), 231-249 (2022).
  46. van Bemmel, J. G., et al. The bipartite TAD organization of the X-inactivation center ensures opposing developmental regulation of Tsix and Xist. Nature Genetics. 51 (6), 1024-1034 (2019).
  47. Galupa, R., et al. A conserved noncoding locus regulates random monoallelic Xist expression across a topological boundary. Molecular Cell. 77 (2), 352-367 (2020).
  48. Gjaltema, R. A. F., et al. Distal and proximal cis-regulatory elements sense X chromosome dosage and developmental state at the Xist locus. Molecular Cell. 82 (1), 190-208 (2022).
  49. Galupa, R., et al. Inversion of a topological domain leads to restricted changes in its gene expression and affects inter-domain communication. Development. 149 (9), (2022).
  50. Savarese, F., Flahndorfer, K., Jaenisch, R., Busslinger, M., Wutz, A. Hematopoietic precursor cells transiently reestablish permissiveness for X inactivation. Molecular and Cellular Biology. 26 (19), 7167-7177 (2006).
  51. Schulz, E. G., et al. The two active X chromosomes in female ESCs block exit from the pluripotent state by modulating the ESC signaling network. Cell Stem Cell. 14 (2), 203-216 (2014).
  52. Gnirke, A., et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nature Biotechnology. 27 (2), 182-189 (2009).
  53. Akgol Oksuz, B., et al. Systematic evaluation of chromosome conformation capture assays. Nature Methods. 18 (9), 1046-1055 (2021).
  54. Piccinini, F., Tesei, A., Arienti, C., Bevilacqua, A. Cell counting and viability assessment of 2D and 3D Cell cultures: Expected reliability of the trypan blue assay. Biological Procedures Online. 19 (1), 8 (2017).
  55. Servant, N., et al. HiC-Pro: an optimized and flexible pipeline for Hi-C data processing. Genome Biology. 16, 259 (2015).
  56. Abdennur, N., Mirny, L. A. Cooler: scalable storage for Hi-C data and other genomically labeled arrays. Bioinformatics. 36 (1), 311-316 (2020).
  57. Imakaev, M., et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization. Nature Methods. 9 (10), 999-1003 (2012).
  58. Forcato, M., et al. Comparison of computational methods for Hi-C data analysis. Nature Methods. 14 (7), 679-685 (2017).
  59. Venev, S., et al. open2c/cooltools: v0.4.1. , (2021).
  60. Wages, J. M. NUCLEIC ACIDS | Immunoassays. Encyclopedia of Analytical Science. , Elsevier. 408-417 (2005).
  61. Ewels, P. A., et al. The nf-core framework for community-curated bioinformatics pipelines. Nature Biotechnology. 38 (3), 276-278 (2020).
  62. Servant, N., Peltzer, A. nf-core/hic: Initial release of nf-core/hic. Zenodo. , (2019).
  63. Furlan, G., et al. The Ftx noncoding locus controls X chromosome inactivation independently of its RNA products. Molecular Cell. 70 (3), 462-472 (2018).
  64. Giorgetti, L., et al. Structural organization of the inactive X chromosome in the mouse. Nature. 535 (7613), 575-579 (2016).
  65. Simon, C. S., et al. Functional characterisation of cis-regulatory elements governing dynamic Eomes expression in the early mouse embryo. Development. 144 (7), 1249-1260 (2017).
  66. Williams, R. M., et al. Reconstruction of the global neural crest gene regulatory network in vivo. Developmental Cell. 51 (2), 255-276 (2019).
  67. Godfrey, L., et al. DOT1L inhibition reveals a distinct subset of enhancers dependent on H3K79 methylation. Nature Communications. 10 (1), 2803 (2019).
  68. Hanssen, L. L. P., et al. Tissue-specific CTCF-cohesin-mediated chromatin architecture delimits enhancer interactions and function in vivo. Nature Cell Biology. 19 (8), 952-961 (2017).
  69. Larke, M. S. C., et al. Enhancers predominantly regulate gene expression during differentiation via transcription initiation. Molecular Cell. 81 (5), 983-997 (2021).
  70. Oudelaar, A. M., et al. A revised model for promoter competition based on multi-way chromatin interactions at the α-globin locus. Nature Communications. 10 (1), 5412 (2019).
  71. Long, H. K., et al. Loss of extreme long-range enhancers in human neural crest drives a craniofacial disorder. Cell Stem Cell. 27 (5), 765-783 (2020).
  72. Schoenfelder, S., Javierre, B. -M., Furlan-Magaril, M., Wingett, S. W., Fraser, P. Promoter Capture Hi-C: High-resolution, genome-wide profiling of promoter interactions. Journal of Visualized Experiments. (136), e57320 (2018).
  73. Siersbæk, R., et al. Dynamic rewiring of promoter-anchored chromatin loops during adipocyte differentiation. Molecular Cell. 66 (3), 420-435 (2017).
  74. Rubin, A. J., et al. Lineage-specific dynamic and pre-established enhancer-promoter contacts cooperate in terminal differentiation. Nature Genetics. 49 (10), 1522-1528 (2017).
  75. Freire-Pritchett, P., et al. Global reorganisation of cis-regulatory units upon lineage commitment of human embryonic stem cells. eLife. 6, 21926 (2017).
  76. Javierre, B. M., et al. Lineage-specific genome architecture links enhancers and non-coding disease variants to target gene promoters. Cell. 167 (5), 1369-1384 (2016).
  77. Miguel-Escalada, I., et al. Human pancreatic islet three-dimensional chromatin architecture provides insights into the genetics of type 2 diabetes. Nature Genetics. 51 (7), 1137-1148 (2019).
  78. Keane, T. M., et al. Mouse genomic variation and its effect on phenotypes and gene regulation. Nature. 477 (7364), 289-294 (2011).
  79. Baxter, J. S., et al. Capture Hi-C identifies putative target genes at 33 breast cancer risk loci. Nature Communications. 9 (1), 1028 (2018).
  80. Sanborn, A. L., et al. Chromatin extrusion explains key features of loop and domain formation in wild-type and engineered genomes. Proceedings of the National Academy of Sciences. 112 (47), 6456-6465 (2015).
  81. Owens, D. D. G., et al. Dynamic Runx1 chromatin boundaries affect gene expression in hematopoietic development. Nature Communications. 13 (1), 773 (2022).

Tags

Tilbaketrekking utgave 188
Dekryptere høyoppløselig 3D-kromatinorganisasjon <em>via</em> Capture Hi-C
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Hauth, A., Galupa, R., Servant, N.,More

Hauth, A., Galupa, R., Servant, N., Villacorta, L., Hauschulz, K., van Bemmel, J. G., Loda, A., Heard, E. Deciphering High-Resolution 3D Chromatin Organization via Capture Hi-C. J. Vis. Exp. (188), e64166, doi:10.3791/64166 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter