Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Dekryptering af 3D-kromatinorganisation med høj opløsning via Capture Hi-C

Published: October 14, 2022 doi: 10.3791/64166

Summary

Denne protokol beskriver Capture Hi-C-metoden, der bruges til at karakterisere 3D-organiseringen af megabaserede målrettede genomiske regioner ved høj opløsning, herunder grænser for topologisk associerende domæner (TAD'er) og langtrækkende kromatininteraktioner mellem regulatoriske og andre DNA-sekvenselementer.

Abstract

Den rumlige organisering af genomet bidrager til dets funktion og regulering i mange sammenhænge, herunder transkription, replikation, rekombination og reparation. At forstå den nøjagtige kausalitet mellem genomtopologi og funktion er derfor afgørende og i stigende grad genstand for intensiv forskning. Kromosomkonformationsfangstteknologier (3C) gør det muligt at udlede 3D-strukturen af kromatin ved at måle hyppigheden af interaktioner mellem enhver region i genomet. Her beskriver vi en hurtig og enkel protokol til at udføre Capture Hi-C, en 3C-baseret målberigelsesmetode, der karakteriserer den allelspecifikke 3D-organisering af megabaserede genomiske mål i høj opløsning. I Capture Hi-C fanges målområder af en række biotinylerede sonder før nedstrøms high-throughput sekventering. Således opnås højere opløsning og allelspecificitet, samtidig med at teknologiens tidseffektivitet og overkommelige pris forbedres. For at demonstrere sine styrker blev Capture Hi-C-protokollen anvendt på musens X-inaktiveringscenter ( Xic), masterregulatorisk locus for X-kromosominaktivering (XCI).

Introduction

Det lineære genom indeholder alle de oplysninger, der er nødvendige for, at en organisme kan gennemgå embryonal udvikling og overleve gennem voksenalderen. At instruere genetisk identiske celler til at udføre forskellige funktioner er imidlertid afgørende for nøjagtigt at kontrollere, hvilke oplysninger der anvendes i specifikke sammenhænge, herunder forskellige væv og/eller udviklingsstadier. Den tredimensionelle organisering af genomet menes at deltage i denne nøjagtige rumlige-tidsmæssige regulering af genaktivitet ved at lette eller forhindre den fysiske interaktion mellem regulatoriske elementer, der kan adskilles af flere hundrede kilobaser i det lineære genom (for anmeldelser 1,2,3). I de sidste 20 år er vores forståelse af samspillet mellem genomfoldning og aktivitet steget hurtigt, hovedsageligt på grund af udviklingen af kromosomkonformationsindfangningsteknologier (3C) (til gennemgang 4,5,6,7). Disse metoder måler hyppigheden af interaktioner mellem alle regioner i genomet og er afhængige af ligering af DNA-sekvenser, der er tæt på 3D-nærhed inden for kernen. De mest almindelige 3C-protokoller starter med fiksering af cellepopulationer med et tværbindingsmiddel, såsom formaldehyd. Det tværbundne kromatin fordøjes derefter med et restriktionsenzym, selvom MNase-fordøjelsen også er blevet anvendt 8,9. Efter fordøjelsen religeres frie DNA-ender i tæt rumlig nærhed, og tværbinding vendes. Dette trin giver anledning til 3C 'biblioteket' eller 'skabelonen', en blandet pulje af hybridfragmenter, hvor sekvenser, der var i 3D-nærhed til kernen, har større chancer for at blive ligeret i det samme DNA-fragment. Nedstrøms kvantificeringen af disse hybridfragmenter gør det muligt at udlede 3D-konformationen af genomiske regioner, der er placeret tusindvis af basepar fra hinanden i det lineære genom, men kan interagere i 3D-rummet.

Der er udviklet mange forskellige tilgange til at karakterisere 3C-biblioteket, der adskiller sig både med hensyn til hvilke delmængder af ligeringsfragmenter der analyseres, og hvilken teknologi der bruges til deres nedstrøms kvantificering. Den oprindelige 3C-protokol var baseret på udvælgelsen af to regioner af interesse og kvantificeringen af deres 'en mod en' interaktionsfrekvens ved PCR10,11. 4C-tilgangen (cirkulær kromosomkonformationsfangst) måler interaktionerne mellem et enkelt interessested (dvs. 'synspunktet') og resten af genomet ('en versus alle')12,13,14. I 4C gennemgår 3C-biblioteket en anden runde af fordøjelse og re-ligering for at generere små cirkulære DNA-molekyler, der er PCR forstærket af synspunktsspecifikke primere15. 5C (chromosome conformation capture carbon copy) muliggør karakterisering af 3D-interaktioner på tværs af større interesseområder og giver indsigt i højere ordens kromatinfoldning inden for denne region ('mange versus mange')16. I 5C hybridiseres 3C-biblioteket til en pulje af oligonukleotider, der overlapper restriktionssteder, der efterfølgende kan forstærkes af multiplex PCR med universelle primere15. I både 4C og 5C blev de informative DNA-fragmenter oprindeligt kvantificeret af mikroarrays og senere ved næste generations sekventering (NGS)17,18,19. Disse strategier karakteriserer målrettede interesseområder, men kan ikke anvendes til at kortlægge genom-dækkende interaktioner. Sidstnævnte mål opnås med Hi-C, en 3C-baseret high-throughput-strategi, hvor massiv parallel sekventering af 3C-skabelonen muliggør upartisk karakterisering af kromatinfoldning på genom-wide level ('all versus all')20. Hi-C-protokollen omfatter inkorporering af en biotinyleret rest i de fordøjede fragmenters ender, som efterfølges af nedtrækning af ligeringsfragmenter med streptavidinperler for at øge genvindingen af ligerede fragmenter20.

Hi-C afslørede, at pattedyrs genomer er strukturelt organiseret på flere skalaer i 3D-kernen. På megabaseskalaen er genomet opdelt i regioner med aktivt og inaktivt kromatin, henholdsvis A- og B-rummene20,21. Eksistensen af yderligere underafdelinger repræsenteret ved forskellige kromatin- og aktivitetstilstande blev også efterfølgende vist22. Ved højere opløsning opdeles genomet yderligere i sub-megabase selvinteragerende domæner kaldet topologisk associerende domæner (TAD'er), først afsløret ved Hi-C og 5C analyse af menneskets og musens genomer23,24. I modsætning til rum, der varierer på en vævsspecifik måde, har TAD'er tendens til at være konstante (selvom der er mange undtagelser). Det er vigtigt, at TAD-grænserne bevares på tværs af arter25. I pattedyrceller omfatter TAD'er ofte gener, der deler det samme regulatoriske landskab og har vist sig at repræsentere en strukturel ramme, der letter gensamregulering, samtidig med at interaktionerne med tilstødende regulatoriske domæner begrænses (til gennemgang 3,26,27,28). Inden for TAD'er kan interaktioner forårsaget af CTCF-steder i bunden af cohesinekstruderede sløjfer desuden øge sandsynligheden for interaktioner mellem promotor og forstærker eller forstærker/forstærker (for gennemgang29).

I Hi-C kan rum og TAD'er detekteres ved 1 Mb til 40 kb opløsning, men højere opløsning kan opnås for at karakterisere mindre kontakter såsom looping interaktioner mellem distale elementer i skalaen 5-10 kb. At øge opløsningen for at kunne detektere sådanne sløjfer effektivt af HiC kræver imidlertid en betydelig stigning i sekventeringsdybden og derfor sekventeringsomkostningerne. Dette forværres, hvis analysen skal være allelspecifik. Faktisk kræver en X-fold stigning i opløsning en X2-stigning i sekventeringsdybde, hvilket betyder, at højopløsnings- og allelspecifikke genom-dækkende tilgange kan være uoverkommeligt dyre30.

For at forbedre omkostningseffektiviteten og overkommelige priser, samtidig med at der opretholdes høj opløsning, kan målområder af interesse fysisk trækkes ned fra genomdækkende 3C- eller Hi-C-biblioteker efter deres hybridisering med komplementære biotinmærkede oligonukleotidprober inden nedstrøms sekventering. Disse målberigelsesstrategier kaldes Capture-C-metoder og tillader forhør af interaktioner mellem hundredvis af målloci spredt over genomet (dvs. Promoter Capture (PC) Hi-C; Næste generation (NG) Capture-C; Lav indgang (LI) Capture-C; nuklear titreret (NuTi) Capture-C; Tri-C)31,32,33,34,35,36,37,38,39,40 eller på tværs af regioner, der spænder over op til flere megabaser (dvs. Capture HiC; HYbrid Capture Hi-C (Hi-C2); Flisebelagt-C)41,42,43. To aspekter kan variere i fangstbaserede metoder: (1) arten og designet af biotinylerede oligonukleotider (dvs. RNA eller DNA, enkelte oligoer, der fanger dispergerede genomiske mål eller flere oligoer, der fliser en region af interesse); og (2) skabelonen, der bruges til at trække mål ned, som kan være 3C- eller Hi-C-biblioteket, sidstnævnte består af biotinylerede restriktionsfragmenter trukket ned fra 3C-biblioteket.

Her beskrives en Capture Hi-C-protokol baseret på berigelse af målkontakter fra 3C-biblioteket. Protokollen er afhængig af designet af et skræddersyet flisebelægningsarray af biotinylerede RNA-sonder og kan udføres på 1 uge fra 3C-biblioteksforberedelsen til NGS-sekventeringen. Protokollen er hurtig, enkel og gør det muligt at karakterisere den højere orden 3D-organisering af megabase-størrelse regioner af interesse ved 5 kb opløsning, samtidig med at tidseffektiviteten og overkommeligheden forbedres sammenlignet med andre 3C-metoder. Capture Hi-C-protokollen blev anvendt på masterregulatorisk locus for X-kromosominaktivering (XCI), X-inaktiveringscentret (Xic), som er vært for Xist noncoding RNA. Xic har tidligere været genstand for omfattende strukturelle og funktionelle analyser (til gennemgang44,45). Hos pattedyr kompenserer XCI for doseringen af X-bundne gener mellem kvinder (XX) og mænd (XY) og involverer transkriptionel hæmning af næsten hele et af de to X-kromosomer i kvindelige celler. Xic har repræsenteret et kraftfuldt, guldstandard locus for studier i 3D genomtopologi og samspillet med genregulering44. 5C-analyse af Xic i embryonale stamceller fra mus (mESC'er) førte til opdagelsen og navngivningen af TAD'er, hvilket gav den første indsigt i den funktionelle relevans af topologisk partitionering og gensamregulering24. Den topologiske organisering af Xic viste sig efterfølgende at være kritisk involveret i den passende udviklingstiming af Xist-opregulering og XCI 46, og uventede cis-regulerende elementer, der kan påvirke genaktivitet inden for og mellem TAD'er, blev også for nylig opdaget inden for Xic47,48,49. Anvendelse af Capture Hi-C på 3 Mb af musens X-kromosom, der spænder over Xic, demonstrerer kraften i denne tilgang til dissekering af kromatinfoldning i stor skala ved høj opløsning. En detaljeret og let at følge protokol leveres, startende fra designet af rækken af biotinylerede sonder på tværs af hvert DpnII-begrænsningssted inden for interesseområdet til generering af det genomdækkende 3C-bibliotek, hybridisering og indfangning af målkontakter og downstream-dataanalyse. Der er også medtaget en oversigt over de relevante kvalitetskontroller og forventede resultater, og både styrkerne og begrænsningerne ved tilgangen diskuteres i lyset af lignende eksisterende metoder.

Protocol

De embryonale stamceller fra mus (mESC'er), der blev anvendt i denne undersøgelse, blev afledt af en krydsning af en TX/TX R26 rtTA/rtTA-hun 50 med en Mus musculus castaneus-han i overensstemmelse med retningslinjerne for dyrepleje fra Institut Curie (Paris)51.

1. Sonde design

  1. Design en række biotinylerede sonder (120-mer RNA-oligonukleotider), der dækker målområdet af interesse.
    1. Flise interesseområdet med overlappende oligonukleotider, så hver sekvens inden for målet i gennemsnit er dækket af to unikke sonder (2x dækning) (figur 1).
    2. Ekskluder gentagne sekvenser fra sondedækning for at undgå berigelse af uspecifikke interaktioner.
      BEMÆRK: For at maksimere berigelsen af informative ligeringsfragmenter blev regioner, der spænder over 300 bp opstrøms og nedstrøms for hvert DpnII-begrænsningssted på tværs af målet, defineret (ChrX: 102.475.000-105.475.000), og 28.913 biotinylerede sonder blev designet i henhold til SureSelect DNA-målberigelsesteknologien gennem Sure Design-platformen52. Ifølge denne strategi tillades op til maksimalt 40 baser af gentagne sekvenser i hvert oligonukleotid for at minimere berigelsen af uspecifikke interaktioner. Sondearrayet blev syntetiseret af Agilent. Her anvendes DpnII som et restriktionsenzym af to grunde: (1) det er en fireskærer, der rutinemæssigt anvendes i flere 3C-baserede metoder53; og (2) det maksimerer chancerne for at fange informative enkeltnukleotidpolymorfier (SNP'er) i nærheden af skærestederne sammenlignet med andre restriktionsenzymer, der blev testet i silico i F1-hybridlinjer, der blev anvendt i denne undersøgelse (C57BL/6J x CASTEi/J).

2. Eksperimentel procedure

  1. Celle forberedelse
    1. Der frøes et passende antal celler på en eller flere cellekulturplader for at opnå et samlet celleantal på ≥ 5 x 107 celler på fikseringsdagen.
      BEMÆRK: Embryonale stamceller fra mus (mESC) blev anvendt i denne undersøgelse. mESC'er er belagt på gelatinerede (0,1% gelatine i 1x PBS - o/n ved 37 °C, 5% CO2-inkubator) cellekulturplader i mESC-medium indeholdende 2i + LIF og batchtestet føtalt kalveserum (DMEM, 15% FBS, 0,1 mM β-mercaptoethanol, 1.000 E/ml-1 leukæmihæmmende faktor (LIF), CHIR99021 (3 μM) og PD0325901 (1 μM)). For denne celletype indeholder en 80% sammenflydende 10 cm plade ca. 2 x 107 celler.
    2. Forbered en ekstra cellekulturplade til celletælling.
      BEMÆRK: En mindre cellekulturplade kan bruges til at reducere medieforbruget. I dette tilfælde skal antallet af celler, der skal frøes på den mindre plade, justeres i overensstemmelse hermed (f.eks. 3x færre celler på en 10 cm plade sammenlignet med en 15 cm plade).
  2. Formaldehydfiksering
    1. Anslå det samlede antal celler, der skal tværbindes.
      1. Før du starter tværbindingsreaktionen, trypsiniserer og tæller celler fra kontrolpladen, der er forberedt specielt til celletælling ved hjælp af en automatiseret celletæller i henhold til producentens anvisninger.
      2. Inkluder en levedygtighedsfarvning (f.eks. Trypan Blue) for at bestemme procentdelen af levedygtige celler54. Ud fra dette celletal estimeres det samlede antal celler i pladen/pladerne, der er forberedt til tværbinding.
    2. Fjern kulturmediet fra pladerne, der er forberedt til tværbinding, og erstat det med den passende mængde fikseringsopløsning (2% formaldehyd i cellekulturmedium). Brug 10 ml på en 10 cm plade (f.eks. ~ 20 ml for en 15 cm plade).
      BEMÆRK: Tilføj en nøjagtig mængde fikseringsopløsning. Hvis fastgørelse af klæbende celler ikke er mulig, kan dette trin tilpasses trypsiniserede celler og udføres i 30 ml fikseringsopløsning i 50 ml koniske centrifugerør. Formaldehyd må ikke være mere end 1 år gammelt. Det foretrækkes at bruge hætteglas til engangsbrug. Fikseringsopløsningen skal bringes til stuetemperatur (RT) før brug.
      FORSIGTIG: Formaldehyd er farligt og skal håndteres i henhold til passende sundheds- og sikkerhedsbestemmelser.
    3. Fastgør i 10 min ved RT under forsigtig blanding på en ryster.
    4. Fikseringsreaktionen slukkes ved tilsætning af 2,5 M glycin-1x PBS til en slutkoncentration på 0,125 M. Der tilsættes 530 μL 2,5 M glycin-1x PBS til 10 ml på en 10 cm plade (f.eks. 1060 μL til 20 ml på en 15 cm plade).
      BEMÆRK: Hvis cellerne blev fastgjort i opløsning, slukkes fikseringsreaktionen med 1590 μL 2,5 M glycin-1x PBS.
    5. Inkuber i 5 minutter ved RT, bland forsigtigt på en ryster.
    6. Overfør pladerne til is og inkuber i yderligere 15 minutter på is, mens du forsigtigt blander på en ryster.
      BEMÆRK: Fra nu af skal cellerne holdes på is, og buffere skal forkøles for at undgå yderligere tværbinding. Flyt til et kølerum, hvis mange plader skal behandles.
    7. Fjern fikseringsopløsningen fra cellerne ved at hælde den i et bægerglas for at sikre hurtig håndtering.
      BEMÆRK: Sørg for at bortskaffe det formaldehydholdige flydende affald i henhold til de relevante sundheds- og sikkerhedsbestemmelser.
    8. Skyl 10 cm pladen hurtigt to gange med 5 ml kold 0,125 M glycin-1x PBS (8 ml for en 15 cm plade) for at vaske snavs og døde celler af. Fjern væsken fra pladen ved at hælde den i et bægerglas for at sikre hurtig håndtering.
    9. Tilsæt 5 ml kold 0,125 M glycin-1x PBS til 10 cm pladen (10 ml for en 15 cm plade) og skrab hurtigt cellerne fra pladen ved hjælp af en plastcelleskraber.
    10. Cellesuspensionen overføres til et forkølet 50 ml konisk centrifugerør ved hjælp af en serologisk pipette.
    11. Pladen skylles to gange med 5 ml kold 0,125 M glycin-1x PBS, og cellesuspensionen tilsættes til det koniske centrifugeglas.
    12. Spin ned ved 480 x g i 10 minutter ved 4 °C.
      BEMÆRK: Hvis cellerne blev fikseret i opløsning, overføres cellen til et forkølet konisk centrifugerør og centrifugeres ned ved 480 x g i 10 minutter ved 4 °C. Fjern fikseringsopløsningen ved at hælde den i et bægerglas og vask tre gange i 10 ml kold 0,125 M glycin-1x PBS. Sørg for at ophænge cellerne igen ved hvert vasketrin.
    13. Supernatanten fjernes ved at aspirere med et bordaspirationssystem. Resuspender cellerne i 500 μL 1x PBS pr. 1 x 107 celler ved forsigtigt at pipettere op og ned med en P1000-pipette. For at resuspendere celler i det nøjagtige volumen henvises til estimeringen af det samlede celleantal opnået i 2.2.1.
    14. Alikvote 500 μL af cellesuspensionen i det beregnede antal 1,5 ml mikrocentrifugeglas (1 x 107 celler/reagensglas).
    15. Spin ned ved 480 x g i 10 minutter ved 4 °C.
    16. Supernatanten fjernes med et benchtop aspirationssystem, og cellepillerne snapfryses i flydende nitrogen. Opbevar tørcellepillerne ved -80 °C.
      BEMÆRK: Prøver kan opbevares i mindst 1 år.
  3. Cellelyse
    1. Optø de(n) frosne pille(r) på is.
    2. Der fremstilles 1,5 ml lysisbuffer i H 2 0 pr. prøve: Der tilsættes 10 mM Tris-HCl, pH 8,0, 10 mM NaCl og0,2% NP40.
    3. Tilsæt 600 μL af den kolde lysisbuffer og resuspender godt på is.
    4. Inkuber på is i 15 minutter for at lade cellerne svulme op.
    5. Centrifugeres ned ved 2655 x g i 5 minutter ved 4 °C, og supernatanten fjernes ved hjælp af et bordaspirationssystem.
    6. For at fjerne snavs resuspenderes pelletten i 1 ml kold lysisbuffer, centrifugeres ned ved 2655 x g i 5 minutter ved 4 °C og supernatanten fjernes.
    7. Drej igen kort tid ved 2655 x g og 4 °C, og fjern så meget af den resterende supernatant som muligt ved hjælp af et bordaspirationssystem udstyret med en P200-spids.
    8. Resuspender i 100 μL 0.5% (vol / vol) SDS.
    9. Der inkuberes i en termomixer ved 62 °C, der roteres ved 1400 o/min i 10 minutter.
    10. Tilsæt 290 μLH2O+ 50 μL 10% TritonX-100 og bland godt, undgå luftbobler.
    11. Der inkuberes i en termomixer ved 37 °C, der hvirvles rundt ved 1400 o/min i 15 minutter.
    12. Tilsæt 50 μL 10x Dpnll buffer og vend røret til blanding.
    13. Tag 50 μL ufordøjet DNA til kvalitetskontrol i et separat rør. Glem ikke at tage den ufordøjede kontrolprøve.
  4. DpnII fordøjelse
    1. Der tilsættes 10 μL Dpnll høj koncentration (500 U i alt) og blandes på hovedet.
    2. Prøverne og den ufordøjede kontrol inkuberes i en termomixer ved 37 °C, der roterer ved 1400 o/min i >4 timer.
    3. Der tilsættes 10 μL Dpnll høj koncentration (500 U i alt) sidst på dagen.
    4. Prøverne og den ufordøjede kontrol inkuberes ved 37 °C, mens de hvirvles rundt ved 1400 o/min natten over.
    5. Der tilsættes 10 μL Dpnll høj koncentration (500 E i alt) i begyndelsen af næste dag til prøverne.
    6. Prøverne og den ufordøjede kontrol inkuberes i en termomixer ved 37 °C, der roterer ved 1400 o/min i 4 timer.
  5. Ligering og tilbageførsel af tværbinding
    1. Reagensglassene inkuberes ved 65 °C i 20 minutter ved 1400 o/min.
      BEMÆRK: Tilføj ikke SDS på dette tidspunkt. Ideen er at bevare nuklear integritet, så ligeringen udføres inde i kernerne og omgår behovet for ekstrem fortynding.
    2. Køl prøverne ned på is i maksimalt 5-10 min. For at undgå SDS-nedbør må prøverne ikke efterlades på is længere end dette.
    3. Tag 50 μL af det uligerede fordøjede DNA til kvalitetskontrol i et separat rør. De ufordøjede og ikke-ligerede kontroller opbevares ved -20 °C.
      BEMÆRK: Glem ikke at tage den ikke-ligerede kontrolprøve.
    4. Tilsæt 800 μL ligationscocktail: 122 μL 10x ligasebuffer, 8 μL T4-ligase (30 U / μL) og 670 μL H20.
    5. Der inkuberes ved 16 °C, hvirvles rundt ved 1000 o/min natten over.
    6. Der tilsættes 7,5 μL proteinase K (20 mg/ml) til prøverne og 2 μL til kontrollerne.
    7. Der inkuberes ved 65 °C i 4 timer ved 1000 o/min.
  6. DNA-oprensning
    1. Overfør prøverne på is til forkølede 15 ml koniske centrifugerør og tilsæt 2 ml vand, 10,5 ml iskold EtOH og 583 μL 3 M NaAC.
      BEMÆRK: Yderligere vand har til formål at forhindre overførsel af DTT til pelleten.
    2. Tilsæt 200 μL iskold EtOH, 10,8 μL NaAC og 1 μL coprecipitant til de ufordøjede og ikke-ligerede kvalitetskontroller.
    3. Der inkuberes ved -80 °C i mindst 4 timer indtil natten over.
    4. Drej 15 ml rørene ved 2200 x g ved 4 °C i 45 min.
    5. Drej 1,5 ml styrerørene ved 20.500 x g ved 4 °C i 30 minutter.
    6. Vask en gang med 3 ml (prøver) og 1 ml (kontroller) iskold 70% EtOH.
    7. Spin ved 2200 x g (prøver) eller 20.500 x g (kontroller) ved 4 °C i 10 min.
    8. Fjern forsigtigt EtOH og lufttør ved RT i 10-15 minutter; Må ikke overdrives.
    9. Prøverne og kontrollerne resuspenderes i henholdsvis 100 μL og 20 μL H20.
    10. Der tilsættes 1 μL RNAseA og inkuberes ved 37 °C, mens der hvirvles rundt ved 1400 o/min i 30 minutter.
  7. Kvalitetskontrol af 3C skabelon forberedelse
    1. Kvantificer hver prøve og kontroller ved hjælp af et fluorometersæt til højfølsomme DNA-koncentrationsmålinger.
    2. Fyld 100-200 ng af hver prøve og hver kontrol på en 1% agarose/1x TBE-gel.
    3. Kontroller, at gelbilledet viser det forventede resultat ved at sammenligne forskellene i DNA-fragmentstørrelser af kontrollerne og 3C-skabelonen som vist i figur 2A.
    4. Prøverne og kontrollerne opbevares ved -20 °C.
  8. Hybridisering, indfangning og prøvebehandling til multiplekseret sekventering
    1. For at hybridisere rækken af biotinylerede RNA-sonder til 3C-skabelonen skal du fange de målrettede ligeringsfragmenter og forberede prøverne til multiplekset sekventering i henhold til målberigelsessystemet, der anvendes i denne undersøgelse til parret multiekset sekventering (se Tabel over materialer). Følg protokollen i henhold til producentens anvisninger, mens du introducerer følgende mindre ændringer:
      1. Afsnit 2 i fabrikantens protokol: Forberedelse af prøver
        1. Følg instruktionerne for målberigelse startende fra 3 μg gDNA-input.
        2. Skær DNA'et i en sonikator ved hjælp af følgende specifikationer: 10% arbejdscyklus, 4 intensitet, 200 cyc / burst og 130 s. Start med 4 μg 3C-skabelon resuspenderet i 130 μL vand for hver indfangningsreaktion for at sikre tilstrækkeligt materiale til at fortsætte prøveforberedelsen med 3 μg af det klippede DNA.
        3. Vurder kvaliteten af klippet DNA. Der køres 1 μL af det klippede DNA på en DNA-bioanalysator i henhold til protokollen med høj følsomhed. Forvent en fordeling af fragmentstørrelse mellem 150-700 bp (figur 2).
        4. Rens prøven ved hjælp af fast fase reversibel immobilisering (SPRI) perler. Der tilsættes 124 μL SPRI-perler til 124 μL af DNA-prøven for at foretage et 1:1 valg i venstre side i henhold til producentens anvisninger og eluere i 25 μL nukleasefrit vand. Dette rensningstrin fjerner kortere fragmenter for at berige fragmenter på omkring 300 bp (figur 2).
          BEMÆRK: Antallet af prøver og SPRI-perler, der anvendes på dette trin, tager højde for det volumentab, der opstod under overførsel af prøverne til nye rør og kørsel af kvalitetskontrollerne på bioanalysatoren. Alle efterfølgende trin til valg af størrelse udføres i henhold til de forhold, der anbefales af producentens protokol. DNA-eluering fra SPRI-perler udføres ved RT gennem hele protokollen.
        5. Vurder kvaliteten af størrelsesvalgt klippet DNA. Der køres 1 μL af det klippede DNA på DNA-bioanalysatoren i henhold til HS-protokollen (High-Sensitiv). Forvent en fordeling af fragmentstørrelser med den højeste berigelse ved 300 bp (figur 2). Gå videre med kvantificeringen af det klippede DNA, hvis klipningen var vellykket.
        6. Kvantificer det klippede DNA med et fluorometersæt til HS-DNA-koncentrationsmålinger.
          BEMÆRK: Hvis DNA-klipning resulterer i et DNA-udbytte på <3 μg, udføres en anden runde DNA-klipning med yderligere 4 μg DNA og kombineres de klippede DNA-prøver efter det første SPRI-perlerensningstrin for at opnå i alt 3 μg klippet DNA.
        7. Der tilsættes nukleasefrit vand til den størrelsesvalgte rensede DNA-prøve (3 μg i alt) til et slutvolumen på 48 μL, og fortsæt med slutreparationsreaktionen i henhold til producentens protokol.
        8. Efter ligering af parrede adaptere skal biblioteket forstærkes ved at udføre fem cyklusser med pre-capture PCR i henhold til producentens instruktioner (betingelserne for PCR og primerne findes i sættet).
      2. Afsnit 4 i fabrikantens protokol: Hybridisering og fangst
        1. For at hybridisere de forberedte DNA-prøver til de målspecifikke RNA-sonder fortyndes 750 ng DNA-prøver i et slutvolumen på 3,4 μL, hvilket resulterer i en startkoncentration på 221 ng / μL. For DNA-prøver fortyndet i større mængder skal du bruge en hastighedsvakuumkoncentrator til at reducere til det endelige volumen. En hastighedsvakuumkoncentration (250 x g; ≤45 °C) i 15-20 minutter er normalt tilstrækkelig for prøver, der resuspenderes i 10 μL. Sørg for at have det samme indgangsvolumen for hver prøve, før du starter hastighedsvakuumkoncentratoren.
        2. Hybridiseringsblandingen inkuberes i 16-18 timer ved 65 °C med et opvarmet låg ved 105 °C i henhold til producentens anvisninger.
      3. Afsnit 5 i fabrikantens protokol: Indeksering og prøvebehandling til multiplekset sekventering
        1. For at forstærke de fangede biblioteker med indekseringsprimere skal du udføre 12 cyklusser med PCR efter optagelse i henhold til producentens instruktioner (betingelserne for PCR og primere findes i sættet).
  9. Næste generations sekventering
    1. Hvis du vil køre flere Hi-C-biblioteker, der hentes, på den samme flowcelle, skal du forberede en ækvimolær blanding af hentningsbibliotekerne og sekvensere 100-120 M-læsninger pr. bibliotek.
    2. Hvis den allelspecifikke analyse er nødvendig, sekvens 150 bp parret ende for at sikre tilstrækkelig SNP-dækning.

3. Analyse af data

  1. Anvend HiC-Pro-pipelinen til at udføre Capture Hi-C-dataanalyse55. HiC-Pro leverer kvalitetskontrol på hvert trin i behandlingen, herunder (figur 3):
    i) Justeringshastigheden på referencegenomet, der specificerer brøkdelen af læsninger, der spænder over et ligationssted, samt antallet af par og singletoner.
    ii) Brøkdelen af gyldige ligeringsprodukter og ikke-informative læsepar (dinglende ende, selvligering osv.).
    iii) Brøkdelen af korte/langtrækkende og intra/interkromosomale kontakter.
    iv) Brøkdelen af on-target-kontakter til Capture Hi-C.
    v) Brøkdelen af allelspecifikke aflæsninger, hvis det er angivet.
    BEMÆRK: HiC-Pro understøtter en lang række protokoller, herunder in situ Hi-C og Capture Hi-C. I sidstnævnte tilfælde skal brugeren blot angive det målrettede område (BED-format) i konfigurationsfilen. Når dataene er behandlet, kan HiC-Pro-udgangene let konverteres til et køligere objekt til downstream-analyse56. På dette trin normaliseres kontaktkortene i forskellige opløsninger ved hjælp af ICE-metoden, der tidligere er beskrevet af Imakaev og kolleger57. Flere analyser kan derefter køres for at kalde kromosomrum, TAD'er eller kromatinsløjfer (til gennemgang58). Protokollens arbejdsgang er vist i figur 4. Her anvendes 'cooltools'-pakken til at beregne isoleringsscore og TAD-grænser, som illustreret i figur 5 og figur 659.

Representative Results

Den beskrevne Capture Hi-C-protokol er baseret på udarbejdelsen af den genom-dækkende 3C-skabelon ved hjælp af en fire-base cutter (DpnII). Den efterfølgende berigelse af ligeringsfragmenter på tværs af det genomiske område af interesse opnås ved hybridisering af en række flise-RNA-sonder og deres streptavidinbaserede indfangning i henhold til målberigelsessystemet, der anvendes i denne undersøgelse (figur 1). Biotinylerede RNA-sonder blev udvalgt, da de viser tættere bindingsaffinitet til deres mål sammenlignet med DNA-sonder52,60. Registrerede biblioteker indekseres og samles derefter til multiplekset sekvensering med højt gennemløb. Capture Hi-C-data kan visualiseres som Hi-C-interaktionskort med høj opløsning, men også som 4C-lignende kontaktkort med et enkelt visningspunkt for specifikt at visualisere interaktionerne mellem mindre sekvenser såsom promotorer eller forstærkere inden for hele det fangede område. Protokollens arbejdsgang er vist i figur 4. Kvalitetskontrol før sekventering er vist i figur 2 og omfatter vurdering af korrekt fordøjelse og religering af 3C-skabelonen og dens effektive klipning og oprensning på tværs af protokollens forskellige trin. Det klippede 3C-skabelon-DNA forventes at køre mellem 150 og 700 bp, og der bør ikke påvises berigelse af fragmenter >2 kb. I løbet af de følgende trin udføres flere perlebaserede DNA-oprydnings- og størrelsesudvælgelsestrin, først efter klipningen, derefter efter PCR'erne før optagelse og efter optagelse. Rengjorte biblioteker viser en tydelig fragmentberigelsesprofil som visualiseret på en højfølsom DNA-bioanalysator (figur 2). Den gennemsnitlige fragmentstørrelse øges i løbet af bibliotekets forberedelse på grund af ligering af adaptere, sekventering og indeksering af primere. Kvalitetskontrol efter sekventering opnås via Hi-C Pro og vist i figur 3. Mange forskellige bioinformatik softwareapplikationer er blevet foreslået til 3C-lignende databehandling og analyse. Blandt dem er HiC-Pro-rørledningen en af de mest populære løsninger, der tillader behandling af rå sekventeringsdata til de endelige kontaktkort ved forskellige opløsninger55. HiC-Pro bruger en to-trins kortlægningsstrategi til at justere sekventeringslæsningerne på referencegenomet. 3C-produkterne rekonstrueres derefter og filtreres ud for at fjerne ikke-informative kontaktpar og generere kontaktkortene. Derudover er den i stand til at bruge en liste over kendte polymorfier til at udføre allelspecifik analyse og adskille kontakterne fra de to forældrealleler i forskellige kontaktkort. For nylig er HiC-Pro blevet inkluderet og udvidet til nf-core framework (nf-core-hic), hvilket giver en meget skalerbar og reproducerbar community-drevet pipeline61,62.

For at fange musen Xic blev der designet en række 28.913 RNA-sonder, der flisede 3 Mb af X-kromosomet. Denne region omfatter nøglespilleren i XCI, det lange ikke-kodende gen Xist, og dets kendte ~ 800 kb regulatoriske landskab (figur 5). Denne ~ 800 kb region er opdelt i to TAD'er: en, der inkluderer Xist-promotoren og dens kendte positive regulatorer (dvs. de ikke-kodende transkripter Ftx, Jpx og Xert og det proteinkodende gen Rnf12) og den nærliggende TAD, der omfatter de negative cis-regulatorer af Xist (dvs. dets antisense-transkript Tsix, forstærkerelementet Xite og det ikke-kodende transkript Linx) (til gennemgang 44,45).

Ved at anvende den beskrevne Capture Hi-C-protokol på Xic blev den topologiske organisering af dette locus opnået ved hidtil uset opløsning (figur 6 og figur 7). Dette er især tydeligt, når man sammenligner Capture Hi-C-profilen med tidligere offentliggjort 5C47 (figur 6 og figur 7; Supplerende tabel 1) og Hi-C61 (figur 6 og figur 7; Supplerende tabel 1) Profiler. For eksempel er sub-TAD-strukturer mere tydelige - TAD'en, der indeholder Xist-promotoren (Xist-TAD), er tydeligt opdelt i to mindre domæner (figur 6A, blå pilespids). Tidligere kunne dette kun visuelt "gættes" ud fra 5C-profilen (figur 6B), omend påvisning af en grænse i denne region ved hjælp af isoleringsscorealgoritmen. Ligeledes tillader opløsningen af Capture Hi-C-profilen identifikation af to mindre domæner i den nærliggende TAD (figur 6A, B), som indeholder promotoren af Tsix-locus ( Tsix-TAD ); Dette blev ikke tidligere opnået med 5C (figur 6B). Det skal bemærkes, at topologiske grænser bestemt af isoleringsscoren fra Capture Hi-C- og 5C-dataene generelt detekteres lidt forskellige steder og med forskellige relative styrker.

Desuden er andre sub-TAD-strukturer såsom kontaktsløjfer tydeligt synlige fra Capture Hi-C-dataene, såsom sløjfen mellem Xist og Ftx (figur 7A), der tidligere blev identificeret med Capture-C63, og sløjfen mellem Xist og Xert (figur 7B), der for nylig blev identificeret ved hjælp af en lignende protokol for Capture Hi-C48 . Andre kontakter kan også kortlægges mere præcist på grund af den øgede opløsning af Capture Hi-C-profilerne, såsom dem, der danner de kendte kontakthotspots inden for Tsix-TAD mellem Linx, Chic1 og Xite loci (figur 7A).

I sammenligning med Hi-C-dataene vist i figur 7 tillod Capture Hi-C en firedobling af opløsningen, men det krævede kun en fjerdedel af sekventeringsdybden (dvs. 126 M læsninger versus 571 M) (supplerende tabel 1). Denne stigning i opløsning gør det muligt at detektere subTAD'er og looping-interaktioner, der ikke kunne detekteres af Hi-C ved sekventeringsdybden vist i figur 6 og figur 7. Den beskrevne protokol for Capture Hi-C giver således mulighed for en langt mere detaljeret karakterisering i høj opløsning af et stort genomisk område af interesse sammenlignet med tidligere tilgange.

Figure 1
Figur 1: Sondedesign. Skematisk gengivelse af den strategi, der anvendes til sondedesign. Regioner på 300 bp opstrøms og nedstrøms for hvert DpnII-restriktionssted på tværs af 3 Mb-målområdet blev udvalgt og flisebelagt med overlappende biotinylerede RNA-sonder. En af disse udvalgte regioner vises, chrX: 102.474.805-102.475.500. Ikke mere end 40 baser af gentagne sekvenser er tilladt i hver sonde. Klik her for at se en større version af denne figur.

Figure 2
Figur 2: Registrer Hi-C kvalitetskontrol før sekventering . (A) Repræsentativt eksempel på kvalitetskontrol af 3C-skabeloner. 200 ng DNA blev lagt på en 1% agarosegel. Bane 1: 1 kb stige. Bane 2: Ufordøjet, tværbundet og intakt kromatin løber som et skarpt bånd på >10 kb. Bane 3: DpnII-fordøjet tværbundet kromatin løber som et udtværing mellem 1 kb og 3 kb i størrelse. Bane 4: Endelig 3C-bibliotek eller skabelon; frie ender af fordøjede tværbundne DNA-fragmenter re-ligeres. DNA-udstrygningen af lavere molekylstørrelse er næsten uopdagelig, og ligeringsproduktet detekteres som et bånd på >10 kb. (B) Repræsentative eksempler på DNA-profiler med høj følsomhed for bioanalysatorer. Øverst til venstre: 3C-bibliotek med succes klippet, der viser en fordeling af fragmentstørrelse mellem 150 bp og 700 bp. Øverst til højre: utilfredsstillende klippet 3C-bibliotek. Uklippet DNA detekteres som bred berigelse af fragmenter >2 kb. (C) Nederst til venstre: klippet DNA-prøve efter en 1:1 venstre sidestørrelsesudvælgelse ved hjælp af SPRI-perler. Fragmenter på ~ 300 bp er beriget. Nederst i midten: Pre-capture PCR-profil efter ligering af parrede adaptere i henhold til producentens protokol. Nederst til højre: det endelige Capture Hi-C-bibliotek inklusive adaptere, sekventering og indekseringsprimere til multiplekset sekventering. Forkortelser: bp = basepar, FU = vilkårlig fluorescensenhed. Klik her for at se en større version af denne figur.

Figure 3
Figur 3: Registrer Hi-C kvalitetskontrol efter sekventering med HiC-Pro . (A) Eksempel på kortlægningshastighed på referencegenomet for førstestyrmand i sekventeringsparrene. Den lyseblå fraktion repræsenterer aflæsningerne justeret af HiC-Pro og spænder over et ligeringskryds. Denne måling kan således bruges til at validere det eksperimentelle ligeringstrin. (B) Når sekventeringsmakkerne er justeret på genomet, opbevares kun entydigt justerede læsepar til analyse. (C) Ikke-gyldige par (i rødt) såsom dinglende ende, selvcirkel eller religering kasseres fra analysen. Brøkdelen af gyldige par er en god indikator for ligerings- og pull-down-effektiviteten. (D) De gyldige par kan yderligere opdeles i intra/interkromosomale og korte/langtrækkende kontakter. Duplikerede læsepar, der sandsynligvis repræsenterer PCR-artefakter, kasseres fra analysen. (E) Til allelspecifik analyse rapporterer HiC-Pro antallet af allellæsninger understøttet af enten en eller to hjælpere for hvert forældregenom (dvs. C57BL/6J x CASTEi/J). Den samme brøkdel af læsninger, der er tildelt moderens og faderens allel, forventes. (F) Endelig vælges kun gyldige par, der overlapper fangstområdet, til at opbygge kontaktkortene. Capture-capture-par repræsenterer kontakter inden for det målrettede område, mens capture-reporter-par involverer interaktion mellem det målrettede område og et område uden for målet. Klik her for at se en større version af denne figur.

Figure 4
Figur 4: Arbejdsproces for Capture Hi-C-protokol. Skematisk repræsentation af forskellige protokoltrin. For at generere den genom-dækkende 3C-skabelon tværbindes kromatin først med formaldehyd og fordøjes derefter med DpnII-restriktionsenzymet. Frie DNA-ender ligeres derefter, tværbinding vendes, og DNA renses. For at berige fragmenter, der omfatter målområdet, hybridiseres en række biotinylerede RNA-sonder til 3C-skabelonen og fanges af streptavidin-medieret pull-down. Optagelsesbiblioteker behandles til multiplekseret sekventering, og gyldige ligeringsfragmenter kvantificeres for at udlede frekvensen af kromatinkontakter på tværs af målet, som visualiseres som interaktionskort i høj opløsning. Klik her for at se en større version af denne figur.

Figure 5
Figur 5: Oversigt over det område, der omfatter Xic på musens X-kromosom. Skematisk repræsentation af musens X-kromosom og zoom ind i det 3 Mb-fangede område (ChrX: 102.475.000-105.475.000). Den målrettede region inkluderer ~ 800 kb DNA svarende til Xic, XCI's overordnede regulatoriske locus. Xic inkluderer de lange ikke-kodende gener, Xist, en nøglespiller i XCI, og dets lovgivningsmæssige landskab. Positive regulatorer af Xist er vist i grønt og negative regulatorer i lilla. Klik her for at se en større version af denne figur.

Figure 6
Figur 6: Hent Hi-C-, 5C- og Hi-C-interaktionskort på tværs af det 3 Mb-optagede område. (A) Optag Hi-C-interaktionskort over 3 Mb-målet, der omfatter musen Xic ved 10 kb opløsning (denne undersøgelse). B) 5C-interaktionskort over samme målregion som i A med en opløsning på 6 kb (data oparbejdet fra47). Gentagne regioner, der ikke indgår i analyserne, maskeres med hvidt. 5C-dataene kræver deres egen bioinformatikbehandling (se47). Efter rengøring og justering binnes 5C-kortene ved primeropløsningen ved hjælp af en løbende median (vindue = 30 kb, trin = 5) for at nå en endelig opløsning på 6 kb. C) Hi-C-interaktionskort over samme genomiske region som i A og B med en opløsning på 40 kb (data oparbejdet fra64). Alle interaktionskort blev genereret fra musens ESC'er. Isoleringsscoren blev beregnet ved hjælp af cooltools og er repræsenteret som histogrammer med isoleringsminimer ved TAD-grænser. TAD-grænser vises som lodrette linjer under kortet. Højden på hver linje angiver grænsestyrke. Gener vises som pile, der peger i retning af transkription. Sub-TAD-grænser, der udelukkende eller mere præcist registreres i Capture Hi-C-kort, er angivet med magenta og blå pilespidser for sub-TAD'er i henholdsvis Tsix og Xist TAD'erne. Klik her for at se en større version af denne figur.

Figure 7
Figur 7: Optag Hi-C-, 5C- og Hi-C-interaktionskort på tværs af 1 Mb inden for det registrerede område. (A) Optag Hi-C-interaktionskort over det genomiske område på 1 Mb, der omfatter musens Xic med 5 kb opløsning (denne undersøgelse). B) 5C-interaktionskort over samme genomiske region som i A. ved 6 KB opløsning (data oparbejdet fra47). Gentagne regioner, der ikke indgår i analyserne, maskeres med hvidt. Det skal bemærkes, at 5C-dataene kræver deres egen bioinformatikbehandling (se47). Efter rengøring og justering binnes 5C-kortene ved primeropløsningen ved hjælp af en løbende median (vindue = 30 kb, trin = 5) for at nå en endelig opløsning på 6 kb. C) Hi-C-interaktionskort over samme genomiske område som i A og B i Hi-C ved 20 kb opløsning (data oparbejdet fra64). Alle interaktionskort blev genereret fra mESC'er. Isoleringsscoren blev beregnet ved hjælp af cooltools og er repræsenteret som histogrammer med isoleringsminimer ved TAD-grænser. TAD-grænser vises som lodrette linjer under kortet. Højden på hver linje angiver grænsestyrke. Gener vises som pile, der peger på transkriptionsretningen. Kontaktsløjfer, der udelukkende eller mere præcist detekteres i Capture Hi-C, er angivet med magenta og blå stjerner for sløjfer i henholdsvis Tsix og Xist TAD'erne. Klik her for at se en større version af denne figur.

Supplerende tabel 1: Postsekventeringsstatistik for de datasæt, der anvendes i dette manuskript: Capture Hi-C (denne undersøgelse), Hi-C64 og 5C47. Klik her for at downloade denne fil.

Discussion

Her beskriver vi en relativt hurtig og nem Capture Hi-C-protokol til at karakterisere den højere ordens organisering af megabase-størrelse genomiske regioner ved 5-10 kb opløsning. Capture Hi-C tilhører familien af Capture-C-teknologier, der er designet til at berige målrettede kromatininteraktioner fra genomdækkende 3C- eller Hi-C-skabeloner. Hidtil er langt de fleste Capture-C-applikationer blevet udnyttet til at kortlægge kromatinkontakter af relativt små regulatoriske elementer spredt over hele genomet. I den første Capture-C-protokol blev flere overlappende RNA-biotinylerede sonder brugt til at fange >400 forudvalgte promotorer i 3C-biblioteker fremstillet af erythroidceller31. Den samme strategi blev efterfølgende forbedret i Next Generation (NG) og Nuclear Titrated (NuTi) Capture-C for at opnå interaktionsprofiler i høj opløsning på >8.000 promotorer ved at bruge enkelte 120 bp DNA-lokkemad, der spænder over enkelte restriktionssteder og to sekventielle runder af Capture for at maksimere berigelsen af informative ligeringsfragmenter32,40. Disse strategier førte til funktionel dissektion af cis-virkende elementer i mange forskellige sammenhænge, herunder museembryonal udvikling, celledifferentiering, X-kromosominaktivering og genfejlregulering under patologiske tilstande 46,63,65,66,67,68,69,70,71.

I Promoter Capture Hi-C (PCHi-C) blev >22.000 annoterede promotorer indeholdende restriktionsfragmenter trukket ned fra Hi-C-biblioteker ved hybridisering af enkelt RNA 120-mer biotinylerede sonder i den ene eller begge ender af restriktionsfragmentet34,72. Denne metode tillod dissektion af interaktomet hos tusindvis af promotorer i et hurtigt stigende antal celletyper, herunder embryonale stamceller fra mus, føtale leverceller og adipocytter 34,35,72,73, men også humane lymfoblastoidlinjer, hæmatopoietiske forfædre, epidermale keratinocytter og pluripotente celler 37,74,75,76,77.

I sammenligning med disse målberigelsesteknologier målretter Capture Hi-C sammenhængende genomiske regioner op til megabaseskalaen og spænder derved over en eller flere TAD'er og omfatter regulatoriske landskaber af gener. Hele interesseområdet skal flisebelægges med en række biotinylerede sonder, der omfatter hvert DpnII-begrænsningssted inden for målet. Hybridiseringen af det biotinylerede array til 3C-skabelonen, dets efterfølgende streptavidinbaserede indfangning og behandling til multiplexet sekventering udføres ved hjælp af et målberigelsessystem til Illumina Paired-End multiplexed sekventering. Hele protokollen er hurtig, da den kan udføres på 1 uge fra 3C-biblioteksforberedelse til NGS-sekventering, og den kræver kun mindre tilpasninger og / eller brugerdefineret specifik fejlfinding.

Protokollen giver også fordele i sammenligning med andre 3C-baserede metoder. For at opnå interaktionskort med en opløsning på 5-10 kb sekventerede vi 100-120 M parrede endelæsninger. Til sammenligning brugte vi her et Hi-C-datasæt på 571 M-læsninger for at nå en 20 kb opløsning64 (GSM2053973), og mindst 1 milliard læsninger ville være påkrævet for at nå en 5 kb opløsning med kromosombred Hi-C22.

Capture Hi-C, som anvendt i denne undersøgelse, når en meget højere opløsning end den tidligere offentliggjorte 5C baseret på et 6-bp cutter restriktionsenzym47 (supplerende tabel 1). Det er vigtigt, at strategien designet til at berige og forstærke målrettede interaktioner i 5C ikke tillader allelspecifik analyse af kromatininteraktioner. Tværtimod kan Capture Hi-C-data kortlægges allelspecifikt, hvilket muliggør dissektion af 3D-strukturelle landskaber af par homologe kromosomer, for eksempel i humane celler eller i F1-hybridcellelinjer afledt ved at krydse genetisk forskellige musestammer78. For at generere allelspecifikke Capture Hi-C-interaktionskort med 5 kb-opløsning sekventerede vi 150 bp-parrede endelæsninger for at øge SNP-dækningen. Lignende allelspecifikke tilgange kan anvendes på humane cellelinjer, for hvilke annotationen af SNP'er er tilgængelig22.

Det er vigtigt, at selvom Capture Hi-C generelt sikrer høj opløsning, samtidig med at det forbedrer overkommeligheden af sekventeringsomkostninger, har produktionen af skræddersyede biotinylerede oligonukleotider indflydelse på de samlede omkostninger ved denne metode. Derfor vil valget af den mest egnede 3C-metode variere for forskellige applikationer og afhænger af det biologiske spørgsmål, der behandles, og den krævede opløsning samt størrelsen af interesseområdet. Andre udviklede Capture Hi-C-protokoller deler nøglefunktioner med den protokol, der er beskrevet her. For eksempel blev en Capture Hi-C-strategi anvendt til at karakterisere ~ 50 kb til 1 Mb genomiske regioner, der spænder over ikke-kodende varianter forbundet med bryst- og kolorektal kræftrisiko; i denne protokol blev målregioner trukket ned fra Hi-C-biblioteker ved at hybridisere 120-mer RNA-lokkemad, der flisede målregionerne med en 3x dækning33,38,79. På samme måde blev HYbrid Capture Hi-C (Hi-C 2) brugt til at målrette interaktioner inden for områder af interesse op til2 Mb80. I begge protokoller øgede brugen af en Hi-C-skabelon beriget til biotinudtrækkede ligeringsfragmenter procentdelen af samlede informative læsninger sammenlignet med vores protokol. I Hi-C-datasættet, som vi brugte her til sammenligning64 (GSM2053973), er procentdelen af gyldige par efter fjernelse af dubletter f.eks. 4,8 gange højere end de gyldige par, der er opnået i Capture Hi-C som beskrevet i figur 3 og supplerende tabel 1. Imidlertid gør den fortløbende nedtrapning af biotinylerede ligerede fragmenter og hybridiserede sonder protokollen betydeligt mere kompleks og tidskrævende, samtidig med at den muligvis reducerer kompleksiteten af den fangede region.

En anden tilgængelig metode til at berige 3C-skabeloner med flisesonder er Tiled-C, som blev anvendt til at studere kromatinarkitektur ved høj rumlig og tidsmæssig opløsning under museerythroiddifferentiering43. I Tiled-C bruges et panel på 70 bp biotinylerede sonder til at berige kontakter inden for store regioner i to på hinanden følgende optagelsesrunder for at generere kort i meget høj opløsning over målrettede interaktioner 43,81. Den dobbelte optagelsesberigelse gør også protokollen længere og mere kompleks sammenlignet med Capture Hi-C. I modsætning til Capture-C-strategierne rettet mod enkelte restriktionssteder synes den anden fangstrunde i Tiled-C imidlertid ikke at øge fangsteffektiviteten væsentligt og kan derfor sandsynligvis udelades43. Endelig blev en lignende flisebelægningsmetode baseret på den samme målberigelsesstrategi, der blev anvendt i denne undersøgelse, anvendt til dissektion af regulatoriske landskaber, der omfatter strukturelle varianter beskrevet hos patienter med medfødte misdannelser og rekonstrueret i transgene mus41,42. I dette tilfælde blev flisebelægningsrækken af sonder designet på tværs af hele målet snarere end i nærheden af DpnII-begrænsningssteder41. Ikke desto mindre var dette arbejde skelsættende ved at fremhæve følsomheden og kraften i denne strategi for at opnå karakterisering i høj opløsning af store genomiske regioner i forskellige sammenhænge41,42,48.

Afslutningsvis repræsenterer protokollen beskrevet her en nem, robust og kraftfuld strategi til 3D-karakterisering i høj opløsning af genomiske regioner af interesse. Anvendelsen af denne tilgang på forskellige modelsystemer, celletyper, udviklingsregulerede kromatinlandskaber og genregulering under sunde og patologiske tilstande vil sandsynligvis lette vores forståelse af samspillet og kausaliteten mellem genomtopologi og genregulering, et af de grundlæggende åbne spørgsmål inden for epigenetikområdet. Desuden har anvendelse af Capture Hi-C til at kortlægge langtrækkende interaktioner og højere ordens kromatinfoldning af risikovarianter identificeret af GWAS-undersøgelser potentialet til at afsløre den funktionelle relevans af ikke-kodende genomiske loci forbundet med menneskelige sygdomme i forskellige sammenhænge og derved give ny indsigt i de processer, der potentielt ligger til grund for patogenese.

Disclosures

Kai Hauschulz er Field Application Scientist hos Agilent Technologies - Diagnostic and Genomics Group. Alle andre forfattere erklærer ingen konkurrerende interesser.

Acknowledgments

Arbejdet i Heard-laboratoriet blev støttet af European Research Council Advanced Investigator Award (XPRESS - AdG671027). A.L. støttes af et individuelt Marie Skłodowska-Curie-stipendium fra Den Europæiske Union (IF-838408). A.H. støttes af ITN Innovative and Interdisciplinary Network ChromDesign under Marie Skłodowska-Curie-tilskudsaftalen 813327. Forfatterne takker Daniel Ibrahim (MPI for Molecular Genetics, Berlin) for hjælpsom teknisk rådgivning, NGS-platformen ved Institut Curie (Paris) og Vladimir Benes og Genomics Core Facility ved EMBL (Heidelberg) for støtte og assistance.

Materials

Name Company Catalog Number Comments
10x PBS pH 7.4 Gibco 10010-023
37% (vol/vol) paraformaldehyde solution Electron Microscopy Sciences 15686 single use glass-vials; do not reuse
50 mL PP conical tube Falcon 352070
Agarose Sigma A9539-500g
Bioanalyzer Agilent G2939BA
Cell Scrapers - 25 cm Handle and 3.0 cm Blade Falcon 353089
CHIR99021 Axon Medchem BV Axon 1386
cOmplete Mini, Protease inhibitor cocktail (EDTA-free) Merck 11836170001
Countess Cell Counting Chamber Slides Invitrogen C10228
Countess II FL Invitrogen ZGEXSCCOUNTESS2FL Automated cell counter
Covaris S2 Covaris 500217 Sonicator
DNA LoBind tube, 1.5 mL Eppendorf 30108051
DpnII (50000 units/mL) New England Biolabs R0543M
Dulbecco's Modified Eagle Medium (DMEM) Merck D6429
Ethanol (100%) Merck 1.00983.2500
Fetal Bovine Serum (FBS) Thermo Scientific 10270106
gelatine from porcine skin Sigma G1890
GeneRuler 1 kb Plus DNA Ladder Thermo Scientific SM0313
GlycoBlue Thermo Scientific AM9516 Coprecipitant
High-Sensitivity Bioanlayzer chips Agilent 5067-4626
Large Cooling Centrifuge 5920 R Eppendorf 5948000018
leukaemia inhibitory factor (LIF) Merck ESG1107
Liquiport KNF NF300 Benchtop aspiration system
Low-binding filter tips Biozym VT0260U, VT0240, VT0220, VT0200U
Molecular biology grade water Merck W3500-6x500ML
Next Seq 500 Illumina SY-415-1001
Next Seq 500 High Output v2 Kit (300 cycles) Illumina FC-404-2004
Nonidet P40 Substitute (NP40) Merck 11332473001
PD0325901 Axon Medchem BV Axon 1408
Protease inhibitor cocktail (EDTA-free) Merck 11873580001
Proteinase K - recombinant, PCR-grade (20 mg/mL) Thermo Scientific EO0491
Qubit 2.0 Thermo Scientific Q32871
Qubit assay tubes Thermo Scientific Q32856
Qubit dsDNA High Sensitivity kit Thermo Scientific Q32851
RNase A (10 mg/mL) Thermo Scientific EN0531
Sodium acetate pH 5.2 (3M) Merck S7899
speed vacuum concentrator Eppendorf EP5305000100-1EA
Agencourt AMPureXP Beckman Coulter A63881 SPRI beads
SureSelect Target Enrichment Box 1 Agilent 5190-8645
SureSelect Target Enrichment Kit ILM Indexing Hyb Module Box 2 Agilent 5190-4455
SureSelect XT Library Prep Kit ILM Agilent 5500-0132
T4 ligase (30 units/µL) Thermo Scientific EL0013
table-top Centrifuge 5427 R Eppendorf 5409000012
Triton-X-100 (500 mL) Merck X100-500ML
Trypan Blue Invitrogen T10282
Trypsine Thermo Scientific 25300054
UltraPure Glycine Thermo Scientific 15527013
β-mercaptoethanol Thermo Scientific 31350010

DOWNLOAD MATERIALS LIST

References

  1. Ibrahim, D. M., Mundlos, S. The role of 3D chromatin domains in gene regulation: a multi-facetted view on genome organization. Current Opinion in Genetics & Development. 61, 1-8 (2020).
  2. Bolt, C. C., Duboule, D. The regulatory landscapes of developmental genes. Development. 147 (3), (2020).
  3. Glaser, J., Mundlos, S. 3D or not 3D: Shaping the genome during development. Cold Spring Harbor Perspectives in Biology. 14 (5), 040188 (2021).
  4. Denker, A., De Laat, W. The second decade of 3C technologies: detailed insights into nuclear organization. Genes & Development. 30 (12), 1357-1382 (2016).
  5. Kempfer, R., Pombo, A. Methods for mapping 3D chromosome architecture. Nature Reviews Genetics. 21 (4), 207-226 (2020).
  6. McCord, R. P., Kaplan, N., Giorgetti, L. Chromosome conformation capture and beyond: Toward an integrative view of chromosome structure and function. Molecular Cell. 77 (4), 688-708 (2020).
  7. Jerkovic, I., Cavalli, G. Understanding 3D genome organization by multidisciplinary methods. Nature ReviewsMolecular Cell Biology. 22 (8), 511-528 (2021).
  8. Hsieh, T. -H. S., et al. Mapping nucleosome resolution chromosome folding in yeast by Micro-C. Cell. 162 (1), 108-119 (2015).
  9. Krietenstein, N., et al. Ultrastructural details of mammalian chromosome architecture. Molecular Cell. 78 (3), 554-565 (2020).
  10. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing chromosome conformation. Science. 295 (5558), 1306-1311 (2002).
  11. Naumova, N., Smith, E. M., Zhan, Y., Dekker, J. Analysis of long-range chromatin interactions using Chromosome Conformation Capture. Methods. 58 (3), 192-203 (2012).
  12. Simonis, M., et al. Nuclear organization of active and inactive chromatin domains uncovered by chromosome conformation capture-on-chip (4C). Nature Genetics. 38 (11), 1348-1354 (2006).
  13. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra-and interchromosomal interactions. Nature Genetics. 38 (11), 1341-1347 (2006).
  14. Würtele, H., Chartrand, P. Genome-wide scanning of HoxB1-associated loci in mouse ES cells using an open-ended Chromosome Conformation Capture methodology. Chromosome Research. 14 (5), 477-495 (2006).
  15. De Wit, E., De Laat, W. A decade of 3C technologies: insights into nuclear organization. Genes & Development. 26 (1), 11-24 (2012).
  16. Dostie, J., et al. Chromosome Conformation Capture Carbon Copy (5C): a massively parallel solution for mapping interactions between genomic elements. Genome Research. 16 (10), 1299-1309 (2006).
  17. Splinter, E., et al. The inactive X chromosome adopts a unique three-dimensional conformation that is dependent on Xist RNA. Genes & Development. 25 (13), 1371-1383 (2011).
  18. Ferraiuolo, M. A., Sanyal, A., Naumova, N., Dekker, J., Dostie, J. From cells to chromatin: capturing snapshots of genome organization with 5C technology. Methods. 58 (3), 255-267 (2012).
  19. Kim, J. H., et al. 5C-ID: Increased resolution Chromosome-Conformation-Capture-Carbon-Copy with in situ 3C and double alternating primer design. Methods. 142, 39-46 (2018).
  20. Lieberman-Aiden, E., et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science. 326 (5950), 289-293 (2009).
  21. Zhang, Y., et al. Spatial organization of the mouse genome and its role in recurrent chromosomal translocations. Cell. 148 (5), 908-921 (2012).
  22. Rao, S. S. P., et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell. 159 (7), 1665-1680 (2014).
  23. Dixon, J. R., et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature. 485 (7398), 376-380 (2012).
  24. Nora, E. P., et al. Spatial partitioning of the regulatory landscape of the X-inactivation centre. Nature. 485 (7398), 381-385 (2012).
  25. Krefting, J., Andrade-Navarro, M. A., Ibn-Salem, J. Evolutionary stability of topologically associating domains is associated with conserved gene regulation. BMC Biology. 16 (1), 87 (2018).
  26. Galupa, R., Heard, E. Topologically associating domains in chromosome architecture and gene regulatory landscapes during development, disease, and evolution. Cold Spring Harbor Symposia on Quantitative Biology. 82, 267-278 (2017).
  27. Tena, J. J., Santos-Pereira, J. M. Topologically associating domains and regulatory landscapes in development, evolution and disease. Frontiers in Cell and Developmental Biology. 9, 702787 (2021).
  28. Lupiáñez, D. G., Spielmann, M., Mundlos, S. Breaking TADs: How alterations of chromatin domains result in disease. Trends in Genetics. 32 (4), 225-237 (2016).
  29. Davidson, I. F., Peters, J. -M. Genome folding through loop extrusion by SMC complexes. Nature Reviews Molecular Cell Biology. 22 (7), 445-464 (2021).
  30. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  31. Hughes, J. R., et al. Analysis of hundreds of cis-regulatory landscapes at high resolution in a single, high-throughput experiment. Nature Genetics. 46 (2), 205-212 (2014).
  32. Davies, J. O. J., et al. Multiplexed analysis of chromosome conformation at vastly improved sensitivity. Nature Methods. 13 (1), 74-80 (2016).
  33. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nature Communications. 6, 6178 (2015).
  34. Schoenfelder, S., et al. The pluripotent regulatory circuitry connecting promoters to their long-range interacting elements. Genome Research. 25 (4), 582-597 (2015).
  35. Sahlén, P., et al. Genome-wide mapping of promoter-anchored interactions with close to single-enhancer resolution. Genome Biology. 16, 156 (2015).
  36. Joshi, O., et al. Dynamic reorganization of extremely long-range promoter-promoter interactions between two states of pluripotency. Cell Stem Cell. 17 (6), 748-757 (2015).
  37. Mifsud, B., et al. Mapping long-range promoter contacts in human cells with high-resolution capture Hi-C. Nature Genetics. 47 (6), 598-606 (2015).
  38. Dryden, N. H., et al. Unbiased analysis of potential targets of breast cancer susceptibility loci by Capture Hi-C. Genome Research. 24 (11), 1854-1868 (2014).
  39. Oudelaar, A. M., Davies, J. O. J., Downes, D. J., Higgs, D. R., Hughes, J. R. Robust detection of chromosomal interactions from small numbers of cells using low-input Capture-C. Nucleic Acids Research. 45 (22), 184 (2017).
  40. Oudelaar, A. M., et al. Single-allele chromatin interactions identify regulatory hubs in dynamic compartmentalized domains. Nature Genetics. 50 (12), 1744-1751 (2018).
  41. Franke, M., et al. Formation of new chromatin domains determines pathogenicity of genomic duplications. Nature. 538 (7624), 265-269 (2016).
  42. Despang, A., et al. Functional dissection of the Sox9-Kcnj2 locus identifies nonessential and instructive roles of TAD architecture. Nature Genetics. 51 (8), 1263-1271 (2019).
  43. Oudelaar, A. M., et al. Dynamics of the 4D genome during in vivo lineage specification and differentiation. Nature Communications. 11 (1), 1-12 (2020).
  44. Galupa, R., Heard, E. X-chromosome inactivation: A crossroads between chromosome architecture and gene regulation. Annual Review of Genetics. 52, 535-566 (2018).
  45. Loda, A., Collombet, S., Heard, E. Gene regulation in time and space during X-chromosome inactivation. Nature Reviews. Molecular Cell Biology. 23 (4), 231-249 (2022).
  46. van Bemmel, J. G., et al. The bipartite TAD organization of the X-inactivation center ensures opposing developmental regulation of Tsix and Xist. Nature Genetics. 51 (6), 1024-1034 (2019).
  47. Galupa, R., et al. A conserved noncoding locus regulates random monoallelic Xist expression across a topological boundary. Molecular Cell. 77 (2), 352-367 (2020).
  48. Gjaltema, R. A. F., et al. Distal and proximal cis-regulatory elements sense X chromosome dosage and developmental state at the Xist locus. Molecular Cell. 82 (1), 190-208 (2022).
  49. Galupa, R., et al. Inversion of a topological domain leads to restricted changes in its gene expression and affects inter-domain communication. Development. 149 (9), (2022).
  50. Savarese, F., Flahndorfer, K., Jaenisch, R., Busslinger, M., Wutz, A. Hematopoietic precursor cells transiently reestablish permissiveness for X inactivation. Molecular and Cellular Biology. 26 (19), 7167-7177 (2006).
  51. Schulz, E. G., et al. The two active X chromosomes in female ESCs block exit from the pluripotent state by modulating the ESC signaling network. Cell Stem Cell. 14 (2), 203-216 (2014).
  52. Gnirke, A., et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nature Biotechnology. 27 (2), 182-189 (2009).
  53. Akgol Oksuz, B., et al. Systematic evaluation of chromosome conformation capture assays. Nature Methods. 18 (9), 1046-1055 (2021).
  54. Piccinini, F., Tesei, A., Arienti, C., Bevilacqua, A. Cell counting and viability assessment of 2D and 3D Cell cultures: Expected reliability of the trypan blue assay. Biological Procedures Online. 19 (1), 8 (2017).
  55. Servant, N., et al. HiC-Pro: an optimized and flexible pipeline for Hi-C data processing. Genome Biology. 16, 259 (2015).
  56. Abdennur, N., Mirny, L. A. Cooler: scalable storage for Hi-C data and other genomically labeled arrays. Bioinformatics. 36 (1), 311-316 (2020).
  57. Imakaev, M., et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization. Nature Methods. 9 (10), 999-1003 (2012).
  58. Forcato, M., et al. Comparison of computational methods for Hi-C data analysis. Nature Methods. 14 (7), 679-685 (2017).
  59. Venev, S., et al. open2c/cooltools: v0.4.1. , (2021).
  60. Wages, J. M. NUCLEIC ACIDS | Immunoassays. Encyclopedia of Analytical Science. , Elsevier. 408-417 (2005).
  61. Ewels, P. A., et al. The nf-core framework for community-curated bioinformatics pipelines. Nature Biotechnology. 38 (3), 276-278 (2020).
  62. Servant, N., Peltzer, A. nf-core/hic: Initial release of nf-core/hic. Zenodo. , (2019).
  63. Furlan, G., et al. The Ftx noncoding locus controls X chromosome inactivation independently of its RNA products. Molecular Cell. 70 (3), 462-472 (2018).
  64. Giorgetti, L., et al. Structural organization of the inactive X chromosome in the mouse. Nature. 535 (7613), 575-579 (2016).
  65. Simon, C. S., et al. Functional characterisation of cis-regulatory elements governing dynamic Eomes expression in the early mouse embryo. Development. 144 (7), 1249-1260 (2017).
  66. Williams, R. M., et al. Reconstruction of the global neural crest gene regulatory network in vivo. Developmental Cell. 51 (2), 255-276 (2019).
  67. Godfrey, L., et al. DOT1L inhibition reveals a distinct subset of enhancers dependent on H3K79 methylation. Nature Communications. 10 (1), 2803 (2019).
  68. Hanssen, L. L. P., et al. Tissue-specific CTCF-cohesin-mediated chromatin architecture delimits enhancer interactions and function in vivo. Nature Cell Biology. 19 (8), 952-961 (2017).
  69. Larke, M. S. C., et al. Enhancers predominantly regulate gene expression during differentiation via transcription initiation. Molecular Cell. 81 (5), 983-997 (2021).
  70. Oudelaar, A. M., et al. A revised model for promoter competition based on multi-way chromatin interactions at the α-globin locus. Nature Communications. 10 (1), 5412 (2019).
  71. Long, H. K., et al. Loss of extreme long-range enhancers in human neural crest drives a craniofacial disorder. Cell Stem Cell. 27 (5), 765-783 (2020).
  72. Schoenfelder, S., Javierre, B. -M., Furlan-Magaril, M., Wingett, S. W., Fraser, P. Promoter Capture Hi-C: High-resolution, genome-wide profiling of promoter interactions. Journal of Visualized Experiments. (136), e57320 (2018).
  73. Siersbæk, R., et al. Dynamic rewiring of promoter-anchored chromatin loops during adipocyte differentiation. Molecular Cell. 66 (3), 420-435 (2017).
  74. Rubin, A. J., et al. Lineage-specific dynamic and pre-established enhancer-promoter contacts cooperate in terminal differentiation. Nature Genetics. 49 (10), 1522-1528 (2017).
  75. Freire-Pritchett, P., et al. Global reorganisation of cis-regulatory units upon lineage commitment of human embryonic stem cells. eLife. 6, 21926 (2017).
  76. Javierre, B. M., et al. Lineage-specific genome architecture links enhancers and non-coding disease variants to target gene promoters. Cell. 167 (5), 1369-1384 (2016).
  77. Miguel-Escalada, I., et al. Human pancreatic islet three-dimensional chromatin architecture provides insights into the genetics of type 2 diabetes. Nature Genetics. 51 (7), 1137-1148 (2019).
  78. Keane, T. M., et al. Mouse genomic variation and its effect on phenotypes and gene regulation. Nature. 477 (7364), 289-294 (2011).
  79. Baxter, J. S., et al. Capture Hi-C identifies putative target genes at 33 breast cancer risk loci. Nature Communications. 9 (1), 1028 (2018).
  80. Sanborn, A. L., et al. Chromatin extrusion explains key features of loop and domain formation in wild-type and engineered genomes. Proceedings of the National Academy of Sciences. 112 (47), 6456-6465 (2015).
  81. Owens, D. D. G., et al. Dynamic Runx1 chromatin boundaries affect gene expression in hematopoietic development. Nature Communications. 13 (1), 773 (2022).

Tags

Tilbagetrækning nr. 188
Dekryptering af 3D-kromatinorganisation med høj opløsning <em>via</em> Capture Hi-C
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Hauth, A., Galupa, R., Servant, N.,More

Hauth, A., Galupa, R., Servant, N., Villacorta, L., Hauschulz, K., van Bemmel, J. G., Loda, A., Heard, E. Deciphering High-Resolution 3D Chromatin Organization via Capture Hi-C. J. Vis. Exp. (188), e64166, doi:10.3791/64166 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter