Waiting
로그인 처리 중...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Umfassende DNA-Methylierungsanalyse unter Verwendung einer Methyl-CpG-bindenden Domänen-Capture-basierten Methode bei chronischen lymphatischen Leukämie-Patienten

Published: June 16, 2017 doi: 10.3791/55773

Summary

Diese Arbeit beschreibt ein optimiertes Methyl-CpG-Bindungsdomäne (MBD) Sequenzierungsprotokoll und eine rechnerische Pipeline zur Identifizierung von differentiell methylierten CpG-reichen Regionen bei chronischen lymphatischen Leukämie (CLL) Patienten.

Abstract

Die Rolle der langen nicht-kodierenden RNAs (lncRNAs) bei Krebs kommt in den Vordergrund, da das Interesse an dem Verständnis ihrer mechanistischen Funktionen während der Krebsentwicklung und -progression zunimmt. Trotzdem wurde die globale epigenetische Regulation von lncRNAs und repetitiven Sequenzen bei Krebs insbesondere bei chronischer lymphozytischer Leukämie (CLL) nicht gut untersucht. Diese Studie konzentriert sich auf einen einzigartigen Ansatz: die immunpräzipitationsbasierte Erfassung von doppelsträngigen, methylierten DNA-Fragmenten unter Verwendung von Methylbindungsdomänen (MBD) -Proteinen, gefolgt von einer Sequenzierung der nächsten Generation (MBD-seq). CLL-Patientenproben, die zu zwei prognostischen Untergruppen gehörten (5 IGVH-mutierte Proben + 5 IGVH-unmutierte Proben), wurden in dieser Studie verwendet. Die Analyse ergab 5.800 hypermethylierte und 12.570 hypomethylierte CLL-spezifische differentiell methylierte Gene (cllDMGs) im Vergleich zu normalen gesunden Kontrollen. Wichtig ist, dass diese Ergebnisse mehrere CLL-spezifische, differentiell methylierte lncRNAs identifiziertenPetitive Elemente und Protein-kodierende Gene mit potenziellem prognostischen Wert. Diese Arbeit skizziert ein detailliertes Protokoll für eine MBD-Seq- und Bioinformatik-Pipeline, die für die umfassende Analyse globaler Methylierungsprofile in hochcpG-reichen Regionen mit CLL-Patientenproben entwickelt wurde. Schließlich wurden ein Protein-kodierendes Gen und eine lncRNA mittels Pyrosequenzierung validiert, was eine hochquantitative Methode zur Analyse von CpG-Methylierungsniveaus ist, um die Befunde aus dem MBD-seq-Protokoll weiter zu bestätigen.

Introduction

Die Verwendung von Sequenztechniken der nächsten Generation zur Analyse globaler DNA-Methylierungsprofile wurde in den letzten Jahren zunehmend populär. Genom-weite Methylierungs-Assays, einschließlich Mikroarray- und Nicht-Mikroarray-basierte Methoden, wurden auf der Grundlage der folgenden entwickelt: die Bisulfit-Umwandlung von genomischer DNA, methylierungsempfindliche Restriktionsenzymverdauungen und die Immunpräzipitation von methylierter DNA unter Verwendung von Methyl-CpG-spezifischen Antikörpern .

Aberrant DNA-Methylierung ist eines der Kennzeichen der Leukämie und Lymphome, einschließlich der chronischen lymphatischen Leukämie (CLL). Früher charakterisierten mehrere Gruppen, einschließlich unserer, die DNA-Methylierungsprofile verschiedener CLL-prognostischer Untergruppen und normale, gesunde B-Zell-Kontrollen unter Verwendung der Bisulfit-Umwandlung von genomischer DNA, gefolgt von Mikro-Array-basierten Methoden oder Voll-Genom-Sequenzierung 1 , 2 , 3 , <Sup class = "xref"> 4. Die Bisulfit-Umwandlung von genomischer DNA führt zur Deamination von unmodifizierten Cytosinen zu Uracil, wobei die modifizierten methylierten Cytosine im Genom zurückbleiben. Nach der Umwandlung kann der Methylierungsstatus der DNA durch PCR-Amplifikation und Sequenzierung unter Verwendung unterschiedlicher quantitativer oder qualitativer Methoden, wie z. B. Mikro-Array-basierte oder Voll-Genom-Bisulfit-Sequenzierung (WGBS), bestimmt werden. Obwohl Bisulfit-umwandlungsbasierte Verfahren viele Vorteile haben und in verschiedenen Krebsarten weit verbreitet sind, um DNA-Methylierungsniveaus zu analysieren, gibt es einige Nachteile, die mit dieser Technik verbunden sind. Die WGBS-Sequenzierung ermöglicht eine Single-Base-Paar-Auflösung mit niedrigeren DNA-Mengen und ist die beste geeignete Option zur Analyse einer großen Anzahl von Proben. Diese Methode unterscheidet jedoch nicht die Modifikationen zwischen den 5 mC und 5 hmC Ebenen im Genom 5 , 6 . Darüber hinaus bieten Microarray-basierte Methoden nicht komplette cÜberleben des Genoms

In einer aktuellen Studie aus unserem Labor 7 wurden immunpräzipitationsbasierte Verfahren anstelle von Bisulfit-Umwandlung verwendet, um hochgradig CpG-reiche, differentiell methylierte Regionen auf globaler Ebene bei CLL-Patienten und normalen gesunden Kontrollen zu identifizieren. Inmethyl-CpG-bindende Domäne (MBD) Sequenzierung der nächsten Generation (MBD-seq), die Anreicherung von doppelsträngiger fragmentierter DNA hängt vom Grad der CpG-Methylierung ab. Dieses Verfahren kann die Nachteile des Bisulfit-Umwandlungsverfahrens überwinden und kann auch eine genomweite Abdeckung der CpG-Methylierung in einer unvoreingenommenen und PCR-unabhängigen Weise bereitstellen. Zusätzlich kann im Gegensatz zu auf der Basis von Bisulfit-umwandlungsbasierten Mikroarray-Methoden MBD-seq verwendet werden, um den Methylierungsstatus von sich wiederholenden Elementen zu analysieren, wie z. B. lange durchbrochene nukleare Elemente (LINEs), kurze durchbrochene nukleare Elemente (SINEs), lange terminale Wiederholungen (LTRS) Usw. Im Vergleich zu Bisulfit-Umwandlungsverfahren,Ein MBD-seq-Protokoll erfordert eine relativ große Menge an Input-DNA. Auch die Qualität der Sequenzierung liest und die Daten hängen von der Spezifität, Affinität und Qualität der verwendeten Antikörper ab.

Die aktuelle Studie erklärt ein detailliertes MBD-seq-Protokoll, um methylierte DNA für die Sequenzierung der nächsten Generation zu bereichern. Es verwendet ein kommerzielles, methyliertes DNA-Bindungsanreicherungs-Kit (aufgeführt in der Materialtabelle ) sowie eine rechnerische Pipeline zur Visualisierung und Interpretation von Methylierungssequenzdaten zur Identifizierung von CLL-spezifischen hyper- und hypomethylierten Regionen im Vergleich zu normalen gesunden Kontrollen. Grundsätzlich nutzt dieses Verfahren die Fähigkeit des MBD der humanen MBD2-Protein-Wechselwirkung mit methylierten CpGs, um mit Methyl-CpGs angereicherte DNA zu extrahieren, worauf die Hochdurchsatz-Sequenzierung von methylierter DNA folgt.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Die ethische Genehmigung für das Sammeln der CLL-Muster ist von 2007-05-21 mit der folgenden Registriernummer: EPN Gbg dnr 239/07. Alle CLL-Patienten wurden nach kürzlich revidierten Kriterien 8 diagnostiziert und die Proben wurden zum Zeitpunkt der Diagnose gesammelt. Die Patienten in der Studie wurden von verschiedenen Hämatologie-Abteilungen im westlichen Teil von Schweden aufgenommen, nachdem schriftliche Zustimmung erhalten worden war. In dieser Studie wurden nur CLL-periphere Blutmononukleäre Zellen (PBMC) mit einem Tumoranteil von Leukämiezellen ≥ 70% ausgewählt.

1. Vorbereitungen

  1. Isolieren Sie PBMCs für DNA-Extraktionen von CLL und normale, gesunde periphere Blutproben unter Verwendung eines kommerziellen Isolationskits (siehe Materialtabelle ) gemäß den Anweisungen des Herstellers.
  2. Autoklav 1,5 mL Röhrchen. Tauschen Sie alle Reagenzien im methylierten DNA-Bindungskit (siehe Materialtabelle ). </ Li>
  3. Verwenden Sie DNase-freies Wasser, um 10 ml 1x Wulstwaschpuffer aus dem 5x Vorratsspülpuffer vorzubereiten, der vom Kit bereitgestellt wird, um Perlen zu waschen und das vom Kit bereitgestellte MBD-Protein zu verdünnen.
  4. Erhalten oder bereiten die folgenden Gegenstände vor: 3 M Natriumacetat, absolutem Ethanol und 70% Ethanol zur DNA-Präzipitation ( Materials Table ).

2. Genomische DNA-Extraktion und Sonikation

  1. Verwenden Sie einen handelsüblichen DNA-Extraktionskit ( Materials Table ), um genomische DNA von Patienten und normalen PBMC-Proben nach dem Protokoll des Herstellers zu isolieren. Quantifizierung der genomischen DNA unter Verwendung eines Spektrophotometers bei 260 nm.
    HINWEIS: Die DNA-Extraktionsspaltenkapazität beträgt 5-6 Millionen Zellen, maximal; Daher ist es wichtig, mehr als eine Spalte für Proben mit mehr als 5 Millionen Zellen zu verwenden. Eluieren Sie die DNA zweimal in gleichen Volumina, die 100 μl 10 mM Tris EDTA (TE) Puffer enthält. Das in der Methyl verwendete MBD-Biotin-ProteinMiner-Kit für MBD-Sequenzierung wird nicht an einzelsträngige DNA binden. So ist es sehr wichtig, die eluierte DNA entweder eingefroren oder bei 4 ° C zu halten, um ihre doppelsträngige Natur zu bewahren.
  2. 5 μg genomische DNA aus jeder Probe auf insgesamt 200 μl unter Verwendung von TE-Puffer (pH 8) verdünnen, wobei eine Endkonzentration von 25 ng / μL erhalten wird.
  3. Führen Sie die Beschallung in speziell entworfenen Rohren mit einem Ultraschallgerät ( Materialtabelle ) für insgesamt 30 Zyklen (30 s an und 30 s aus pro Zyklus, nach jeweils 5 Zyklen, kurz die Röhrchen drehen, um die Proben nach unten zu sammeln).
    HINWEIS: Dies führt zu fragmentierter DNA zwischen 150 bp und 300 bp, was für dieses Protokoll optimal ist.
  4. Überprüfen Sie den Beschallungsbereich für alle Proben, bevor Sie mit dem nächsten Schritt der MBD-Sequenzierung fortfahren, indem Sie 1 μl der fragmentierten DNA-Proben und eine DNA-Größenleiter auf einem handelsüblichen, vorgegossenen 2% Agarosegel unter Verwendung von DNA-Elektrophorese-Bildgebungsgeräten laufen lassen. Visualisierung tEr DNA mit einem Standard-UV-Transilluminator.

3. Perlenpräparation vor der Bindung mit MBD-Biotin-Protein

  1. Die magnetischen Streptavidin-Kügelchen aus dem durch den Bausatz bereitgestellten Vorratsschlauch resuspendieren, vorsichtig nach oben und unten pipettieren, um eine homogene Suspension zu erhalten. Verwirren Sie die Perlen nicht oder lassen Sie sie trocknen.
  2. Legen Sie 50 & mgr; l Perlen (für jede 5 & mgr; g fragmentierte DNA-Probe) in getrennten, sauberen und markierten 1,5 ml Röhrchen. Füge 50 μl 1x Wulstwaschpuffer hinzu, um das Endvolumen von 100 μl zu erreichen.
    HINWEIS: Bei der Verwendung von kleinen 0,5 mL Polymerase Kettenreaktion (PCR) Streifen zum Waschen von Perlen werden etwa 150-200 & mgr; l Waschpuffer pro Röhrchen verwendet, wie im Kit-Protokoll erwähnt. Im Falle von 1,5 ml Röhrchen werden jedoch mindestens 250 μl zu 300 μl Waschpuffer pro Röhrchen für die Wulstwäsche zugegeben.
  3. Legen Sie die Röhrchen für eine Minute auf einen Magnetständer, damit sich alle magnetischen Perlen auf die Innenwand des Rohres konzentrieren könnenMit dem Magneten Entfernen Sie die Flüssigkeit, ohne die Perlen zu berühren, mit einer 200 μl Pipette.
  4. Entfernen Sie die Röhrchen aus dem Magnetständer, fügen Sie 250 μl 1x Wulstwaschpuffer hinzu und mischen Sie die Perlen vorsichtig mit einer Pipette.
  5. Wiederholen Sie die Schritte 3.3 und 3.4 mindestens 4-5 mal für alle Proben und schließlich in 250 μl 1x Wulstwaschpuffer resuspendieren. Halten Sie sie auf Eis.

4. Bindung des MBD-Biotin-Proteins an die gewaschenen Perlen

  1. Füge 35 μl MBD-Protein (7 μl für 1 μg DNA-Probe) hinzu, um Röhrchen zu trennen und das Gesamtvolumen bis zu 250 μl unter Verwendung von 1x Bead Wash Puffer zu bringen.
  2. Füge 250 μl verdünntes MBD-Protein zu den 250 μl gewaschenen Perlen hinzu und läßt sie bei Raumtemperatur 1 h bei einer End-to-End-Rotation liegen.
  3. Nach dem Mischen der Perlen und des Proteins für 1 h, waschen Sie das MBD-Protein-Biotin, das mit magnetischen Streptavidin-Perlen gebunden ist.
    1. Legen Sie die Röhrchen 1 min auf den Magnetständer und entfernen Sie tEr fließt, ohne die Perlen mit einer Pipette zu berühren. Füge 250 μl 1x Wulstwaschpuffer hinzu und lege die Röhrchen 5 min bei Raumtemperatur auf einen Rotationsmischer.
  4. Wiederholen Sie Schritt 4.3.1 zwei weitere Male und schließlich die gewaschenen MBD-Biotinperlen in 200 μl 1x Bead-Waschpuffer resuspendieren, wodurch die Perlen für die methylierte DNA-Capture bereit sind.
    HINWEIS: Waschen 2-3 mal auf diese Weise entfernt alle Hintergrund ungebundenen MBD-Protein-Perlen und verbessert die effiziente Bindung von MBD-Protein-gekoppelten Perlen mit fragmentierten genomischen DNA.

5. Bindung von MBD-Biotin-Perlen mit Fragmentierter Genom-DNA

  1. In einem sauberen 1,5 ml DNase-freien Röhrchen werden 100 & mgr; l 5 & times; Perlenwaschpuffer und 180 & mgr; l der fragmentierten genomischen DNA zugegeben (Schritt 2.3). Bringen Sie das Endvolumen auf 500 μl mit DNase freiem Wasser.
  2. Füge 380 μl DNase-freies Wasser zu den restlichen 20 μl der fragmentierten genomischen DNA hinzu und gefriere sie. Verwenden Sie diese Samples als Eingabe DNEine Kontrolle und fällt sie später zusammen mit den endgültigen eluierten methylierten DNA-Proben (siehe Schritt 7.1).
  3. Legen Sie die Röhrchen mit gewaschenen MBD-Biotinperlen (Schritt 4.4) auf einen Magnetständer für 1 min und entfernen Sie die Flüssigkeit, ohne die Perlen zu stören. Fügen Sie 500 μl fragmentierte genomische DNA hinzu, die in Perlenwaschpuffer verdünnt ist.
  4. Alle Röhrchen fest mit Paraffinfolie abdichten und über Nacht bei 4 ° C auf einem End-to-End-Rotationsständer bei 8-10 U / min belassen.
    ANMERKUNG: Die DNA- und Biotin-Bead-Bindungsreaktion kann für 1 h bei Raumtemperatur durchgeführt werden, aber bei 4 ° C über Nacht kann die Wiederherstellung der endgültigen methylierten DNA verbessert werden.

6. Entfernen der ungebundenen DNA und Eluieren der methylierten DNA aus den Perlen

  1. Nach der DNA- und MBD-Perlen-Bindungsreaktion die Röhrchen für 1 min auf die magnetische Zahnstange stellen, um alle Perlen auf die Innenwand des Röhrchens zu konzentrieren.
  2. Entfernen Sie die überstehende Flüssigkeit mit einer Pipette, ohne zu berührenDie Perlen und speichern diese ungebundene DNA-Probenfraktion auf Eis.
  3. Füge 200 μl 1x Wulstwaschpuffer zu den Perlen hinzu und lege die Röhrchen 3 min bei Raumtemperatur auf den rotierenden Ständer. Legen Sie die Rohre auf den Magnetständer und entfernen Sie die Flüssigkeit. Wiederholen Sie die Wäsche noch zwei Mal, um die restliche ungebundene DNA zu entfernen.
  4. Nach dem abschließenden Waschen werden 200 & mgr; l hochsalziger Elutionspuffer (2.000 mM NaCl) zugegeben, der in dem Kit zur Eluierung der DNA bereitgestellt wird.
  5. Die Röhrchen 15 min bei Raumtemperatur auf den rotierenden Ständer stellen. Legen Sie sie 1 min auf den Magnetständer und verwenden Sie eine Pipette, um den Überstand sorgfältig auf ein neues, sauberes 1,5 mL Röhrchen zu übertragen.
  6. 200 μl Hochsalz-Elutionspuffer zugeben und die Elution durch Drehen der Röhrchen bei Raumtemperatur für 15 min wiederholen. Füge die zweite Elute zu demselben Röhrchen hinzu, das die 200 μl des ersten Eluats enthält.
    HINWEIS: Die endgültigen 400 μl der gesamten eluierten DNA ist nun bereit für die Ethanol-Präzipitation, um die gereinigten zu extrahierenDNA, die für die Sequenzierung der nächsten Generation geeignet ist.

7. Ethanol-Präzipitation und die Anreicherung von methylierter DNA

  1. Füge 1 μl Glykogen (20 μg / μL, im Kit enthalten) ein; 40 & mgr; l 3 M Natriumacetat, pH 5,2; Und 800 & mgr; l eiskaltes absolutes Ethanol zu 400 & mgr; l eluierter DNA und auch zu den in Schritt 5.2 hergestellten 400 & mgr; l Input-DNA-Proben
  2. Mischen Sie die Röhrchen gut durch Vortexen und inkubieren sie bei -80 ° C über Nacht.
  3. Die Röhrchen mit 12.000 xg (Höchstgeschwindigkeit) und 4 ° C zentrifugieren. Den Überstand sorgfältig verwerfen, ohne das Pellet zu stören, 500 μl 70% iges Ethanol zuzugeben und die Röhrchen zu verwirbeln.
  4. 10 Minuten bei 4 ° C mit maximaler Geschwindigkeit zentrifugieren und den Überstand sorgfältig mit einer Pipette entfernen. Die Röhrchen mit maximaler Geschwindigkeit für 1 min bei Raumtemperatur zentrifugieren und das restliche Ethanol vollständig mit einer Pipettenspitze entfernen.
  5. Das Pellet für 5 min bei Raumtemperatur abtrocknenReifen Füge 10 μl DNase-freies Wasser zum DNA-Pellet hinzu. Weiter mit der methylierten DNA-Quantifizierung (Schritt 7.6), MBD-Sequenzierung (Schritt 7.7) und Analyse (Abschnitte 8 und 9).
  6. Quantifizieren Sie die endgültig gewonnenen methylierten DNA-Proben unter Verwendung eines handelsüblichen fluorometrischen Quantifizierungskits (siehe Materialtabelle ) gemäß den Anweisungen des Herstellers.
  7. Anmerkung: Mit diesem Protokoll wurden 30-50 ng endgültige DNA aus jeder Probe gewonnen. DNA-Proben sind bereit, auf Trockeneis für nachgeschaltete Bibliotheksbau und Hochdurchsatz-MBD-Sequenzierung zu senden
  8. Durchführen einer DNA-Bibliothekskonstruktion und einer Hochdurchsatz-MBD-Sequenzierung unter Verwendung einer kommerziellen Plattform ( Materials Table ), wie in Referenz 9 beschrieben.
    ANMERKUNG: Für die anfängliche Qualitätskontrolle der endgültigen methylierten DNA führen Sie Bibliothekszubereitungen unter Verwendung von 50-bp-Paar-End-Sequenzierungen für alle Proben durch. Verarbeiten Sie die Rohdaten für die Nachsequenzierung der Qualitätskontrolle, aS, die in Schritt 8.1 ausgearbeitet wurden, und weiterverarbeiten sie mit bioinformatischen Ansätzen und statistischen Methoden, wie unten beschrieben (Schritte 8.2-9.6).

8. Bioinformatik-Analyse Methode 1: Identifizierung von CLL-assoziierten differenziell methylierten Regionen (cllDMRs)

  1. Reinigen Sie die erhaltenen 49-bp-Lesungen (FASTQ-Format) für Adapter mit den verfügbaren Qualitätskontrollwerkzeugen wie Trimmomatic 10 oder Cutadapt. Crosscheck die Qualität der getrimmten Lesungen mit dem FastQC Toolkit:
    Java -jar trimmomatic.jar SE SAMPLE_uncleaned.fastq SAMPLE.fastq ILLUMINACLIP: adapters.fasta: 2: 30: 10
  2. Richten Sie die gereinigten FASTQ-Dateien mit dem Kurzlesen-Genom-Aligner Bowtie gegen ein Referenzgenom aus 11 aus . Geben Sie die folgenden Parameter an:
    1. Erlaube bis zu zwei Fehlanpassungen (Bowtie-Parameter: -v 2).
    2. Begrenzung der Berichterstattung auf die sechs besten Ausrichtungen pro Lesen (Bowtie-Parameter: -m 6) zur SteuerungFür Multi-Mapping liest.
      Bowtie -v 2 -a -m 6 HG19_INDEX -S SAMPLE.fastq> SAMPLE.sam
      HINWEIS: Konvertieren Sie die SAM-Dateien, die für einzelne Samples generiert wurden, nach der Ausrichtung in BAM mit SAMtools.
      Samtools sehen -bS -o SAMPLE.bam SAMPLE.sam
  3. Verwenden Sie die modellbasierte Analyse des ChIP-Seq (MACS) Peak Callers auf ausgerichteten Samples (BAM), um angereicherte / methylierte Regionen aus den CLL-Subgruppen 12 vorherzusagen.
    HINWEIS: Vergleich I: Verwenden Sie das Input-Beispiel als Kontrollgruppe und die Normal- und CLL-Patientenproben als Behandlungsgruppen. Dieser Schritt ist, alle negativen Spitzen zu sammeln (Spitzen, die in Eingang / Hintergrund angereichert sind). Vergleich II: Verwenden Sie die Normal-Probengruppe als Kontrollgruppe und die CLL-Patienten-Probengruppe als Behandlungsgruppe. Erhaltene positive Peaks sind CLL-hypermethylierte Regionen, und negative Peaks sind CLL-hypomethylierte Regionen über normale oder differentiell methylierte Regionen (DMRs).
    Macs14 -t SAMPLE_TREATMENT.bam -c SAMPLE_CONTROL.bam - Format BAM -g hs
  4. Vergleiche I-Hintergrund-Peaks aus differentiell methylierten Regionen (DMRs) mit BEDtools 13 .
    Bedtools subtrahieren -a <CLL_enriched_regions> -b <Input_enriched_regions>
  5. Vorhersage des Prozentsatzes der Wiederholungselemente (SINE-Alu, LINE, etc. ), angereichert in DMRs.
    1. Verwenden Sie Fastacmd, um die FASTA-Sequenz von DMRs durch die chromosomalen Koordinaten aus dem Referenzgenom HG19 zu extrahieren.
      Fastacmd -d HG19_genome.fa -s Chromosom -L Start, Ende -l 50000> DMRs.fasta
    2. Verwenden Sie das RepeatMasker-Befehlszeilen-Tool, um den Prozentsatz der Wiederholungselemente, die in der FASTA-Sequenz von DMRs vorhanden sind, vorherzusagen.
      RepeatMasker -gc -gccalc -s -species mensch -html DMRs.fasta
  6. Annotieren Sie die vorhergesagten DMRs mit Homer "annotatePeaks.pl" mit dem verfügbaren Ensembl [PMC4919035] oR Gencode [PMID 22955987] Transkript-Annotation (Protein-Codierung und nicht-kodierende Transkripte).
    AnnotatePeaks.pl DMRs.bed <GENOME> -gtf <Ensembl oder Gencode GTF>
    HINWEIS: Hier finden Sie Informationen über die Verteilung von Peaks über verschiedene genetische Regionen ( zB Promotor, Exon, Intron, 3 'UTRs und 5' UTRs) und intergene Regionen. Transkripte oder Gene, die mit DMRs assoziiert sind, werden als differentiell methylierte Gene (DMGs) bezeichnet.
  7. Verwenden Sie das Anreicherungswerkzeug mit der aktualisierten oder aktuellen Funktionsdatenbank, um Funktionen zu finden, die mit CLL DMGs angereichert sind (nur Protein-codierende Gene) 14 .
    HINWEIS: Gene Set Clustering basierend auf Functional Annotation (GeneSCF) 14 ist ein Echtzeit-basiertes Tool zur funktionalen Anreicherungsanalyse, das aktualisierte KEGG und Gene Ontology als Referenzdatenbank verwendet.

9. Bioinformatik-Analyse Methode 2: Identifizierung CLL-assoziiert signifikant DiffErentlich Methylierte Regionen (cll sigDMRs)

  1. Befolgen Sie die Schritte 8.1-8.5 von Methode I (Abschnitt 8) und verwenden Sie die Read-Count-basierte Differentialanreicherungsanalyse, indem Sie die verfügbaren Tools verwenden, wie in den Schritten 9.2 - 9.6 ausgearbeitet, um der Analyse-Pipeline eine weitere Statistikebene hinzuzufügen.
  2. Quantifizieren Sie die Anzahl der Lesevorgänge, die einzelnen Peaks oder DMRs in Normal- und CLL-Patientenproben zugeordnet sind, mit "featureCounts" aus dem "Subread" -Paket 15 .
    Subread / bin / featureCounts -Q 30 -F SAF -a DMRs.SAF -o DMRs_counts.table SAMPLE_TREATMENT.bam SAMPLE_CONTROL.bam
    HINWEIS: Ein Mapping-Qualitätsfilter kann eingeführt werden, um eine Bestätigung der schlechten Qualität zu vermeiden ( z. B. -Q 30). Für diesen Schritt bereite ich SAF-Dateien für die erhaltenen DMRs vor. Für weitere Informationen über das SAF-Dateiformat verwenden Sie bitte diesen Link http://bioinf.wehi.edu.au/featureCounts/.
  3. Verwenden Sie eine RAW-Lese-Zähler-Tabelle mit der Anzahl der Lesevorgänge für die einzelnen Peaks in Normal anD CLL Patientenprobengruppen in edgeR als Eingang 16 .
    HINWEIS: Vergleichen Sie normale versus CLL Patientenprobengruppen, um sigDMRs zu finden. Zur differenziellen Anreicherungsanalyse folgen Sie der Anleitung von edgeR für detaillierte Schritt-für-Schritt-Anleitungen (https://bioconductor.org/packages/release/bioc/vignettes/edgeR/inst/doc/edgeRUsersGuide.pdf).
  4. Filtern Sie die sigDMRs mit der falschen Discovery Rate (FDR) und Log-Fold-Änderung, die von edgeR 16 vorhergesagt wird.
  5. Annotieren Sie die vorhergesagten SigDMRs mit Homer "annotatePeaks.pl" mit der verfügbaren Ensembl- oder Gencode-Transkript-Annotation (Protein-Codierung und nichtcodierende Transkripte).
    AnnotatePeaks.pl sigDMRs.bed HG19_genome.fa -gtf <Ensembl oder Gencode GTF> -CpG
    HINWEIS: Hier finden Sie Informationen über die Verteilung von Peaks über verschiedene genetische Regionen ( zB Promotor, Exon, Intron, 3 'UTRs und 5' UTRs) und intergene Regionen. Transkripte oder Gene, die mit si assoziiert sindGDMRs heißen sigDMGs.
  6. Verwenden Sie ein Anreicherungswerkzeug mit der aktualisierten oder aktuellen Funktionsdatenbank, um mit CLL sigDMGs angereicherte Funktionen zu finden (nur Protein-kodierende Gene) 14 .
    HINWEIS: GeneSCF, eines der Echtzeit-Tools für die funktionale Anreicherungsanalyse, verwendet KEGG und Gene Ontology als Referenzdatenbanken.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

MBD-seq wurde vor kurzem bei CLL-Patienten und abgestimmten, normalen, gesunden Kontrollen durchgeführt, um CLL-spezifische differentiell hyper- und hypomethylierte Gene zu identifizieren 7 . Die experimentelle und bioinformatische Pipeline, die für die Analyse der von CLL und normalen gesunden Proben erzeugten Daten verwendet wird, ist in 1A und 1B gezeigt . Diese Analysen identifizierten mehrere CLL-spezifische differentiell methylierte Regionen (cllDMRs), die signifikant hyper / hypomethyliert aus IGHV-mutierten und IGHV-unmutierten Proben im Vergleich zu Kontrollproben mit einem p-Wert <0,00001 waren. Fig. 2A zeigt alle cllDMRs, die sowohl von normalen B-Zell- als auch von normalen PMBC-Vergleichen erhalten wurden. Alle cllDMRs wurden auf verschiedene Klassen von Protein-codierenden und nicht-kodierenden Genen abgebildet, wie in 2B gezeigt . Wichtig in dieser Analyse waren die Vergleiche perforMed unabhängig zwischen den CLL Patienten Proben, mit zwei verschiedenen normalen Kontrollen, sortiert B-Zelle und PMBCs. Interessanterweise führte die Analyse zu einer großen Überlappung von üblichen CLL-spezifischen differentiell methylierten Genen (cllDMGs, 851 hypermethylierten und 2.061 hypomethylierten) im Vergleich zur normalen B-Zell-Kontrolle und normalen PBMC-Kontrollproben (Abbildung 2C ), was darauf hindeutet, dass diese cllDMGs sein können Mögliche CLL-Signaturgene mit signifikanten Rollen in der Krankheitspathogenese. Um die analysierten Daten zu amplifizieren, wurden mehrere CpG-Stellen, die sich in einem hypermethylierten Protein- kodierenden Gen, SKOR1 und einer hypomethylierten langen nicht-kodierenden lncRNA, AC012065.7 , befinden , unter Verwendung eines Pyrosequenzierungsverfahrens validiert, wie in den früheren Veröffentlichungen 7 , 17 , 18 beschrieben ( 3A Und B ). Fig. 4 zeigt gescherte DNANach dem beschallungsprotokoll Die fragmentierte DNA liegt zwischen 150 und 300 bp und ist damit ideal für Sequenzierungszwecke.

Abbildung 1
Abbildung 1: Überblick über den in dieser Studie verwendeten Arbeitsablauf. Diese Figur, die aus unserer jüngsten Publikation 7 gewonnen wurde , zeigt die Ausgestaltung der Gesamtanalyse zur Identifizierung der differentiell methylierten Regionen (DMRs) bei chronischen lymphatischen Leukämie (CLL) Patientenproben. ( A ) Experimentelles Design der MBD-basierten Anreicherung von methylierter DNA. ( B ) Die Pipeline der Bioinformatikanalyse zur Identifizierung von CLL-spezifischen differentiell methylierten Regionen (cllDMRs). Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.


Abbildung 2: Hypermethylierte und hypomethylierte cllDMRs und cllDMGs von CLL Patient Proben im Vergleich zu normalen, gesunden, sortierten B Zellen 7 . ( A ) Alle chronischen lymphatischen Leukämie (CLL) assoziierten differentiell methylierten Regionen mit signifikanten p-Werten (<0,00001), die aus dem Vergleich der IGHV-mutierten und -unmutierten CLL-Proben mit normal sortierten B-Zellen (oberer Tafel) und normalen PBMC-Proben erhalten wurden (Untere Platte). Die Anreicherungen, die in der Wärmekapazität gezeigt wurden, waren innerhalb eines ± 3-kb-Fensters von der differentiell methylierten Region (DMRs). ( B ) Venn-Diagramm, das die Überlappung von CLL-spezifischen differentiell methylierten Genen (cllDMGs, hypermethyliert und hypomethyliert) zwischen IGHV-mutierten und IGHV-unmutierten Gruppen zeigt. Das Kreisdiagramm repräsentiert den Prozentsatz der Gene, die zu einer anderen Klassifikation gehören, wie z. B. Protein-Codierung, Lange nicht-kodierende RNA (lncRNA), Pseudogene, Antisense und andere nicht-kodierende RNAs. ( C ) Venn-Diagramm, das die Überlappung von gemeinsamen differentiell methylierten Genen (IGHV-mutierte und IGHV-unmutierte prognostische Gruppen) zwischen B-Zell- und PBMC-Vergleichen zeigt. Die linke Tafel des Venn-Diagramms zeigt die Überlappung für hypermethylierte Gene und die rechte Tafel für hypomethylierte Gene. Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.

Abbildung 3
Abbildung 3: Validierung des DNA-Methylierungsstatus für einzelne CpG-Standorte auf den ausgewählten, signifikant differenziell methylierten Zielgenen. Pyrosquencing-Daten zur Quantifizierung des Prozentsatzes der DNA-Methylierung für zwei ausgewählte Gene unter Verwendung eines unabhängigen chronischen LymphozytenIc Leukämie (CLL) Probenkohorte mit 54 Proben und 6 normalen, gesunden, altersangepassten B-Zellproben. ( A ) Die Kastenplots repräsentieren den Prozentsatz der Methylierungswerte für 3 einzelne CpG-Stellen des hypermethylierten SKOR1- Gens unter Verwendung von Pyrosequenzierung. ( B ) Die Boxplot zeigt den Grad der Methylierung für 5 einzelne CpG-Stellen des hypomethylierten AC012065.7- Gens unter Verwendung von Pyrosequenzierung. Die Felder zeigen den Interquartilbereich (25-75%) an, während die innere horizontale Linie den Medianwert anzeigt. Die Whisker stellen die minimalen und maximalen Werte dar. Der p-Wert, der dem Grad der differentiellen Methylierung von CLL-Proben über normale B-Zellen entspricht, ist in den Kastenplots für jede einzelne CpG-Stelle gezeigt. Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.

Abbildung 4: Scheren von genomischer DNA Die repräsentativen Ergebnisse von vier chronischen lymphozytischen (CLL) DNA-Proben nach der Ultraschallbehandlung wurden zusammen mit einer CLL-Probe von vor (0 min) Ultraschallbehandlung in einem 2% vorgegossenen Agarosegel durchgeführt, gefärbt und unter UV-Licht sichtbar gemacht. Die DNA-Größenleiter ist auf der Spur 1 angegeben. Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

MBD-seq ist eine kostengünstige, immunpräzipitationsbasierte Technik, die verwendet werden kann, um Methylierungsmuster mit vollständiger genomweiter Abdeckung zu untersuchen. Sowohl MeDIP-Seq (methylierte DNA-Immunopräzipitation als auch Sequenzierung) und MBD-Seq führen zur Anreicherung von CpG-reicher methylierter DNA. Allerdings zeigt MBD-seq mehr Affinität zur Bindung an hoch-cpG-reiche Regionen im Vergleich zu MeDIP seq 19 . Unter Verwendung eines Methyl-bindenden Anreicherungs-Kits kann man die DNA in hoch-CpG- und niedrig-CpG-reiche Regionen durch Eluieren von DNA mit hochsalzigen und salzarmen Puffern fraktionieren. In dieser Untersuchung wurde nur eine einzige Fraktionselution durchgeführt, um hoch angereicherte CpG-reiche Regionen zu erfassen, die die meisten CpG-Inseln bedeckten.

MBD-seq kann eine leistungsfähige Alternative zu WGBS sein, die häufig in CLL und anderen Leukämie-Untersuchungen verwendet wird. Obwohl MBD-seq eine relativ höhere Menge an Input-DNA im Vergleich zum Bisulfit benötigtUmwandlungsbasierte Methoden ermöglicht es die Untersuchung von globalen Methylierungsänderungen, die nur für 5-mC-Modifikationen spezifisch sind, ohne dass eine PCR-Amplifikationsvorspannung nach der Umwandlung erzeugt wird. Somit ist MBD-seq eine ideale Methode, um cllDMGs zu adressieren, die potentielle epigenetisch-basierte CLL-Signaturgene mit prognostischem Wert sein könnten.

Die entscheidenden Faktoren für die Durchführung dieser Methode sind die Qualität und der Beschallungsbereich der fragmentierten DNA, die vor der Bindungsreaktion verwendet wurde. Alle Proben zeigten kürzere Fragmentbereiche zwischen 150 und 300 bp (Abbildung 4 ), was zu qualitativ hochwertigen Sequenzierungsergebnissen führte, wobei etwa 25-33 Millionen einmalige Lesevorgänge für jede Probenabbildung zum Genom nach Datenfilterung und Reinigung waren.

Schließlich wurde der Methylierungsstatus von hyper- und hypomethylierten cllDMGs für wenige Gene unter Verwendung eines Pyrosequenzierungsverfahrens in einer unabhängigen Probenkohorte validiert. Diese Methode gibt die PerceNtd der DNA-Methylierung, abhängig vom Verhältnis von C-zu-T an einzelnen CpG-Stellen, bezogen auf die Menge an C und T, die während der Sequenzerweiterung enthalten sind. Die hypermethylierten cllDMGs zeigten im Vergleich zu den normalen Proben hohe Prozentsätze der Methylierung in CLL-Proben. Ebenso zeigten die hypomethylierten cllDMGs das Gegenteil. Pyrosequenzierungsdaten für zwei cllDMGs sind in 3 gezeigt .

Im Vergleich zu Array-basierten Methoden ermöglicht dieses Verfahren die breitere Untersuchung von Sequenzen über das Genom hinweg, einschließlich der zuvor annotierten Regionen, die Protein-codierende Regionen überspannen, und nicht-annotierte Sequenzen, die sich wiederholende Elemente und lncRNAs erstrecken. So nannte dieser Ansatz bei CLL-Patienten mehrere neuartige cllDMGs, die lncRNAs und repetitive Elemente überspannten. Da diese Untersuchungen bisher nicht in CLL-Patientenproben durchgeführt wurden, dient diese Studie als wertvolle Ressource zur Identifizierung von CLL-assoziierten differentiellen methylierten Regionen inVerschiedene prognostische Untergruppen. Diese cllDMGs dienen als neuartige Biomarker und Ziele für epigenetische medikamentöse Therapie.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren haben nichts zu offenbaren.

Acknowledgments

Diese Studie wurde vom schwedischen Forschungsrat, der schwedischen Krebsgesellschaft, der Knut- und Alice-Wallenberg-Stiftung (KAW) und den FoU VästraGötalandsregionen unterstützt.

Materials

Name Company Catalog Number Comments
Dneasy Blood and tissue kit Qaigen 69504
Lymphoprep solution A X I S-S H I E L D 1114544
Nano drop 2000 Thermo Fischersceintific
TE buffer pH 8 Sigma aldrich 93283
Bioruptor standard sonication device Diagenode UCD-200
TPX bioruptor tubes 1.5 mL Diagenode C30010010-300
3 M Sodium acetate Diagenode C03030002
E-gel iBase safe imager combo kit Thermo Fischersceintific G6465EU
E-gel 2% Agarose gels Thermo Fischersceintific G441002
Methylminer Methylated DNA enrichment kit Thermo Fischersceintific ME10025
Labquake Tube Shaker/Rotators Thermo Fischersceintific 415110
Dynal MPC-S Thermo Fischersceintific A13346
Vortex mixer VWR 12620-848
Absolute Ethanol Any company
70% Ethanool Any company
DNAse free water Milli Q
DNA precipitant (3M sodium acetate) Diagenode C03030002
Safe seal 1.5 mL eppendorf tubes Eppendorf 4036-3204
Qubit dsDNA HS Assay Kit Thermo Fischersceintific Q32851
Qubit 0.5 mL tubes Thermo Fischersceintific Q32856
Qubit Thermo Fischersceintific Q32866
Illumina Hiseq2000 Platform Illumina
Water  Bath Grant
Heat block grant
Tube rotater Labquake

DOWNLOAD MATERIALS LIST

References

  1. Kanduri, M., et al. Differential genome-wide array-based methylation profiles in prognostic subsets of chronic lymphocytic leukemia. Blood. 115 (2), 296-305 (2010).
  2. Cahill, N., et al. 450K-array analysis of chronic lymphocytic leukemia cells reveals global DNA methylation to be relatively stable over time and similar in resting and proliferative compartments. Leukemia. 27 (1), 150-158 (2013).
  3. Kanduri, M., et al. Distinct transcriptional control in major immunogenetic subsets of chronic lymphocytic leukemia exhibiting subset-biased global DNA methylation profiles. Epigenetics. 7 (12), 1435-1442 (2012).
  4. Kulis, M., et al. Epigenomic analysis detects widespread gene-body DNA hypomethylation in chronic lymphocytic leukemia. Nat Genet. 44 (11), 1236-1242 (2012).
  5. Booth, M. J., et al. Quantitative sequencing of 5-methylcytosine and 5-hydroxymethylcytosine at single-base resolution. Science. 336 (6083), 934-937 (2012).
  6. Yu, M., et al. Base-resolution analysis of 5-hydroxymethylcytosine in the mammalian genome. Cell. 149 (6), 1368-1380 (2012).
  7. Subhash, S., Andersson, P. O., Kosalai, S. T., Kanduri, C., Kanduri, M. Global DNA methylation profiling reveals new insights into epigenetically deregulated protein coding and long noncoding RNAs in CLL. Clin Epigenetics. 8, 106 (2016).
  8. Hallek, M., et al. Guidelines for the diagnosis and treatment of chronic lymphocytic leukemia: a report from the International Workshop on Chronic Lymphocytic Leukemia updating the National Cancer Institute-Working Group 1996 guidelines. Blood. 111 (12), 5446-5456 (2008).
  9. De Meyer, T., et al. Quality evaluation of methyl binding domain based kits for enrichment DNA-methylation sequencing. PLoS One. 8 (3), e59068 (2013).
  10. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  11. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10 (3), R25 (2009).
  12. Zhang, Y., et al. Model-based analysis of ChIP-Seq (MACS). Genome Biol. 9 (9), R137 (2008).
  13. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26 (6), 841-842 (2010).
  14. Subhash, S., Kanduri, C. GeneSCF: a real-time based functional enrichment tool with support for multiple organisms. BMC Bioinformatics. 17 (1), 365 (2016).
  15. Liao, Y., Smyth, G. K., Shi, W. featureCounts: an efficient general purpose program for assigning sequence reads to genomic features. Bioinformatics. 30 (7), 923-930 (2014).
  16. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  17. Martinelli, S., et al. ANGPT2 promoter methylation is strongly associated with gene expression and prognosis in chronic lymphocytic leukemia. Epigenetics. 8 (7), 720-729 (2013).
  18. Kopparapu, P. K., et al. Epigenetic silencing of miR-26A1 in chronic lymphocytic leukemia and mantle cell lymphoma: Impact on EZH2 expression. Epigenetics. 11 (5), 335-343 (2016).
  19. Robinson, M. D., et al. Evaluation of affinity-based genome-wide DNA methylation data: effects of CpG density, amplification bias, and copy number variation. Genome Res. 20 (12), 1719-1729 (2010).

Tags

Genetik Ausgabe 124 DNA-Methylierung Methyl-CpG-DNA-Bindungsdomänenprotein differentiell methylierte Regionen Sequenzierung der nächsten Generation Proteincodierung und nichtkodierende Gene chronische lymphatische Leukämie
Umfassende DNA-Methylierungsanalyse unter Verwendung einer Methyl-CpG-bindenden Domänen-Capture-basierten Methode bei chronischen lymphatischen Leukämie-Patienten
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Subhash, S., Kanduri, M.More

Subhash, S., Kanduri, M. Comprehensive DNA Methylation Analysis Using a Methyl-CpG-binding Domain Capture-based Method in Chronic Lymphocytic Leukemia Patients. J. Vis. Exp. (124), e55773, doi:10.3791/55773 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter