Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: Eine grafische Benutzeroberfläche für die Straffung der Analyse hochdimensionaler Cytometry Daten

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT ist ein MATLAB-basierte grafische Benutzeroberfläche (GUI), die Benutzern erlaubt, ihre Flow Cytometry über häufig Datenanalyse Analysetechniken für hochdimensionale Daten, einschließlich der Reduzierung der Dimensionalität über t-SNE, eine Vielzahl von automatisierten und manuellen beschäftigt Clustering-Methoden, Heatmaps und neuartige hochdimensionalen Fluss Grundstücke.

Abstract

Mit dem Aufkommen der fließen Cytometers messen eine zunehmende Anzahl von Parametern weiterhin größere Platten phänotypisch Eigenschaften ihrer zellulären Muster zur Erkundung entwickeln Wissenschaftler. Allerdings liefern diese technologischen Zuführungen hochdimensionalen Daten-Sets, die immer schwieriger zu Objektiv im traditionellen Handbuch-gating Programme analysieren haben. Um besser zu analysieren und darstellen von Daten, arbeiten Wissenschaftler mit Bioinformatikern mit Erfahrung in der Analyse hochdimensionaler Daten um ihre Flow Cytometry Daten analysiert werden. Während diese Methoden sehr wertvoll bei der Untersuchung der Durchflusszytometrie gezeigt wurden, haben sie noch in eine einfache und leicht zu bedienenden Paket für Wissenschaftler einbezogen werden, die rechnerische oder Programmierung Fachwissen verfügen. Zu diesem Zweck haben wir ExCYT, ein MATLAB-basierte grafische Benutzeroberfläche (GUI) entwickelt, die die Analyse hochdimensionaler Flow Cytometry Daten optimiert durch die Implementierung verwendeten Analyseverfahren für hochdimensionale Daten einschließlich Reduzierung der Dimensionalität von t-SNE, Grundstücke eine Vielzahl von automatisierten und manuellen clustering Methoden, Heatmaps und neuartige hochdimensionalen fließen. Darüber hinaus bietet ExCYT traditionelle gating Optionen wählen Sie Populationen von Interesse für weitere t-SNE und clustering-Analyse sowie die Fähigkeit, Tore direkt am t-SNE Grundstücke anzuwenden. Die Software bietet den zusätzlichen Vorteil des Arbeitens mit entweder ausgeglichen oder unkompensierten FCS-Dateien. Für den Fall, dass nach der Übernahme Ausgleich erforderlich ist, können Benutzer dem Programm ein Verzeichnis von einzelnen Flecken und einer ungefärbten Probe zur Verfügung stellen. Das Programm erkennt positive Ereignisse in allen Kanälen und verwendet diese Daten auswählen mehr Objektiv die Vergütungsmatrix berechnen. ExCYT bietet eine umfassende Analyse Pipeline um Flow Cytometry Daten in Form von FCS-Dateien und jede Person, unabhängig von der rechnerische Ausbildung, um die neuesten algorithmische Ansätze für das Verständnis ihrer Daten verwenden lassen.

Introduction

Fortschritte in der Durchflusszytometrie sowie das Aufkommen der Masse Zytometrie hat erlaubt, Kliniker und Wissenschaftler, um schnell zu identifizieren und zu charakterisieren, phänotypisch biologisch und klinisch interessante Muster mit neuen Levels von Auflösung, große hochdimensionalen Daten-Sets, die Informationen reichen1,2,3sind. Während herkömmliche Methoden für die Analyse von Flow Cytometry Daten wie z. B. manuelle Anspritzung einfacher für Experimente wurden gibt es einige Marker und diese Marker haben optisch erkennbare Populationen, kann dieser Ansatz nicht generieren reproduzierbare Ergebnisse bei der Analyse der höherdimensionalen Datensätze oder solche mit Marker Flecken auf ein Spektrum. Beispielsweise wurden in einer Multi-institutionelle Studie, wo intrazelluläre Färbung (ICS) Assays durchgeführt, um die Reproduzierbarkeit der Quantifizierung antigenspezifischen T-Zell-Reaktionen, trotz guter laborübergreifenden Präzision, Analyse, insbesondere zu beurteilen Anspritzung, eine bedeutende Quelle der Variabilität4eingeführt. Darüber hinaus ist der Prozess der manuell Anspritzung Bevölkerung von Interessen, abgesehen davon, dass höchst subjektiv sehr zeitaufwendig und arbeitsintensiv. Das Problem der Analyse hochdimensionaler Datensätze in eine robuste, effiziente und rechtzeitige Weise ist jedoch nicht eine neue Forschung Wissenschaften. Genexpressionsstudien erzeugen oft sehr hochdimensionalen Daten-Sets (oft in der Größenordnung von Hunderten von Genen) wo manuelle Formen der Analyse einfach nicht machbar wäre. Um die Analyse dieser Daten-Sets zu begegnen, wurde viel Arbeit bei der Entwicklung von bioinformatische Werkzeuge gen Ausdruck Daten5analysieren. Diese algorithmische Ansätze wurden gerade vor kurzem in der Analyse der Zytometrie Daten angenommen wie die Anzahl der Parameter gestiegen ist und haben sich als von unschätzbarem Wert für die Analyse von diesen hohen dreidimensionale Datensätze6,7.

Trotz der Erzeugung und Anwendung einer Vielzahl von Algorithmen und Software-Pakete, mit denen Wissenschaftler dieser hochdimensionalen bioinformatische Ansätze auf ihre Flow Cytometry Daten anwenden, bleiben diese analytische Techniken noch weitgehend ungenutzt. Es gibt zwar eine Vielzahl von Faktoren, die die Verbreitung dieser Ansätze auf Zytometrie Daten8begrenzt haben, das große Hindernis, die wir in den Verdacht dieser Ansätze von Wissenschaftlern verwenden, ist ein Mangel an rechnerische wissen. In der Tat sind viele dieser Software-Pakete (z.B. FlowCore, FlowMeans und OpenCyto) geschrieben, um in Programmiersprachen wie z. B. R, die materiellen Programmierkenntnisse noch benötigen umgesetzt werden. Software-Pakete wie FlowJo haben Gnade unter Wissenschaftlern aufgrund der Einfachheit der Nutzung und "Plug-n-Play" Natur sowie Kompatibilität mit dem PC-Betriebssystem gefunden. Um die Vielfalt der anerkannte und wertvolle analytische Techniken der Wissenschaftler unbekannte Programmierung bieten, haben wir ExCYT, eine grafische Benutzeroberfläche (GUI) entwickelt, die leicht auf einem PC/Mac installiert werden kann, die viele der neuesten Techniken zieht einschließlich der Reduzierung der Dimensionalität für intuitive Visualisierung, eine Vielzahl von clustering Methoden in der Literatur, zusammen mit neuartigen Features zu erkunden die Ausgabe dieser zitiert clustering-Algorithmen mit Heatmaps und Roman hochdimensionalen Fluss/Box-Plots.

ExCYT ist eine grafische Benutzeroberfläche in MATLAB gebaut und daher können entweder direkt ausgeführt werden in MATLAB oder ein Installationsprogramm ist, vorausgesetzt, die verwendet werden können, um die Installation auf jedem PC/Mac. Die Software ist erhältlich bei https://github.com/sidhomj/ExCYT. Wir präsentieren Ihnen ein detailliertes Protokoll wie Sie Daten importieren, vorab zu bearbeiten, führen t-SNE Reduzierung der Dimensionalität, Cluster-Daten, Art & filtern Cluster basierend auf Benutzer-Einstellungen und Displayinformationen zu den Clustern von Interesse über Heatmaps und Roman hochdimensionalen Fluss/Box-Plots ()Abbildung 1(). Achsen in t-SNE Parzellen sind willkürlich und in beliebigen Einheiten und als solche nicht immer in den Figuren der Einfachheit des Benutzers dargestellt-Schnittstelle. Die Färbung der Datenpunkte in der "t-SNE Heatmaps" ist von blau auf Gelb basierend auf das Signal der angegebenen Markierung. Beim clustering-Lösungen, die Farbe des Datenpunkts willkürliche Blockzahl basiert. Alle Teile des Workflows können durchgeführt werden, im Bereich GUI ()Abbildung 2 & Tabelle 1). Zu guter Letzt demonstrieren wir Ihnen die Verwendung von ExCYT auf zuvor veröffentlichten Daten der immun Landschaft von Nierenzellkarzinomen in der Literatur auch mit ähnlichen Methoden analysiert. Die Beispiel-Dataset verwendeten wir die Zahlen in diesem Manuskript zusammen mit dem Protokoll unten erstellen finden Sie auf https://premium.cytobank.org/cytobank/projects/875, bei der Registrierung eines Accounts.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

(1) sammeln und aufbereiten Cytometry Daten

  1. Setzen Sie alle einzelnen Flecken in einem Ordner von selbst und Label von der Kanalname (indem Fluorophor, keine Markierung).

2. Daten Import & Pre-Processing

  1. Um anzuhalten oder während dieser Analyse Pipeline zu speichern, verwenden die Schaltfläche " Arbeitsbereich speichern " in der unteren linken Ecke des Programms, um den Arbeitsbereich zu speichern ein ". MAT "-Datei, die später über den Button Load Arbeitsbereich geladen werden kann. Mehr als eine Instanz des Programms nicht zu einem Zeitpunkt ausgeführt. Wenn Sie einen neuen Arbeitsbereich zu laden, stellen Sie daher sicher, zu überprüfen, gibt es keine andere Instanz der ExCYT ausgeführt.
  2. Um zu Beginn der Analyse Pipeline zuerst wählen Sie Cytometry (Flow Cytometry oder Masse Zytometrie – CYTOF), unter die Datei Selektionsparameter wählen Sie Anzahl der Ereignisse aus der Datei (für dieses Beispiel verwenden 2.000) zu probieren. Sobald die Daten erfolgreich importiert wurde, erscheint ein Dialogfeld den Benutzer darüber informiert, dass die Daten erfolgreich importiert wurde.
  3. Drücken Sie Auto-Kompensation , einen optionaler Auto-Kompensation Schritt durchzuführen wie Bagwell & Adams9erledigt. Wählen Sie das Verzeichnis mit einzelnen Flecken. Wählen Sie die ungefärbte Probe innerhalb der Benutzer-Schnittstelle-Dialog.
    1. Legen Sie ein Tor nach vorne/Seite-Streuung auf die Beispiele in diesem Verzeichnis, das verwendet wird, um Ereignisse zur Berechnung der Entschädigung Matrix auswählen. Es wird empfohlen, die ungefärbte Probe für diesen Zweck zu verwenden. An dieser Stelle wurde ein Algorithmus implementiert, um einheitliche Schwellenwerte bei99 Perzentil der ungefärbten Probe, positive Ereignisse in jedem der einzelnen Flecken zur Berechnung der Entschädigung-Matrix zu definieren . Wenn dies abgeschlossen ist, wird ein Dialogfeld den Benutzer informieren, dass der Ausgleich stattgefunden hat.
  4. Als nächstes drücken Sie Tor Bevölkerung und wählen Sie die Bevölkerungen der Zellen von Interesse, wie die Konvention im Flow Cytometry Analysen ist. Bei der Bevölkerung der Zellen ausgewählt ist, geben Sie die Anzahl der Prozentsatz der Ereignisse nachgelagerte Analyse (in diesem 10.000 Veranstaltungen).
  5. Wählen Sie als nächstes die Anzahl Kanäle für die Analyse in der Listbox in der rechten Seite des Feldes Vorverarbeitung verwendet werden (verwenden Sie die spezielle Kanäle im Beispiel gezeigt).

3. t-ans-Analyse

  1. Drücken Sie die T-ans -Taste, um das Programm Start beginnen, das reduzierte Dimensionalität Dataset für die Visualisierung im Fenster unterhalb des t-SNE zu berechnen. Bild von t-SNE, speichern TSNE Bild speicherndrücken. Auf einem Computer mit 8 CPU @ 3,4 GHz und 8 GM RAM dieser Schritt ca. 2 Minuten für 10.000 Veranstaltungen, 10 Minuten für 50.000 Veranstaltungen und 20 Minuten für 100.000 Veranstaltungen dauert.
  2. Erstelle ich eine t-SNE Heatmap ", wie in mehreren CYTOF Publikationen10,11, wählen Sie eine Option aus dem Einblendmenü" Marker-spezifischen t-SNE "gesehen (verwenden Sie die spezifische Marker CD64 oder CD3, wie im Beispiel gezeigt). Eine Figur wird pop-up zeigt eine Heatmap-Darstellung des t-SNE Plots, die Abbildung Generation gespeichert werden können.
  3. Wählen Sie Bereiche von Interesse in den t-SNE Parzellen durch den Benutzer für weitere nachgelagerte Analysen mit dem Tor t-ans -Button.

(4) die Cluster-Analyse

  1. Um clustering Analyse zu beginnen, wählen Sie eine Option im Listenfeld Clustering-Methode (in diesem Beispiel uns zitierten mit Abstand Faktor 5 im Dialog box rechts neben dem Listenfeld). Drücken Sie die Schaltfläche " Cluster ".
  2. Verwenden Sie eine der folgenden Optionen für automatisierte clustering-Algorithmen im Bereich 'Automatisierte Clustering Parameter' gefunden:
    1. Harte KMEANS (auf t-SNE): k-Means clustering auf die reduzierte 2-dimensionale t-ans-Daten anwenden und erfordert die Anzahl der Cluster die Algorithmus-12zur Verfügung gestellt werden.
    2. Harte KMEANS (auf HD Daten): Anwendung der k-Means clustering auf die ursprünglichen hochdimensionalen Daten, die der t-ans-Algorithmus gegeben wurde. Wieder einmal muss die Anzahl der Cluster für den Algorithmus zur Verfügung gestellt werden.
    3. Zitierten: Gelten die clustering-Methode des clustering, genannt Dichte basierenden Spatial Clustering von Anwendungen mit Lärm13 , die die reduzierte 2-dimensionale t-ans-Daten-Cluster und erfordert einen dimensionslose Faktor, der bestimmt, die allgemeine Größe der der Clustern. Diese Art der clustering-Algorithmus eignet sich gut Cluster die t-ans-Reduktion, wie es ist in der Lage, Cluster nicht kugelförmige Cluster, die oft in der reduzierten t-ans-Darstellung vorhanden sind. Zusätzlich, da es auf der 2-dimensionalen Daten arbeitet, ist es eines der schneller clustering-Algorithmen.
    4. Hierarchische Cluster: Die hochdimensionalen Daten wo die gesamte euklidische Entfernungsmatrix, zwischen allen Ereignissen berechnet wird vor Erbringung des Algorithmus ein Entfernungsfaktor, die die Größe des Clusters setzt zuweisen Sie die herkömmliche hierarchische Cluster Methode.
    5. Netzwerk-Diagramm Sitz: Gelten Sie eine clustering-Methode, die vor kurzem eingeführt worden ist, in Flow Cytometry Daten zu analysieren, wann gibt es seltene Subpopulationen, die der Benutzer möchte erkennen,11,14. Diese Methode beruht auf vorherige Erstellung eines Diagramms, das die Verbindungen zwischen allen Ereignissen in den Daten bestimmt. Dieser Schritt besteht darin, einen erste Parameter, um das Diagramm zu erstellen, das die Anzahl der k-nächsten Nachbarn ist. Dieser Parameter regelt in der Regel die Größe der Cluster. An dieser Stelle erscheint eine weitere Dialogbox den Benutzer auffordert, einsetzen eines 5 clustering-Algorithmen, die auf das Diagramm angewendet wird. Dazu gehören 3 Optionen, um die Modularität des Diagramms, die Danon-Methode und eine spektrale clustering Algorithmus14,15,16,17,18zu maximieren. Wenn man in der Regel schneller Clusteringlösung will, empfehlen wir Spectral Clustering oder die schnell gierig Modularität-Maximierung. Während die Modularität Maximierung Methoden zusammen mit den Danon-Methode die optimale Anzahl der Cluster bestimmen, erfordert Spectral Clustering die Anzahl der Cluster das Programm gewidmet werden.
    6. Selbstorganisierte Karte: Einsetzen eines neuronalen Netzes zu hochdimensionalen Daten cluster.
    7. GMM-Maximierung der Erwartung: "glockenförmig" Mischung Modell mit Erwartung Maximierung (EM) Technik zu hochdimensionalen Daten cluster erstellen. 19 diese Art der clustering-Methode erfordert auch den Benutzer zur Eingabe der Anzahl der Cluster.
    8. Variantenreiche Bayesian Inference für GMM: Erstellen Sie ein "glockenförmig" Mischung-Modell, aber im Gegensatz zu EM, es kann automatisch bestimmen Sie die Anzahl der Mischung Komponenten k.20 während des Programms erfordert eine Anzahl von Clustern gegeben werden (größer als die erwartete Anzahl von Clustern), der Algorithmus bestimmt die optimale Anzahl von alleine.
  3. Um einen bestimmten Bereich der t-SNE Handlung zu studieren, drücken Sie Cluster manuell wählen Sie eine Reihe von benutzerdefinierten Gruppen zu zeichnen. Der Hinweis Teilen nicht Clustern Mitglieder (d. h. , die jedes Ereignis nur 1 Cluster gehören kann).

(5) cluster-Filtration

  1. Komplettinstallation von Clustern können identifiziert entweder manuell oder über eine der oben beschriebenen automatischen Verfahren wie folgt über filtern.
    1. Um Cluster (im Bedienfeld " Cluster-Filter ") von keinem der Marker im Experiment gemessen zu sortieren, wählen Sie eine Option aus dem Einblendmenü " Art ". Um festzulegen, ob die Reihenfolge aufsteigend oder absteigend, drücken Sie Aufsteigend/absteigend Taste rechts neben dem Einblendmenü " Art ". Das aktualisieren die Liste von Clustern in der Listbox "Cluster (Filtration)" und neu ordnen sie in absteigender Reihenfolge der Median Cluster Ausdruck, der Marker. Der Prozentsatz in der Listbox "Cluster (Filtration)" gekennzeichnet bezeichnet die Prozent der Bevölkerung, die dieses Clusters darstellt.
    2. Um einen minimalen Grenzwert für einen bestimmten Cluster über einen bestimmten Kanal festzulegen, wählen Sie eine Option aus dem Einblendmenü " Schwelle " (in diesem Beispiel uns das Marker CD65 und setzen einen Schwellenwert bei 0,75). Entweder geben Sie einen Wert in das numerische Feld unterhalb des Diagramms oder verwenden Sie den Schieberegler, einen Schwellenwert festzulegen. Sobald Schwellenwert festgelegt ist, drücken Sie Über dem Schwellenwert hinzufügen oder Unter Schwellenwert Hinzufügen um die Richtung der Schwellenwert festzulegen. Sobald diese Schwelle festgelegt wurde, wird es im Feld "Schwellenwerte" neben die Filterplatte "Cluster" aufgeführt, wo die Markierung, den Schwellenwert und die Richtung aufgelistet, werden, so dass der Benutzer ist sich bewusst welche Schwellenwerte derzeit angewendet werden. Schließlich t-ans Grundstück wird aktualisieren, indem Sie verwischen, Cluster, die nicht den Anforderungen der Filtration und das Listenfeld "Cluster (Filtration)" wird aktualisiert, um Cluster zeigen, die den Filtration Anforderungen.
    3. Um eine Mindestgrenze für die Frequenz eines Clusters festzulegen, geben Sie einen numerischen Cut-off in der Cluster-Frequenz-Wert (%) Box im Bedienfeld "Cluster-Filter" (in diesem Beispiel Nutzung 1 %).

6. cluster-Analyse & Visualisierung

  1. Wählen Sie Cluster für die weitere Analyse und Visualisierung wählen Sie Cluster In Clustern (Filtration) Listbox aus und drücken Sie Wählen Sie À auf die Cluster analysieren Listbox verschieben.
  2. Heatmaps von Clustern zu erstellen, wählen Sie die Cluster von Interesse in der Listbox Cluster zu analysieren und drücken Sie die HeatMap von Cluster -Taste. Wenn diese Schaltfläche gedrückt wird, erscheint eine Figur mit einer Heatmap zusammen mit Dendrogramme auf der Cluster und Parameter. Das Dendrogramm auf der vertikalen Achse wird Gruppe Cluster von denen, die eng miteinander, während das Dendrogramm auf der horizontalen verbunden sind Achse werden gruppiert, Marker, die zusammen verbunden sind. Um Heatmap zu speichern, drücken Sie die Datei | Exportieren Sie Setup | Exportieren Sie.
  3. Um eine "Hohe dreidimensionale Box Plot" oder "Hohe dreidimensionale fließen Plot" erstellen, wählen Sie die Cluster von Interesse im Cluster analysieren Listenfeld und drücken Sie entweder die Hohe dreidimensionale Box Plot oder die Schaltfläche " Hoch dimensionalen fließen Plot ". Diese Grundstücke können verwendet werden, um visuell beurteilen die Verteilung der Kanäle von verschiedenen Clustern in allen Dimensionen gegeben.
  4. Um Cluster in traditionellen 2D Fluss Parzellen anzuzeigen, wählen Sie die Transformation (lineare, log10, Arcsinh) und Kanal in der Konventionellen Plot-Flow Panel und Presse herkömmlichen Flow Plot.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Um die Nutzbarkeit des ExCYT zu testen, haben wir analysiert einen kuratierten Datensatz von Chevrier Et Al. mit dem Titel "Ein immun Atlas der klare Renal Basalzellkarzinom" wo die Gruppe CyTOF mit einem umfangreichen immun-Panel Tumor Proben 73 Analyse veröffentlicht Patienten-11. Zwei getrennte Platten, einer myeloischen und lymphatischen Panel wurden verwendet, um der Tumor Mikroumgebung phänotypisch zu charakterisieren. Das Ziel unserer Studie war es, die Ergebnisse ihrer t-SNE rekapitulieren und Clusteranalyse, zeigen, dass ExCYT verwendet werden könnten, kommen zu den gleichen Schlussfolgerungen sowie zusätzliche Methoden der Visualisierung und Clusteranalyse zeigen.

Im Originalmanuskript beschrieb die Gruppe 22 T-Zell-Cluster durch die lymphatischen Panel identifiziert und 17 Zellcluster identifiziert durch die myeloische Panel. In Abbildung 3 und Abbildung 4 der Publikation zeigt die Gruppe Heatmaps von Clustern, t-SNE mit farbcodierten clustering-Lösungen und t-SNE Heatmaps im Unterfenster A, B und C. Grundstücke Um die Analyse durchzuführen, wir manuell nichtöffentlichen Daten aus Cytobank gewonnen und gesampelt 2.000 Veranstaltungen aus jeder Datei oder nahm die gesamte Datei wenn es weniger als 2.000 Veranstaltungen, hatte nach der Analyse Pipeline im Originalmanuskript illustriert. An dieser Stelle Stichprobe insgesamt 100.000 Veranstaltungen über unsere Post-gating subsampling Parameter, t-ans-Analyse durchgeführt und eine Vielzahl von clustering Methoden verwendet, um die Daten auf verschiedene Weise erkunden.

Zunächst untersuchten wir die myeloische Panel durch Anschluss an die gleiche Analyse Rohrleitung wie das ursprüngliche Manuskript durch Abschluss der t-ans-Analyse und die Schaffung von Heatmaps der verschiedenen Marker (Abb. 3A). Während die Originalhandschrift der t-SNE Heatmaps,die 99 Perzentil der einzelnen Marker normalisiert, wird ExCYT nicht diese Art von Normalisierung für seine Heatmaps. Jedoch wurden ähnliche Verteilungen der Marker Co Ausdruck beobachtet, wie im ursprünglichen Manuskript beschrieben. Wir beantragte daraufhin eine Netzwerk-Graph-basierte Methode des clustering der das durch die Schaffung der Graph mit 100 k-nächsten Nachbarn und clustering der Grafik über die Optimierung der Modularität des Diagramms mithilfe der Fast gierig Umsetzung in ExCYT, wo wir 19 fanden Sub-Populationen von Zellen (Abb. 3 b). Beim Vergleich der Heatmap dieser Cluster von ExCYT mit der Heatmap erstellt im Originalmanuskript veröffentlicht, haben wir festgestellt, dass wir ähnliche Cluster myeloische Zellen (Abbildung 3) identifizieren konnten. Der Hinweis, die Originalhandschrift identifiziert und kontrastiert zwei Sub-Populationen der myeloischen Zellen, die wir in unserer Analyse von HLA-DRIntCD68IntCD64IntCD36 definiert identifiziert+CD11b+ (Cluster 13) und HLA-DR+ CD4+CD68+CD64+CD36 CD11b (Cluster-18). Visualisierung von hochdimensionalen Boxplot dieser zwei Populationen ergab statistisch signifikante Unterschiede (Mann-Whitney) in die sechs Markierungen erwähnt (Abbildung 1).

Als nächstes haben wir die lymphatischen Panel mit einem eher konventionellen und schneller hierarchische Cluster Ansatz analysiert. Dieser Ansatz brachte ähnliche Marker-Distributionen über t-SNE Heatmaps (Abb. 4A). Darüber hinaus demonstriert clustering der Daten über hierarchische clustering (Abbildung 4 b), ähnliche Cluster von lymphatischen Zellen (Abbildung 4). Der Hinweis, wir auch einzigartige regulatorische T-Zellenbevölkerung aus dem Originalmanuskript definiert als CD4 identifiziert+CD25+Foxp3+CTLA-4+CD127 (Cluster 17) über unser Grundstück hochdimensionalen Strömung (Abbildung 4).

Schließlich wollten wir eine Methode innerhalb ExCYT, schnell und quantitativ beurteilen Co Assoziationen zwischen Markern beschäftigen. Wir begannen mit einem harten k-Means clustering-Algorithmus 5.000 Cluster auf den zweidimensionalen t-ans-Daten (Abbildung 4E) festzulegen. Anschließend wurde den mittlere Ausdruck aller Marker dieser Cluster erstellen Sie eine Heatmap aus dieser Cluster (Abb. 4F) verwendet. Da diese Heatmaps cluster-Reihen als auch Spalten, die ähnlich sind, diese Methode der Abstraktion der Daten durch die Anwendung eines feinen Netzes von Clustern und erstellen dann eine Heatmap ermöglicht uns Co Verbände leicht, z. B. Co Association von Tim-3, PD-1, CD38, abholen und 4-1BB.

Figure 1
Abbildung 1: ExCYT Pipeline & Features. (A) ExCYT beginnt mit der FCS-Rohdaten importieren, Anwendung optional Entschädigung, gating und zufällige Unterabtastung vor der nachfolgenden Analyse. Dadurch wird sichergestellt, dass alle Ereignisse analysiert das Experiment analysierten relevant sind. t-SNE Dimensionalität Reduktion wird dann durchgeführt, um alle Ereignisse zu visualisieren und t-SNE Heatmaps zur phänotypische Distributionen Visualisierung erzeugt werden kann. Schließlich kann eine Vielzahl von clustering-Algorithmen auf t-SNE Transformation oder hochdimensionale Rohdaten angewendet werden. (B) sortieren und Schwellwerte Neuerungen erlauben Benutzern, schnell sortieren möglicherweise Hunderte von Clustern für diejenigen von Interesse zu finden. (C) Heatmaps von Clustern können erstellt werden, um zu untersuchen, wie mehrere Cluster vergleichen miteinander sowie die Marker Co zuordnen. (D) neuartige hochdimensionalen Fluss/Box-Plots können als eine Form der Rückseite Anspritzung auf Originaldaten Cluster, während schätzen die hochdimensionalen Natur der Daten generiert werden. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 2
Abbildung 2: ExCYT Graphical User Interface: Die ExCYT, die grafische Benutzeroberfläche ermöglicht eine Stromlinie Arbeit fließen Arbeiten von links nach rechts des Fensters wie die Benutzer ihre Daten importiert führt t-SNE Reduzierung der Dimensionalität, clustering, und letzte Cluster-Analyse und Visualisierung. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 3
Abbildung 3: Zusammenfassung der myeloischen Sub-Populationen von Chevrier Et al. (A) Token t-SNE Heatmaps myeloische Panel (B) t-ans Grundstück myeloische Panel Farbe codiert durch Netzwerk-Graph clustering-Algorithmus (C) Heatmap von Clustern durch clustering Lösung auf myeloische Panel identifiziert (D) vergleichende hoch dreidimensionale Box-Plot Vergleich kontrastierenden myeloische Teilgruppen (Cluster 13 & 18) in original-Manuskript verwiesen Klicken Sie bitte hier, um eine größere Version dieser Figur.

Figure 4
Abbildung 4: Zusammenfassung der lymphoiden Subpopulationen von Chevrier Et al. (A) Token t-SNE Heatmaps von lymphatischen Panel (B) t-ans Grundstück von lymphatischen Panel Farbe codiert durch hierarchische clustering-Algorithmus (C) Heatmap von Clustern durch clustering Lösung auf lymphatischen Panel (D) hohe dreidimensionale Strömung identifiziert Grundstück von identifizierten regulatorische T-Zellenbevölkerung (Cluster-17) in original-Manuskript (E) -Clustering-Lösung von 5.000 Cluster schwer k-Mittel t-SNE Auswertungen (F) Heatmap von Clustern von k-Means clustering-Lösung auf lymphatischen identifiziert Panel zeigt Marker Co Verbände. Bitte klicken Sie hier für eine größere Version dieser Figur.

Nein. Beschreibung Name (GUI)
1 Wählen Sie Art der Zytometrie NA
2 Zufällige subsampling von raw-Daten NA
3 Wählen Sie Dateien zur Analyse Wählen Sie die Datei(en)
4 Auto-Kompensation von raw-Daten basierend auf einzelne Flecken zur Verfügung gestellten Software-Verzeichnis Auto-Kompensation
5 Anspritzung um Veranstaltungen für t-SNE und clustering Analyse auszuwählen Tor-Bevölkerung
6 Zufällige Unterabtastung der gated Daten (absolute Zahl) NA
7 Zufällige Unterabtastung der gated Daten (Prozent der gated Bevölkerung) NA
8 Wählen Sie Kanäle für die Analyse NA
9 Ausführung t-SNE Reduzierung der Dimensionalität t-ans
10 t-ans Fenster NA
11 Arbeitsbereich speichern Arbeitsbereich speichern
12 Arbeitsbereich zu laden Arbeitsbereich zu laden
13 T-SNE Heatmap auf ausgewählte Marker erstellen NA
14 T-ans Tor zu re-do t-SNE Analyse der ausgewählten Bevölkerung T-ans Tor
15 T-ans Fenster als Bild speichern TSNE Bild speichern
16 Wählen Sie Clustering-Algorithmus Clustering-Methode
17 Clustering Parameter eingeben, für bestimmte Algorithmus NA
18 Cluster-Analyse Cluster
19 Cluster manuell zeichnen Wählen Sie Cluster manuell
20 Klar alle Cluster Cluster-Analyse wiederholen Klar-Cluster
21 Zeigen Sie Cluster unter aktuellen Filterbedingungen Cluster (Filtration)
22 Wählen Sie Cluster aus Cluster analysieren Listbox entfernen Entfernen Sie <--
23 Analysieren Sie Cluster Listbox Cluster hinzufügen Wählen Sie-->
24 Konventionelle Heatmap aller Ereignisse in Analyse erstellen HeatMap von Ereignissen
25 Art-Cluster von wählen Sie marker Art
26 Schwelle von ausgewählten marker Schwelle
27 Erstellen Sie konventionelle Heatmap von ausgewählten Clustern aus Cluster analysieren listbox HeatMap von Clustern
28 Reihenfolge der Sortierung umkehren Aufsteigender/absteigender
29 Deaktivieren Sie alle Schwellen Deaktivieren Sie alle Schwellen
30 Eingestellte Frequenz Schwelle für Cluster Cluster-Frequenz-Wert (%)
31 Liste der aktuellen Schwellen auf "Cluster (Filtration)" Listbox aktiv Schwellenwerte
32 Hohe dreidimensionale Box-Plot Hohe dreidimensionale Box-Plot
33 Dimensionale High-Flow-Grundstück Dimensionale High-Flow-Grundstück
34 Horizontale Achse Parameter für konventionellen Strom plot NA
35 Vertikale Achse Parameter für konventionellen Strom plot NA
36 Datentransformation für konventionellen Strom Plot auf horizontalen Achse NA
37 Datentransformation für konventionellen Strom Plot auf vertikalen Achse NA
38 Konventionellen Strom Plot erstellen Konventionelle Flow Grundstück
39 Cluster für die Analyse zeigen NA

Tabelle 1: Übersicht über alle Funktionen im ExCYT GUI

Name des Softwarepakets / ExCYT CYT FCS-Express flowCore openCyto FlowMeans
Programmtyp MATLAB MATLAB Stand-alone-Anwendung R R R
Preis für Benutzer Kostenlos Kostenlos $1.000 Kostenlos Kostenlos Kostenlos
Grafische Benutzeroberfläche Ja Ja Ja Nein Nein Nein
Dimensionalität Reduktionstechniken t-ans t-SNE, PCA t-SNE, PCA, Spaten keine keine keine
Clustering-Algorithmen K-Means
ZITIERTEN
Hierarchische Cluster
Selbstorganisierte Karte
Mehrere Netzwerk-Graph-basierten Methoden
GMM - EM
GMM - variantenreiche Bayesian Inference
K-Means
GMM - EM
Einzelne Netzwerk-Graph basierte Methode (Phenograph)
K-Means keine Automatisierung von manuellen gating workflow K-Means
Fähigkeit, Art/Filter-Cluster Ja Nein Nein Nein Nein Nein
Dimensionale High-Flow-Grundstücke Ja Nein Nein Nein Nein Nein

Tabelle 2: Übersicht über Software-gestützte Flow Cytometry Analysis Solutions

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Hier präsentieren wir Ihnen ExCYT, eine neue grafische Benutzeroberfläche laufen MATLAB-basierten Algorithmen zur Analyse hochdimensionaler Zytometrie Daten, Optimierung ermöglicht Personen ohne Hintergrund in der Programmierung, die neuesten in hochdimensionalen Daten zu implementieren Analysealgorithmen. Die Verfügbarkeit dieser Software der breiteren Fachöffentlichkeit können Wissenschaftler ihre Flow Cytometry Daten in einem intuitiven und einfachen Workflow durchsuchen. Durch Durchführung von t-SNE Reduzierung der Dimensionalität, ein clustering Verfahren Anwendung, in der Lage werden, Art/Filter durch diese Cluster schnell, und flexible, anpassbare Heatmaps und hochdimensionalen Fluss/Box-Plots, Wissenschaftler in der Lage, nicht nur verstehen der eindeutig definierten Subpopulationen in ihre Proben aber werden in der Lage Visualisierungen erstellen, die intuitiv und leicht verständlich durch ihre Kollegen sind.

Während das Programm flexibel im Umgang mit einer Vielzahl von Datentypen (konventionelle Zytometrie Vs mass Durchflusszytometrie) ist, gibt es ein paar Überlegungen zur optimalen Nutzen des Programms. Die erste davon ist die Datenqualität, speziell der Flow Cytometry Daten in Bezug auf. Angemessene Entschädigung und Auflösung von überlappenden Emissionsspektren ist von größter Bedeutung. Schlecht bezahlte Daten können versehentlich zu falschen Co Verbände von Markern und Bildung von Clustern, die nicht der wahre biologische Bedeutung führen. Daher ist es sehr ratsam, dass die eingegebenen Daten an Klangqualität bevor Sie mit der t-SNE und weitere nachgelagerte Analyse ist. Darüber hinaus erfordert die Verwendung von automatische Kompensation Algorithmus implementiert in ExCYT klare einzelne Flecken für alle Kanäle um die Entschädigung Parameter genau zu berechnen.

Ein weiterer wichtiger Aspekt für den Einsatz von ExCYT ist, wenn mehrere FCS-Dateien in einer Analyse zu verketten, (wie in diesem Manuskript gezeigt), müssen sie über alle Kanäle hinweg vergleichbar sein. Zunächst bedeutet dies, dass das gleiche Panel muss in allen Proben und , dass es keine Drift zwischen Proben über alle Kanäle hinweg verwendet werden. Beispielsweise könnte wenn man wurden zwei Proben an verschiedenen Tagen zu lesen und gefärbten CD8 in FITC am Tage aber die Spannung der Cytometer wurde anders an einem Tag, was zu einer leicht verschobenen CD8-Bevölkerung, einer falschen Cluster in der nachfolgenden Analyse generieren , da diese Verschiebung als eine Funktion der Instrument-Variation und nicht durch biologische Bedeutung generiert wurde. Während zukünftige Versionen von ExCYT in der Lage, Proben, deren einzelnen Flecken zu normalisieren, zu diesem Zeitpunkt reiflicher Überlegung erfolgen, dass FCS-Dateien miteinander verglichen werden können, bevor Sie sie in ExCYT importieren.

Schließlich ist der Prozess des clustering nicht die Absolute/steif ist. Verschiedene clustering-Algorithmen und Parameter können verschiedene clustering-Lösungen generieren. Ob die Lösung des Algorithmus eignet ist für den Benutzer durch ihr Verständnis für die Biologie mit der Clusterlösung Synthese zu bestimmen. Beispielsweise wenn die immun-Umgebung von Tumoren zu verstehen, man kann interessiert makroskopischen Cluster (d. h. T Zellen Vs B Zellen Vs myeloische Zellen) während andere in Subpopulationen von makroskopischen Clustern interessiert sein könnten. Die Auflösung der Cluster wird bestimmt durch den Benutzer und daher kein clustering Lösung ist "richtig." Dies ist einer der wichtigsten Vorteile der Verwendung von high-dimensional Flow Grundstücke in ExCYT zur Verfügung. Die Fähigkeit zu visualisieren, die Verteilung eines bestimmten Clusters auf allen Kanälen kann den Benutzer bestimmen, ob sie in nicht nur eine biologisch relevante zusammengefasst haben, Weise aber in einer Weise, die für die wissenschaftliche Frage im Experiment ist helfen. Während unser Ziel ist es, bieten eine Fülle von Methoden in der Literatur zu hochdimensionalen Flow Cytometry Clusterdaten gleichzeitig zusätzliche Methoden der Clusterbildung, empfehlen wir, mit Methoden wie k-Means und zitierten die Daten über schnell durchsuchen für Cluster-Nummer, Größe und hin zu Netzwerk-Grafik und Gauß gemischt Modellansätze für robuster aber zeitaufwendiger Ansätze durchlaufen.

Angesichts dieser ExCYT ist immer noch eine hochflexible und wertvollen Werkzeug für die Erkundung hoch dimensionalen Zytometrie Daten und bietet einzigartige/Differenzierung Funktionen als andere verfügbare Pakete zur Verfügung, um diese Art von Analyse (Tabelle 2) . ExCYT unterscheidet sich zunächst über die meisten Flow Cytometry Analyse Ansätze nutzen Reduzierung der Dimensionalität und clustering-Algorithmen durch seine Fähigkeit, ohne scripting/Programmierung Kenntnisse genutzt werden. Darüber hinaus durch Aggregation viele clustering-Algorithmen in der Literatur zitiert, glauben wir, dass wir die meisten Optionen für clustering Daten zur Verfügung stellen. Zu guter Letzt unser einzigartige Merkmal des Cluster-Filterung und Sortierung zusammen mit Anzeige über neuartige dreidimensionale high-Flow-Grundstücke, ermöglicht es Benutzern, die Merkmale ihrer Cluster schnell und effizient zu erkunden macht den Prozess der "Entdeckung" seltene Subpopulationen einfach und effizient.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren haben nichts preisgeben.

Acknowledgments

Die Autoren haben keine Bestätigungen.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Ausgabe 143 Flow Cytometry High-Dimensionsanalyse Retraktion t-SNE clustering Karten Reduzierung der Dimensionalität zu heizen
ExCYT: Eine grafische Benutzeroberfläche für die Straffung der Analyse hochdimensionaler Cytometry Daten
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter