Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: Een grafische gebruikersinterface voor het stroomlijnen van de analyse van High-dimensionale Cytometry gegevens

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT is een MATLAB gebaseerde grafische User Interface (GUI) waarmee gebruikers hun stroom cytometry om gegevens te analyseren via algemeen gebruikte analytische technieken voor high-dimensional data waaronder dimensionaliteit vermindering via t-GND, een aantal handmatige en geautomatiseerde Clustering van de methoden, heatmaps en roman high-dimensionale stroom percelen.

Abstract

Met de komst van flow cytometers kan meten van een toenemend aantal parameters, blijven wetenschappers ontwikkelen grotere panelen om te verkennen fenotypische kenmerken van hun cellulaire monsters. Echter, deze technologische vooruitgang opleveren hoog-dimensionale datasets die steeds moeilijker te analyseren objectief binnen traditionele handleiding gebaseerde gating programma's zijn geworden. Om beter analyseren en presenteren van gegevens, werken wetenschappers samen met bioinformaticians met expertise in het analyseren van hoge-dimensionale gegevens hun stroom cytometry gegevens parseren. Terwijl deze methoden is aangetoond dat het zeer waardevol zijn bij het bestuderen van stroom cytometry, moeten ze nog worden opgenomen in een eenvoudig en makkelijk te gebruiken pakket voor wetenschappers die computationele of programmeertaal deskundigheid ontbreken. Om aan deze behoefte, hebben we ExCYT, een MATLAB-based Graphical User Interface (GUI) die de analyse van hoge-dimensionale stroom cytometry gegevens stroomlijnt door de uitvoering van gewoonlijk werknemer analytische technieken voor het opnemen van high-dimensional data de vermindering van dimensionaliteit door t-GND, een aantal handmatige en geautomatiseerde clustering methoden, heatmaps en roman high-dimensionale stroom percelen. Daarnaast biedt ExCYT traditionele gating opties selecteren populaties van belang voor verdere t-GND en clustering analyse evenals het vermogen om poorten direct aan t-GND percelen. De software verstrekt het extra voordeel van het werken met ofwel gecompenseerd of de niet-gecompenseerde FCS-bestanden. In het geval dat na overname compensatie vereist is, kan de gebruiker kiezen om het programma een directory van enkele vlekken en een onbevlekt monster. Het programma detecteert positieve gebeurtenissen in alle kanalen en gebruikt deze gegevens selecteren om te meer objectief berekenen de compensatie-matrix. Kortom biedt ExCYT een uitgebreide analyse pijpleiding om stroom cytometry gegevens in de vorm van FCS-bestanden en elk individu, ongeacht de computationele opleiding, gebruik van de nieuwste algoritmische benaderingen in het begrip van hun gegevens toestaan.

Introduction

Voorschotten in stroom cytometry evenals de komst van massale cytometry heeft toegestaan clinici en wetenschappers te snel identificeren en fenotypische karakteriseren biologisch en klinisch interessant monsters met nieuwe niveaus van resolutie, maken grote high-dimensional data sets die informatie rijke1,2,3. Terwijl conventionele methoden voor het analyseren van stroom cytometry gegevens zoals handmatige gating eenvoudiger voor experimenten waarbij er paar markeringen en de markeringen hebben visueel waarneembaar populaties zijn, kan deze aanpak mislukken om te genereren reproduceerbare resultaten bij het analyseren van de hoger-dimensionale datasets of degenen met markeringen, vlekken op een spectrum. Bijvoorbeeld, in een multi-institutionele studie, waren waar intra-cellulaire kleuring (ICS) testen wordt uitgevoerd om na te gaan van de reproduceerbaarheid van antigeen-specifieke T cel reacties, ondanks goede interlaboratorium precisie, analyse, met name quantitating gating, introduceerde een belangrijke bron van variabiliteit4. Bovendien, het proces van gating handmatig bevolking van belangen, naast zeer subjectief is zeer tijdrovend en arbeid-intensieve. Echter behoort het probleem van het hoge-dimensionale datasets analyseren in een robuuste, efficiënte en tijdige wijze niet nieuw voor de wetenschappen van het onderzoek. Gen expressie studies genereren vaak extreem hoge-dimensionale datasets (vaak over de volgorde van honderden genen) waar handmatige vormen van analyse zou gewoon onhaalbaar. Om aan te pakken van de analyse van deze data sets, is er veel werk in het ontwikkelen van bioinformatic hulpmiddelen te parsen van gen expressie gegevens5. Deze algoritmische benaderingen hebben zojuist onlangs aangenomen in de analyse van cytometry gegevens zoals het aantal parameters is toegenomen en hebben bewezen te zijn van onschatbare waarde zijn in de analyse van deze hoge dimensionale datasets6,7.

Ondanks de generatie en de toepassing van een verscheidenheid van algoritmen en softwarepakketten waarmee wetenschappers deze hoge-dimensionale bioinformatic benaderingen toepassen op hun stroom cytometry gegevens, blijven deze analytische technieken nog steeds grotendeels ongebruikt. Hoewel er wellicht een verscheidenheid van factoren die de wijdverspreide goedkeuring van deze benaderingen van cytometry gegevens8hebben beperkt, de grote belemmering we vermoeden in gebruik van deze benaderingen van wetenschappers, is een gebrek aan computationele kennis. In feite, zijn veel van deze softwarepakketten (dat wil zeggen, flowCore, flowMeans en OpenCyto) geschreven in programmeertalen zoals R, waarvoor nog steeds inhoudelijke kennis van programmeren moeten worden uitgevoerd. Softwarepakketten zoals FlowJo hebben gevonden tussen wetenschappers te wijten aan de eenvoud van gebruik en 'plug-n-play' aard, alsmede de compatibiliteit met het besturingssysteem van de PC gunst. Om de verscheidenheid van geaccepteerde en waardevolle analytische technieken om de wetenschapper onbekend programmering, hebben we ExCYT, een grafische-gebruikersinterface (GUI) die gemakkelijk kan worden geïnstalleerd op een PC/Mac, die veel van de nieuwste technieken trekt inclusief dimensionaliteit reductie voor intuïtieve visualisatie, een verscheidenheid van clustering methoden genoemd in de literatuur, samen met nieuwe functies te verkennen van de uitvoer van deze clustering algoritmen met heatmaps en roman high-dimensionale stroom/vak percelen.

ExCYT is een grafische gebruikersinterface gebouwd in MATLAB en daarom kan ofwel worden uitgevoerd binnen MATLAB direct of een installateur is op voorwaarde dat kan worden gebruikt voor het installeren van de software op elke PC/Mac. De software is beschikbaar op https://github.com/sidhomj/ExCYT. Presenteren we een gedetailleerd protocol voor het importeren van gegevens, vooraf verwerken, voeren t-GND dimensionaliteit vermindering, clusterconfiguratiegegevens, sorteren & filteren op basis van gebruikersvoorkeuren, en weergave-informatie over de clusters van belang via heatmaps en roman clusters hoge-dimensionale stroom/vak percelen ()Figuur 1). Assen op de t-GND percelen zijn willekeurig en in willekeurige eenheden en als zodanig, zoals in de cijfers voor de eenvoud van de gebruiker niet altijd interface. De kleuring van gegevenspunten in de "t-GND Heatmaps" is van blauw naar geel op basis van het signaal van de aangegeven markering. Cluster oplossingen, is de kleur van het gegevenspunt willekeurige gebaseerd op clusteraantal. Alle onderdelen van de werkstroom kunnen worden uitgevoerd in het één deelvenster GUI ()Figuur 2 & tabel 1). Tot slot zullen we laten zien dat het gebruik van ExCYT op eerder gepubliceerde gegevens verkennen de immuun landschap van niercelcarcinoom in de literatuur, ook met soortgelijke methoden geanalyseerd. De monster-dataset die we gebruikt voor het maken van de cijfers in dit manuscript samen met het protocol hieronder vindt u op https://premium.cytobank.org/cytobank/projects/875, bij het registreren van een account.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. verzamelen en Cytometry gegevens voorbereiden

  1. Alle enkele vlekken in een map plaatsen door zichzelf en etiket door de naam van het kanaal (door fluorophore, niet de markering).

2. gegevens invoer & voorbehandeling

  1. Als u wilt onderbreken of op te slaan gedurende deze analyse-pijpleiding, gebruiken de Werkruimte opslaan -knop in de linkerbenedenhoek van het programma op te slaan van de werkruimte als een '. MAT' bestand dat later kan worden geladen via de knop Load werkruimte . Voer niet meer dan één exemplaar van het programma op een moment. Dus, bij het laden van een nieuwe werkruimte, zorg ervoor om er is geen andere exemplaar van ExCYT uitgevoerd.
  2. Om te beginnen analyse pijpleiding, selecteert u eerst type cytometry (Stroom Cytometry of massa Cytometry – CYTOF), onder de Selectie bestandsparameters select aantal gebeurtenissen om te proeven van het bestand (voor dit voorbeeldgebruik 2.000). Zodra de gegevens heeft ingevoerd, zal een dialoogvenster opduiken informeren van de gebruiker dat de gegevens geïmporteerd is geweest.
  3. Druk op de knop Auto-compensatie uit te voeren van een optioneel auto-compensatie stap, zoals gedaan door t-Bag & Adams9. Selecteer de map met enkele vlekken. Selecteer het Onbevlekt monster binnen de dialoog van de user interface.
    1. Plaats een voorwaarts/kant-scatter-gate op de monsters in deze directory die worden gebruikt voor het selecteren van gebeurtenissen voor de berekening van de compensatie-matrix. Het is aanbevolen om het gebruik van het Onbevlekt voorbeeld voor dit doel. Op dit punt is een algoritme geïmplementeerd te stellen consequente drempels ophet 99 percentiel van het Onbevlekt monster te bepalen positieve gebeurtenissen in elk van de enkele vlekken voor de berekening van de compensatie-matrix . Wanneer dit is voltooid, wordt een dialoogvenster gemeld dat de compensatie is verricht.
  4. Vervolgens druk op Gate bevolking en selecteer de populaties van cellen van belang, aangezien het Verdrag in stroom cytometry analyses. Wanneer de bevolking van cellen is ingeschakeld, nummer invoeren van percentage van de stroomafwaartse analyse van de gebeurtenissen (in deze 10.000 gebeurtenissen).
  5. Selecteer vervolgens het aantal kanalen moet worden gebruikt voor de analyse van de listbox in de rechterkant van het vak voorbewerkend (gebruik de specifieke kanalen weergegeven in het voorbeeld).

3. t-GND analyse

  1. Druk op de knop T-GND het programma start beginnen te hebben voor het berekenen van de verminderde dimensionaliteit gegevensset voor visualisatie in het venster onder de knop t-GND. Druk op TSNE-afbeelding opslaanals afbeelding wilt opslaan van t-GND. Op een machine met 8 CPU @ elke 3,4 GHz en 8 GM RAM dit stap ongeveer 2 minuten voor 10.000 evenementen, 10 minuten voor 50.000 evenementen, en 20 minuten voor 100.000 evenementen duurt.
  2. Maken van een heatmap 't-GND ', zoals te zien in verschillende CYTOF publicaties10,11, selecteert u een optie uit het venstermenu ' Marker-specifieke t-GND (de specifieke markers CD64 of CD3 gebruiken, zoals in het voorbeeld). Een figuur zal pop-up tonen een heatmap-vertegenwoordiging van de t-GND plot dat kan worden opgeslagen voor figuur generatie.
  3. Selecteer gebieden van belang in de t-GND percelen door de gebruiker voor verder stroomafwaarts analyses met behulp van de Gate t-GND -knop.

4. de clusteranalyse

  1. Om te beginnen met clustering analyse, selecteert u een optie in Clustering methode listbox (in dit voorbeeld ons DBSCAN met een factor van de afstand van 5 in de dialoog box rechts van de listbox). Druk op de knop van het Cluster .
  2. Gebruik een van de volgende opties voor geautomatiseerde clustering algoritmen te vinden in het paneel 'Geautomatiseerde Clustering Parameters':
    1. Harde KMEANS (op t-GND): k-means clustering tot de verminderde 2-dimensionale t-GND gegevens van toepassing en vereist het aantal clusters aan de algoritme12te verstrekken.
    2. Harde KMEANS (op HD Data): k-means clustering met de oorspronkelijke hoge-dimensionale gegevens die werd gegeven aan de t-GND algoritme van toepassing. Nogmaals, moet het aantal clusters worden verstrekt aan het algoritme.
    3. DBSCAN: Methode toepassen de clustering van clustering, genaamd dichtheid gebaseerde ruimtelijke Clustering van toepassingen met lawaai-13 dat clusters van de verminderde 2-dimensionale t-GND gegevens en vereist een niet-dimensionale afstand factor die de globale grootte van bepaalt de clusters. Dit type clustering algoritme is goed geschikt voor cluster de vermindering van de t-GND zoals is het kundig cluster niet-sferoïdale cluster die vaak in de verminderde t-GND vertegenwoordiging aanwezig zijn. Bovendien, wijten aan het feit dat zij op de 2-dimensionale gegevens opereert, is het een van de sneller clustering algoritmen.
    4. Hiërarchische Clustering: De conventionele hiërarchische cluster methode toepassen op de hoge-dimensionale gegevens waar de hele Euclidische afstand matrix is berekend tussen alle gebeurtenissen voor het verstrekken van het algoritme een afstand factor die de grootte van de cluster stelt.
    5. Netwerk grafiek- Gebaseerd: Een clustering methode die onlangs is ingevoerd in het analyseren van stroom cytometry gegevens wanneer er zeldzame subpopulaties die de gebruiker wil detecteren11,14toepassen. Deze methode is gebaseerd op het eerste het maken van een grafiek die de verbindingen tussen alle gebeurtenissen in de gegevens bepaalt. Deze stap bestaat uit het verstrekken van een eerste parameter om de grafiek, die het aantal k-dichtstbijzijnde buren is maken. Deze parameter regelt in het algemeen de grootte van de clusters. Op dit moment ijslollie een ander dialoogvenster opwaarts asking van de gebruiker te wenden tot 5 clusters van algoritmen die is toegepast op de grafiek. Het gaat hierbij om 3 opties om te maximaliseren de modulariteit van de grafiek, de methode Danon, en een spectrale clustering algoritme14,15,16,17,18. Als men wil een over het algemeen sneller clustering oplossing, raden we spectrale Clustering of het snel hebzuchtig maximalisatie van de modulariteit. Terwijl de modulariteit maximalisatie methoden samen met de methode Danon het optimale aantal clusters bepalen, vereist spectrale Clustering het aantal clusters worden gegeven aan het programma.
    6. Zelf georganiseerd kaart: Dienst een kunstmatig neuraal netwerk clusteren van de high-dimensional data.
    7. GMM-verwachting maximalisatie: maken van een Gaussiaanse mengsel Model met behulp van verwachting maximalisatie (EM) techniek clusteren van de high-dimensional data. 19 dit type clustering methode is ook vereist de gebruiker om het aantal clusters.
    8. Variationele Bayesian gevolgtrekking voor GMM: maken van een Gaussiaanse mengsel Model maar in tegenstelling tot EM, het kan automatisch bepalen het aantal de mengsel onderdelen k.20 terwijl het programma vereist een aantal clusters worden gegeven (groter dan de verwacht aantal clusters), het algoritme bepaalt het optimale nummer op zijn eigen.
  3. Om te bestuderen van een bepaald gebied van de t-GND plot, druk Cluster handmatig selecteren om op te tekenen van een set van gebruiker gedefinieerde clusters. Van de nota delen clusters niet leden (dat wil zeggen, elke gebeurtenis alleen deel van cluster 1 uitmaken kan).

5. cluster filtratie

  1. Combinatie van clusters dergelijke geïdentificeerd ofwel handmatig of via een van de hierboven beschreven automatische methoden kunnen filteren als volgt.
    1. Clusters (in het filterdeelvenster Cluster ) om op te sorteren een van de markers in de experiment gemeten, door een optie te selecteren in het pop-upmenu sorteren . Als u wilt instellen of de volgorde oplopend of aflopend, drukt u op de knop Oplopend/Aflopend naar rechts van het pop-upmenu sorteren . Dit zal de lijst bijwerken van Clusters in de listbox 'Clusters (filtratie)' en hen opnieuw te sorteren in aflopende volgorde van mediaan cluster expressie van die markering. Het percentage aangeduid in de listbox 'Clusters (filtratie)' duidt het percentage van de bevolking dat deze cluster vertegenwoordigt.
    2. Als u wilt instellen een minimale drempelwaarde voor een bepaald cluster in een bepaalde zender, selecteert u een optie uit het venstermenu ' drempel (in dit voorbeeld ons de markering CD65 en stelt een drempel op 0,75). Typ een waarde in het numerieke vak onder de grafiek of de dia-balk gebruiken om een drempel instellen. Zodra de drempel is ingesteld, druk Boven drempel toevoegen of Onder drempel toevoegen om op te geven van de richting van de drempel. Zodra deze drempel is vastgesteld, zal het worden vermeld in het vak van de drempels naast het ' Cluster filterdeelvenster ' waar de markeringen, de drempelwaarde en de richting wordt weergegeven zodat de gebruiker zich bewust is van welke drempels zijn momenteel wordt toegepast. Ten slotte, de t-GND plot wordt bijgewerkt door vervaging uit clusters die niet voldoen aan de eisen van de filtratie en listbox 'Clusters (filtratie)' wordt bijgewerkt om aan te tonen van clusters die voldoen aan de eisen van de filtratie.
    3. Wilt instellen een minimumdrempel voor de frequentie van een cluster, geeft een numerieke licht-donkerscheiding op de Cluster frequentie drempel (%) vak in het filterdeelvenster van Cluster (in dit voorbeeld gebruik 1%).

6. cluster-analyse & visualisatie

  1. Als clusters voor verdere analyse en visualisatie, selecteert u clusters In Clusters (filtratie) listbox en druk op de Select à knop om ze te verplaatsen aan de keuzelijst Cluster analyseren .
  2. U maakt heatmaps van clusters, selecteer de clusters van belang in de keuzelijst Cluster analyseren en druk op de knop HeatMap van Clusters . Wanneer deze knop wordt gedrukt, zal een figuur opduiken die een warmte-kaart samen met dendrograms op de cluster en parameter assen bevatten. De dendrogram op de verticale as worden gegroepeerd clusters door degenen die nauw terwijl de dendrogram op de horizontale verbonden zijn as worden gegroepeerd markeringen die samen horen. Als u wilt opslaan van heatmap, druk op bestand | Exporteren van Setup | Exporteren.
  3. U maakt een 'Hoge dimensionale vak Plot' of 'Hoge dimensionale Flow Plot', selecteer de clusters van belang in de keuzelijst Cluster analyseren en druk op de knop Hoge dimensionale vak uitzetten of de Hoge dimensionale Flow Plot -knop. Deze percelen kunnen worden gebruikt om het visueel beoordelen van de verdeling van de kanalen van verschillende clusters gegeven over alle dimensies.
  4. Als u clusters in traditionele 2D stroom percelen weergeven, selecteer de transformatie (lineaire, log10, arcsinh) en kanaal in het deelvenster Conventionele stroom uitzetten en de druk op conventionele stroom Plot.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Om te testen de bruikbaarheid van ExCYT, geanalyseerd wij een curator gegevensset gepubliceerd door Chevrier et al. getiteld 'An immuun Atlas van duidelijke cel renale carcinoom' waar de groep uitgevoerd CyTOF analyse met een uitgebreide immuun panel met tumor monsters van 73 patiënten11. Twee afzonderlijke panelen, een myeloïde en lymfoïde panel, werden gebruikt om de fenotypische karakteriseren de communicatie van de tumor. Het doel van onze studie was om de resultaten van hun t-GND recapituleren en cluster-analyse, waaruit blijkt dat de ExCYT kan worden gebruikt om te komen tot dezelfde conclusies, evenals het weergeven van aanvullende methoden voor visualisatie en cluster-analyse.

In het originele manuscript beschreef de groep 22 T cel clusters geïdentificeerd door de lymfoïde panel en 17 cel clusters geïdentificeerd door de myeloïde panel. In Figuur 3 & 4 van de figuur van de publicatie, de groep laat zien heatmaps van clusters, t-GND Staanplaatsen met gekleurde clustering-oplossingen, en t-GND heatmaps in subpanels A, B & C. Om de analyses uit te voeren, dat wij de handmatig gated gegevens verkregen Cytobank en bemonsterd 2.000 gebeurtenissen uit elk bestand of nam het hele bestand indien zij minder dan 2.000 gebeurtenissen, had na de analyse pijpleiding geïllustreerd in het originele manuscript. Op dit punt, we bemonsterd totaal 100.000 evenementen via onze post gating subsampling parameter, t-GND analyse uitgevoerd, en een verscheidenheid van clustering methoden gebruikt om de gegevens op verschillende manieren verkennen.

Eerst, onderzocht we myeloïde hettoezichtpanel volgens dezelfde analyse pijpleiding als het originele manuscript door het invullen van de analyse van de t-GND en maken heatmaps van de verschillende markers (figuur 3A). Terwijl het originele manuscript genormaliseerd de t-GND heatmaps omhet 99 percentiel van iedere markeerdraad , doet ExCYT niet dit soort normalisatie voor haar heatmaps. Echter werden soortgelijke distributies van marker co meningsuiting waargenomen zoals beschreven in het originele manuscript. Wij vervolgens toegepast een netwerk grafiek gebaseerde methode van clustering van de gegevens door de grafiek te maken met 100 k-dichtstbijzijnde buren en clustering van de grafiek via de modulariteit van de grafiek te optimaliseren met behulp van de Fast-gulzige uitvoering in ExCYT, waar we 19 vonden subpopulatie van cellen (figuur 3B). Toen de heatmap van deze clusters gemaakt door ExCYT met de heatmap vergelijken in het originele manuscript gepubliceerd, merkte we dat we konden identificeren van soortgelijke clusters van myeloïde cellen (Figuur 3 c). Van de nota, het originele manuscript geïdentificeerd en contrast twee subpopulatie myeloïde cellen die we in onze analyse gedefinieerd door HLA-DRintCD68intCD64,intCD36+CD11b+ (Cluster 13) en HLA-DR+ CD4+CD68+CD64+CD36-CD11b- (Cluster 18). Visualisatie door hoge-dimensionale Boxplot van deze twee populaties geopenbaard statistisch significant verschillen (Mann-Whitney) in de zes markeringen genoemd (Figuur 1 d).

Vervolgens geanalyseerd wij de lymfoïde paneel met een meer conventionele en sneller hiërarchische benadering van clustering. Deze benadering leverde vergelijkbare marker distributies via t-GND heatmaps (figuur 4A). Bovendien, clustering van de gegevens via hiërarchische clusters (figuur 4B), aangetoond vergelijkbare clusters van lymfoïde cellen (figuur 4C). Van de nota, we ook de unieke regelgevende T-celpopulatie uit het originele manuscript gedefinieerd als CD4 geïdentificeerd+CD25+Foxp3+CTLA-4+CD127- (Cluster 17) via onze hoge-dimensionale stroom perceel (Figuur 4 d).

Tot slot wilden wij een methode binnen ExCYT te snel en kwantitatief beoordelen co verenigingen onder markeringen in dienst. Wij zijn begonnen met behulp van een harde k-means clustering algoritme om 5.000 clusters op de twee-dimensionale t-GND gegevens (figuur 4E) vast te stellen. We gebruikt dan de mediaan uitdrukking van alle markeringen van alle deze clusters maken een heatmap van deze clusters (figuur 4F). Aangezien deze heatmaps cluster zowel rijen als kolommen die vergelijkbaar zijn, deze methode van abstraheren van de gegevens door toepassing van een fijne maaswijdte van clusters en vervolgens een heatmap stelt ons in staat om te halen co verenigingen gemakkelijk, zoals de co vereniging van Tim-3, PD-1, CD38, en 4-1BB.

Figure 1
Figuur 1: ExCYT pijpleiding & functies. (A) ExCYT begint met het importeren van de ruwe gegevens van de FCS, optionele compensatie toe te passen, gating en willekeurige steekproef van vóór de downstream-analyse. Dit zorgt ervoor dat alle gebeurtenissen worden geanalyseerd relevant zijn voor het experiment wordt geanalyseerd. t-GND dimensionaliteit vermindering wordt vervolgens uitgevoerd om te visualiseren van alle gebeurtenissen en t-GND heatmaps om te visualiseren fenotypische distributies kunnen worden gegenereerd. Tenslotte, een verscheidenheid van clustering algoritmen kan worden toegepast op t-GND omzetting of high-dimensionale onbewerkte gegevens. (B) nieuwe sorteer- en drempelmethode kenmerken kunnen gebruikers snel sorteren door eventueel honderden clusters te vinden die van belang. (C) Heatmaps van clusters kunnen worden gemaakt om te onderzoeken hoe meerdere clusters bij elkaar en welke markeringen koppelen co vergelijken. (D) roman high-dimensionale stroom/vak percelen kunnen worden gegenereerd als een vorm van rug-gating clusters op oorspronkelijke gegevens terwijl het waarderen van de hoge-dimensionale aard van de gegevens. Klik hier voor een grotere versie van dit cijfer.

Figure 2
Figuur 2: ExCYT grafisch verbruiker raakvlak: De ExCYT grafische gebruikersinterface voorziet een stroomlijn werk stroom werken van links naar rechts in het deelvenster de gebruiker invoer hun gegevens, voert t-GND dimensionaliteit vermindering, clustering, en definitieve cluster-analyse en visualisatie. Klik hier voor een grotere versie van dit cijfer.

Figure 3
Figuur 3: Recapitulatie van de myeloïde subpopulatie van Chevrier et al. (A) Token t-GND heatmaps van myeloïde paneel (B) t-GND perceel van myeloïde deelvenster kleur gecodeerd door netwerk-Graph clustering algoritme (C) Heatmap van clusters geïdentificeerd door te clusteren oplossing op myeloïde paneel (D) vergelijkende hoge dimensionale Boxplot vergelijken contrasterende myeloïde subpopulaties (Clusters 13 & 18) waarnaar wordt verwezen in het originele manuscript Klik hier voor een grotere versie van dit cijfer.

Figure 4
Figuur 4: Recapitulatie van de lymfoïde subpopulatie van Chevrier et al. (A) Token t-GND heatmaps van lymfoïde paneel (B) t-GND perceel van lymfoïde deelvenster kleur gecodeerd door hiërarchische clustering algoritme (C) Heatmap van clusters geïdentificeerd door te clusteren oplossing op lymfoïde paneel (D) hoge dimensionale stroom plot van geïdentificeerde regelgevende T-celpopulatie (Cluster 17) in het originele manuscript (E) Clustering oplossing van 5.000 cluster harde k-middelen analyse op t-GND gegevens (F) Heatmap van clusters geïdentificeerd door k-means clustering oplossing op lymfoïde deelvenster weergegeven: marker co verenigingen. Klik hier voor een grotere versie van dit cijfer.

Nr. Beschrijving Naam (in de GUI)
1 Selecteer type van Cytometry NB
2 Willekeurige steekproef van raw-gegevens NB
3 Selecteer bestanden voor analyse Selecteer bestanden
4 Auto-compensatie van onbewerkte gegevens gebaseerd op directory van enkele vlekken verstrekt aan software Auto-compensatie
5 Gating Schakel gebeurtenissen voor t-GND en clustering analyse Gate bevolking
6 Willekeurige steekproef van gated gegevens (absolute nummer) NB
7 Willekeurige steekproef van gegevens (procent van gated bevolking) omheinde NB
8 Kies zenders voor analyse NB
9 Uitvoeren van t-GND dimensionaliteit vermindering t-GND
10 t-GND venster NB
11 Werkruimte opslaan Werkruimte opslaan
12 Laden van de werkruimte Laden van de werkruimte
13 T-GND heatmap maken op Selecteer marker NB
14 T-GND poort opnieuw doen t-GND analyse van select bevolking Poort t-GND
15 T-GND venster Opslaan als afbeelding TSNE afbeelding opslaan
16 Selecteer Clustering algoritme Clustering van de methode
17 Clustering Parameter invoert voor gegeven algoritme NB
18 Cluster-analyse Cluster
19 Clusters handmatig tekenen Cluster handmatig selecteren
20 Duidelijk alle Clusters overdoen clusteranalyse Duidelijke Clusters
21 Clusters weergeven onder de huidige omstandigheden van de filter Clusters (filtratie)
22 Selecteer clusters te verwijderen uit de keuzelijst Cluster analyseren Verwijderen <--
23 Cluster toevoegen aan keuzelijst Cluster analyseren Selecteer-->
24 Conventionele heatmap van alle gebeurtenissen in analyse maken HeatMap van gebeurtenissen
25 Soort clusters door Selecteer markering Sorteren
26 Ingestelde drempel door Selecteer marker Drempel
27 Conventionele heatmap van select clusters maken uit de keuzelijst Cluster analyseren HeatMap van Clusters
28 Orde van soort spiegelen Oplopend/aflopend
29 Schakel alle drempels Schakel alle drempels
30 Ingestelde frequentie drempel voor clusters Cluster frequentie drempel (%)
31 Lijst van huidige drempels actief op 'Clusters (filtratie)' listbox Drempels
32 Hoge dimensionale Boxplot Hoge dimensionale Boxplot
33 Hoge dimensionale stroom Plot Hoge dimensionale stroom Plot
34 Horizontale as parameter voor conventionele stroom perceel NB
35 Verticale as parameter voor conventionele stroom perceel NB
36 Gegevens transformatie voor conventionele stroom plot op horizontale as NB
37 Gegevens transformatie voor conventionele stroom plot op verticale as NB
38 Maken van conventionele stroom perceel Conventionele stroom Plot
39 Toon Clusters voor analyse NB

Tabel 1: Overzicht van alle functies aanwezig in de ExCYT GUI

Naam van softwarepakket / ExCYT CYT FCS Express flowCore openCyto FlowMeans
Programmatype MATLAB MATLAB Stand-Alone applicatie R R R
Prijs voor gebruiker Gratis Gratis 1.000 dollar Gratis Gratis Gratis
Grafische gebruikersinterface Ja Ja Ja No No No
Dimensionaliteit Reduction Techniques t-GND t-GND, PCA t-GND, PCA, SPADE geen geen geen
Clustering van algoritmen K-Means
DBSCAN
Hiërarchische Clustering
Zelf-georganiseerde kaart
Methoden op basis van meerdere netwerk-Graph
GMM - EM
GMM - variationele Bayesian gevolgtrekking
K-Means
GMM - EM
Één netwerk-Graph gebaseerd methode (Phenograph)
K-Means geen automatisering van handmatige gating workflow K-Means
Vermogen voor sortering/Filter Clusters Ja No No No No No
Hoge dimensionale stroom percelen Ja No No No No No

Tabel 2: Overzicht van Software-bijgewoonde Stroom Cytometry analyse oplossingen

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Hier presenteren we ExCYT, een nieuwe grafische gebruikersinterface uitgevoerd op basis van MATLAB algoritmen om te stroomlijnen analyse van hoge-dimensionale cytometry gegevens, waardoor individuen met geen achtergrond in programmeren uit te voeren uiterlijk in high-dimensional data analyse algoritmen. De beschikbaarheid van deze software aan de bredere wetenschappelijke gemeenschap kunnen wetenschappers om te verkennen hun stroom cytometry gegevens in een intuïtieve en eenvoudige workflow. Via het uitvoeren van t-GND dimensionaliteit vermindering een clustering methode toe te passen, kunnend zal Sortering/filter door middel van deze clusters snel en flexibel, aanpasbaar heatmaps en hoge-dimensionale stroom/vak Staanplaatsen, wetenschappers zitten kundig voor niet alleen begrijpen van de unieke gedefinieerde subpopulaties in hun monsters maar zal zitten kundig voor maken visualisaties die intuïtief en gemakkelijk te begrijpen door hun collega's zijn.

Hoewel het programma is flexibel in de behandeling van allerlei gegevenstypen (conventionele stroom cytometry vs massa cytometry), zijn er een paar overwegingen voor optimale nut van het programma. De eerste daarvan is met betrekking tot de kwaliteit van de gegevens, specifiek voor stroom cytometry data. Goede compensatie en resolutie van overlappende emissie spectra is van het allergrootste belang. Slecht gecompenseerd gegevens kan onbedoeld leiden tot valse co verenigingen van markeringen en de vorming van clusters die niet van ware biologische betekenis. Daarom is het zeer aan te raden dat de invoergegevens van geluidskwaliteit voordat u verdergaat met de t-GND en verder stroomafwaarts analyse is. Bovendien vereist gebruik van de automatische compensatie algoritme geïmplementeerd in ExCYT duidelijk enkele vlekken voor alle kanalen de compensatie parameters precies kunnen worden berekend.

Een andere belangrijke overweging voor gebruik van ExCYT is wanneer concatenatie van meerdere FCS-bestanden in één analyse (zoals aangetoond in dit manuscript), zij moeten vergelijkbaar zijn in alle kanalen. Ten eerste betekent dit dat hetzelfde panel binnen alle monsters en moet dat er geen drift tussen monsters in alle kanalen worden gebruikt. Bijvoorbeeld, als een waren om te lezen van twee monsters op verschillende dagen en gebeitst CD8 in FITC op beide dagen maar de spanning van de cytometer werd ingesteld anders op één dag, wat resulteert in een iets verschoven CD8-bevolking, kan een genereren valse clusters in de downstream-analyse , zoals deze verschuiving werd gegenereerd als een functie van instrument variatie en niet wegens de biologische betekenis. Terwijl de toekomstige versies van ExCYT mogelijk te normaliseren monsters hun enkele vlekken, op dit punt, moet zorgvuldige afweging worden gemaakt dat FCS bestanden kunnen worden vergeleken met elkaar voordat u deze importeert in ExCYT.

Tot slot, het proces van clustering is niet een absolute/stijve thats. Verschillende clustering algoritmen en parameters kunnen verschillende clustering-oplossingen genereren. Of de oplossing van het algoritme geschikt is is voor de gebruiker om te bepalen door de synthese van hun begrip van de biologie met de clustering oplossing. Bijvoorbeeld, wanneer het immuun milieu van tumoren te begrijpen, men kan worden geïnteresseerd in macroscopische clusters (dat wil zeggen, T cellen vs B cellen versus myeloïde cellen) terwijl een ander wellicht geïnteresseerd zijn in subpopulaties van macroscopische clusters. De resolutie van de clusters wordt bepaald door de gebruiker en dus geen single clustering oplossing klopt '.' Dit is een van de belangrijkste voordelen van het gebruik van de hoge dimensionale stroom percelen beschikbaar in ExCYT. De mogelijkheid om de verdeling van een bepaald cluster visualiseren via alle kanalen kan helpen de gebruiker bepalen of ze zijn gegroepeerd in niet alleen een biologisch relevante manier maar op een manier die relevant is voor de wetenschappelijke vraag in het experiment. Terwijl ons doel is te zorgen voor een overvloed van methodes in de literatuur naar cluster high-dimensionale stroom cytometry gegevens terwijl het verstrekken van aanvullende methoden van clustering, is het raadzaam met behulp van methoden zoals k-means en DBSCAN te verkennen van de gegevens via snel itereren clusteraantal en grootte en richting van de netwerk-grafiek en Gaussiaans-gemengd model benaderingen voor de aanpak van de meer robuuste maar meer tijd in beslag.

Gezien deze overwegingen, ExCYT is nog steeds een zeer flexibel en waardevol hulpmiddel voor het verkennen van hoge dimensionale cytometry gegevens, en biedt unieke/differentiatie van functies dan de andere beschikbare pakketten beschikbaar om uit te voeren dit type analyse (tabel 2) . ExCYT onderscheidt zich eerst over de meeste stroom cytometry analyse benaderingen met gebruikmaking van dimensionaliteit vermindering en clustering van algoritmen door haar vermogen om te worden gebruikt zonder enige kennis van scripts/programmering. Bovendien, door het aggregeren van vele clustering algoritmen, aangehaald in de literatuur, wij geloven dat wij bieden de meeste opties voor clustering gegevens. Tot slot, onze unieke functie van cluster filtratie en sortering op samen met Vertoning via nieuwe hoge dimensionale stroom percelen, gebruikers toestaat om te verkennen van de kenmerken van hun clusters, snel en efficiënt, waardoor het proces van 'ontdekken' zeldzame subpopulaties eenvoudig en efficiënt.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben niets te onthullen.

Acknowledgments

De auteurs hebben geen bevestigingen.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Retractie kwestie 143 Stroom Cytometry High-dimensionale analyse t-GND clustering kaarten dimensionaliteit vermindering warmte
ExCYT: Een grafische gebruikersinterface voor het stroomlijnen van de analyse van High-dimensionale Cytometry gegevens
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter