Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: Ett grafiskt användargränssnitt för att effektivisera analys av högdimensionella flödescytometri Data

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT är en MATLAB-baserat grafiskt användargränssnitt (GUI) som tillåter användare att analysera deras flöde flödescytometri data via vanligen anställd analystekniker för högdimensionella data inklusive dimensionalitet minskning via t-SNE, en mängd automatiserade och manuella klustring metoder, heatmaps och romanen högdimensionella flöde tomter.

Abstract

Med tillkomsten av flöde cytometers kan mäta ett ökande antal parametrar, fortsätta forskare att utveckla större paneler fenotypiskt utforska egenskaperna hos deras cellulära prover. Men, ge dessa tekniska framsteg högdimensionella datauppsättningar som har blivit allt svårare att analysera objektivt inom traditionell manuell-baserade Usenets program. För att bättre analysera och presentera data, samarbetar forskare med bioinformatiker med expertis inom analys av högdimensionella data för att tolka deras flödesdata flödescytometri. Medan dessa metoder har visat sig vara mycket värdefulla i att studera flödescytometri, har de ännu inte införlivas i en enkel och lätt-till-använda paketet för forskare som saknar computational eller programmering expertis. För att bemöta detta behov, har vi utvecklat ExCYT, en MATLAB-baserat grafiskt användargränssnitt (GUI) som effektiviserar analys av högdimensionella flödesdata flödescytometri av genomförandet vanligen anställd analysmetoder för högdimensionella data inklusive dimensionalitet minskning av t-SNE, en mängd automatiserade och manuella klustring metoder, heatmaps och romanen högdimensionella flöde tomter. Dessutom ger ExCYT traditionella Usenets alternativ av Välj populationer av intresse för ytterligare t-SNE och klustring analys samt förmåga att tillämpa grindar direkt på t-SNE tomter. Programvaran ger den ytterligare fördelen att arbeta med antingen kompenseras eller okompenserad FCS filer. I händelse av att efter förvärvet ersättning krävs, kan användaren välja att ge programmet en katalog av enstaka fläckar och en ofärgade provet. Programmet upptäcker positiva händelser i alla kanaler och använder detta Välj data att mer objektivt beräkna matrisen ersättning. Sammanfattningsvis ger ExCYT en omfattande analys rörledning för att ta flödescytometri flödesdata i form av FCS filer och låta varje enskild person, oavsett computational utbildning, att använda de senaste algoritmiska metoderna för att förstå deras data.

Introduction

Framsteg inom flödescytometri samt tillkomsten av massa flödescytometri har tillåtit kliniker och forskare för att snabbt identifiera och karaktärisera fenotypiskt biologiskt och kliniskt intressant prov med nya nivåer av upplösning, skapa stora högdimensionella datauppsättningar som är information rik1,2,3. Medan konventionella metoder för att analysera flödesdata flödescytometri såsom manuell gating har varit mer rättframt för experiment där det finns några markörer och dessa markörer har visuellt urskiljbara populationer, kan detta tillvägagångssätt misslyckas att generera reproducerbara resultat när man analyserar högre-dimensionell datauppsättningar eller de med markörer färgning på ett spektrum. Till exempel i en flera institutionella studie, som där inom cellulär färgning (ICS) analyser utfördes för att bedöma reproducerbarheten för quantitating antigen-specifika T-cell svar, trots god genomför mellan olika laboratorier precision, analys, särskilt gating, infört en betydande källa till variabilitet4. Dessutom är manuellt gating befolkningen av intressen, förutom att vara högst subjektiva mycket tidskrävande och labor intensiv. Problemet med analysera högdimensionella datauppsättningar i ett robust, effektiv och snabb sätt är dock inte en ny till forskning vetenskaperna. Gen uttryck studier genererar ofta extremt högdimensionella datauppsättningar (ofta på order av hundratals gener) där manuell former av analys är helt enkelt omöjligt. För att ta itu med analysen av dessa datamängder, har det varit mycket arbete med att utveckla bioinformatiska verktyg att parsa gen uttryck data5. Dessa algoritmiska metoder har bara nyligen antagits i analysen av flödescytometri data som antalet parametrar har ökat och har visat sig vara ovärderlig i analysen av dessa höga tredimensionella datauppsättningar6,7.

Trots den generation och tillämpning av olika algoritmer och programpaket som gör forskare att tillämpa dessa högdimensionella bioinformatiska metoder på deras flödesdata flödescytometri, fortfarande dessa analytiska tekniker till stor del outnyttjade. Det kan finnas en mängd faktorer som har begränsat den utbredda användningen av dessa metoder för flödescytometri data8, den stora hinder som vi misstänker i använda dessa metoder av forskare, saknar computational knowledge. I själva verket, skrivs många av dessa programvarupaket (dvs. flowCore, flowMeans och OpenCyto) ska genomföras i programmeringsspråk som R som fortfarande kräver materiella programmeringskunskaper. Programvarupaket som FlowJo har funnit nåd bland forskare på grund av enkelheten i användningen och 'plug-n-play' natur, samt kompatibilitet med PC operativsystem. För att ge olika accepterade och värdefulla analytiska tekniker till den vetenskapsman obekanta programmeringen, har vi utvecklat ExCYT, en grafiskt-användargränssnitt (GUI) som enkelt kan installeras på en dator som drar många av de senaste teknikerna inklusive dimensionalitet minskning för intuitiv visualisering, en mängd klustring metoder som nämns i litteraturen, tillsammans med nya funktioner att utforska produktionen av dessa kluster algoritmer med heatmaps och roman högdimensionella flöde/lådagram.

ExCYT är ett grafiskt användargränssnitt byggt i MATLAB och därför kan antingen köras inom MATLAB direkt eller ett installationsprogram tillhandahålls som kan användas för att installera programvara på varje dator. Programvaran finns på https://github.com/sidhomj/ExCYT. Vi presenterar ett detaljerat protokoll för hur du importerar data, förbehandla det, genomföra t-SNE dimensionalitet minskning, klusterdata, sortera och filtrera kluster baserat på användarinställningar och Visa information om kluster av intresse via heatmaps och roman högdimensionella flöde/lådagram ()figur 1). Yxor i t-SNE tomter är godtyckliga och i godtyckliga enheter och som sådan som inte alltid visas i siffrorna för enkelhet för användaren gränssnitt. Färgen av datapunkterna i den ”t-SNE Heatmaps” är från blått till gult baserat på signalen för den angivna markören. I klustring lösningar, utifrån färgen på datapunkten godtyckliga kluster nummer. Alla delar av arbetsflödet kan utföras i den enda panelen GUI ()figur 2 & tabell 1). Slutligen kommer vi att visa användning av ExCYT på tidigare publicerade uppgifter att utforska immun landskapet av njurcellscancer i litteraturen, också analyseras med liknande metoder. Prov datamängden vi används för att skapa siffror i detta manuskript tillsammans med protokollet nedan kan hittas på https://premium.cytobank.org/cytobank/projects/875, på att registrera ett konto.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. insamling och förbereda flödescytometri Data

  1. Placera alla enstaka fläckar i en mapp av sig själva och etikett av kanalnamnet (av fluorophore, inte markör).

2. data import & förbehandling

  1. För att pausa eller spara hela denna analys rörledning, Använd knappen Spara arbetsyta längst ner till vänster i programmet för att spara arbetsytan som en '. MATTA ' fil som senare kan läsas via knappen Load arbetsyta . Kör inte mer än en instans av programmet på en gång. Därför, när du laddar en ny arbetsyta, se till att kontrollera det finns ingen annan instans av ExCYT kör.
  2. För att påbörja analysen pipeline, först välja typ av flödescytometri (Flow flödescytometri eller massa flödescytometri – CYTOF), under Fil urvalsparametrar Välj antalet händelser att ta prov från filen (till exempel Använd 2.000). När data har importerats framgångsrikt, dyker en dialogruta upp informerar användaren om att data har importerats.
  3. Tryck på knappen Auto-ersättning att genomföra ett steg för valfria auto-ersättning som görs av Bagwell & Adams9. Välj den katalog som innehåller enstaka fläckar. Välj ofärgade provet inom användargränssnittet dialogen.
    1. Placera en framåt/sida-scatter grind på något av proverna i denna katalog som används för att markera händelser att beräkna matrisen ersättning. Det rekommenderas att använda ofärgade provet för detta ändamål. Vid denna punkt, har en algoritm genomförts för att fastställa konsekvent trösklar på den 99n : te percentilen av ofärgade provet definiera positiva händelser i varje enstaka fläckar att beräkna matrisen ersättning. När detta är klart kommer en dialogruta informera användaren att ersättningen har utförts.
  4. Nästa, tryck på Gate befolkningen och välja populationer av celler av intresse, eftersom konventionen i flödet flödescytometri analyser. När befolkningen i celler är markerad, ange antal andelen händelser nedströms analys (i denna 10 000 händelser).
  5. Nästa, Välj antal kanaler som skall användas för analys i listbox i längst till höger i rutan förbehandling (använda de specifika kanaler som visas i exemplet).

3. t-SNE analys

  1. Tryck på knappen t-SNE att programmet ska påbörja start att beräkna reducerad dimensionalitet datauppsättningen för visualisering i fönstret nedanför knappen t-SNE. Spara bilden av t-SNE, trycka på Spara TSNE bild. På en maskin med 8 CPU @ 3,4 GHz varje och 8 GM RAM detta steg bör ta ungefär 2 minuter för 10 000 händelser, 10 minuter för 50.000 evenemang, och 20 minuter för 100.000 händelser.
  2. Att skapa en 't-SNE heatmap', som sett flera CYTOF publikationer10,11, Välj ett alternativ från popupmenyn Markör-specifika t-SNE (använda de specifika markörerna CD64 eller CD3 som visas i exemplet). En figur dyker upp visar en heatmap representation av t-SNE tomten som kan sparas för figur generation.
  3. Välj intresseområden i t-SNE tomterna av användaren för ytterligare nedströms analyser med hjälp av knappen Gate t-SNE .

4. klusteranalys

  1. För att börja klustring analys, markerar du ett alternativ i Kluster metod listbox (i detta exempel oss DBSCAN med en avstånd faktor 5 dialog rutan till höger om listrutan). Tryck på knappen kluster .
  2. Använd någon av följande alternativ för automatisk klustring algoritmer som finns i panelen 'Automatisk klustring parametrar':
    1. Hård KMEANS (på t-SNE): Applicera k-means klustring till nedsatt 2-dimensionella t-SNE data och kräver antalet kluster som ska lämnas till den algoritm12.
    2. Hård KMEANS (på HD Data): tillämpa k-means klustring till de ursprungliga högdimensionella data som gavs till t-SNE algoritmen. Återigen, måste antalet kluster lämnas till algoritmen.
    3. DBSCAN: Använda metoden klustring av klustring, kallas densitet-baserade rumsliga kluster av applikationer med buller13 som kluster nedsatt 2-dimensionella t-SNE data och kräver en icke-dimensionell avstånd faktor som bestämmer den allmänna storleken på den kluster. Denna typ av klustring algoritm är väl lämpad för klustret t-SNE minskning som det är att klustret icke-sfäriska kluster som förekommer ofta i nedsatt t-SNE representation. Dessutom, på grund av att den fungerar på 2-dimensionella data, är det en av de snabbare klustring algoritmerna.
    4. Hierarkisk klustring: Använda metoden för konventionella hierarkisk klustring högdimensionella data där matrisen hela euklidiska avståndet beräknas mellan alla händelser innan du lämnar algoritmen en avstånd faktor som anger storleken på klustret.
    5. Network diagram- Baserat: Applicera en klustring metod som mest nyligen har införts i analysera flödesdata flödescytometri när det finns sällsynta subpopulations som användaren vill upptäcka11,14. Denna metod bygger på att först skapa en graf som bestämmer anslutningarna mellan alla händelser i data. Detta steg består i att tillhandahålla en initial parameter för att skapa diagrammet, vilket är antalet k-närmaste grannar. Denna parameter generellt reglerar storleken på kluster. Vid denna punkt, dyker en annan dialogruta upp frågar användaren att anställa en av 5 klustring algoritmer som används i diagrammet. Dessa inkluderar 3 alternativ att maximera Modulariteten av grafen, metoden Danon och en spektral klustring algoritm14,15,16,17,18. Om man vill en allmänt snabbare kluster lösning, rekommenderar vi spektrala klustring eller snabbt giriga modularitet maximering. Medan de modularitet maximering metoderna tillsammans med metoden Danon fastställa det optimala antalet kluster, kräver spektrala klustring antalet kluster ges till programmet.
    6. Självorganiserade karta: Anställa en artificiella neurala nätverk att klustra högdimensionella data.
    7. GMM – förväntan maximering: skapa en Gaussisk blandning modell med förväntan maximering (EM) teknik för att klustra högdimensionella data. 19 denna typ av klustring metod också kräver att användaren att mata in antalet kluster.
    8. Variationsmetoder Bayesiansk inferens för GMM: skapa en Gaussisk blandning modell men till skillnad från EM, kan det automatiskt bestämma antalet blandning komponenter k.20 medan programmet kräver ett antal kluster ges (större än den Förväntat antal kluster), algoritmen avgör antalet optimal på egen hand.
  3. För att studera ett visst område av t-SNE tomten, tryck på knappen Välj klustret manuellt rita en uppsättning användardefinierade kluster. Notera dela inte kluster medlemmar (dvs. varje händelse kan bara tillhöra 1 kluster).

5. kluster filtrering

  1. Uppsättning av kluster kan identifieras antingen manuellt eller via en av de automatiska metoder som beskrivs ovan filtrera följande.
    1. Välj ett alternativ från popupmenyn Sortera för att sortera kluster (i panelen Kluster Filter ) av någon av de markörer som mätt i experimentet. Du anger om ordern stigande eller fallande, tryck på knappen Stigande/fallande till höger om popupmenyn Sortera . Detta kommer att uppdatera listan över kluster i 'Kluster (Filtration)' listbox och sortera dem i fallande ordning efter medianvärdet kluster uttryck för sådan markör. Den procentandel som betecknas i 'Kluster (Filtration)' listbox betecknar procenten av befolkningen som detta kluster representerar.
    2. Om du vill ange ett lägsta tröskelvärde för ett visst kluster över en viss kanal, Välj ett alternativ från popupmenyn tröskel (i detta exempel oss den markör CD65 och ange ett tröskelvärde på 0,75). Skriv ett värde i rutan numeriska nedanför diagrammet eller Använd skjutreglaget-för att fastställa en tröskel. När tröskeln är inställd, tryck Lägg till ovan tröskelvärde eller Lägg till nedanför tröskelvärde ange riktning mot tröskeln. När detta tröskelvärde har ställts in, visas det i rutan tröskelvärden bredvid panelen 'Kluster Filter' där markören, tröskelvärdet och riktning visas så att användaren är medveten om vilka tröskelvärden som för närvarande tillämpas. Slutligen, t-SNE tomten kommer uppdatera genom att sudda ut sig kluster som inte uppfyller kraven i filtrering och 'Kluster (Filtration)' listbox uppdateras för att Visa kluster som uppfyller krav som filtrering.
    3. För att fastställa en lägsta tröskel för frekvensen av ett kluster, ange en numerisk cut-off i Klustret frekvens tröskel (%) Box i klustret filterpanelen (i detta exempel användning 1%).

6. kluster analys & visualisering

  1. Välj kluster för ytterligare analys och visualisering, Välj kluster i kluster (Filtration) listbox och tryck på knappen Välj à för att flytta dem till Klustret analysera listbox.
  2. Skapa heatmaps kluster, Välj kluster av intresse i Klustret analysera listbox och tryck på knappen HeatMap av kluster . När denna knapp trycks dyker en figur upp som innehåller en intensitetskarta tillsammans med dendrograms på klustret och parametern axlarna. Dendrogram på den vertikala axeln grupperar kluster av dem som är närbesläktade medan dendrogram på horisontellt axeln grupperar markörer som är samtidig associerade. Spara heatmap, trycka på fil | Exportera inställningar | Exportera.
  3. Skapa en 'Hög dimensionell lådagram' eller 'Hög dimensionell Flow Plot', Välj kluster av intresse i Klustret analysera listbox och tryck på antingen knappen Hög dimensionell lådagram eller knappen Hög dimensionell Flow tomt . Dessa tomter kan användas för att visuellt bedöma fördelningen av tanke kanaler av olika kluster i alla dimensioner.
  4. För att Visa kluster i traditionella 2D flöde tomter, Välj omvandlingen (linjär, log10, arcsinh) och kanal i Konventionella flödet Rita panelen och tryck konventionella flödet rita.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

För att testa användbarheten av ExCYT, analyserade vi en kurator datauppsättning utgiven av Chevrier et al. med titeln 'An immun Atlas för klart Cell njurcancer' där gruppen genomfört CyTOF analys med en omfattande immun panel på tumörprover från 73 patienter11. Två separata paneler, en myeloiska och lymfoida panel, användes till fenotypiskt karakterisera den tumör mikromiljö. Syftet med vår studie var att sammanfatta resultaten av deras t-SNE och kluster analys, visar att ExCYT kan användas för att komma till samma slutsatser samt visa ytterligare analysmetoder visualisering och kluster.

I det original-manuskriptet beskrivs gruppen 22 T cell kluster identifieras av panelen lymfoida och 17 cell kluster identifieras av myeloisk panelen. I figur 3 och figur 4 i publikationen visar gruppen heatmaps av kluster, t-SNE tomter med färgkodade klusterlösningar och t-SNE heatmaps i subpanels A, B, & C. För att utföra analysen, vi manuellt gated data från Cytobank och provtas 2 000 händelser från varje fil eller tog hela filen om den hade mindre än 2 000 händelser, efter analys rörledningen illustreras i det original-manuskriptet. Vid denna punkt, vi provtas sammanlagt 100.000 händelser via vår efter Usenets delsampling parametern t-SNE analys och används en mängd klustring metoder för att utforska data på olika sätt.

Vi undersökte först, myeloisk panelen genom att följa samma analys rörledning som det original-manuskriptet genom att fylla i t-SNE analysen och skapar heatmaps av olika markörer (figur 3A). Medan det original-manuskriptet normaliserade den t-SNE heatmaps till den 99: e percentilen av varje markör, gör ExCYT inte denna typ av normalisering för dess heatmaps. Dock observerades liknande distributioner av markör samtidig uttryck som beskrivs i det original-manuskriptet. Vi sedan tillämpas en nätverket grafisk metod för klustring data genom att skapa diagrammet med 100 k-närmaste grannar och klustring grafen via optimera Modulariteten av grafen med hjälp av snabb-giriga genomförandet inom ExCYT, där vi hittade 19 delpopulationer av celler (figur 3B). När man jämför heatmap av dessa kluster som skapats av ExCYT med heatmap publicerade i det original-manuskriptet, noterade vi att vi kunde identifiera liknande kluster av myeloida celler (figur 3 c). Notera det original-manuskriptet identifieras och kontrasterade två delpopulationer av myeloida celler som vi identifierat i vår analys definieras av HLA-DRintCD68intCD64intCD36+CD11b+ (kluster 13) och HLA-DR+ CD4+CD68+CD64+CD36 CD11b (kluster 18). Visualisering av högdimensionella lådagram av dessa två populationer visade statistiskt signifikanta skillnader (Mann-Whitney) i de sex markörer som nämns (figur 1 d).

Nästa, vi analyserat lymfoida panelen med en mer konventionell och snabbare hierarkisk klustring strategi. Detta tillvägagångssätt gav liknande markör distributioner via t-SNE heatmaps (figur 4A). Dessutom visat klustring av data via hierarkisk klustring (figur 4B), liknande kluster av lymfoida celler (figur 4 c). Notera, vi har även identifierat unika regulatoriska T-cell befolkningen från det original-manuskript definieras som CD4+CD25+Foxp3+CTLA-4+CD127 (kluster 17) via vår högdimensionella flöde tomt (figur 4 d).

Slutligen, vi ville anställa en metod inom ExCYT att snabbt och kvantitativt bedöma samtidig sammanslutningar bland markörer. Vi började med ett hårt k-means klustring algoritm för att fastställa 5.000 kluster på tvådimensionella t-SNE data (figur 4E). Vi använde sedan median uttrycket av alla markörer av alla dessa kluster för att skapa en heatmap från dessa kluster (figur 4F). Eftersom dessa heatmaps kluster rader samt kolumner som är liknande, denna metod för att abstrahera data genom att tillämpa en finmaskig kluster och sedan skapa en heatmap tillåter oss att plocka upp samtidig föreningar enkelt, såsom samtidig association av Tim-3, PD-1, CD38, och 4-1BB.

Figure 1
Figur 1: ExCYT Pipeline & funktioner. (A) ExCYT börjar med att importera FCS rådata, tillämpa valfri kompensation, gating och slumpmässiga delsampling före efterföljande analys. Detta säkerställer att alla händelser som analyseras är relevanta för experimentet som analyseras. t-SNE dimensionalitet minskning utförs sedan för att visualisera alla händelser och t-SNE heatmaps kan genereras för att visualisera fenotypiska distributioner. Slutligen kan, en mängd klustring algoritmer tillämpas på antingen t-SNE omvandling eller högdimensionella rådata. (B) nya funktioner för sortering och tröskelvärde tillåter användare att snabbt sortera igenom eventuellt hundratals kluster att hitta böcker av intresse. (C) Heatmaps kluster kan skapas för att undersöka hur flera kluster jämför med varandra samt vilka markörer tillsammans associera. (D) roman högdimensionella flöde/lådagram kan genereras som en form av back-gating kluster på ursprungliga data medan uppskattar högdimensionella arten av uppgifterna. Klicka här för att se en större version av denna siffra.

Figure 2
Figur 2: ExCYT grafiskt användargränssnitt: Den ExCYT som grafiskt användargränssnitt möjliggör en förenklad arbete flöde fungerar från vänster till höger på panelen som användaren importerar sina data, bedriver t-SNE dimensionalitet minskning, klustring, och slutliga klusteranalys och visualisering. Klicka här för att se en större version av denna siffra.

Figure 3
Figur 3: Rekapitulation av myeloisk delpopulationer från Chevrier o.a. (A) Token t-SNE heatmaps myeloisk panel (B) t-SNE Plot av myeloisk panelen Färg kodade av nätverk-Graph klustring algoritm (C) Heatmap av kluster identifieras av kluster lösning på myeloisk panel (D) jämförande hög dimensionell lådagram jämföra kontrasterande myeloisk subpopulationer (kluster 13 & 18) refereras i original-manuskript vänligen klicka här för att visa en större version av denna siffra.

Figure 4
Figur 4: Sammanfattning av lymfoida delpopulationer från Chevrier o.a. (A) Token t-SNE heatmaps lymfoida panel (B) t-SNE Plot av lymfoida panelen Färg kodade av hierarkisk klustring algoritm (C) Heatmap av kluster identifieras av kluster lösning på lymfoida panel (D) högt dimensionell flöde tomt på identifierade regulatoriska T-cell befolkningen (kluster 17) i original-manuskript (E) kluster lösning av 5.000 kluster hårda k-means analys på t-SNE data (F) Heatmap av kluster identifieras av k-means kluster lösning på lymfoida panelen visar markör samtidig föreningar. Klicka här för att se en större version av denna siffra.

Nej. Beskrivning Namn (i GUI)
1 Välj typ av flödescytometri NA
2 Slumpmässiga delsampling rådata NA
3 Markera filer för analys Välj fil(er)
4 Auto-ersättning av rådata baserat på katalog av enstaka fläckar till programvara Auto-ersättning
5 Gating för att välja händelser för t-SNE och klustring analys Utfärda utegångsförbud för befolkningen
6 Slumpmässiga delsampling av gated data (absoluta tal) NA
7 Slumpmässiga delsampling av gated data (procent av gated befolkningen) NA
8 Välj kanaler för analys NA
9 Kör t-SNE dimensionalitet minskning t-SNE
10 t-SNE fönster NA
11 Spara arbetsytan Spara arbetsytan
12 Läsa in arbetsytan Läsa in arbetsytan
13 Skapa t-SNE heatmap på Välj markör NA
14 Utfärda utegångsförbud för t-SNE att åter göra t-SNE analys av Välj befolkningen Gate t-SNE
15 T-SNE fönstret Spara som bild Spara TSNE bild
16 Välj klustring algoritm Klustring metod
17 Ange klustring Parameter för gett algoritm NA
18 Klusteranalys Kluster
19 Manuellt rita kluster Markera klustret manuellt
20 Rensa alla kluster för att göra om klusteranalys Tydliga kluster
21 Visa kluster under aktuella filter Kluster (Filtration)
22 Ta bort utvalda kluster från klustret analysera listbox Ta bort <--
23 Lägga till kluster i klustret analysera listbox Välj-->
24 Skapa konventionella heatmap av alla händelser i analysen. HeatMap av händelser
25 Sortera kluster av Välj markör Sortera
26 Inställd tröskel av Välj markör Tröskel
27 Skapa konventionella heatmap Välj kluster från klustret analysera listbox HeatMap av kluster
28 Vänd ordning sortera Stigande/fallande
29 Rensa alla trösklar Rensa alla trösklar
30 Välj frekvens tröskeln för kluster Klustret frekvens tröskel (%)
31 Lista över aktuella tröskelvärdena aktiv på 'Kluster (Filtration)' listbox Trösklar
32 Hög dimensionell lådagram Hög dimensionell lådagram
33 Dimensionell Högflödes tomt Dimensionell Högflödes tomt
34 Horisontella axeln parametern för konventionella flöde tomt NA
35 Vertikala axeln parametern för konventionella flöde tomt NA
36 Dataomvandling för konventionella flöde tomt på vågräta axeln NA
37 Dataomvandling för konventionella flöde tomt på vertikala axeln NA
38 Skapa konventionella flöde handling Konventionella flöde tomt
39 Visa kluster för analys NA

Tabell 1: Översikt över alla funktioner i ExCYT GUI

Namnet på programvara/paket ExCYT CYT FCS Express flowCore openCyto FlowMeans
Programtyp MATLAB MATLAB Fristående program R R R
Pris till användare Gratis Gratis $1.000 Gratis Gratis Gratis
Grafiskt användargränssnitt Ja Ja Ja Nej Nej Nej
Dimensionalitet tekniker t-SNE t-SNE, PCA t-SNE, PCA, SPADE ingen ingen ingen
Klustring algoritmer K-Means
DBSCAN
Hierarkisk klustring
Självorganiserade karta
Flera nätverk-diagram baserade metoder
GMM - EM
GMM - Variationsmetoder Bayesiansk inferens
K-Means
GMM - EM
Enda nätverk-diagram baserade metod (Phenograph)
K-Means ingen automatisering av manuella Usenets arbetsflöde K-Means
Förmågan att sortera/filtrera kluster Ja Nej Nej Nej Nej Nej
Dimensionell Högflödes tomter Ja Nej Nej Nej Nej Nej

Tabell 2: Översikt över Software-assisted flöde flödescytometri analys lösningar

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Här presenterar vi ExCYT, ett nytt grafiskt användargränssnitt köra MATLAB-baserade algoritmer för att effektivisera analys av högdimensionella flödescytometri data, så att människor utan bakgrund i programmering för att genomföra senast i högdimensionella data algoritmer för analys. Tillgången till denna programvara till bredare vetenskapliga gemenskapen tillåter forskare att utforska deras flöde flödescytometri data i ett intuitivt och enkelt arbetsflöde. Genom genomför t-SNE dimensionalitet minskning, tillämpa en klustring metod, kunna kommer sortera/filtrera genom dessa kluster snabbt och göra flexibla, anpassningsbara heatmaps och högdimensionella flöde/lådagram, forskare att kunna inte bara förstår unikt definierade subpopulationsna i sina prover men kommer att kunna skapa visualiseringar som är intuitivt och lätt att förstå deras kolleger.

Medan programmet är flexibelt hantera en mängd olika datatyper (konventionell flödescytometri vs massa flödescytometri), finns det några överväganden för optimal nytta av programmet. Först av dessa är om kvaliteten på uppgifterna, särskilt av flödescytometri flödesdata. Skälig ersättning och upplösning av överlappande utsläpp spectra är av största vikt. Dåligt kompenserad data kan oavsiktligt leder till falska samtidig sammanslutningar av markörer och bildandet av kluster som inte är sant biologiska betydelse. Därför är det tillrådligt att indata är av ljudkvalitet innan du fortsätter med t-SNE analys och ytterligare efterföljande analys. Dessutom kräver användning av automatisk ersättning algoritmen genomförs i ExCYT klara enstaka fläckar för alla kanaler för att exakt beräkna parametrarna ersättning.

En annan viktig faktor för användning av ExCYT är när sammanfoga flera FCS filer i en analys (som visas i detta manuskript), de måste vara jämförbara över alla kanaler. Först, detta innebär att samma panel behöver användas över alla prov och att det finns ingen drift mellan prover i alla kanaler. Till exempel om man skulle läsa två prover på separata dagar och färgade CD8 i FITC på båda dagar men spänningen i cytometer sattes annorlunda på en dag vilket resulterar i en något skiftat CD8 befolkning, kunde en generera falska kluster i den efterföljande analysen , eftersom detta skifte genererades som funktion av instrumentet variation och inte på grund av biologisk betydelse. Framtida versioner av ExCYT kan vara kunna normalisera prover till deras enda fläckar, vid denna punkt, göras noggrant övervägande att FCS filer kan jämföras med varandra innan du importerar dem till ExCYT.

Slutligen, processen för klustring är inte en som är absolut/styv. Olika kluster algoritmer och parametrar kan generera olika klusterlösningar. Om lösningen av algoritmen är lämpligt är för användaren att fastställa genom att syntetisera sin förståelse av biologi med klustring lösningen. Exempelvis när förståelse immun miljön av tumörer, något kan vara intresserade i makroskopiska kluster (d.v.s. T celler vs B celler vs myeloida celler) medan en annan kan vara intresserade i subpopulationer av makroskopiska kluster. Upplösningen av klustren bestäms av användaren och därför ingen enda kluster lösning är 'rätt'. Detta är en av de största fördelarna med att använda dimensionella Högflödes tomter finns i ExCYT. Förmågan att visualisera fördelningen av ett visst kluster i alla kanaler kan hjälpa användaren att avgöra om de har klustrade i inte bara ett biologiskt relevant sätt men på ett sätt som är relevant för den vetenskapliga fråga som ställs i experimentet. Vårt mål är att erbjuda en uppsjö av metoder som används i litteraturen till klustret högdimensionella flödescytometri flödesdata samtidigt som den ger ytterligare metoder av klustring, rekommenderar vi att du använder metoder såsom k-means och DBSCAN för att utforska data via snabbt Iterating på klustret nummer och storlek och flytta mot nätverk-diagram och Gaussisk-blandad modell metoder för mer robust men mer tidskrävande metoder.

Med tanke på dessa överväganden, ExCYT är fortfarande en mycket flexibel och värdefulla verktyg för att utforska hög dimensionell flödescytometri data, och erbjuder unik/skilja funktioner än andra tillgängliga paket som är tillgängliga att utföra denna typ av analys (tabell 2) . Först, ExCYT skiljer sig över de flesta flöde flödescytometri analys metoder utnyttja dimensionalitet minskning och klustring algoritmer genom dess förmåga att användas utan scripting/programmering kunskap. Dessutom genom sammanläggning många kluster algoritmer som nämns i litteraturen, tror vi att vi ge de flesta alternativen för klustring data. Slutligen, vår unika funktionen kluster filtrering och sortering tillsammans med display via roman dimensionell Högflödes tomter, tillåter användare att utforska egenskaperna hos deras kluster snabbt och effektivt, vilket gör processen 'upptäcka' sällsynta subpopulationer enkelt och effektivt.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har något att avslöja.

Acknowledgments

Författarna har inga bekräftelser.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Fråga 143 hög-dimensionell analys Flow flödescytometri indragning t-SNE klustring värme kartor dimensionalitet minskning
ExCYT: Ett grafiskt användargränssnitt för att effektivisera analys av högdimensionella flödescytometri Data
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter