Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: En grafisk brugergrænseflade til at strømline analyse af høj-dimensionelle flowcytometri Data

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT er en MATLAB-baserede grafiske bruger Interface (GUI) at tillader brugernes hen til analysere deres flow flowcytometri data via almindeligt anvendte analyseteknikker for high-dimensionale data herunder dimensionalitet reduktion via t-SNE, en række automatiserede og manuelle klyngedannelse metoder, heatmaps og roman high-dimensionelle flow parceller.

Abstract

Med fremkomsten af flow cytometers stand til at måle et stigende antal parametre, fortsat forskere at udvikle større paneler fænotype udforske Karakteristik af deres cellulære prøver. Men disse teknologiske fremskridt give høj-dimensionelle datasæt, der er blevet stadig vanskeligere at analysere objektivt inden for traditionel manuel-baserede gating programmer. For at analysere og fremlægge data bedre partner forskere med bioinformaticians med ekspertise i at analysere høj-dimensionale data til at analysere deres flow flowcytometri data. Mens disse metoder har vist sig at være meget værdifulde i at studere flowcytometri, har de endnu at blive indarbejdet i en enkel og nem at bruge pakke for videnskabsfolk, der mangler beregningsressource eller programmering ekspertise. For at imødegå dette behov, har vi udviklet ExCYT, en MATLAB-baserede grafiske bruger Interface (GUI), strømliner analyse af høj-dimensionelle flow flowcytometri data ved at implementere almindeligvis ansat analytiske teknikker til høj-dimensionale data, herunder dimensionalitet reduktion af t-SNE, en række automatiserede og manuelle klyngedannelse metoder, heatmaps og roman high-dimensionelle flow parceller. ExCYT omfatter desuden traditionelle gating indstillinger af udvalgte populationer af interesse for yderligere t-SNE og clustering analyse samt mulighed for at anvende gates direkte på t-udstationerede parceller. Softwaren giver den ekstra fordel af at arbejde med enten kompenseret eller ukompenserede FCS filer. I tilfælde af, at efter købet kompensation er påkrævet, kan brugeren vælge at give programmet et bibliotek af enkelt pletter og en unstained prøve. Programmet registrerer positive begivenheder i alle kanaler og bruger denne vælge data til mere objektivt beregne kompensationsmatrix. I Resumé giver ExCYT en omfattende analyse rørledningen for at tage strømmen flowcytometri data i form af FCS filer og give enhver person, uanset beregningsmæssige uddannelse, for at bruge de nyeste algoritmiske tilgange i forståelsen af deres data.

Introduction

Fremskridt i flowcytometri samt fremkomsten af masse flowcytometri har tilladt klinikere og forskere til hurtigt at identificere og karakterisere fænotype biologisk og klinisk interessant prøver med nye niveauer af opløsning, skaber store høj-dimensionelle datasæt, der er information rige1,2,3. Mens konventionelle metoder til at analysere flow flowcytometri data såsom manuel gating har været mere ligetil for eksperimenter hvor der er få markører og disse markører har visuelt mærkbare populationer, kan denne tilgang undlade at generere reproducerbare resultater når du analyserer højere-dimensionelle datasæt eller dem med markører farvning på et spektrum. For eksempel, i en multi institutionelle undersøgelse, blev hvor intra cellulære farvning (ICS) assays der udføres for at vurdere reproducerbarhed quantitating antigen-specifikke T-celle svar, trods gode sammenlignende nøjagtighed, analyse, især gating, indført en betydelig kilde til variation4. Derudover er processen med manuelt gating befolkningens interesser, udover at være stærkt subjektive meget tidskrævende og labor intensiv. Men problemet med at analysere høj-dimensionelle datasæt i en robust, effektiv og rettidig måde er ikke en ny forskning videnskaber. Gen expression undersøgelser generere ofte ekstremt høj-dimensionelle datasæt (ofte om hundredvis af gener) hvor manuel former for analyse ville være simpelthen umuligt. For at tackle analyse af disse data sæt, har der været meget arbejde med at udvikle bioinformatic værktøjer til at analysere gen expression data5. Disse algoritmiske tilgange har netop for nylig vedtaget i analysen af flowcytometri data som antallet af parametre er steget og har vist sig for at være uvurderlig i analysen af disse høj dimensionel datasæt6,7.

Trods den generation og anvendelsen af en række algoritmer og software-pakker, der giver forskerne til at anvende disse høj-dimensionelle bioinformatic tilgange til deres flow flowcytometri data, er disse analytiske teknikker stadig stort set ubrugt. Selvom der kan være en række faktorer, der har begrænset udbredt vedtagelse af disse tilgange til flowcytometri data8, den store hindring vi formoder i brug af disse tilgange af forskere, er manglende beregningsmæssige viden. Faktisk er mange af disse softwarepakker (dvs., flowCore, flowMeans og OpenCyto) skrevet skal gennemføres i programmeringssprog såsom Rasmussen, der stadig kræver grundlæggende kendskab til programmering. Software-pakker, som FlowJo har fundet favor blandt videnskabsmænd på grund af enkelheden i brug og 'plug-n-play' natur, samt kompatibilitet med PC-operativsystem. For at give forskellige accepterede og værdifulde analytiske teknikker til videnskabsmand uvante programmering, har vi udviklet ExCYT, en anskuelighed bruger grænseflade (GUI), der nemt kan installeres på en PC/Mac, der trækker mange af de nyeste teknikker herunder dimensionalitet reduktion for intuitiv visualisering, en række klyngedannelse metoder nævnt i litteraturen, sammen med nye funktioner til at udforske output af disse klynger algoritmer med heatmaps og roman high-dimensionelle flow/boks parceller.

ExCYT er en anskuelighed brugergrænseflade bygget i MATLAB og derfor kan enten køres i MATLAB direkte eller et installeringsprogram er forudsat der kan bruges til at installere softwaren på enhver PC/Mac. Softwaren er tilgængelig på https://github.com/sidhomj/ExCYT. Vi præsenterer en detaljeret protokol for hvordan til at importere data, pre-behandle det, adfærd t-udstationerede dimensionalitet reduktion, klynge data, sortere og filtrere klynger baseret på brugerens præferencer og vise oplysninger om klynger af interesse via heatmaps og roman høj-dimensionelle flow/boks parceller ()figur 1). Akser i t-udstationerede parceller er vilkårlig og i arbitrære enheder og som sådan ikke altid vist i tallene for enkelheden i brugeren grænseflade. Farve af datapunkter i "T-udstationerede Heatmaps" er fra blå til gul baseret på signalet fra den angivne markør. I clustering løsninger, baseret farven på datapunktet vilkårlig på klyngenummer. Alle dele af arbejdsprocessen kan udføres i de enkelt panel GUI ()figur 2 & tabel 1). Endelig vil vi demonstrere brugen af ExCYT på tidligere offentliggjorte data at udforske den immun landskab af renalcellecarcinom i litteratur, også analyseres med lignende metoder. Prøven datasæt vi brugt til at oprette tallene i dette manuskript sammen med protokollen nedenfor kan findes på https://premium.cytobank.org/cytobank/projects/875, efter registrering af en konto.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. indsamling og forberede flowcytometri Data

  1. Placere alle enkelt pletter i en mappe af sig selv og mærke af kanalnavnet (ved fluorophore, ikke markør).

2. data import & forbehandling

  1. For at holde pause eller gemme hele denne analyse pipeline, brug knappen Gem arbejdsområde nederst til venstre af programmet til at gemme arbejdsområde som en '. MAT' fil, der senere kan indlæses via knappen Load arbejdsområde . Kør ikke mere end én forekomst af programmet ad gangen. Derfor, når du lægger et nyt arbejdsområde, Sørg for at tjekke der er ingen andre forekomst af ExCYT kører.
  2. Til at begynde analysen pipeline, først vælge type af flowcytometri (Flow flowcytometri eller masse flowcytometri – CYTOF), under Fil udvalg parametre vælge antallet af arrangementer for at prøve fra fil (til dette eksempel brug 2.000). Når data er blevet importeret, vil en dialogboks poppe op informere brugeren at data er blevet importeret.
  3. Tryk på knappen Auto-kompensation til at gennemføre en valgfri auto-kompensation trin, som gjort af Bagwell & Adams9. Vælg den mappe, der indeholder enkelt pletter. Vælg den unstained prøve inden for bruger interface dialog.
    1. Placer en frem/side-scatter gate på nogen af prøverne i denne mappe, der skal bruges til at vælge begivenheder til at beregne kompensationsmatrix. Det anbefales at bruge den unstained prøve for dette formål. På dette tidspunkt, er en algoritme blevet gennemført for at indstille konsekvent tærskler på de 99th percentilen af den unstained prøve at definere positive begivenheder i hver af de enkelt pletter til at beregne kompensationsmatrix. Når dette er færdig, vil en dialogboks informere brugeren at kompensationen har udført.
  4. Næste, tryk på Gate befolkning og vælg populationer af celler af interesse, som er konventionen i flow flowcytometri analyser. Når befolkningen af celler er markeret, Angiv antal procentdel af begivenheder downstream analyse (i denne 10.000 begivenheder).
  5. Dernæst skal du vælge de antal kanaler anvendes til analyse i listefeltet i længst til højre for boksen forbehandling (bruge de specifikke kanaler i eksemplet).

3. t-udstationerede nationale analyse

  1. Tryk på knappen T-udstationerede at få programmet til at begynde starten til at beregne det reducerede dimensionalitet datasæt for visualisering i vinduet under knappen t-SNE. Tryk på Gem TSNE billedefor at gemme billedet af t-SNE. På en maskine med 8 CPU @ 3,4 GHz og 8 GM RAM dette trin bør tage omkring 2 minutter for 10.000 begivenheder, 10 minutter til 50.000 begivenheder, og 20 minutter til 100.000 begivenheder.
  2. Oprette en 't-udstationerede heatmap', som det ses i flere CYTOF publikationer10,11, skal du vælge en mulighed på lokalmenuen Markør-specifikke t-SNE (bruge de specifikke markører CD64 eller CD3, som vist i eksemplet). En figur vil poppe op viser et heatmap repræsentation af handlingen t-udstationerede nationale eksperter, som kan gemmes til figur generation.
  3. Vælg interesseområder i t-udstationerede parceller af brugeren for videre downstream analyse ved hjælp af knappen Gate t-SNE .

4. cluster analyse

  1. Til at begynde klyngedannelse analyse, skal du vælge en indstilling i Clustering metode listbox (i dette eksempel os DBSCAN med en afstand faktor 5 i dialog boksen til højre for for listbox). Tryk på knappen klynge .
  2. Brug en af følgende indstillinger for automatiske klyngedannelse algoritmer findes i panelet 'Automatiseret klyngedannelse parametre':
    1. Hårdt KMEANS (på t-SNE): anvende k-betyder klyngedannelse til reduceret 2-dimensionelle t-udstationerede nationale data og kræver, at antallet af klynger til algoritme12.
    2. Hårdt KMEANS (på HD Data): anvende k-betyder klynger til de oprindelige high-dimensionale data, der blev givet til t-udstationerede algoritme. Igen, skal antallet af klynger gives til algoritme.
    3. DBSCAN: Anvende metoden klynger af klynger, kaldet tæthed-baserede rumlige Clustering applikationer med støj13 der klynger reduceret 2-dimensionelle t-udstationerede nationale data og kræver en ikke-dimensional afstand faktor, der afgør den generelle størrelse af den klynger. Denne type af klyngedannelse algoritme er velegnet til klynge t-udstationerede reduktion, som det er i stand til klyngen ikke-kugleformede klynge, der er ofte til stede i de reduceret t-udstationerede repræsentation. Desuden, at det fungerer på det 2-dimensionale data, er det en af de hurtigere klyngedannelse algoritmer.
    4. Hierarkiske klyngedannelse: Anvende den konventionelle hierarkisk clustering metode til high-dimensionale data hvor matrixen hele euklidisk afstand beregnes mellem alle begivenheder før du videregiver algoritmen en afstand faktor, der angiver størrelsen af klyngen.
    5. Netværk graf- Baseret: Anvende en clustering metode, der har været mest for nylig indført i analysere flow flowcytometri data, når der er sjælden delpopulationer, som brugeren ønsker at opdage11,14. Denne metode bygger på først at oprette en graf, der bestemmer forbindelser mellem alle begivenheder i dataene. Dette trin består i at give en første parameter for at oprette den graf, som er antallet af k-nærmeste naboer. Denne parameter styrer normalt størrelsen af klynger. På dette tidspunkt, affyrer en anden dialogboks oppe beder brugeren om at ansætte en af 5 klyngedannelse algoritmer, der anvendes på grafen. Disse omfatter 3 valgmuligheder til at maksimere modularitet af grafen, metoden Danon og en spektral klyngedannelse algoritme14,15,16,17,18. Hvis man ønsker et generelt hurtigere klyngedannelse løsning, anbefaler vi spektrale klynger eller den hurtigt grådige modularitet maksimering. Mens modularitet maksimering metoder sammen med metoden Danon bestemme det optimale antal klynger, kræver spektrale klyngedannelse antallet af klynger til programmet.
    6. Selv arrangeret kort: Ansætte en kunstigt neuralt netværk til klynge af høj-dimensionale data.
    7. GMM-forventning om profitmaksimering: oprette en Gaussisk blanding Model ved hjælp af forventning maksimering (EM) teknik for at klynge af høj-dimensionale data. 19 denne type af clustering metode også kræver, at brugeren indtaste antallet af klynger.
    8. Variational Bayesiansk inferens for GMM: oprette en Gaussisk blanding Model, men i modsætning til EM, det kan automatisk bestemme antallet af blandingen komponenter k.20 , mens programmet kræver en række klynger skal gives (større end den Forventet antal klynger), algoritmen vil bestemme det optimale antal på sin egen.
  3. Tryk på knappen Vælg klyngen manuelt at tegne et sæt brugerdefinerede klynger for at undersøge et bestemt område af t-udstationerede plot. Af note, kan ikke klynger dele medlemmer (dvs. hver event kan kun tilhøre 1 cluster).

5. klynge filtrering

  1. Enhed af klynger identificeres enten manuelt eller via en af de automatiske metoder beskrevet ovenfor kan filtrere som følger.
    1. Vælg en mulighed for at sortere klynger (i panelet Klynge Filter ) af nogen af de markører, målt i eksperimentet, pop op-menuen form . Tryk på knappen Stigende/faldende til højre for pop op-menuen sortere for at angive, om ordren stigende eller faldende. Opdatere listen af klynger i 'Klynger (filtrering)' liste vil og omgruppere dem i faldende rækkefølge af median klynge udtryk af denne markør. Den procentdel, der er angivet i 'Klynger (filtrering)' liste angiver procent af befolkningen, som denne klynge repræsenterer.
    2. Hvis du vil angive en minimumstærskel værdi for en given klynge på tværs af en bestemt kanal, Vælg en indstilling på lokalmenuen tærskel (i dette eksempel os markør CD65 og sæt en tærskel på 0,75). Enten skal du skrive en værdi i boksen numeriske under grafen eller bruge skyderen til at indstille en tærskel. Når tærsklen er indstillet, skal du trykke på Tilføj over tærsklen eller Tilføje under tærsklen til at angive retningen af tærskel. Når denne grænse er sat, vil det blive opført i boksen tærskler ved siden af panelet «Cluster Filter», hvor markøren, tærskelværdien, og retningen vil blive opført, så brugeren er klar over, hvilke tærskler anvendes i øjeblikket. Endelig, t-udstationerede plot vil opdatere af sløring ud klynger, der ikke opfylder kravene i filtrering og 'Klynger (filtrering)' liste opdateres for at vise klynger, der opfylder kravene til filtrering.
    3. Du kan angive en minimumstærskel for hyppigheden af en klynge, skrive en numerisk cut-off i Klynge frekvens tærskel (%) boksen i panelet klynge Filter (i dette eksempel brug 1%).

6. cluster analyse & visualisering

  1. Du vælger klynger for yderligere analyse og visualisering, vælge klynger i klynger (filtrering) listbox og tryk på knappen Vælg à at flytte dem til den Klynge analysere listbox.
  2. Oprette heatmaps af klynger, Vælg klynger af interesse i den Klynge analysere listbox og tryk på knappen HeatMap af klynger . Når der trykkes på denne knap, vil en figur poppe op indeholdende en zonekort sammen med dendrograms på de klynge og parameter akser. Dendrogram på den lodrette akse vil gruppere klynger af dem, der er nært beslægtede, mens dendrogram på vandret akse vil gruppere markører, der knyttes sammen. Hvis du vil gemme heatmap, tryk fil | Eksportere Setup | Eksportere.
  3. Hvis du vil oprette en 'Høj dimensionel Box Plot' eller 'Høj dimensionel Flow Plot', Vælg klynger af interesse i den Klynge analysere listbox og tryk på enten knappen Høj dimensionel Box Plot eller knappen Høj dimensionel Flow Plot . Disse arealer kan bruges til visuelt at vurdere fordelingen af givet kanaler af forskellige klynger på tværs af alle dimensioner.
  4. For at vise klynger i traditionelle 2D flow parceller, Vælg transformation (lineær, log10, arcsinh) og kanal i Konventionel Flow Plot panel og tryk konventionel Flow Plot.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

For at teste anvendeligheden af ExCYT, analyseret vi en kurateret data, der er udgivet af Chevrier et al. med titlen «en immun Atlas af klart Renal karcinom' hvor gruppen gennemførte CyTOF analyse med en omfattende immun panel på tumor prøver taget fra 73 patienter11. To separate paneler, en myeloid og lymfoide panel, blev brugt til fænotype karakterisere tumor mikromiljø. Formålet med vores undersøgelse var at sammenfatte resultaterne af deres t-udstationerede nationale eksperter og cluster analyse, viser, at ExCYT kunne bruges til at komme til de samme konklusioner samt vise yderligere metoder til visualisering og cluster analyse.

I det oprindelige manuskript beskrevet gruppen 22 T-celle klynger identificeres af panelet lymfoide og 17 celle klynger identificeres af panelet myeloide. I figur 3 og figur 4 af publikationen viser gruppen heatmaps af klynger, t-udstationerede parceller med farvekodede clustering løsninger, og t-udstationerede heatmaps i subpanels A, B, & C. For at foretage analysen, vi havde fået manuelt gated oplysningerne fra Cytobank og stikprøven 2.000 begivenheder fra hver fil eller tog hele filen, hvis det havde mindre end 2.000 begivenheder, efter analyse rørledningen illustreret i det originale manuskript. På dette tidspunkt vi stikprøven i alt 100.000 begivenheder via vores post gating undersampling parameter, foretaget t-udstationerede analyse, og brugt en række klyngedannelse metoder til at udforske data på forskellige måder.

Vi undersøgte først, de myeloide panel ved at følge den samme analyse rørledning som det originale manuskript ved at udfylde den t-udstationerede analyse og skabe heatmaps af de forskellige markører (figur 3A). Mens det originale manuskript normaliseret t-udstationerede heatmaps til den 99th fraktil for hver markør, gør ExCYT ikke denne form for normalisering for sin heatmaps. Imidlertid observeret lignende fordelinger af markør Co udtryk som beskrevet i det oprindelige manuskript. Vi derefter anvendt et netværk graf-baseret metode til klynger af data ved at oprette grafen med 100 k-nærmeste naboer og klyngedannelse grafen via optimering modularitet af grafen ved hjælp af hurtig-grådige gennemførelsen inden for ExCYT, hvor vi fandt 19 delpopulationer af celler (figur 3B). Sammenligne heatmap af disse klynger, lavet af ExCYT med heatmap offentliggøres i det oprindelige manuskript, bemærkede vi, at vi var i stand til at identificere lignende klynger af myeloide celler (figur 3 c). Bemærk, det originale manuskript identificeres og sammenholdes to delpopulationer af myeloide celler, som vi identificerede i vores analyse, defineret af HLA-DRintCD68intCD64intCD36+CD11b+ (klynge 13) og HLA-DR+ CD4+CD68+CD64+CD36-CD11b- (Cluster-18). Visualisering af høj-dimensionelle box plot af disse to befolkninger viste statistisk signifikante forskelle (Mann-Whitney) i seks markører nævnt (fig. 1 d).

Næste, vi analyseret den lymfoide panel med en mere konventionel og hurtigere hierarkisk klyngedannelse tilgang. Denne fremgangsmåde gav lignende markør distributioner via t-udstationerede heatmaps (figur 4A). Desuden viste klynger af data via hierarkisk klynger (figur 4B), lignende klynger af lymfoide celler (figur 4 c). Bemærk, vi også identificeret den unikke regulerende T-celle befolkning fra det originale manuskript defineret som CD4+CD25+Foxp3+CTLA-4+CD127- (klynge 17) via vores high-dimensionelle flow plot (figur 4D).

Endelig, vi ønskede at ansætte en metode inden for ExCYT hurtigt og kvantitativt vurdere Co foreninger blandt markører. Vi begyndte ved hjælp af en hård k-betyder klyngedannelse algoritme for at fastsætte 5.000 klynger på to-dimensionelle t-udstationerede data (figur 4E). Vi brugte derefter den mediane udtryk af alle markører for alle disse klynger til at oprette et heatmap fra disse klynger (figur 4F). Da disse heatmaps klynge rækker samt kolonner, der er lignende, denne metode til at abstrahere data ved at anvende et finmasket af klynger og derefter oprette et heatmap tillader os at afhente Co foreninger let, såsom fælles sammenslutning af Tim-3, PD-1, CD38, og 4-1BB.

Figure 1
Figur 1: ExCYT Pipeline & funktionerne. (A) ExCYT begynder ved rå FCS dataimporten, anvende valgfri kompensation, gating og tilfældige undersampling inden downstream analyse. Dette sikrer, at alle begivenheder ved at blive analyseret er relevante for eksperimentet ved at blive analyseret. t-udstationerede dimensionalitet reduktion udføres derefter for at visualisere alle begivenheder og t-udstationerede heatmaps kan genereres for at visualisere fænotypiske distributioner. Endelig, en række klyngedannelse algoritmer kan anvendes på enten t-udstationerede transformation eller high-dimensionelle rådata. (B) roman sortering og tærskel funktioner kan brugerne hurtigt sortere gennem eventuelt hundredvis af klynger til at finde dem, af interesse. (C) Heatmaps af klynger kan oprettes for at undersøge, hvordan flere klynger sammenligne med hinanden såvel som markører Co knytte. (D) roman high-dimensionelle flow/boks plots kan oprettes som en form for back-gating klynger på oprindelige data mens Værdistigningen den høj-dimensionelle karakter af data. Venligst klik her for at se en større version af dette tal.

Figure 2
Figur 2: ExCYT grafiske brugergrænseflade: ExCYT grafisk brugergrænseflade giver mulighed for en strømline arbejdet flow arbejder fra venstre til højre i panelet som brugeren importerer deres data, udfører t-udstationerede dimensionalitet reduktion, klyngedannelse, og endelige cluster analyse og visualisering. Venligst klik her for at se en større version af dette tal.

Figure 3
Figur 3: Sammenfatning af myeloide delpopulationer fra Chevrier et al. (A) Token t-udstationerede heatmaps af myeloide panel (B) t-udstationerede plot af myeloide panelet farve kodet af net-grafen klyngedannelse algoritme (C) Heatmap af klynger identificeres af klyngedannelse løsning på myeloide panel (D) sammenlignende høj dimensional box plot sammenligne kontrasterende myeloide delpopulationer (klynger 13 & 18) der henvises til i originale manuskript venligst klik her for at se en større version af dette tal.

Figure 4
Figur 4: Sammenfatning af lymfoide delpopulationer fra Chevrier et al. (A) Token t-udstationerede heatmaps af lymfoide panel (B) t-udstationerede plot af lymfoide panelet farve kodet af hierarkisk klyngedannelse algoritme (C) Heatmap af klynger identificeres af klyngedannelse løsning på lymfoide panel (D) høj dimensionel flow Plot af identificerede regulerende T-celle population (klynge 17) i originale manuskript (E) Clustering løsning 5.000 klynge hårdt k-betyder analyse på t-udstationerede data (F) Heatmap af klynger identificeres af k-betyder klyngedannelse løsning på lymfoide panelet viser markør Co foreninger. Venligst klik her for at se en større version af dette tal.

Lol Beskrivelse Navn (i GUI)
1 Vælg type af flowcytometri NA
2 Tilfældige undersampling af rådata NA
3 Vælg filer til analyse Vælg fil(er)
4 Auto-erstatning af rå data baseret på Register af enkelt pletter til software Auto-kompensation
5 Gating for at vælge begivenheder for t-SNE og clustering analyse Gate befolkning
6 Tilfældige undersampling af gated data (absolutte tal) NA
7 Tilfældige undersampling af gated data (procent af gated befolkning) NA
8 Vælg kanaler for analyse NA
9 Kør t-udstationerede dimensionalitet reduktion t-SNE
10 t-udstationerede vindue NA
11 Gem arbejdsområde Gem arbejdsområde
12 Indlæse arbejdsrummet Indlæse arbejdsrummet
13 Oprette t-udstationerede heatmap på Vælg markør NA
14 Gate t-SNE til at re-do t-udstationerede analyse af udvalgte befolkning Gate t-SNE
15 Gemme t-udstationerede vindue som billede Gemme TSNE billede
16 Vælg klyngedannelse algoritme Clustering metode
17 Angiv klyngedannelse Parameter for givet algoritme NA
18 Cluster analyse Klynge
19 Tegne klynger manuelt Vælg klyngen manuelt
20 Klare alle klynger at omgøre cluster analyse Klart klynger
21 Vis klynger under aktuelle filterbetingelser Klynger (filtrering)
22 Fjerne udvalgte klynger fra klyngen analysere listefeltet Fjerne <--
23 Tilføje klynge til klynge analysere listefeltet Vælg-->
24 Oprette konventionelle heatmap af alle begivenheder i analyse HeatMap af begivenheder
25 Sorter klynger af Marker mærke Sorter
26 Sæt grænsen af Vælg markør Tærskel
27 Oprette konventionelle heatmap af udvalgte klynger fra klyngen analysere listefeltet HeatMap af klynger
28 Vende rækkefølgen af form Stigende/faldende
29 Ryd alle tærskler Ryd alle tærskler
30 Indstil frekvens tærskel for klynger Klynge frekvens tærskel (%)
31 Liste over nuværende tærskler aktive på 'Klynger (filtrering)' listefeltet Tærskler
32 Høj dimensionel Box Plot Høj dimensionel Box Plot
33 Høj dimensionel Flow Plot Høj dimensionel Flow Plot
34 Vandrette akse parameter for konventionel flow plot NA
35 Lodrette akse parameter for konventionel flow plot NA
36 Data transformation for konventionel flow plot på vandret akse NA
37 Data transformation for konventionel flow plot på lodret akse NA
38 Oprette konventionel flow plot Konventionel Flow Plot
39 Vis klynger for analyse NA

Tabel 1: Oversigt over alle funktioner i ExCYT GUI

Navnet på Software-pakke ExCYT CYT FCS Express flowCore openCyto FlowMeans
Programtype MATLAB MATLAB Enkeltstående program RASMUSSEN RASMUSSEN RASMUSSEN
Pris til bruger Gratis Gratis $1.000 Gratis Gratis Gratis
Grafisk brugergrænseflade Ja Ja Ja Nej Nej Nej
Dimensionalitet reduktion teknikker t-SNE t-SNE, PCA t-SNE, PCA, SPADE ingen ingen ingen
Klyngedannelse algoritmer K-midler
DBSCAN
Hierarkisk klynger
Self-Organized kort
Flere netværk-graf baseret metoder
GMM - EM
GMM - Variational Bayesiansk inferens
K-midler
GMM - EM
Enkelt netværk-graf baseret metode (Phenograph)
K-midler ingen automatisering af manuel gating arbejdsproces K-midler
Evnen til at sortering/Filter klynger Ja Nej Nej Nej Nej Nej
Høj dimensionel Flow parceller Ja Nej Nej Nej Nej Nej

Tabel 2: Oversigt over Software-assisteret Flow flowcytometri analyse løsninger

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Her præsenterer vi ExCYT, en roman anskuelighed brugergrænseflade køre MATLAB-baserede algoritmer for at strømline analyse af høj-dimensionelle flowcytometri data, hvilket giver enkeltpersoner med ingen baggrund i programmering til at gennemføre senest i high-dimensionale data analyse algoritmer. Tilgængeligheden af denne software til det bredere videnskabelige samfund vil tillade forskere til at udforske deres flow flowcytometri data i en intuitiv og enkel arbejdsgang. Gennem udførelse t-udstationerede dimensionalitet reduktion, anvende en clustering metode, at være i stand vil til sortering/filter gennem disse klynger hurtigt, og gøre fleksible, tilpasselig heatmaps og høj-dimensionelle flow/boks parceller, forskere være i stand til ikke kun forstå de entydigt defineret delpopulationer i deres prøver, men vil være i stand til at skabe visuelle effekter, der er intuitiv og let at forstå deres kolleger.

Mens programmet er fleksible i håndtering af en række forskellige datatyper (konventionelle flowcytometri vs masse flowcytometri), er der et par overvejelser for optimal nytte af programmet. Først af disse er med hensyn til datakvalitet, specielt af flow flowcytometri data. Ordentlig kompensation og opløsning af overlappende emission spectra er af afgørende betydning. Dårligt kompenseret data kan uforvarende føre til falsk Co sammenslutninger af markører og dannelsen af klynger, der ikke er sande biologiske betydning. Derfor er det yderst tilrådeligt at inputdataene er af lydkvalitet før du fortsætter med t-udstationerede analyse og videre downstream analyse. Derudover kræver anvendelse af den automatiske kompensation algoritme implementeret i ExCYT klare enkelt pletter for alle kanaler for at præcist beregne kompensation parametre.

En anden vigtig overvejelse for brug af ExCYT er når sammenkæde flere FCS filer i én analyse (som vist i dette håndskrift), de skal være sammenlignelige på tværs af alle kanaler. Det betyder først og fremmest, at det samme panel skal bruges på tværs af alle prøver, og at der er ingen drift mellem prøver på tværs af alle kanaler. For eksempel, hvis man skulle læse to prøver på separate dage og farves CD8 i FITC på begge dage men spændingen på forskellige blev sat forskelligt på én dag resulterer i et lidt skiftede CD8 befolkning, kunne man generere falske klynger i den efterfølgende analyse , da dette skift blev dannet som en funktion af instrument variation og ikke på grund af biologiske betydning. Mens fremtidige versioner af ExCYT kan være i stand til at normalisere prøver at deres enkelt pletter, på dette tidspunkt, skal nøje overvejelser gøres, FCS filer kan sammenlignes med hinanden før du importerer dem til ExCYT.

Endelig, processen med klynger er ikke en, der er absolut/stiv. Forskellige klyngedannelse algoritmer og parametre kan generere forskellige clustering løsninger. Om løsning af algoritmen er passende er for brugeren at bestemme ved at syntetisere deres forståelse af biologi med klyngedannelse løsning. For eksempel når forståelse immun miljøet af tumorer, kan man være interesseret i makroskopisk klynger (dvs. T celler vs B celler vs myeloide celler) mens en anden kan være interesseret i delpopulationer af makroskopiske klynger. Opløsning af klyngerne bestemmes af brugeren og derfor ingen enkelt clustering løsning er "korrekte." Dette er en af de vigtigste fordele ved at bruge de høje dimensionelle flow grunde til rådighed i ExCYT. Evnen til at visualisere distribution af en given klynge på tværs af alle kanaler kan hjælpe brugeren bestemme, om de har grupperet i ikke kun et biologisk relevant måde, men på en måde, der er relevante for den videnskabelige spørgsmål i eksperimentet. Mens vores mål er at tilbyde et utal af metoder, der anvendes i litteraturen til at klynge high-dimensionelle flow flowcytometri data samtidig give yderligere metoder af klyngedannelse, anbefaler vi at bruge metoder som k-midler og DBSCAN for at udforske data via hurtigt iteration på klynge antal og størrelse og retning af net-grafen og Gaussisk-blandet model tilgange for mere robust men mere tidskrævende tilgange.

I betragtning af disse overvejelser, ExCYT er stadig et meget fleksibelt og værdifuldt redskab for at udforske høj dimensionel flowcytometri data, og tilbyder enestående/skelne funktioner end andre tilgængelige pakker til rådighed til at udføre denne type analyse (tabel 2) . Første, ExCYT adskiller sig over de fleste flow flowcytometri analyse tilgange udnytte dimensionalitet reduktion og klyngedannelse algoritmer ved sin evne til at blive brugt uden scripting/programmering viden. Derudover ved en sammenlægning af mange klyngedannelse algoritmer omtalt under hele litteraturen, mener vi, at vi giver de fleste muligheder for klyngedannelse data. Endelig, vores unikke træk ved klynge filtrering og sortering sammen med skærm via roman høj dimensionel flow parceller, tillader brugernes hen til udforske Karakteristik af deres klynger, hurtigt og effektivt, at gøre processen med 'opdagelse' sjældne delpopulationer enkel og effektiv.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ikke noget at oplyse.

Acknowledgments

Forfatterne har ingen anerkendelser.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Retraktion spørgsmålet 143 Flow flowcytometri høj-dimensionelle analyse t-SNE klyngedannelse varme kort dimensionalitet reduktion
ExCYT: En grafisk brugergrænseflade til at strømline analyse af høj-dimensionelle flowcytometri Data
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter