Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: En grafisk bruker grenseflate for effektivisering analyse av høy-dimensjonale cytometri Data

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT er en MATLAB-basert grafisk brukergrensesnitt (GUI) det innrømmer brukernes å analysere flyt cytometri data via vanlig ansatt analytiske teknikker for høy-dimensjonale data inkludert dimensionality reduksjon via t-SNE, en rekke automatiserte og manuelle klynging metoder, heatmaps og romanen høy-dimensjonale flyt i plotter.

Abstract

Med ankomsten av flyt cytometers stand til å måle et økende antall parametere, fortsette forskere å utvikle større paneler for å utforske svært egenskapene til deres cellular prøver. Men gir disse teknologiske fremskritt høy-dimensjonale datasett som har blitt stadig vanskeligere å analysere objektivt tradisjonell håndbok gating programmer. For å bedre analysere og presentere data, samarbeide forskere med bioinformaticians med kompetanse i å analysere høy-dimensjonale data for å analysere flyt cytometri data. Mens disse metodene har vist seg å være svært verdifull i å studere flowcytometri, har de likevel innarbeides i en enkel og lett-å-bruk pakke for forskere som mangler databehandlingsressurs eller programmering kompetanse. For å løse dette behovet, har vi utviklet ExCYT, en MATLAB-basert grafisk brukergrensesnitt (GUI) som forenkler analyse av høy-dimensjonale flyt cytometri data ved å implementere vanligvis ansatt analytiske teknikker for høy-dimensjonale data inkludert dimensionality reduksjon av t-SNE, en rekke automatiserte og manuelle klynging metoder, heatmaps og romanen høy-dimensjonale flyt tomter. I tillegg inneholder ExCYT tradisjonelle gating Alternativer Velg befolkninger rundt for ytterligere t-SNE og klynging analyse, samt muligheten til å bruke portene på t-SNE tomter. Programvaren gir den ekstra fordelen med å jobbe med enten kompensert eller uncompensated FCS-filer. Som etter oppkjøpet kompensasjon er nødvendig, kan brukeren velge å gi programmet en katalog av enkelt flekker og en unstained kvinne prøve. Programmet oppdager positive hendelser i alle kanaler og bruker denne merke data til å beregne mer objektivt kompensasjonsplanen. Oppsummert gir ExCYT en omfattende analyse rørledning å ta flyt cytometri data i form av FCS filer og gi noen person, uansett beregningsorientert opplæring, bruke de nyeste algoritmiske tilnærmingene forstå dataene.

Introduction

Fremskritt innen flowcytometri, samt bruk av masse cytometri har tillatt leger og forskere å raskt identifisere og karakterisere svært biologisk og klinisk interessant prøver med nye nivåer av oppløsning, skaper store høy-dimensjonale datasett som informasjon rik1,2,3. Mens konvensjonelle metoder for analyserer flyt cytometri som manuell gating har vært enklere for eksperimenter der det er få markører og disse markørene har visuelt synlig bestander, kan denne tilnærmingen ikke generere reproduserbar resultater når du analyserer høyere-dimensjonale datasett eller de med indikatorer flekker på et spektrum. For eksempel i en multi institusjonelle studie, ble der intra mobilnettet flekker (ICS) analyser utført for å vurdere reproduserbarhet av quantitating antigen-spesifikke T celle svar, til tross for gode inter-laboratory presisjon, analyse, spesielt gating, introduserte en betydelig kilde til variasjoner4. Videre er prosessen med manuelt gating befolkningen av interesser, foruten å være svært subjektive svært tidkrevende og arbeidsintensiv. Men er problemet med analysere høy-dimensjonale datasett i en robust, effektiv og rimelig måte ikke en ny forskning realfag. Gene expression studier generere ofte svært høy-dimensjonale datasett (ofte på hundrevis av gener) der manuell former for analyse skulle bare umulig. For å takle analyse av disse datasett, har det vært mye arbeid i å utvikle bioinformatic verktøy for å analysere gene expression data5. Disse algoritmisk tilnærminger har bare nylig vedtatt analyse av cytometri data som antall parametere har økt, og har vist seg for å være uvurderlig i analysen av disse høy dimensjonal datasett6,7.

Til tross for den generasjon og anvendelse av en rekke algoritmer og programvarepakker som tillater forskere å søke disse høy-dimensjonale bioinformatic tilnærminger til flyt cytometri dataene, fortsatt disse analytiske teknikker hovedsakelig ubrukt. Mens det kan være en rekke faktorer som har begrenset utbredt bruk av disse metodene til cytometri data8, den store hinder vi mistenker i bruk disse tilnærmingene av forskere, er mangel på beregningsorientert kunnskap. Faktisk er mange av disse programvarepakkene (dvs. flowCore, flowMeans og OpenCyto) skrevet implementeres i programmeringsspråk som R som fortsatt krever materielle programmering kunnskap. Programvarepakker som FlowJo har funnet favør blant forskere på grunn av enkelhet av bruk og "plug-n-play" natur, i tillegg til kompatibilitet med operativsystemet PC. For å gi en rekke akseptert og verdifulle analytiske teknikker forsker ukjent programmering, har vi utviklet ExCYT, en grafisk bruker grenseflate (GUI) som enkelt kan installeres på en PC/Mac som trekker mange av de nyeste teknikkene inkludert dimensionality reduksjon for intuitiv visualisering, en rekke klynging metoder i litteraturen, sammen med romanen funksjoner å utforske produksjon av disse klynging algoritmer med heatmaps og roman høy-dimensjonale flyt/boks tomter.

ExCYT er et grafisk brukergrensesnitt i MATLAB og derfor kan enten kjøres i MATLAB direkte eller installasjonsprogram finnes som kan brukes til å installere programvaren på en PC/Mac. Programvaren er tilgjengelig på https://github.com/sidhomj/ExCYT. Vi presenterer en detaljert protokoll å importere data, behandle det, gjennomføre t-SNE dimensionality reduksjon, klyngedata, sortere og filtrere klynger basert på brukerens preferanser og vise informasjon om i klynger av interesse via heatmaps og roman høy-dimensjonale flyt/boks tegnes ()figur 1). Akser i t-SNE tomter er vilkårlig og tilfeldig enheter og slik som ikke alltid vist i tallene for enkelhet av brukeren grenseflate. Farging av datapunktene i "t-SNE Heatmaps" er fra blå til gul basert på signalet fra den angitte markøren. I klynger løsninger er fargen på datapunktet basert vilkårlig klynge nummer. Alle deler av arbeidsflyten kan utføres i én panelet GUI ((figur 2 ) & tabell 1). Til slutt, viser vi bruk av ExCYT på tidligere publiserte data å utforske immun landskapet av Nyrecellekarsinom i litteraturen, også analysert med lignende metoder. Eksempel datasettet vi pleide å opprette tallene i dette manuskriptet med protokollen nedenfor kan finnes på https://premium.cytobank.org/cytobank/projects/875, ved å registrere en konto.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. samle og forberede cytometri Data

  1. Sett alle enkelt flekker i en mappe ved seg selv og etiketten av kanalnavnet (ved fluorophore, ikke markør).

2. data import og pre-prosessering

  1. For å stanse eller lagre hele denne analyse rørledningen, bruke knappen Lagre arbeidsområde nederst til venstre for programmet for å lagre arbeidsområdet som en ". MAT "fil som senere kan lastes via knappen Load arbeidsområde . Ikke Kjør flere forekomster av programmet samtidig. Derfor når du legger et nytt arbeidsområde, pass på å sjekke det er ingen andre forekomst av ExCYT kjører.
  2. For å begynne analyse rørledningen, først velge typen cytometri (Flow cytometri eller masse cytometri-CYTOF), under Utvalg parametere Velg antall hendelser å prøve fra filen (for eksempel bruk 2000). Når dataene er importert, vil en dialogboks dukker opp informerer brukeren om at dataene er importert.
  3. Trykk på Auto-kompensasjon for å gjennomføre en valgfri auto-kompensasjon trinn, som gjort av Bagwell & Adams9. Velg mappen som inneholder enkelt flekker. Velg unstained kvinne utvalget innen brukergrensesnittet dialogen.
    1. Plass en forover/side-scatter gate på noen av eksemplene i denne mappen som skal brukes til å velge hendelser å beregne kompensasjonsplanen. Det anbefales å bruke unstained kvinne utvalget for dette formålet. På dette punktet, er en algoritme implementert for å angi konsekvent terskler på det 99te persentilet av unstained kvinne prøven å definere positive hendelser i hver enkelt flekker beregne kompensasjonsplanen. Når dette er fullført, vil en dialogboks informere brukeren at erstatningen er utført.
  4. Deretter trykk Gate befolkningen og velg bestander av celler av interesse, som er konvensjonen i flyt cytometri analyser. Når populasjon av celler er valgt, angir du antall prosent av hendelser nedstrøms analyse (i denne 10.000 hendelser).
  5. Deretter velger du antall kanaler brukes til analyse i liste i høyre side av boksen forhåndsbehandling (bruker bestemte kanaler vist i eksemplet).

3. t-SNE analyse

  1. Trykk t-SNE å begynne start til å beregne redusert dimensionality datasettet for visualisering i vinduet under knappen t-SNE. Hvis du vil lagre bilde av t-SNE, trykker du Lagre TSNE bilde. På en maskin med 8 CPU @ 3,4 GHz og 8 GM RAM dette trinnet tar ca 2 minutter for 10.000 hendelser, 10 minutter for 50.000 hendelser, og 20 minutter for 100.000 hendelser.
  2. Opprette en 't-SNE heatmap ", sett i flere CYTOF publikasjoner10,11, Velg et alternativ på hurtigmenyen Markør-spesifikke t-SNE (bruk bestemt markører CD64 eller CD3 som vist i eksemplet). En figur vil komme opp å vise en heatmap representasjon av t-SNE tomten som kan lagres for figur generasjon.
  3. Velg interesseområder t-SNE tomter av brukeren for videre nedstrøms analyser ved hjelp av knappen Gate t-SNE .

4. klynge analyse

  1. For å begynne klynging analyse, velge i Klynger metoden liste (i dette eksempelet oss DBSCAN med en avstand faktor 5 i dialog boksen til høyre for listen). Trykk på klyngen .
  2. Bruk en av følgende alternativer for automatiserte grupperingsalgoritmer i "Automatisert Clustering Parameters" panelet:
    1. Hard KMEANS (på t-SNE): bruke k-betyr clustering redusert 2-dimensjonal t-SNE dataene og krever antallet klynger skal gis til de algoritme12.
    2. Hard KMEANS (på HD Data): bruke k-betyr clustering til originaldataene høy-dimensjonale som ble gitt til t-SNE algoritmen. Igjen, må antallet klynger gis algoritmen.
    3. DBSCAN: Bruke klynging metoden klynging, kalt tetthet-baserte romlige Clustering programmer med støy13 som klynger redusert 2-dimensjonal t-SNE dataene og krever en ikke-dimensjonale avstand faktor som bestemmer den generelle størrelsen på den klynger. Denne typen klynging algoritmen er godt egnet til klyngen t-SNE reduksjon som det er kjøpedyktig for klyngen ikke-spheroidal klynge som er ofte tilstede i redusert t-SNE representasjon. I tillegg på grunn av at den opererer på 2-dimensjonal dataene, er det en av de raskere grupperingsalgoritmer.
    4. Hierarkisk klynger: Bruke konvensjonelle hierarkisk klynging metoden til høy-dimensjonale data der hele euklidsk distansen matrix beregnes mellom alle hendelser før du oppgir algoritmen en avstand faktor som angir størrelsen på klyngen.
    5. Nettverket diagrammet- Basert: Bruke klynging metode som har blitt mest nylig introdusert i analyserer flyt cytometri når det er sjelden subpopulasjoner som brukeren ønsker å oppdage11,14. Denne metoden bruker først å opprette et diagram som bestemmer forbindelsene mellom alle hendelser i dataene. Dette trinnet består av å gi en første parameteren for å opprette diagrammet, som er antall k-nærmeste naboer. Denne parameteren styrer generelt størrelsen på klynger. På dette punktet, dukker en annen dialogboks opp spørsmål å ansette en av 5 klynging algoritmer som er brukt i diagrammet. Disse inkluderer 3 valgmulighetene å maksimere modularitet grafen, metoden Danon og en spektral klynging algoritmen14,15,16,17,18. Hvis man ønsker en generelt raskere klyngeløsning, anbefaler vi Spectral klynger eller rask grådig modularitet-maksimere. Mens metodene modularitet maksimering sammen med metoden Danon finne det optimale antallet klynger, krever Spectral klynger antallet klynger gis til programmet.
    6. Selv organisert kart: Ansette en kunstig nettverk å klynge høy-dimensjonale data.
    7. GMM-forventning maksimering: opprette en Gaussian blanding modell med forventning maksimering (EM) teknikk for å klynge høy-dimensjonale data. 19 denne typen klynging metoden krever også brukeren å input antallet klynger.
    8. Variational Bayesisk slutning for GMM: opprette en Gaussian blanding modell, men i motsetning til EM, kan det automatisk bestemme antall blanding komponenter k.20 mens programmet krever en rekke klynger gis (større enn den forventet antall sektorgrupper), algoritmen vil finne optimale nummeret på egen hånd.
  3. For å studere et bestemt område av t-SNE tomten, trykk Velg klynge manuelt å tegne et sett av brukerdefinerte klynger. Av notatet, kan ikke klynger dele medlemmer (dvs. hver hendelse kan bare tilhøre 1 klynge).

5. klynge filtrering

  1. Ble av klynger identifisert enten manuelt eller via en av de automatiske metodene beskrevet ovenfor kan filtrere som følger.
    1. Hvis du vil sortere klynger (i Klyngen Filter -panelet) av noen av markørene målt i eksperimentet, Velg et alternativ fra type -lokalmenyen. Hvis du vil angi om ordren er stigende eller synkende, trykk på Stigende/synkende til høyre for Sorter -lokalmenyen. Dette vil oppdatere listen over klynger i 'Klynger (filtrering)' liste og endre rekkefølgen dem i synkende median klynge uttrykk for at markøren. Prosentandelen som er angitt i 'Klynger (filtrering)' liste angir prosent av befolkningen som denne sektorgruppen representerer.
    2. Hvis du vil angi en minimumsterskelverdien for en gitt klynge over én kanal, velger du et alternativ på hurtigmenyen terskelen (i dette eksemplet oss markør CD65 og sett en terskel på 0,75). Skriv inn en verdi i boksen numeriske under grafen eller Bruk glidebryteren til å angi en terskel. Når terskelen er angitt, trykker du Legge over terskelen eller Legge under terskelen for å angi retning av terskelen. Når denne terskelen er angitt, vises den i av terskler for 'klynge Filter-panelet der markøren, terskelverdien og retning vil vises slik at brukeren er klar over hvilke terskler for tiden blir brukt. Endelig t-SNE handlingen vil oppdatere av sløret ut klynger som ikke oppfyller kravene for filtrering og 'Klynger (filtrering)' listen oppdateres for å vise klynger som oppfyller filtrering.
    3. Hvis du vil angi en laveste terskelen for hyppigheten av en klynge, angi en numerisk cut-off i Klynge frekvens terskelen (%) boksen i klyngen Filter-panelet (i denne eksempel bruk 1%).

6. klynge analyse og visualisering

  1. Klynger for videre analyse og visualisering, og Velg Velg klynger i klynger (filtrering) liste og trykk knappen Velg à flyttes til Klyngen analysere liste.
  2. Du oppretter heatmaps av klynger, velge i klynger av interesse i Klyngen analysere liste og trykk HeatMap av klynger . Når denne knappen trykkes, vil en figur komme opp som inneholder en varmekart med dendrograms på klyngen og parameter aksene. Dendrogram på den vertikale aksen vil gruppere klynger av dem som er nært relatert mens dendrogram på vannrett aksen vil gruppere markører co forbundet. Trykk filen for å lagre heatmap, | Eksporterer oppsettet | Eksportere.
  3. For å opprette en 'Høy dimensjonal Box Plot' eller 'Høy dimensjonal Flow Plot', velge i klynger av interesse i Klyngen analysere liste og trykk knappen Høy dimensjonal Bokstegning eller knappen Høy dimensjonal Flow Plot . Disse flatene kan brukes til å vurdere visuelt fordelingen av gitt kanaler med ulike klynger på tvers av alle dimensjoner.
  4. Slik viser klynger tradisjonelle 2D flyt tomter, Velg transformasjonen (lineær, log10, arcsinh) og kanal i Konvensjonelle flyt Plot -panelet og trykk konvensjonelle flyt Plot.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

For å teste brukbarheten av ExCYT, analysert vi en kuratert datasett publisert av Chevrier et al. tittelen "en immun Atlas av klare celle Renal karsinom' der gruppen gjennomført CyTOF analyse med en omfattende immun panel på svulst prøver tatt fra 73 pasienter11. To separate paneler, en lymfoide og myeloide panel, ble brukt til svært karakterisere svulst microenvironment. Målet med vår studie var recapitulate resultatene av deres t-SNE og klynge analyse, viser at ExCYT kan brukes til å komme til de samme konklusjonene, samt vise ekstra analysemetoder visualisering og klynge.

I den opprinnelige manuskriptet beskrevet gruppen 22 T celle klynger identifisert av lymfoide panel og 17 celle klynger identifisert av myelogen panel. I Figur 3 & Figur 4 av publikasjonen viser gruppen heatmaps av klynger, t-SNE tomter med fargekodet klyngeløsninger og t-SNE heatmaps i subpanels A, B, & C. For å utføre analysen, vi fant manuelt gated dataene fra Cytobank og samplet 2000 hendelser fra hver fil eller tok hele filen hvis den hadde mindre enn 2.000 hendelser, etter analyse rørledningen illustrert i det opprinnelige manuskriptet. På dette punktet vi samplet totalt 100.000 arrangementer via vår post gating subsampling parameteren gjennomført t-SNE analyse og brukt en rekke klynging metoder for å utforske dataene på forskjellige måter.

Først undersøkte vi myelogen panelet ved å følge den samme analyse rørledningen som den opprinnelige manuskriptet fullfører t-SNE analyse og opprette heatmaps på ulike markørene (figur 3A). Mens det opprinnelige manuskriptet normalisert t-SNE heatmaps til det 99te persentilet av hver merketråd, gjør ExCYT ikke denne typen normalisering for sin heatmaps. Lignende distribusjoner av markør co uttrykket ble imidlertid observert som beskrevet i det opprinnelige manuskriptet. Vi deretter brukt en nettverk grafbasert metode for klynging dataene ved å opprette diagrammet med 100 k-nærmeste naboer og klynging grafen via optimalisere modularitet av grafen ved hjelp av Fast-grådig implementering i ExCYT, hvor vi fant 19 Sub-populasjoner av celler (figur 3B). Når sammenligne heatmap av disse klyngene opprettet av ExCYT med heatmap publisert i den opprinnelige manuskriptet, bemerket vi at vi kunne identifisere lignende klynger av myeloide celler (Figur 3 c). Av notatet, den opprinnelige manuskriptet identifisert og kontrast to undergrupper av myeloide celler som vi identifisert i vår analyse definert av HLA-DRintCD68intCD64intCD36+CD11b+ (Cluster 13) og HLA-DR+ CD4+CD68+CD64+CD36-CD11b- (klynge 18). Visualisering av høy-dimensjonale boksen plott av disse to bestandene viste statistisk signifikante forskjeller (Mann-Whitney) i seks markører nevnt (figur 1 d).

Neste, vi analyserte lymfoide panelet med et mer konvensjonelt og raskere hierarkisk klynging tilnærming. Denne tilnærmingen ga lignende markør distribusjoner via t-SNE heatmaps (figur 4A). Videre vist klynger av data via hierarkisk klynger (figur 4B), lignende klynger av lymfoide celler (figur 4C). Av notatet, vi også identifisert unikt regulatoriske T celle befolkningen fra den opprinnelige manuskriptet definert som CD4+CD25+Foxp3+CTLA-4+CD127- (Cluster 17) via våre høy-dimensjonale flyt plot (Figur 4 d).

Til slutt, vi ønsket å ansette en metode innen ExCYT å raskt og kvantitativt vurdere co foreninger blant markører. Vi begynte med en vanskelig k-midler klynging algoritme for å legge ned 5 000 sektorgrupper på todimensjonale t-SNE data (figur 4E). Vi brukte deretter median uttrykket av alle markører av alle disse klyngene opprette en heatmap fra disse klyngene (figur 4F). Siden disse heatmaps klynge rader samt kolonner som ligner, denne metoden abstraheringens data ved bruk av finmasket av klynger og deretter opprette en heatmap tillater oss å hente co foreninger lett, som co association Tim-3, PD-1, CD38, og 4-1BB.

Figure 1
Figur 1: ExCYT rørledning og funksjoner. (A) ExCYT begynner ved import FCS rådata, bruke valgfrie kompensasjon, gating og tilfeldig delsampling før nedstrøms. Dette sikrer at alle hendelser blir analysert gjelder eksperimentet blir analysert. t-SNE dimensionality reduksjon utføres da for å visualisere alle hendelser og t-SNE heatmaps kan genereres for å visualisere fenotypiske distribusjoner. Til slutt, en rekke grupperingsalgoritmer kan brukes på enten den ene eller den andre av t-SNE transformasjon eller høy-dimensjonale rådata. (B) romanen sortering og terskelverdi funksjoner tillate brukernes å rask slag igjennom muligens hundrevis av klynger å finne noen av interesse. (C) Heatmaps av klynger kan opprettes for å undersøke hvordan flere klynger sammenligne med hverandre og som markører co knytte. (D) romanen høy-dimensjonale flyt/boksen plott kan genereres som en form for tilbake-gating klynger på originaldataene mens verdsette høy-dimensjonale natur dataene. Klikk her for å se en større versjon av dette tallet.

Figure 2
Figur 2: ExCYT grafisk brukergrensesnitt: ExCYT brukergrensesnitt tillater en effektivisere arbeidet flyt arbeider fra venstre til høyre i panelet som brukeren importerer data, utfører t-SNE dimensionality reduksjon, klynger og endelige klynge analyse og visualisering. Klikk her for å se en større versjon av dette tallet.

Figure 3
Figur 3: Recapitulation av myelogen undergrupper fra Chevrier et al. (A) Token t-SNE heatmaps av myelogen panelet (B) t-SNE tomten myelogen panelet farge kodet av nettverk-Graph klynging algoritmen (C) Heatmap av klynger identifisert av klyngeløsning myelogen panelet (D) komparative høy dimensjonal boksen plott sammenligne kontrast myelogen subpopulasjoner (klynger 13 og 18) i opprinnelige manuskriptet Klikk her for å se en større versjon av dette tallet.

Figure 4
Figur 4: Recapitulation av lymfoide undergrupper fra Chevrier et al. (A) Token t-SNE heatmaps av lymfoide panelet (B) t-SNE plott av lymfoide panelet farge kodet av hierarkiske klynging algoritmen (C) Heatmap av klynger identifisert av klyngeløsning på lymfoide panelet (D) høy dimensjonal flyt tomt identifiserte regulatoriske T celle befolkningen (Cluster 17) i opprinnelige manuskriptet (E) Clustering løsning av 5000 klynge vanskelig k-midler analyse på t-SNE data (F) Heatmap av klynger identifisert av k-midler klyngeløsning på lymfoide panelet viser markøren co foreninger. Klikk her for å se en større versjon av dette tallet.

nei. Beskrivelse Navnet (på GUI)
1 Velg cytometri NA
2 Tilfeldig delsampling med rådata NA
3 Velg filer for analyse Velg fil(er)
4 Auto-kompensasjon av rådata basert på katalogen av enkelt flekker til programvare Auto-kompensasjon
5 Gating Velg hendelser for t-SNE og klynging analyse Gate befolkningen
6 Tilfeldig delsampling av gated data (absolutte tall) NA
7 Tilfeldig delsampling av gated data (prosent av gated befolkningen) NA
8 Velg kanaler for analyse NA
9 Kjøre t-SNE dimensionality reduksjon t-SNE
10 t-SNE vindu NA
11 Lagre arbeidsområde Lagre arbeidsområde
12 Laste inn arbeidsområdet Laste inn arbeidsområdet
13 Opprette t-SNE heatmap på Velg markør NA
14 Gate t-SNE å re-gjøre t-SNE analyse av Velg befolkningen Gate t-SNE
15 Lagre t-SNE vinduet som bilde Lagre TSNE bilde
16 Velg klynging algoritme Klynging metode
17 Angi Clustering parameteren for angitt algoritme NA
18 Klynge analyse Klynge
19 Trekke klynger manuelt Velg klynge manuelt
20 Fjern alle klynger for å gjøre klyngen analyse Fjerne klynger
21 Vis klynger under gjeldende filterbetingelser Klynger (filtrering)
22 Fjerne Velg klynger fra klyngen analysere liste Fjerne <--
23 Legge klyngen til klyngen analysere liste Velg-->
24 Opprette konvensjonelle heatmap av alle hendelser i analyse HeatMap av hendelser
25 Sorter klynger av Velg markør Sorter
26 Angitt terskel ved velge merket Terskel
27 Opprette konvensjonelle heatmap av Velg klynger fra klyngen analysere liste HeatMap av klynger
28 Snu rekkefølgen av slag Stigende eller synkende sorteringsrekkefølge
29 Fjern alle terskler Fjern alle terskler
30 Angi frekvensen terskelen for klynger Klynge frekvens terskelen (%)
31 Liste over gjeldende grenser aktiv på 'Klynger (filtrering)' liste Terskler
32 Høy dimensjonal Box Plot Høy dimensjonal Box Plot
33 Høy dimensjonal Flow Plot Høy dimensjonal Flow Plot
34 Vannrett akse parameteren for konvensjonelle flyt plott NA
35 Loddrett akse parameteren for konvensjonelle flyt plott NA
36 Data transformation konvensjonelle flyt handlingen på vannrette aksen NA
37 Data transformation konvensjonelle flyt handlingen på loddrette aksen NA
38 Opprette konvensjonelle flyt tomten Konvensjonelle flyt Plot
39 Vis klynger for analyse NA

Tabell 1: Oversikt over alle funksjoner i ExCYT GUI

Navn på programvarepakke / ExCYT CYT FCS Express flowCore openCyto FlowMeans
Programtypen MATLAB MATLAB Frittstående program R R R
Pris til bruker Gratis Gratis $1000 Gratis Gratis Gratis
Grafisk brukergrensesnitt ja ja ja nei nei nei
Dimensionality teknikker t-SNE t-SNE, PCA t-SNE, PCA, SPADE ingen ingen ingen
Grupperingsalgoritmer K-midler
DBSCAN
Hierarkisk klynging
Self-organisert kart
Flere nettverk-Graph basert metoder
GMM - EM
GMM - Variational Bayesisk inferens
K-midler
GMM - EM
Enkelt nettverk-Graph basert metode (Phenograph)
K-midler ingen automatisering av manuell gating arbeidsflyt K-midler
Muligheten til å slag/filterene klynger ja nei nei nei nei nei
Høy dimensjonal Flow tomter ja nei nei nei nei nei

Tabell 2: Oversikt over programvare-assistert Flow cytometri analyse løsninger

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Her presenterer vi ExCYT, en ny grafisk bruker grenseflate kjører MATLAB-basert algoritmer for å effektivisere analyse av høy-dimensjonale cytometri data, slik at personer uten bakgrunn i programmering for å implementere nyest i høy-dimensjonale data analysealgoritmer. Tilgjengeligheten av denne programvare å det bredere vitenskapelige samfunnet vil tillate forskere å utforske flyt cytometri dataene i et intuitivt og enkelt arbeidsflyt. Gjennom gjennomføre t-SNE dimensionality reduksjon, bruke en klynging metode, kunne vil slag/filterene gjennom disse klyngene raskt og lage fleksible, egendefinerbare heatmaps og høy-dimensjonale flyt/boksen plott, forskere kunne ikke bare forstå de unikt definert subpopulasjoner i deres prøver, men vil kunne lage effekter som er intuitivt og lett forstått av sine kolleger.

Mens programmet er fleksibel i å håndtere en rekke datatyper (konvensjonelle cytometri vs masse flowcytometri), er det noen betraktninger for optimal nytte av programmet. Først av disse er om datakvaliteten, spesielt med flyten cytometri data. Skikkelig kompensasjon og oppløsning på overlappende utslipp spectra er av avgjørende betydning. Dårlig kompensert data kan utilsiktet føre til falske co sammenslutninger av markører og dannelse av klynger som ikke er ekte biologiske betydning. Derfor er det svært anbefales at inndataene er kvalitet før du fortsetter med t-SNE analyse og videre nedstrøms analyse. Videre krever bruk av automatisk erstatning algoritmen implementert i ExCYT klar eneste flekker for alle kanaler for å nøyaktig beregne parameterne kompensasjon.

En annen viktig faktor for bruk av ExCYT er når lenke sammen flere FCS filer inn en analyse (som vist i dette manuskriptet), må de være sammenlignbare over alle kanaler. Først, dette betyr at samme panel må brukes på alle prøvene og at det er ingen drift mellom eksempler på tvers av alle kanaler. For eksempel hvis man skulle lese to eksempler på forskjellige dager og farget CD8 i FITC på begge dager men spenningen fra cytometer ble satt forskjellig på en dag som resulterer i en litt skiftet CD8 befolkning, kan en generere falske klynger i nedstrøms , Dette skiftet ble generert som en funksjon av instrumentet variasjon og ikke biologisk betydning. Mens fremtidige versjoner av ExCYT kunne normalisere prøver å deres enkelt flekker, på dette punktet, må nøye overveielse gjøres at FCS filer kan sammenlignes med hverandre før du importerer dem til ExCYT.

Til slutt, prosessen med klynger er ikke en som er absolutt/stiv. Ulike grupperingsalgoritmer og parametere kan generere ulike klyngeløsninger. Om løsning av algoritmen er egnet er å finne ved å syntetisere sin forståelse av biologi med gruppeløsningen. For eksempel når forståelse immunsystemet miljøet av svulster, kan en være interessert i makroskopisk klynger (dvs. T celler vs B celler vs myeloide celler) mens en annen kan være interessert i subpopulasjoner av makroskopisk klynger. Oppløsningen for klynger bestemmes av brukeren, og derfor ingen enkelt klyngeløsning er "korrekt". Dette er en av de største fordelene med å bruke høy dimensjonal flow tomter tilgjengelig i ExCYT. Muligheten til å visualisere fordelingen av en gitt klynge over alle kanaler kan hjelpe brukeren bestemme om de har samlet i ikke bare en biologisk relevant måte, men på en måte som er relevant for vitenskapelige spørsmålet blir stilt i eksperimentet. Mens vårt mål er å gi en overflod av metoder som brukes i litteraturen til klyngen høy-dimensjonale flyt cytometri data samtidig som flere metoder for klynging, anbefaler vi å bruke metoder som k-midler og DBSCAN for å utforske dataene via raskt iterating klynge antall, størrelse og bevege seg mot nettverket-graph og Gauss-blandet modell tilnærminger for mer robust men mer tidkrevende tilnærminger.

Gitt disse hensyn, ExCYT er fortsatt en svært fleksibel og verdifulle verktøy for å utforske høy dimensjonal cytometri data, og tilbyr unike/skille funksjoner enn andre pakker tilgjengelig til å utføre denne type analyser (tabell 2) . Først skiller ExCYT seg over de fleste flyt cytometri analyse tilnærminger utnytte dimensionality reduksjon og klynger algoritmer av dens evne til å bli brukt uten skript/programmering kunnskap. I tillegg ved å aggregere mange grupperingsalgoritmer nevnt i litteraturen, tror vi vi tilbyr de mest alternativene for klynging data. Endelig, vår enestående ansiktstrekk av klyngen filtrering og sortering samt visning via romanen høy dimensjonal flow tomter, innrømmer brukernes å utforske hva som kjennetegner klaser raskt og effektivt, gjør prosessen med å "oppdage" sjeldne subpopulasjoner enkel og effektiv.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne ikke avsløre.

Acknowledgments

Forfatterne har ingen takk.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Retraksjon problemet 143 Flow cytometri høy-dimensjonal analyse t-SNE klynger varme kart Dimensionality reduksjon
ExCYT: En grafisk bruker grenseflate for effektivisering analyse av høy-dimensjonale cytometri Data
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter