Grunderna i multivariat analys i Neuroimaging Data

Neuroscience
JoVE Journal
Neuroscience
AccessviaTrial
 

Summary

Den aktuella artikeln beskrivs grunderna för multivariat analys och kontraster till de vanligaste Voxel-wise univariat analys. Båda typerna av analys tillämpas på en klinisk neurovetenskap datamängden. Kompletterande delad halv Simuleringarna visar bättre replikering av multivariata resultat i oberoende datamängder.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Habeck, C. G. Basics of Multivariate Analysis in Neuroimaging Data. J. Vis. Exp. (41), e1988, doi:10.3791/1988 (2010).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Multivariat analys tekniker för neuroimaging data har nyligen fått ökad uppmärksamhet eftersom de har många attraktiva funktioner som inte lätt kan realiseras av de vanligaste univariat, Voxel-vis, tekniker

Protocol

  1. För att ge en konceptuell överblick av multivariat analys kan vi bild en mycket enkel situation: en hypotetisk uppsättning data för 50 mänskliga deltagare, där endast tre regioner, betecknas som voxlar (= 3-dimensionell pixlar i figur 1) i hjärnan mättes. (Sätt in Figur 1 här, läs bildtexten som röst över.)
  2. Det övergripande syftet med multivariat analys är att identifiera de viktigaste källorna till varians i data, och sedan beskriver de viktigaste konsekvenserna av intresse i data i termer av dessa källor till varians. Figur 2 visar ett förenklat exempel. (Sätt in Figur 2 här, läs bildtexten som röst över.)
  3. Vi tillämpar nu både univariat och multivariat analys till ett kliniska data set. Vi hämtade FDG-PET vila söker efter 95 tidig Alzheimers patienter och 102 åldersmatchade kontroller från webbplatsen för Alzheimers sjukdom Neuroimaging Initiative (http://www.loni.ucla.edu/ADNI/). Vi valde slumpmässigt 20 skanningar av både patienter och kontroller och utsett dem som vår härledning prov. Resterande 75 och 82 skanningar, respektive utgör vår replikering prov. Univariata och multivariata Alzheimers sjukdom (AD) markörer kommer nu att hämtas i härledningen provet, och deras diagnostiska effekt testas i replikering provet.
  4. För den univariata markör, vi kontrastera 20 AD skannar med 20 kontroller skannar i härledningen prov och plocka hjärnan platsen som visar den största minskningen i PET-signalen i AD patienter som framgår av ett t-test. För att testa den diagnostiska effekten av denna region, kontrollerar vi data i replikering prov på denna plats och rita sin PET-signalen som funktion av sjukdomsstatus.
  5. För de multivariata markör, utför vi först en PCA på det kombinerade 40 skannar i härledningen provet, och sedan konstruera en kovariansen mönster från de första fem huvudkomponenter vars föremål skalfaktor visar en maximal genomsnittlig skillnad mellan AD patienter och friska kontroller. (Detaljer finns i dessa representativa papper 2.) Det diagnostiska kovarians mönster erhålls utgör härledningen provet sedan prospektivt tillämpas på replikering provet. Den resulterande ämnet skalning faktorer ritas som en funktion av sjukdom status.
  6. För att ge en mer generell jämförelse av både univariata och multivariata metoder från steg 4 och 5 genomför vi en "split prov" simulering och upprepa både steg 1000 gånger på samplas data varje gång att bilda ett 20/20 härledning prov och en 75/82 replikering av AD patienter och friska kontroller på nytt. Univariata och multivariata sjukdomsmarkörer beräknas från härledningen prov och beslutet satts så att högst en frisk kontrollgrupp är felaktigt klassificeras som AD (= specificitet 95%). Sjukdomen markörer med sina specifika beslut trösklar sedan prospektivt tillämpas på replikering prover. Klassificeringen felprocent i replikering prov redovisas för alla resampling iterationer.

Representativa resultat

Univariat prestanda Resultaten kan ses i detalj i figur 3. Det område av största AD-relaterade FDG underskott hittades i super temporala gyrus, Brodmann område 38. Ytan under ROC-kurvan som uppnåddes var AUC = 0,90. Generalisering av denna kontrast till replikering provet var ganska bra med en area under ROC kurvan av AUC = 0,84.

Multivariat prestanda Resultaten kan ses i detalj i Figur 4. Områden med positiv belastning, antyder en relativ bevara signal inför sjukdomen hittades i lillhjärnan, medan tillhörande signalförlust hittades den parietotemporal och frontala områden, och den bakre cingulum gyrus. De områden under ROC-kurvor i både härledning och prover replikering var något bättre än den endimensionella markör på 0,96 och 0,88, respektive.

Split-prov simuleringar Resultaten kan ses i detalj i figur 5. Figuren visar att den multivariata markör ger bättre replikering av diagnostiska prestanda än univariata markör. Den genomsnittliga totala felprocenten för multivariata markör är 0,203, medan den univariata markör är 0,307.

Figur 1
. Figur 1 Denna enkel figur beskriver skillnaden mellan univariata och multivariata analytiska strategier: en hypotetisk 3-dimensionell datamängd visas i denna illustration. På vänster sida finns det ingen korrelation mellan 3 variabler plottas. På höger sida däremot kan man se en stor källa till varians visar ett positivt samband mellan alla tre voxlar. En univariat analys som bara anses medelvärden på en Voxel-för-Voxel grund kunde inte berätta någon skillnad mellan dessa två scenarier. Multivariat analys, däremot, identifierar de främsta källorna Variance i data (röd pil) innan du fortsätter att bygga neurala aktiveringen mönster bildar dessa källor.

Figur 2
Figur 2. Detta bildspel i en förenklad form de grundläggande fullgörandet av någon multivariat analys i neuroimaging data. Uppgifterna array Y (s, x), vilket beror på ett ämne index s och en Voxel index x, som anger läget för den Voxel i hjärnan, är upp i en summa av flera villkor. Först, en produkt av ett rent ämne-beroende faktor poäng, SSF (s), och ett rent Voxel beroende kovarians mönster, V (x). För det andra, aktivering som inte kan förklaras av kovariansen mönster fångas i ett ämne och Voxel-beroende buller sikt, e (n, x). De två bilderna nedan ekvationen ger ett exempel på ämnet skalfaktor och kovarians mönster. Varje deltagare visar kovariansen mönster, bara i olika utsträckning som framgår av ämnet faktorn poäng. Hellre än att behöva hålla reda på alla Voxel beteende separat kovariansen mönstret och dess föremål uttryck ger en snål sammanfattning av den viktigaste källan till varians. Eftersom ämnet ökar skalfaktor omfattning, områden betecknade med blått i kovarians mönstret minskningen tillhörande aktivering, medan de områden som anges i rött samtidigt öka deras associerade aktivering. Ämnet faktor poäng kan korreleras med externa variabler av intresse som omfattas av ålder eller beteendemässiga prestanda i en kognitiv uppgift, och ingen korrigering för multipla jämförelser måste tillämpas på detta samband.

Flera tekniker för sådan nedbrytning existerar, men den vanligaste är Principal Components Analysis (PCA). Detta är den teknik val för oss. Observera att ämnet skalfaktorer kan erhållas genom att projicera kovariansen mönstret i någon datauppsättning lika dimensionerna, inte bara de data som produceras kovariansen mönstret i första hand. Detta gör kovarians mönster lämplig för att testa om hjärnan beteendeterapi relationer som observerades i en datamängd kan replikeras i en annan datamängd.

Figur 3
Figur 3. Bilden visar resultatet av univariata analysen. I den nedre vänstra panelen, är FDG signalvärden ritas för det område som visar den största AD-relaterade underskott i härledningen provet. Dess MNI koordinater är X = 2 mm, Y = -48 mm, Z = 30 mm (Precuneus / PCG, Brodmann Area 31). Den nedre högra panelen visar FDG signalen på denna mycket plats i replikering provet. Man kan uppskatta att FDG skillnader mellan AD patienter och kontroller i replikering provet, men ändå betydande totalt sett reduceras med mer överlappning mellan grupperna.

Figur 4
Figur 4. Bilden visar resultatet av multivariat analys. I den övre panelen, visar vi flera axiella skivor som visar signifikant positivt och negativt viktade områden (p <0,001) i kovariansen mönster i rött och blått, respektive. Observera att vi skalat varje scanna av sin globala medelvärdet, så röd och blå färg indikerar relativa snarare och absoluta ökningar och minskningar av PET-signal med sjukdomens svårighetsgrad. Röda områden antyder därmed vid relativa bevara i ansiktet av sjukdomen, medan blått visar på en förlust av signal som en följd av sjukdomen. Röda områden finns främst i lillhjärnan, medan blå områdena visas i den bakre cingulum gyrus, parietotemporal och frontala regioner. Nedre vänstra panelen: är föremål faktorn betyg för AD-relaterade samvariation mönster visas i härledningen provet. Högre föremål poäng för AD patienter. Nedre högra panelen: motivet faktor poäng till följd av potentiella tillämpningen av AD-relaterade kovarians mönster till replikering prov plottas här. Man kan uppskatta en liten försämring av kontrastmedel för diagnostik med ökad överlappning i replikering prov, men generalisering av den diagnostiska effekten är märkbart bättre än i univariata fallet.

Figur 5
Figur 5. Bilden visar resultatet av 1000 split-prov simuleringar. Noterade är medelvärden och standardavvikelser av univariata och multivariata diagnostiska felprocent i replikering prover. Man kan uppskatta att den multivariata markör generalisering av prestanda är betydligt bättre, även om något mer rörliga än de univariata markörs.

Discussion

Vi hoppas ha gett betraktaren en smak av grunderna i multivariat analys, intresserade tittare uppmuntras att kolla in vår hemsida. Några val för parametrar i multivariat analys gjordes som kan bli föremål debatten till stor debatt. Vi slipper diskussionen om dessa frågor i den här artikeln för att undvika distraktion från de stora frågorna. Först valde vi de första 6 viktigaste komponenterna för att bygga vår AD-relaterade kovarians mönster. Det finns teoretiska skäl för detta val som vi inte diskuterar 4. Den särskilda Valet av 6 viktigaste delarna är dock inte avgörande för våra argument: en kan välja i mellan 2 och 20 st och ändå få överlägsen generalisering prestanda multivariata markör i split-sample simuleringar. Resultaten är lika robusta med avseende på valet av antalet patienter i härledning och prover replikering. Vi valde 20 ämnen för båda grupperna i replikering urvalet, men detta var enbart för matematisk bekvämlighet för att snabba upp beräkningarna. Våra resultat om de relativa fördelarna av båda teknikerna skulle hålla samma sätt om antalet patienter i härledningen prover ökat.

För det andra presenterade vi bara de mest grundläggande typen av multivariat analys. Betydande komplikation med tekniker lånade från Maskinen-lärande litteratur, linjära och icke-linjära transformationer innan PCA, och diverse andra rynkor är möjliga som kan öka generalisering prestanda ännu mer. För enkelhetens skull har vi inte berört dessa möjligheter i denna artikel.

Disclosures

Inga intressekonflikter deklareras.

Acknowledgments

Författaren är tacksam för NIH bevilja stöd:

NIH / NIBIB 5R01EB006204-03 multivariat metoder för neuroradiologiska analys

NIH / NIA 5R01AG026114-02 Tidig AD Detection med ASL MR & Kovarians Analys

ADNI: Imaging uppgifter lämnades av Alzheimers sjukdom Neuroimaging Initiative (ADNI) (NIH U01AG024904). Datainsamling och utbyte för detta projekt har finansierats av Alzheimers sjukdom Neuroimaging Initiative (ADNI) (National Institutes of Health Grant U01 AG024904). ADNI finansieras av National Institute on Aging, National Institute of Biomedical Imaging och bioteknik, och genom generösa bidrag från följande: Abbott, AstraZeneca AB, Bayer Schering Pharma AG, Bristol-Myers Squibb, Eisai Global Clinical Development, Elan Corporation, Genentech, GE Healthcare, GlaxoSmithKline, Innogenetics, Johnson och Johnson, Eli Lilly & Co, Medpace, Inc., Merck & Co, Inc., Novartis AG, Pfizer Inc, F. Hoffman-La Roche, Schering-Plough, Synarc , Inc. och Wyeth, samt icke-vinstdrivande partner Alzheimers Association och Alzheimers Drug Discovery Foundation, med deltagande från den amerikanska Food and Drug Administration. Den privata sektorns bidrag till ADNI underlättas av Stiftelsen för National Institutes of Health ( http://www.fnih.org ). Den behörige organisationen är norra Kalifornien institutet för forskning och utbildning, och studien samordnas av Alzheimers sjukdom Cooperative Study vid University of California, San Diego. ADNI uppgifter sprids av laboratoriet för Neuro Imaging vid University of California, Los Angeles. Denna forskning stöddes också av NIH bidrag P30 AG010129, K01 AG030514 och Dana Foundation.

References

  1. Moeller, J. R., Strother, S. C. A regional covariance approach to the analysis of functional patterns in positron emission tomographic data. J Cereb Blood Flow Metab. 11, (2), A121-A121 (1991).
  2. Scarmeas, N. Covariance PET patterns in early Alzheimer's disease and subjects with cognitive impairment but no dementia: utility in group discrimination and correlations with functional performance. Neuroimage. 23, (1), 35-35 (2004).
  3. Siedlecki, K. L. Examining the multifactorial nature of cognitive aging with covariance analysis of positron emission tomography data. J Int Neuropsychol Soc. 15, (6), 973-973 (2009).
  4. Burnham, K. P., Anderson, D. R. Model selection and multimodel inference a practical information-theoretic approach. Springer. New York. Volume xxvi (2002).
  5. Moeller, J. R., Strother, S. C., Sidtis, J. J., Rottenberg, D. A. Scaled subprofile model: a statistical approach to the analysis of functional patterns in positron emission tomographic data. J Cereb Blood Flow Metab. 7, (5), 649-649 (1987).
  6. Habeck, C. Multivariate and univariate neuroimaging biomarkers of Alzheimer's disease. Neuroimage. 40, (4), 1503-1503 (2008).
  7. Habeck, C. A new approach to spatial covariance modeling of functional brain imaging data: ordinal trend analysis. Neural Comput. 17, (7), 1602-1602 (2005).
  8. McIntosh, A. R., Bookstein, F. L., Haxby, J. V., Grady, C. L. Spatial pattern analysis of functional brain images using partial least squares. Neuroimage. 3 Pt 1, 143-143 (1996).
  9. McIntosh, A. R., Lobaugh, N. J. Partial least squares analysis of neuroimaging data: applications and advances. Neuroimage. 23, Suppl 1. S250-S250 (2004).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics