We hebben een eenvoudige, aanpasbare en efficiënte methode ontwikkeld voor het vastleggen van kwantitatieve procesgegevens van interactieve ruimtelijke taken en het in kaart brengen van deze rotatiegegevens met eye-tracking gegevens.
Method Article
We hebben een eenvoudige, aanpasbare en efficiënte methode ontwikkeld voor het vastleggen van kwantitatieve procesgegevens van interactieve ruimtelijke taken en het in kaart brengen van deze rotatiegegevens met eye-tracking gegevens.
We presenteren een methode voor het real-time vastleggen van menselijke interactie met driedimensionale (3D) virtuele objecten. De aanpak bestaat uit het associëren van rotatiegegevens van het gemanipuleerde object met gedragsmetingen, zoals eye-tracking, om betere conclusies te trekken over de onderliggende cognitieve processen.
De taak bestaat uit het weergeven van twee identieke modellen van hetzelfde 3D-object (een molecuul), gepresenteerd op een computerscherm: een roterend, interactief object (iObj) en een statisch doelobject (tObj). Deelnemers moeten iObj met de muis draaien totdat ze van mening zijn dat de oriëntatie identiek is aan die van tObj. De computer houdt alle interactiegegevens in realtime bij. De blikgegevens van de deelnemer worden ook geregistreerd met behulp van een eyetracker. De meetfrequentie is 10 Hz op de computer en 60 Hz op de eyetracker.
De oriëntatiegegevens van iObj ten opzichte van tObj worden vastgelegd in rotatiequaternionen. De blikgegevens worden gesynchroniseerd met de oriëntatie van iObj en er wordt naar verwezen met behulp van hetzelfde systeem. Deze methode stelt ons in staat om de volgende visualisaties van het menselijke interactieproces met iObj en tObj te verkrijgen: (1) hoekongelijkheid gesynchroniseerd met andere tijdsafhankelijke gegevens; (2) 3D-rotatiebaan binnen wat we besloten een "bal van rotaties" te noemen; (3) 3D fixatie heatmap. Alle stappen van het protocol hebben gebruik gemaakt van vrije software, zoals GNU Octave en Jmol, en alle scripts zijn beschikbaar als aanvullend materiaal.
Met deze benadering kunnen we gedetailleerde kwantitatieve studies uitvoeren van het taakoplossende proces met mentale of fysieke rotaties, in plaats van alleen het bereikte resultaat. Het is mogelijk om precies te meten hoe belangrijk elk onderdeel van de 3D-modellen is voor de deelnemer bij het oplossen van taken, en zo de modellen te relateren aan relevante variabelen zoals de kenmerken van de objecten, cognitieve vaardigheden van de individuen en de kenmerken van de mens-machine-interface.
Mentale rotatie (MR) is een cognitief vermogen dat individuen in staat stelt objecten mentaal te manipuleren en te roteren, waardoor een beter begrip van hun kenmerken en ruimtelijke relaties wordt vergemakkelijkt. Het is een van de visueel-ruimtelijke vaardigheden, een fundamentele cognitieve groep die al in 1890 werd bestudeerd1. Visueel-ruimtelijke vaardigheden zijn een belangrijk onderdeel van het cognitieve repertoire van een individu dat wordt beïnvloed door zowel erfelijke als omgevingsfactoren 2,3,4,5. De belangstelling voor visueel-ruimtelijke vaardigheden is in de loop van de twintigste eeuw gegroeid als gevolg van toenemend bewijs van hun belang in belangrijke vakken zoals leeftijd6 en ontwikkeling7, prestaties in wetenschap, technologie, techniek en wiskunde (STEM) 8,9, creativiteit10 en evolutionaire kenmerken11.
Het hedendaagse idee van MR komt voort uit het baanbrekende werk dat Shepard en Metzler (SM) in 197112 publiceerden. Ze bedachten een chronometrische methode met behulp van een reeks "dezelfde of andere" taken, waarbij ze twee projecties van abstracte 3D-objecten naast elkaar presenteerden. Deelnemers moesten de objecten mentaal op een bepaalde as draaien en beslissen of die projecties hetzelfde object anders roteerden of verschillende objecten afbeeldden. De studie onthulde een positieve lineaire correlatie tussen responstijd (RT) en de hoekongelijkheid (AD) tussen representaties van hetzelfde object. Deze correlatie staat bekend als het hoekongelijkheidseffect (ADE). ADE wordt beschouwd als een gedragsmanifestatie van MR en werd alomtegenwoordig in verschillende invloedrijke latere onderzoeken in het veld 13,14,15,16,17,18,19,20,21,22,23,24,25. De 3D-objecten die in de SM-studie werden gebruikt, waren samengesteld uit 10 aaneengesloten kubussen die werden gegenereerd door de pionier op het gebied van computergrafieken Michael Noll bij Bell Laboratories26. Ze worden SM-figuren genoemd en worden veel gebruikt in MR-studies.
Twee ontwikkelingen waren van groot belang in het baanbrekende werk van Shepard en Metzler; ten eerste het overwegen van de bijdragen op het gebied van MR-beoordelingen. In 1978 ontwikkelden Vanderberg en Kuze27 een psychometrische potlood-en-papiertest met 20 items op basis van SM "dezelfde of andere" cijfers die bekend werd als de mentale rotatietest (VKMRT). Elk testitem presenteert een doelstimulus. Deelnemers moeten kiezen uit vier stimuli, welke hetzelfde object vertegenwoordigen dat in de doelstimulus is afgebeeld en welke niet. VKMRT is gebruikt om de correlatie tussen MR-vermogen en verschillende andere factoren te onderzoeken, zoals seksegerelateerde verschillen 6,21,24,28,29,30, veroudering en ontwikkeling 6,31,32, academische prestaties 8,33, en vaardigheden in muziek en sport34. In 1995 publiceerden Peters et al. een studie met hertekende cijfers voor de VKMRT 35,36. Evenzo, volgens het "dezelfde of andere" taakontwerp, zijn een verscheidenheid aan andere bibliotheken van door de computer gegenereerde stimuli gebruikt om MR-processen te onderzoeken en MR-vaardigheden te beoordelen (3D-versies van de originele SM-stimuli 19,22,23,37,38, menselijk lichaam dat SM-figuren nabootst 25,39,40, platte polygonen voor 2D-rotatie 41, 42, anatomie en organen43, organische vormen44, moleculen45,46, onder andere21). De Purdue Spatial Visualization Test (PSVT) voorgesteld door Guay in 197647 is ook relevant. Het omvat een reeks tests, waaronder MR (PSVT:R). Door gebruik te maken van andere stimuli dan die in VKMRT, PSVT:R vereist dat deelnemers een rotatiebewerking in een modelstimulus identificeren en deze mentaal toepassen op een andere. PSVT:R wordt ook veel gebruikt, met name in onderzoeken naar de rol van MR bij STEM-prestaties 48,49,50.
De tweede vooruitgang van groot belang in het baanbrekende werk van Shepard en Metzler omvat de bijdragen aan het begrip van het MR-proces, in het bijzonder met het gebruik van eye-tracking-apparaten. In 1976 gebruikten Just en Carpenter14 analoge video-gebaseerde eye-tracking-apparatuur om een onderzoek uit te voeren op basis van het ADE-experiment van Shepard en Metzler. Op basis van hun resultaten over saccadische oogbewegingen en RT's stelden ze een model van MR-processen voor dat bestaat uit drie fasen: 1) de zoekfase, waarin vergelijkbare delen van de figuren worden herkend; 2) de transformatie- en vergelijkingsfase, waarin een van de geïdentificeerde delen mentaal wordt geroteerd; 3) de bevestigingsfase, waarin wordt besloten of de cijfers hetzelfde zijn of niet. De fasen worden recursief herhaald totdat er een beslissing kan worden genomen. Elke stap komt overeen met specifieke saccadische en fixationele oogbewegingspatronen in nauwe relatie tot waargenomen ADE's. Door oogactiviteit te correleren met chronometrische gegevens, leverden Just en Carpenter dus een cognitieve handtekening voor de studie van MR-processen. Tot op heden is dit model, zij het met aanpassingen, in verschillende onderzoeken overgenomen 15,42,46,51,52,53.
In navolging van dit spoor volgen verschillende daaropvolgende onderzoeken die gedrag 18,19,22,23,25,34,40,54,55 en hersenactiviteit 20,22,56,57 monitoren Functies tijdens stimulirotatie werden uitgevoerd. Hun bevindingen wijzen op een coöperatieve rol tussen MR en motorische processen. Bovendien is er een groeiende belangstelling voor het onderzoeken van probleemoplossende strategieën met betrekking tot MR in relatie tot individuele verschillen 15,41,46,51,58.
Over het algemeen kan worden aangenomen dat het ontwerp van onderzoeken die gericht zijn op het begrijpen van MR-processen gebaseerd is op het presenteren van een taak met visuele stimuli die deelnemers vraagt een MR-operatie uit te voeren die op zijn beurt een motorische reactie met zich meebrengt. Als deze reactie rotatie van de stimuli mogelijk maakt, wordt dit vaak fysieke rotatie (PR) genoemd. Afhankelijk van de specifieke doelstellingen van elke studie zijn verschillende strategieën en apparaten gebruikt voor gegevensverzameling en analyse van MR en PR. In de stap van de presentatie van taakstimulus is het mogelijk om de soorten stimuli te wijzigen (d.w.z. eerder aangehaalde voorbeelden); de projectie (door de computer gegenereerde beelden in traditionele displays 22,23,25,29,40,41,59, evenals in stereoscopen 19 en virtual60 en mixed43 reality-omgevingen); en de interactiviteit van de stimuli (statische beelden 12,27,36, animaties61 en interactieve virtuele objecten 19,22,23,43,53,59).
MR wordt meestal afgeleid uit metingen van RT's (ADE), evenals oog- en hersenactiviteit 25,46,62. Oculaire activiteit wordt gemeten met behulp van eye-tracking-gegevens bestaande uit saccadische bewegingen en fixaties 14,15,42,51,52,54,58,60, evenals pupillometrie 40. RT-gegevens zijn doorgaans afkomstig van motorresponsgegevens die zijn geregistreerd tijdens het bedienen van verschillende apparaten, zoals hendels13, knoppen en schakelaars 14,53, pedalen53, draaiknoppen19, joysticks37, toetsenbord61 en muis 29,58,60, aandrijfwielen 53, traagheidssensoren22,23, aanraakschermen52,59, en microfoons22. Om PR te meten, zal het onderzoeksontwerp naast de RT's ook het opnemen van handmatige rotaties van interactieve stimuli omvatten terwijl deelnemers de MR-taak 22,23,52,53 uitvoeren.
In 1998 gebruikten Wohlschläger en Wohlschläger19 "dezelfde of andere" taken met interactieve virtuele SM-stimuli die werden gemanipuleerd met een knop, met rotaties beperkt tot één as per taak. Ze maten RT en het cumulatieve record van fysieke rotaties die tijdens de taken werden uitgevoerd. Door situaties met en zonder daadwerkelijke rotatie van de interactieve stimuli te vergelijken, concludeerden ze dat MR en PR een gemeenschappelijk proces delen voor zowel ingebeelde als daadwerkelijk uitgevoerde rotaties.
In 2014 werden twee onderzoeken uitgevoerd waarbij gebruik werd gemaakt van hetzelfde type taken met virtuele interactieve stimuli22,23. De objecten werden echter gemanipuleerd met traagheidssensoren die beweging in de 3D-ruimte vastlegden. In beide gevallen werden, naast RT's, rotatietrajecten geregistreerd - de evolutie van rotatieverschillen tussen referentie- en interactieve stimuli tijdens de taken. Uit deze trajecten was het mogelijk om zowel cumulatieve informatie (d.w.z. het totale aantal omwentelingen in quaternionische eenheden) als gedetailleerde informatie over oplossingsstrategieën te extraheren. Adams et al.23 bestudeerden het coöperatieve effect tussen MR en PR. Naast RT's gebruikten ze de integraal van de rotatietrajecten als een parameter voor nauwkeurigheid en objectiviteit van de resolutie. Curveprofielen werden geïnterpreteerd volgens een driestappenmodel63 (planning, grote rotatie, fijnafstelling). De resultaten geven aan dat MR en PR niet noodzakelijkerwijs één gemeenschappelijke factor hebben. Gardony et al.22 verzamelden gegevens over RT, nauwkeurigheid en real-time rotatie. Naast het bevestigen van de relatie tussen MR en PR, bleek uit de analyse van rotatietrajecten dat deelnemers de cijfers manipuleerden totdat ze konden vaststellen of ze verschillend waren of niet. Als ze hetzelfde waren, zouden deelnemers ze roteren totdat ze er hetzelfde uitzagen.
Voortbordurend op deze strategie gebruikten Wetzel en Bertel52 in 2018 ook interactieve SM-figuren in "dezelfde of andere" taken met behulp van touchscreen-tablets als interface. Bovendien gebruikten ze een eye-tracking-apparaat om cumulatieve gegevens te verkrijgen over fixatietijd en saccadische amplitude als parameters van de cognitieve belasting die betrokken is bij het oplossen van MR-taken. De auteurs bevestigden de eerdere studies die hierboven zijn besproken met betrekking tot de relaties tussen MR en PR en de taakoplossende processen. In deze studie gebruikten ze echter geen fixatiemapping en saccadesgegevens voor de stimuli.
Methodologische benaderingen voor het in kaart brengen van eye-tracking-gegevens over virtuele 3D-objecten zijn voorgesteld en voortdurend verbeterd, vaak door onderzoekers die geïnteresseerd zijn in het bestuderen van de factoren die verband houden met visuele aandacht in virtuele omgevingen64. Hoewel betaalbaar en met behulp van vergelijkbare eye-tracking-apparaten, zijn deze methoden blijkbaar niet effectief geïntegreerd in het experimentele repertoire dat wordt gebruikt in mentale rotatiestudies met interactieve 3D-objecten zoals eerder genoemd. Omgekeerd hebben we in de literatuur geen studies gevonden die real-time mapping van fixatie- en saccadebewegingsgegevens op interactieve 3D-objecten rapporteren. Er lijkt geen handige methode te zijn om oogactiviteitsgegevens gemakkelijk te integreren met rotatietrajecten. Met dit onderzoek willen we een bijdrage leveren aan het opvullen van deze leemte. De procedure wordt in detail gepresenteerd, van data-acquisitie tot het genereren van grafische output.
In dit artikel beschrijven we in detail een methode voor het bestuderen van mentale rotatieprocessen met virtuele interactieve 3D-objecten. De volgende vorderingen worden belicht. Ten eerste integreert het kwantitatieve gedragsmotorische (met de hand aangedreven objectrotatie via een computerinterface) en oculaire (eye-tracking) gegevensverzameling tijdens interactiesessies met virtuele 3D-modellen. Ten tweede vereist het alleen conventionele computerapparatuur en eye-tracking-apparaten voor visueel taakontwerp, gegevensverzameling, opname en verwerking. Ten derde genereert het eenvoudig grafische uitvoer om gegevensanalyse te vergemakkelijken - hoekongelijkheid, fysieke rotatie, quaternionische rotatietrajecten en hitmapping van eye-tracking-gegevens over virtuele 3D-objecten. Ten slotte vereist de methode alleen vrije software. Alle ontwikkelde code en scripts zijn gratis (https://github.com/rodrigocnstest/rodrigocnstest.github.io) beschikbaar.
1. Voorbereiding van instrumenten voor gegevensverzameling
2. Verzamelen van gegevens
3. Gegevensverwerking en -analyse
4. Aanpassing van taken
OPMERKING: Dit hele gedeelte is optioneel en wordt alleen aanbevolen voor degenen die graag experimenteren of begrijpen hoe ze moeten coderen. Hieronder vindt u enkele van de vele aanpasbare opties die beschikbaar zijn, en er zullen meer opties beschikbaar komen naarmate we de methoden verder ontwikkelen.
Evolutie van hoekongelijkheid en andere variabelen
Zoals afgebeeld in stap 3.3.1 in aanvullend bestand 2, worden twee canvassen aan de deelnemer gepresenteerd op het videobeeldscherm, waarop kopieën van hetzelfde virtuele 3D-object in verschillende oriëntaties worden weergegeven. Op het linker canvas blijft het doelobject (tObj) statisch en dient het als de doelpositie of tObj-positie. Op het rechtercanvas wordt het interactieve object (iObj) in een andere positie getoond en stelt de deelnemer in staat om het in de loop van de tijd met een muis rond een vast rotatiecentrum te bewegen (alleen rotaties; vertalingen zijn uitgeschakeld). De taak die voorhanden is, omvat het aanpassen van iObj om nauw overeen te komen met tObj op basis van het oordeel van de deelnemer. De drie gebruikte 3D-objecten zijn te zien in figuur 1. Het oplossingsproces, hoewel complex, kan nauwgezet worden vastgelegd voor latere analyse. Deze opname gaat verder dan alleen videobeelden, aangezien elke positie in de loop van de tijd met vaste tussenpozen van 0,1 s wordt vastgelegd als een quaternion, waardoor een tijdreeks wordt gevormd die een volledige reconstructie van het hele proces mogelijk maakt. Op elke positie bestaat er een unieke rotatie rond een specifieke as, variërend van 0° tot 180°, die de tObj-positie direct transformeert in de iObj-positie. Hoewel deze rotatie abstract is en geen verband houdt met de PR van de deelnemer tijdens de taak, geeft het nauwkeurig de precieze iObj-positie ten opzichte van tObj aan. AD is de hoek van deze rotatie en kan worden berekend op basis van het respectieve quaternion. Naarmate de iObj-positie de tObj-positie nadert, nadert deze waarde nul.
Na stap 3.1.6 van de sectie Gegevensverwerking en -analyse zijn twee bestanden gemaakt: output merge X Y.xlsx en output jmol console X Y.xlsx, waarbij X de sessionID-waarde is en Y de taskID-waarde . Als u de standaardwaarden gebruikt door de invoervelden leeg te laten, moeten de bestanden de naam uitvoer samenvoegen 1682707472090 bolaBastao_c.xlsx en uitvoer jmol console 1682707472090 bolaBastao_c.xlsx krijgen. De uitvoer voegt X Y.xlsx-bestanden samen en bevat de geselecteerde eye-trackergegevens die zijn samengevoegd met de iRT-gegevens, uitgelijnd door de UNIX Epoch-tijd, vergelijkbaar met Figuur 2A als alles correct is verlopen, of Figuur 2B als er een probleem is opgetreden.
De uitvoer jmol console X Y.xlsx-bestanden bevatten maximaal vijf tabbladen gevuld met Jmol-console-opdrachten die, wanneer ze op de Jmol-console worden geplakt, de bewegingen van de deelnemer reproduceren bij het oplossen van de taak: rotatieherhaling reproduceert de iObj-rotaties die door de deelnemer zijn gemaakt; gaze replay int reproduceert de iObj-rotaties met toegevoegde fixatie heatmap op het object in de tijd door gebruik te maken van een transparante/ondoorzichtige schaal; gaze replay tgt toont alleen de 3D-fixatie heatmap van tObj tijdens de taak; gaze frame int en gaze frame tgt tonen de algehele fixatiemapping van het hele proces voor zowel iObj als tObj. Ze worden allemaal geïllustreerd in figuur 3A-F. Jmol en JSmol zijn in wezen identiek, Jmol is de plug-in op basis van de programmeertaal Java en JSmol in de programmeertaal JavaScript, die beide dezelfde functionaliteiten hebben en door elkaar worden gebruikt.
Figuur 4 illustreert de evolutie van hoekongelijkheid als functie van de tijd voor zes verschillende scenario's met twee deelnemers en drie objecten. De duur van het proces kan aanzienlijk variëren, afhankelijk van de prestaties van de deelnemer met het interactieve taakobject. Bij elke taak die correct door de deelnemer is voltooid, neigt AD aan het einde naar nul. Als dezelfde grafiek dit gedrag niet vertoont, kon de deelnemer de taak niet voltooien omdat hij de tijdslimiet per taak opgaf of bereikte (ongeveer 5 minuten), of er is een fout opgetreden in de gegevensverwerking.
De gecombineerde resultaten van de iObj PR-records en de gegevens verkregen uit de eye-tracking-metingen zijn weergegeven in figuur 5. De variatie in het hoekverschil tussen het doel en de inertiaalobjecten als functie van de tijd geeft drie verschillende fasen aan in het proces van het oplossen van de gegeven taak: eerste waarneming van de modellen; ballistische rotatie van het interactieve model; Verfijning van de rotatie van het interactieve model. Figuur 5A toont de blik afwisselend tussen de modellen in de beginfase en, meer specifiek, in de fine-tuning-fase. Figuur 5B laat zien dat de pupil meer verwijd blijft in de begin- en fine-tuning fasen. In de fine-tuningfase komt de lange fixatieperiode op het interactieve model (40-47s in Figuur 5A) overeen met een plateau in pupildiameter (40-47s, Figuur 5B).
Deze resultaten suggereren dat de gegevens die zijn verkregen met de hier voorgestelde methode consistent zijn met het model voor het oplossen van problemen met mentale rotatie dat is voorgesteld op basis van blikfixatiegegevens voor statische modellen14,66 en voor interactieve modellen23. Zo'n model zou drie fasen omvatten: zoeken, transformeren en vergelijken, en bevestiging van de match of mismatch tussen de modellen. Bovendien is de afwisseling van fixaties tussen het doelmodel en interactieve modellen in de vergelijkingsfasen die zijn waargenomen in figuur 5A consistent met de resultaten die zijn verkregen in tests van het Sheppard- en Metzler-type die gebruik maken van statische beelden42,66. In het geval van interactieve modellen is het echter waarschijnlijk dat deze stadia van zoeken, transformatie, vergelijking en bevestiging achtereenvolgens plaatsvinden door interactie en herpositionering van het interactieve model.
3D rotatie trajecten
Elke rotatie in een 3D-ruimte van 0° tot 180° kan worden vertaald naar een punt in een bal (dat wordt opgevat als het volume in een bol) met een straal gelijk aan 180°. Figuur 6 toont deze overeenkomst aan de hand van drie voorbeeldrotaties. De afstand van het punt tot het midden van de bal is het iObj-hoekverschil ten opzichte van de tObj-positie, en de vector die van het midden van de bal naar het punt wijst, is de rotatierichting, waarbij de rotatie wordt gemaakt in de zin van de klok mee, kijkend vanuit het midden. Deze vertaling van rotaties in punten in een bal stelt iemand in staat om direct, in een enkele 3D-tekening, het hele traject van rotaties te visualiseren dat de deelnemer aan een taak heeft gemaakt. Deze tekening noemen we de 3D rotatiebaan.
Analoog aan de AD-meting, voor alle taken die correct door de deelnemer zijn uitgevoerd, moet de baan uiteindelijk het midden van de bal naderen. Als de baan de grens van de bol bereikt met een rotatie van 180°, zal deze zich omwikkelen naar het antipodale punt op de bol. Figuur 7 illustreert het rotatietraject van de twee eerder genoemde deelnemers die de derde taak uitvoeren (C1 en C2 in figuur 4), zowel in perspectief als in projecties op de drie coördinatenvlakken. Uit de figuur blijkt duidelijk dat, ondanks de relatief kleine start-AD van bijna 45°, deelnemer 1 aanvankelijk afweek van de doelpositie voordat hij een definitief pad naar de oplossing vond, in tegenstelling tot deelnemer 2, die de taak sneller voltooide.
3D Fixatie heatmap
Tijdens het probleemoplossende proces wisselt de deelnemer zijn blik af tussen tObj en iObj tijdens de interactie met iObj. Met de eye-tracking-gegevens kunnen we de blikpositie van de deelnemer extraheren en een heatmap maken van de schermregio's die in een bepaald interval de meeste en minste aandacht van de deelnemer hebben getrokken. Als we verder gaan, kunnen we met gesynchroniseerde eye-tracking- en iRT-quaterniongegevens tegelijkertijd in de 3D-ruimte en in de tijd in kaart brengen hoeveel aandacht elk van de objectpunten krijgt, zelfs voor objecten die in de tijd worden geroteerd.
In figuur 3 wordt de aandacht die aan het object wordt besteed weergegeven door het dekkingsniveau van elk hoekpunt. Hoe dichter het bij de blik van de deelnemer is en hoe langer het in de buurt blijft, hoe meer aandacht het krijgt, wat resulteert in een hogere opaciteit in dat deel van het object. De ruimtelijke afname van de aandacht wordt gemodelleerd met behulp van een bivariate homogene Gaussiaanse functie voor de blikpositie en een eenvoudige homogene Gaussiaanse functie toegepast voor de verstreken tijd. De standaarddeviatie van deze Gaussianen werd gekozen uitgaande van een visuele hoek van 2 graden67 en een visueel kortetermijngeheugen van 10 s68. Om visuele artefacten met deze methode te voorkomen, worden de nabijheidsgegevens van de blik op nul gezet terwijl de blik zich buiten het objectcanvas bevindt (iObj krijgt geen resterende aandacht wanneer de blik zich binnen het tObj-canvas of buiten beide bevindt). Figuur 3 toont een enkel frame van elk object van een volledige herhalingsanimatie en dezelfde frames met de 3D-fixatieheatmap. Een mogelijke vergelijking tussen tObj en iObj door de deelnemer tijdens het oplosproces is te zien (Figuur 3C,D) naarmate de taak zijn voltooiing nadert (tijd = 6,3 s). Het hele proces is te zien als een video in Supplemental Video S1. We rapporteren de resultaten van de computergemedieerde rotatie van 3D-modellen die aan de deelnemers worden gepresenteerd als een taak die onder normale omstandigheden wordt uitgevoerd.

Figuur 1: Gebruikte doelobjecten. Afbeelding van de 3D-modellen die worden gebruikt in de taken op de webpagina. (A) Een molecuul met voorstelling van bal en stok; (B) Hetzelfde molecuul met gevulde veelhoeken, geen waterstofatomen, en alleen weergegeven door stokjes; (C) een polykubus vergelijkbaar met een van de figuren van Shepard en Metzler13, afgeleid uit de stimulibibliotheek van Peters en Battista36. Klik hier om een grotere versie van deze figuur te bekijken.

Afbeelding 2: Vergelijking van werkbladen. (A,B) Afbeeldingen zijn afkomstig van de 1682707472090 bolaBastao_c.xlsx voor het samenvoegen van spreadsheetuitvoer. Kolommen A tot en met G bevatten iRT-gegevenswaarden, terwijl kolommen H tot en met N eyetracker-gegevenswaarden bevatten. In (A) is alles correct, terwijl in (B), in de eyetracker-kolommen, alle waarden constant zijn en niet overeenkomen met de tijdwaarden van het iRT-systeem. Als er een probleem optreedt met het gegevenssynchronisatieproces, zal deze fout waarschijnlijk optreden. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 3: 3D fixatie heatmap. Fixatie heatmap over het 3D-object met behulp van een schaal van dekking, waarbij meer ondoorzichtig correleert met meer tijd doorgebracht in de buurt van de blik van de deelnemer. (A,B) tObj en iObj afbeeldingen van de taak die door de deelnemer wordt opgelost op 6.3 s. (C,D) Dezelfde afbeeldingen als (A,B) op hetzelfde moment met de toegevoegde dekkingsschaal van de heatmap. (E,F) Fixatie heatmap-afbeeldingen rekening houdend met de gehele periode waarin de deelnemer de objecten kon zien. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 4: AD-raster. Plot een raster van hoekongelijkheid over twee deelnemers en drie taken. Kolommen vertegenwoordigen deelnemers 1 en 2, en rijen vertegenwoordigen de taken die door de deelnemers zijn opgelost met behulp van de drie objecten die in figuur 3 worden geïllustreerd. Houd er rekening mee dat hoewel AD varieert tussen 0° en 180°, het tijdsbereik niet vaststaat en varieert met de prestaties van de deelnemer en zijn eigen beslissing om het proces te stoppen. Terwijl de deelnemer iObj roteert, varieert de AD tussen tObj en iObj naarmate de tijd vordert, en uiteindelijk kiest de deelnemer de huidige iObj-oriëntatie als de dichtstbijzijnde bij tObj. In de1e en 2etaak leken beide deelnemers op een vergelijkbare manier vooruitgang te hebben geboekt, maar deelnemer 1 nam half zoveel tijd in beslag als deelnemer 2. En in de 3etaak, hoewel deelnemer 2 minder tijd nodig had om de taak te voltooien, had deelnemer 1 de taak al opgelost vóór de 20 s en bleef hij kleine aanpassingen maken om iObj beter aan te passen aan tObj. Afkorting: AD = hoekverschil. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 5: AD met eye-tracking data. Evolutie van hoekongelijkheid gecombineerd met eye-tracker data. (A) Hoekverschil en blikpositie, de evolutie van het hoekverschil tussen tObj en iObj, gekoppeld aan regionale fixatiegegevens voor elk model. De grafiek laat zien in welk gebied de blik van de deelnemer zich bevindt: rood wanneer hij zich in het iObj-canvas bevindt, blauw wanneer hij zich in het canvas bevindt en grijs wanneer hij zich buiten beide bevindt, naar een ander element op het scherm kijkt of ervan wegkijkt. (B) Hoekverschil en pupildiameter. Hoekverschil, in blauw, gekoppeld aan gegevens over de pupildiameter, in oranje. De diameter van de pupil is de gemiddelde waarde van de linker- en rechterpupillen op elk moment in de tijd. Afkorting: AD = hoekverschil. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 6: Bal van rotaties. Deze figuur illustreert hoe elke mogelijke rotatiepositie van een object vanuit een referentiepositie kan worden weergegeven als een punt in een bal met een straal van 180°, waardoor een volledige weergave van de rotatiepositie van het object in alle drie de assen mogelijk is. Onder een bal wordt hier verstaan het volume dat wordt begrensd door een bol. (A) Het object dat als voorbeeld wordt gebruikt, is een asymmetrische unie van zeven kubussen, linksboven afgebeeld. Drie eenvoudige rotaties genummerd I, II en III worden toegepast op dit object, zoals rechts weergegeven. Ze zijn respectievelijk +90° op de x-as, -60° op de z-as en 180° op een as tussen +x en -y, op 45° van beide assen. (B) De rotatiebal wordt weergegeven met de punten die overeenkomen met de rotaties I, II en III. De afstand tot het midden van de bal is het hoekverschil. Aangezien III de maximale rotatiehoek (180°) bereikt, wordt het ook weergegeven op het antipodale punt, aangezien ze in wezen hetzelfde zijn. Rotatie II, die tegen de klok in is ten opzichte van de positieve richting van as z, verschijnt aan de negatieve kant. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 7: 3D rotatiebaan. De rotatiebaan in de bal van rotaties genomen door de twee deelnemers aan de derde taak, zowel bekeken in perspectief (A) als in projecties op de coördinatenvlakken (B-D). De lijndikte neemt na verloop van tijd af. Elke kolom komt overeen met een deelnemer (v1 en v2). Naarmate de banen het midden van de bal naderen, zijn de deelnemers dichter bij het oplossen van de taak. '0' geeft de beginpositie van de taak aan. Volgende getallen geven punten aan waar de baan de rand van de bal bereikt en doorgaat door het antipodale punt aan de andere kant (1 tot 2, 2 tot 3, 3 tot 4, enz.). Klik hier om een grotere versie van deze figuur te bekijken.
Aanvullende tabel S1: Bladkoppen. Lijst met kopteksten in het gekloonde bladbestand. Elke header komt overeen met de naam van een variabele en ontvangt gegevens van deze variabele, die een kolom met waarden vormt die worden gebruikt bij de verwerking en analyse van onze gegevens. Klik hier om dit bestand te downloaden.
Aanvullend bestand 1: Protocol stap 1 gids. Een lijst met schermafbeeldingen die de stappen van de protocolmethode "1. Voorbereiding van instrumenten voor gegevensverzameling". Klik hier om dit bestand te downloaden.
Aanvullend bestand 2: Protocol stap 3 gids. Een lijst met schermafbeeldingen die de stappen van de protocolmethode "3. Gegevensverwerking en -analyse". Klik hier om dit bestand te downloaden.
Aanvullende video 1: Herhaling van fixatiemapping. Een voorbeeld van geanimeerde herhalingen van de temporele aandachtsmapping in 3D van iObj en tObj tegelijkertijd. Opgenomen met OBS Studios en gerenderd met OpenShot Video Editor. Klik hier om dit bestand te downloaden.
Zoals eerder vermeld, is dit document bedoeld om een gedetailleerde procedure te presenteren voor het real-time in kaart brengen van fixatie- en saccadebewegingsgegevens op interactieve 3D-objecten, die gemakkelijk kan worden aangepast en alleen gebruik maakt van gratis beschikbare software, met stapsgewijze instructies om alles te laten werken.
Hoewel deze experimentele opstelling een zeer interactieve taak inhield, zoals het verplaatsen van een 3D-object om de oriëntatie van een ander object overeen te laten komen met PR in twee van de drie mogelijke assen, zorgden we voor een grondige documentatie van onze scripts door middel van de juiste opmerkingen om eventuele aanpassingen te vergemakkelijken. Er kunnen verschillende andere soorten experimenten worden ontworpen, waarbij het eye-tracking-apparaat slechts een van de vele andere mogelijke apparaten is die worden gebruikt voor tijdelijke gegevensverzameling.
De headers in het gekopieerde bestand uit stap 1.1.3.3 bepalen de inhoud en locatie waar de gegevens online worden verzameld. Aanvullende tabel S1 geeft een overzicht van de namen van de variabelen (allemaal hoofdlettergevoelig) en hun betekenis. Deze variabelen komen overeen met de variabelen in de JavaScript-bestanden in de GitHub-repository. Het type en de verscheidenheid van de gegevens en de namen van variabelen, zowel uit dit blad als uit de JavaScript-bestanden, moeten worden gewijzigd afhankelijk van de reikwijdte en vereisten van het onderzoek.
De registratie van rotatiegegevens in quaternionen stelt de onderzoeker in staat om dezelfde bewegingen van de deelnemers tijdens de taken te reproduceren, waardoor een analyse van het proces wordt vergemakkelijkt en de opslagruimte veel efficiënter wordt gebruikt in vergelijking met een schermopname. Een meer gedetailleerde analyse, zoals de 3D-rotatiebaan, weergegeven in figuur 7 met behulp van de rotatiebal, is alleen mogelijk door de interne quaterniongegevens van de interactieve objecten. Dit nieuwe type grafiek breidt zich in de loop van de tijd uit van de AD-plot door Gardony22 en Adams23 en biedt meer gedetailleerde informatie, met de werkelijke 3D-rotatiecoördinaten in de tijd.
Een ander voordeel is het gebruik van een standaard tijdmeting om alle gegevensbronnen te synchroniseren. Het samenvoegen van verschillende lagen van tijdsafhankelijke informatie hiermee wordt veel gemakkelijker, zoals het over elkaar heen leggen van grafieken met meerdere gegevensbronnen, zoals in Figuur 5B met de pupilverwijdingsmeting, of in Figuur 5A met gekleurde verticale banden, die mogelijke patronen in het oplossingsproces van de deelnemers aangeven, zelfs terwijl er bijna geen rotatie plaatsvond in iObj. De heatmap voor 3D-fixatie die in figuur 3 wordt weergegeven, is alleen mogelijk op basis van zowel quaterniongegevens als gegevenssynchronisatie.
Het is van cruciaal belang om synchronisatie te gebruiken door middel van een standaard tijdmeting om elke integratie van tijdelijke gegevens te garanderen. De tijdstandaard die voor ons project werd gekozen, was de UNIX Epoch, die wordt gebruikt in JavaScript en de meeste andere programmeertalen. Voor elke dataset moet een soort bekende tijdstandaard in gebruik zijn, zelfs als er een andere standaard is, die later kan worden geconverteerd naar UNIX Epoch. Tijdelijke gegevens die geen standaarden gebruiken, zullen zeker niet kunnen worden gesynchroniseerd en hun nut verliezen.
Een andere beperking is de relatief lage frequentie van 10 Hz die in de iRT-tests werd gebruikt ten opzichte van de eyetracker-frequentie van 60 Hz. Dit gebeurt deels als gevolg van beperkingen op het gebied van gegevensverwerking en overdracht binnen de browser, aangezien elke hogere frequentie die wordt gebruikt, de maximale tijdslimiet van elke taak proportioneel zou verminderen, momenteel 327 s. Bovendien bracht het vloeiend renderen van complexe animaties in Jmol met deze framerate al uitdagingen met zich mee. Supplemental Video S1 is een video-opname van Jmol die een herhaling weergeeft met de verandering van dekking in de tijd, waarbij de hoeveelheid focus die elk hoekpunt heeft ontvangen, in kaart wordt gebracht. Hoewel de videoduur bijna 2 minuten is, werd de eigenlijke taak in 63 s voltooid. Toekomstige softwareontwikkelingen die specifiek op dergelijke functionaliteiten zijn gericht, in plaats van bestaande functionaliteiten aan te passen, zouden deze beperkingen kunnen aanpakken en de mogelijkheden voor gegevensverzameling en -analyse kunnen verbeteren.
De auteurs hebben geen belangenconflicten bekend te maken.
De auteurs zijn dankbaar voor de Coördinatie voor de Verbetering van het Personeel in het Hoger Onderwijs (CAPES) - Financiële Code 001 en de Federale Universiteit van ABC (UFABC). João R. Sato ontving financiële steun van de São Paulo Research Foundation (FAPESP, subsidies nrs. 2018/21934-5, 2018/04654-9 en 2023/02538-0).
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| Firefox | Mozilla Foundation (Open Source) | Any updated modern browser that is compatible with WebGL (https://caniuse.com/webgl), and in turn with Jmol, can be used | |
| GNU Octave | Open Source | https://octave.org/ | |
| Google Apps Script | Google LLC | script.google.com | |
| Google Sheets | Google LLC | https://www.google.com/sheets/about/ | |
| Laptop | Any computer that can run the eye tracking system software. | ||
| Mangold Software Suite | Mangold | Software interface used for the Eye tracking device. Any Software that outputs the data with system time values can be used. | |
| Mouse | Any mouse capable of clicking and dragging with simple movements should be compatible. Human interfaces analogous to a mouse with the same capabilities, such as a touchscreen or pointer, should be compatible, but may behave differently. | ||
| Vt3mini | EyeTech Digital Systems | 60 Hz. Any working Eye Tracking device should be compatible. |
Request permission to reuse the text or figures of this JoVE article
Request Permission