Hemos desarrollado un método simple, personalizable y eficiente para registrar datos procesuales cuantitativos de tareas espaciales interactivas y mapear estos datos de rotación con datos de seguimiento ocular.
Method Article
Hemos desarrollado un método simple, personalizable y eficiente para registrar datos procesuales cuantitativos de tareas espaciales interactivas y mapear estos datos de rotación con datos de seguimiento ocular.
Presentamos un método para el registro en tiempo real de la interacción humana con objetos virtuales tridimensionales (3D). El enfoque consiste en asociar los datos de rotación del objeto manipulado con medidas de comportamiento, como el seguimiento ocular, para hacer mejores inferencias sobre los procesos cognitivos subyacentes.
La tarea consiste en mostrar dos modelos idénticos del mismo objeto 3D (una molécula), presentados en la pantalla de un ordenador: un objeto interactivo giratorio (iObj) y un objeto objetivo estático (tObj). Los participantes deben rotar iObj con el ratón hasta que consideren que su orientación es idéntica a la de tObj. La computadora rastrea todos los datos de interacción en tiempo real. Los datos de la mirada del participante también se registran mediante un rastreador ocular. La frecuencia de medición es de 10 Hz en el ordenador y de 60 Hz en el rastreador ocular.
Los datos de orientación de iObj con respecto a tObj se registran en cuaterniones de rotación. Los datos de mirada se sincronizan con la orientación de iObj y se referencian mediante este mismo sistema. Este método nos permite obtener las siguientes visualizaciones del proceso de interacción humana con iObj y tObj: (1) disparidad angular sincronizada con otros datos dependientes del tiempo; (2) Trayectoria de rotación en 3D dentro de lo que decidimos llamar una "bola de rotaciones"; (3) Mapa de calor de fijación 3D. En todos los pasos del protocolo se ha utilizado software libre, como GNU Octave y Jmol, y todos los scripts están disponibles como material complementario.
Con este enfoque, podemos realizar estudios cuantitativos detallados del proceso de resolución de tareas que involucran rotaciones mentales o físicas, en lugar de solo el resultado alcanzado. Es posible medir con precisión la importancia de cada parte de los modelos 3D para el participante en la resolución de tareas y, por lo tanto, relacionar los modelos con variables relevantes como las características de los objetos, las habilidades cognitivas de los individuos y las características de la interfaz hombre-máquina.
La rotación mental (RM) es una capacidad cognitiva que permite a las personas manipular y rotar objetos mentalmente, lo que facilita una mejor comprensión de sus características y relaciones espaciales. Es una de las habilidades visoespaciales, un grupo cognitivo fundamental que se estudió ya en 18901. Las habilidades visoespaciales son un componente importante del repertorio cognitivo de un individuo que está influenciado tanto por factores hereditarios como ambientales 2,3,4,5. El interés en las habilidades visoespaciales ha crecido a lo largo del siglo XX debido a la creciente evidencia de su importancia en temas clave como la edad6 y el desarrollo7, el rendimiento en ciencia, tecnología, ingeniería y matemáticas (STEM)8,9, la creatividad10 y los rasgos evolutivos11.
La idea contemporánea de la RM deriva del trabajo pionero publicado por Shepard y Metzler (SM) en 197112. Idearon un método cronométrico utilizando una serie de tareas "iguales o diferentes", presentando dos proyecciones de objetos abstractos en 3D mostrados uno al lado del otro. Los participantes tenían que rotar mentalmente los objetos en algún eje y decidir si esas proyecciones representaban el mismo objeto girado de manera diferente u objetos distintos. El estudio reveló una correlación lineal positiva entre el tiempo de respuesta (RT) y la disparidad angular (AD) entre representaciones de un mismo objeto. Esta correlación se conoce como efecto de disparidad de ángulos (ADE). La ADE se considera una manifestación conductual de la IM y se hizo omnipresente en varios estudios posteriores influyentes en el campo 13,14,15,16,17,18,19,20,21,22,23,24,25. Los objetos 3D empleados en el estudio SM estaban compuestos por 10 cubos contiguos generados por el pionero de los gráficos por computadora Michael Noll en Bell Laboratories26. Se les conoce como figuras de SM y se emplean ampliamente en los estudios de RM.
Dos avances fueron de gran importancia en el trabajo seminal de Shepard y Metzler; en primer lugar, considerando las contribuciones en el campo de las evaluaciones de RM. En 1978, Vanderberg y Kuze27 desarrollaron una prueba psicométrica de lápiz y papel de 20 ítems basada en figuras SM "iguales o diferentes" que se conoció como la prueba de rotación mental (VKMRT). Cada ítem de la prueba presenta un estímulo objetivo. Los participantes deben seleccionar entre cuatro estímulos, cuáles representan el mismo objeto representado en el estímulo objetivo y cuáles no. VKMRT se ha utilizado para investigar la correlación entre la capacidad de RM y varios otros factores, como las diferencias relacionadas con el sexo 6,21,24,28,29,30, envejecimiento y desarrollo 6,31,32, rendimiento académico8,33, y habilidades en la música y los deportes34. En 1995, Peters et al. publicaron un estudio con figuras redibujadas para el VKMRT35,36. De manera similar, siguiendo el diseño de tarea "igual o diferente", se han empleado una variedad de otras bibliotecas de estímulos generados por computadora para investigar los procesos de RM y evaluar las habilidades de RM (versiones 3D de los estímulos SM originales 19,22,23,37,38, cuerpo humano imitando las figuras SM 25,39,40, polígonos planos para la rotación 2D41, 42, anatomía y órganos43, formas orgánicas44, moléculas45,46, entre otros21). También es relevante el Test de Visualización Espacial de Purdue (PSVT) propuesto por Guay en 197647. Implica una batería de pruebas, incluida la RM (PSVT:R). Empleando estímulos diferentes a los de VKMRT, PSVT:R requiere que los participantes identifiquen una operación de rotación en un estímulo modelo y la apliquen mentalmente a uno diferente. PSVT:R también se utiliza ampliamente, especialmente en estudios que investigan el papel de la RM en el logro de STEM 48,49,50.
El segundo avance de gran importancia en el trabajo seminal de Shepard y Metzler comprende las contribuciones a la comprensión del proceso de RM, en particular, con el uso de dispositivos de seguimiento ocular. En 1976, Just y Carpenter14 utilizaron un equipo de seguimiento ocular basado en video analógico para realizar un estudio basado en el experimento ADE de Shepard y Metzler. A partir de sus resultados sobre los movimientos oculares sacádicos y los RT, propusieron un modelo de procesos de RM que consta de tres fases: 1) la fase de búsqueda, en la que se reconocen partes similares de las figuras; 2) la fase de transformación y comparación, en la que una de las partes identificadas se rota mentalmente; 3) la fase de confirmación, en la que se decide si las cifras son iguales o no. Las fases se repiten de forma recursiva hasta que se puede tomar una decisión. Cada paso corresponde a patrones específicos de movimiento ocular sacádico y de fijación en estrecha relación con los ADE observados. Por lo tanto, al correlacionar la actividad ocular con los datos cronométricos, Just y Carpenter proporcionaron una firma cognitiva para el estudio de los procesos de resonancia magnética. Hasta la fecha, este modelo, aunque con adaptaciones, ha sido adoptado en varios estudios 15,42,46,51,52,53.
Siguiendo esta pista, varios estudios posteriores monitorean el comportamiento 18,19,22,23,25,34,40,54,55 y la actividad cerebral 20,22,56,57 Se realizaron funciones durante la rotación de estímulos. Sus hallazgos apuntan a un papel cooperativo entre la RM y los procesos motores. Además, existe un creciente interés en investigar estrategias de resolución de problemas que involucren la RM en relación con las diferencias individuales 15,41,46,51,58.
En general, se puede considerar que el diseño de estudios destinados a comprender los procesos de RM se basa en la presentación de una tarea con estímulos visuales que solicita a los participantes la realización de una operación de RM que, a su vez, implica una reacción motora. Si esta reacción permite la rotación de los estímulos, a menudo se denomina rotación física (RP). Dependiendo de los objetivos específicos de cada estudio, se han empleado diferentes estrategias y dispositivos para la adquisición y análisis de datos de RM y RP. En el paso de presentación de estímulos de la tarea, es posible cambiar los tipos de estímulos (es decir, ejemplos citados anteriormente); la proyección (imágenes generadas por ordenador en pantallas tradicionales 22,23,25,29,40,41,59, así como en estereoscopios19 y entornos de realidad virtual 60 y mixta43); y la interactividad de los estímulos (imágenes estáticas 12,27,36, animaciones61 y objetos virtuales interactivos 19,22,23,43,53,59).
La RM suele inferirse a partir de las mediciones de las RT (ADE), así como de la actividad ocular y cerebral 25,46,62. La actividad ocular se mide mediante datos de seguimiento ocular que consisten en movimientos y fijaciones sacádicas 14,15,42,51,52,54,58,60, así como pupilometría 40. Los datos RT suelen surgir de los datos de respuesta del motor registrados durante el funcionamiento de diversos dispositivos, como las palancas13, los botones e interruptores14,53, los pedales53, los mandos giratorios19, los joysticks37, el teclado61 y el ratón29,58,60, las ruedas motrices53, los sensores inerciales22,23, las pantallas táctiles52,59y micrófonos22. Para medir la RP, además de los RT, el diseño del estudio también incluirá el registro de rotaciones manuales de estímulos interactivos mientras los participantes realizan la tarea de RM 22,23,52,53.
En 1998, Wohlschläger y Wohlschläger19 utilizaron tareas "iguales o diferentes" con estímulos virtuales interactivos de SM manipulados con una perilla, con rotaciones limitadas a un eje por tarea. Midieron el RT y el registro acumulado de las rotaciones físicas realizadas durante las tareas. Al comparar situaciones con y sin rotación real de los estímulos interactivos, concluyeron que la RM y la RP comparten un proceso común tanto para las rotaciones imaginadas como para las realmente realizadas.
En 2014, se realizaron dos estudios que emplearon el mismo tipo de tareas con estímulos interactivos virtuales22,23. Sin embargo, los objetos fueron manipulados con sensores inerciales que capturaban el movimiento en el espacio 3D. En ambos casos, además de los RT, se registraron las trayectorias de rotación, es decir, la evolución de las diferencias de rotación entre los estímulos de referencia y los interactivos durante las tareas. A partir de estas trayectorias, fue posible extraer tanto información acumulativa (es decir, el número total de rotaciones, en unidades cuaterniónicas) como información detallada sobre las estrategias de solución. Adams et al.23 estudiaron el efecto cooperativo entre la RM y la RP. Además de los RT, utilizaron la integral de las trayectorias de rotación como parámetro de precisión y objetividad de la resolución. Los perfiles de las curvas se interpretaron de acuerdo con un modelo de tres pasos63 (planificación, rotación mayor, ajuste fino). Los resultados indican que la RM y la RP no tienen necesariamente un único factor común. Gardony et al.22 recolectaron datos sobre RT, precisión y rotación en tiempo real. Además de confirmar la relación entre RM y RP, el análisis de las trayectorias de rotación reveló que los participantes manipularon las cifras hasta que pudieron identificar si eran diferentes o no. Si eran iguales, los participantes los rotaban hasta que se vieran iguales.
Continuando con esta estrategia, en 2018, Wetzel y Bertel52 también utilizaron figuras SM interactivas en tareas "iguales o diferentes" utilizando tabletas con pantalla táctil como interfaz. Además, utilizaron un dispositivo de seguimiento ocular para obtener datos acumulativos sobre el tiempo de fijación y la amplitud sacádica como parámetros de la carga cognitiva implicada en la resolución de tareas de RM. Los autores confirmaron los estudios previos discutidos anteriormente con respecto a las relaciones entre RM y RP y los procesos de resolución de tareas. Sin embargo, en este estudio, no utilizaron el mapeo de fijación y los datos de movimientos sacádicos para los estímulos.
Se han propuesto y mejorado constantemente enfoques metodológicos para el mapeo de datos de seguimiento ocular sobre objetos virtuales en 3D, generalmente por investigadores interesados en estudiar los factores relacionados con la atención visual en entornos virtuales64. A pesar de ser asequibles y utilizar dispositivos de seguimiento ocular similares, aparentemente, estos métodos no se han integrado de manera efectiva en el repertorio experimental empleado en los estudios de rotación mental con objetos 3D interactivos como los mencionados anteriormente. Por el contrario, no encontramos ningún estudio en la literatura que informara sobre el mapeo en tiempo real de los datos de fijación y movimiento sacádico en objetos 3D interactivos. No parece haber un método conveniente para integrar fácilmente los datos de actividad ocular con las trayectorias de rotación. En esta investigación, nuestro objetivo es contribuir a llenar este vacío. El procedimiento se presenta en detalle, desde la adquisición de datos hasta la generación de resultados gráficos.
En este artículo, describimos en detalle un método para estudiar los procesos de rotación mental con objetos virtuales interactivos en 3D. Se destacan los siguientes avances. En primer lugar, integra la recopilación de datos cuantitativos de datos motores conductuales (rotación de objetos impulsados a mano a través de una interfaz informática) y oculares (seguimiento ocular) durante sesiones de interacción con modelos virtuales 3D. En segundo lugar, solo requiere equipos informáticos convencionales y dispositivos de seguimiento ocular para el diseño de tareas visuales, la adquisición de datos, el registro y el procesamiento. En tercer lugar, genera fácilmente una salida gráfica para facilitar el análisis de datos: disparidad angular, rotación física, trayectorias de rotación cuaterniónica y mapeo de datos de seguimiento ocular sobre objetos virtuales 3D. Finalmente, el método solo requiere software libre. Todo el código y los scripts desarrollados están disponibles de forma gratuita (https://github.com/rodrigocnstest/rodrigocnstest.github.io).
1. Preparación de herramientas de recopilación de datos
2. Recopilación de datos
3. Procesamiento y análisis de datos
4. Personalización de tareas
NOTA: Toda esta sección es opcional y solo se recomienda para aquellos a quienes les gusta experimentar o comprender cómo codificar. A continuación, encontrará algunas de las muchas opciones personalizables disponibles, y habrá más opciones disponibles a medida que desarrollemos más los métodos.
Evolución de la disparidad angular y otras variables
Como se muestra en el paso 3.3.1 del Archivo Suplementario 2, se presentan dos lienzos al participante en la pantalla del monitor de vídeo, mostrando copias del mismo objeto virtual 3D en diferentes orientaciones. En el lienzo izquierdo, el objeto de destino (tObj) permanece estático y sirve como posición de destino o posición de tObj. En el lienzo de la derecha, el objeto interactivo (iObj) se muestra en una posición diferente y permite al participante moverlo a lo largo del tiempo alrededor de un centro de rotación fijo con un ratón (solo rotaciones; las traducciones están desactivadas). La tarea en cuestión consiste en ajustar el iObj para que coincida estrechamente con el tObj en función del juicio del participante. Los tres objetos 3D utilizados se pueden ver en la Figura 1. El proceso de resolución, aunque complejo, puede registrarse meticulosamente para su posterior análisis. Esta grabación va más allá de un mero metraje de vídeo, ya que cada posición a lo largo del tiempo se captura a intervalos fijos de 0,1 s como un cuaternión, formando una serie temporal que permite una reconstrucción completa de todo el proceso. En cualquier posición, existe una rotación única alrededor de un eje específico, que va desde 0° hasta 180°, que transforma directamente la posición tObj en la posición iObj. Si bien esta rotación es abstracta y no está relacionada con el PR del participante durante la tarea, indica con precisión la posición precisa de iObj en relación con tObj. AD es el ángulo de esta rotación y se puede calcular a partir del cuaternión respectivo. A medida que la posición iObj se acerca a la posición tObj, este valor se aproxima a cero.
Después del paso 3.1.6 de la sección Procesamiento y análisis de datos, se crearon dos archivos: la combinación de salida X Y.xlsx y la consola jmol de salida X Y.xlsx, donde X es el valor de sessionID e Y es el valor de taskID . Si utiliza los valores predeterminados dejando los campos de entrada en blanco, los archivos deben denominarse 1682707472090 bolaBastao_c.xlsx de combinación de salida y 1682707472090 bolaBastao_c.xlsx de consola jmol de salida. Los archivos de combinación X Y.xlsx de salida contienen los datos del seguimiento ocular seleccionados combinados con los datos iRT, alineados por el tiempo de época UNIX, similar a la Figura 2A si todo procedió correctamente, o a la Figura 2B si ocurrió algún problema.
Los archivos de salida de la consola jmol X Y.xlsx contienen hasta cinco pestañas llenas de comandos de la consola Jmol que, cuando se pegan en la consola Jmol, reproducirán los movimientos del participante al resolver la tarea: rotation replay reproduce las rotaciones iObj realizadas por el participante; gaze replay int reproduce las rotaciones de iObj con un mapa de calor de fijación adicional en el objeto en el tiempo mediante el uso de una escala de transparencia/opaca; gaze replay tgt muestra solo el mapa de calor de fijación 3D de tObj durante la tarea; gaze frame int y gaze frame tgt muestran el mapeo de fijación general de todo el proceso tanto para iObj como para tObj. Todos ellos se ilustran en la Figura 3A-F. Jmol y JSmol son esencialmente idénticos, siendo Jmol el complemento basado en el lenguaje de programación Java y JSmol en el lenguaje de programación JavaScript, ambos con las mismas funcionalidades y se utilizan indistintamente.
La Figura 4 ilustra la evolución de la disparidad angular en función del tiempo para seis escenarios diferentes que involucran a dos participantes y tres objetos. La duración del proceso puede variar significativamente en función del rendimiento del participante con el objeto de tarea interactivo. En cualquier tarea completada correctamente por el participante, AD tiende a cero al final. Si el mismo gráfico no muestra este comportamiento, el participante no pudo completar la tarea porque se dio por vencido o alcanzó el límite de tiempo por tarea (aproximadamente 5 min), o se produjo un error en el procesamiento de datos.
En la Figura 5 se muestran los resultados combinados de los registros de RP de iObj y los datos obtenidos de las mediciones de seguimiento ocular. La variación en la disparidad angular entre el objetivo y los objetos inerciales en función del tiempo indica tres etapas distintas en el proceso de resolución de la tarea asignada: observación inicial de los modelos; rotación balística del modelo interactivo; Ajuste fino de la rotación del modelo interactivo. La figura 5A muestra la alternancia de miradas entre los modelos en la fase inicial y, más concretamente, en la fase de puesta a punto. La figura 5B muestra que la pupila permanece más dilatada en las fases inicial y de ajuste fino. En la fase de ajuste, el largo período de fijación en el modelo interactivo (40-47 s en la Figura 5A) corresponde a una meseta en el diámetro de la pupila (40-47 s, Figura 5B).
Estos resultados sugieren que los datos obtenidos con el método aquí propuesto son consistentes con el modelo de resolución de problemas de rotación mental propuesto a partir de los datos de fijación de la mirada para los modelos estáticos14,66 y para los modelos interactivos23. Un modelo de este tipo abarcaría tres etapas: búsqueda, transformación y comparación, y confirmación de la coincidencia o discrepancia entre los modelos. Además, la alternancia de fijaciones entre los modelos objetivo e interactivo en las etapas de comparación observadas en la Figura 5A es consistente con los resultados obtenidos en las pruebas tipo Sheppard y Metzler que utilizan imágenes estáticas42,66. Sin embargo, en el caso de los modelos interactivos, es probable que estas etapas de búsqueda, transformación, comparación y confirmación ocurran sucesivamente a través de la interacción y el reposicionamiento del modelo interactivo.
Trayectorias de rotación 3D
Cada rotación en un espacio 3D de 0° a 180° se puede trasladar a un punto dentro de una bola (que se entiende como el volumen dentro de una esfera) con un radio igual a 180°. La Figura 6 muestra esta correspondencia con tres ejemplos de rotaciones. La distancia del punto al centro de la bola es la disparidad de ángulo iObj desde la posición tObj, y el vector que apunta desde el centro de la bola hasta el punto es la dirección de rotación, la rotación se realiza en el sentido de las agujas del reloj visto desde el centro. Esta traducción de las rotaciones en puntos en una bola permite visualizar directamente, en un solo dibujo en 3D, toda la trayectoria de las rotaciones realizadas por el participante en una tarea. A este dibujo lo llamamos trayectoria de rotación 3D.
De manera análoga a la medida AD, para cualquier tarea correctamente completada por el participante, la trayectoria debe acercarse, al final, al centro de la pelota. Si la trayectoria alcanza el límite de la esfera a una rotación de 180°, se envolverá hasta el punto antípoda de la esfera. La Figura 7 ilustra la trayectoria de rotación tomada por los dos participantes mencionados anteriormente que realizan la tercera tarea (C1 y C2 en la Figura 4), vista tanto en perspectiva como en proyecciones en los tres planos de coordenadas. De la figura se desprende que, a pesar de la relativamente pequeña DA inicial cercana a 45°, el participante 1 se desvió inicialmente de la posición objetivo antes de encontrar un camino definitivo hacia la solución, a diferencia del participante 2, que completó la tarea más rápido.
Mapa de calor de fijación 3D
Durante el proceso de resolución de problemas, el participante alterna su mirada entre tObj e iObj mientras interactúa con iObj. Con los datos de seguimiento ocular, podemos extraer la posición de la mirada del participante y crear un mapa de calor de las regiones de la pantalla que captaron la mayor y menor atención del participante en un intervalo determinado. Yendo más allá, con los datos de seguimiento ocular y de cuaternión iRT sincronizados, podemos mapear simultáneamente en el espacio 3D y en el tiempo, cuánta atención está recibiendo cada uno de los vértices del objeto, incluso para objetos que se rotan en el tiempo.
En la Figura 3, la atención prestada al objeto está representada por el nivel de opacidad de cada vértice. Cuanto más cerca esté de la mirada del participante y cuanto más tiempo permanezca en proximidad, más atención recibe, lo que resulta en una mayor opacidad en esa región del objeto. La disminución espacial de la atención se modela utilizando una función gaussiana homogénea bivariada para la posición de la mirada y una función gaussiana homogénea simple aplicada para el tiempo transcurrido. La desviación estándar de estos gaussianos se eligió asumiendo un ángulo visual de 2 grados67 y una memoria visual a corto plazo de 10 s68. Para evitar cualquier artefacto visual con este método, los datos de proximidad de la mirada se establecen en cero mientras la mirada está fuera del lienzo del objeto (iObj no recibe atención residual cuando la mirada está dentro del lienzo tObj o fuera de ambos). En la figura 3 se muestra un solo fotograma de cada objeto de una animación de repetición completa y los mismos fotogramas con el mapa de calor de fijación 3D. Se puede ver una posible comparación entre tObj e iObj por parte del participante durante el proceso de resolución (Figura 3C,D) a medida que la tarea se acerca a su conclusión (tiempo = 6,3 s). Todo el proceso se puede ver como un video en el Video Complementario S1. Presentamos los resultados de la rotación mediada por ordenador de modelos 3D presentados a los participantes como una tarea realizada en condiciones ordinarias.

Figura 1: Objetos de destino utilizados. Imagen de los modelos 3D utilizados en las tareas de la página web. (A) Una molécula con representación de bola y palo; (B) La misma molécula con polígonos rellenos, sin hidrógenos, y representada solo por palos; (C) un policubo similar a una de las figuras de Shepard y Metzler13, derivado de la biblioteca de estímulos de Peters y Battista36. Haga clic aquí para ver una versión más grande de esta figura.

Figura 2: Comparación de hojas. (A,B) Las imágenes se toman de la 1682707472090 bolaBastao_c.xlsx de combinación de salida de la hoja de cálculo. Las columnas de la A a la G contienen valores de datos de iRT, mientras que las columnas H a N contienen valores de datos de seguimiento ocular. En (A), todo es correcto, mientras que en (B), en las columnas de seguimiento ocular, todos los valores son constantes y no coinciden con los valores de tiempo del sistema iRT. Si se produce algún problema con el proceso de sincronización de datos, es probable que ocurra este error. Haga clic aquí para ver una versión más grande de esta figura.

Figura 3: Mapa de calor de fijación 3D. Mapa de calor de fijación sobre el objeto 3D utilizando una escala de opacidad, donde más opaco se correlaciona con más tiempo cerca de la mirada del participante. (A,B) imágenes tObj e iObj de la tarea que está resolviendo el participante en la marca de 6.3 s. (C,D) Las mismas imágenes que (A, B) en el mismo instante con la escala de opacidad añadida del mapa de calor. (E,F) Fijación de imágenes de mapa de calor considerando todo el período durante el cual el participante pudo ver los objetos. Haga clic aquí para ver una versión más grande de esta figura.

Figura 4: Cuadrícula AD. Traza una cuadrícula de disparidad angular entre dos participantes y tres tareas. Las columnas representan a los participantes 1 y 2, y las filas representan las tareas resueltas por los participantes utilizando los tres objetos ilustrados en la Figura 3. Tenga en cuenta que si bien la DA varía entre 0° y 180°, el rango de tiempo no es fijo y varía según el desempeño del participante y su propia decisión de detener el proceso. A medida que el participante rota iObj, el AD entre tObj e iObj varía a medida que avanza el tiempo y, finalmente, el participante elige la orientación actual de iObj como la más cercana a tObj. En la1ª y2ª tarea, ambos participantes parecían haber progresado de manera similar, pero el participante 1 tardó la mitad de tiempo que el participante 2. Y en la3ª tarea, aunque el participante 2 tardó menos en completar la tarea, el participante 1 ya había resuelto la tarea antes de la marca de los 20 s y siguió haciendo pequeños ajustes para hacer coincidir mejor iObj con tObj. Abreviatura: AD = disparidad angular. Haga clic aquí para ver una versión más grande de esta figura.

Figura 5: AD con datos de seguimiento ocular. Evolución de la disparidad angular combinada con datos de seguimiento ocular. (A) Disparidad angular y posición de la mirada, la evolución de la disparidad angular entre tObj e iObj, junto con los datos de fijación regional para cada modelo. El gráfico muestra en qué región se encuentra la mirada del participante: rojo cuando está dentro del lienzo iObj, azul cuando está dentro del lienzo tObj y gris cuando está fuera de ambos, mirando a otro elemento de la pantalla o apartando la vista de él. (B) Disparidad angular y diámetro de la pupila. Disparidad angular, en azul, junto con los datos del diámetro de la pupila, en naranja. El diámetro de la pupila es el valor medio de las pupilas izquierda y derecha en cada punto en el tiempo. Abreviatura: AD = disparidad angular. Haga clic aquí para ver una versión más grande de esta figura.

Figura 6: Bola de rotaciones. Esta figura ilustra cómo cada posible posición de rotación de un objeto desde una posición de referencia se puede representar como un punto en una bola de radio de 180°, lo que permite una representación completa de la posición de rotación del objeto en los tres ejes. Aquí, una bola se entiende como el volumen delimitado por una esfera. (A) El objeto utilizado como ejemplo es una unión asimétrica de siete cubos, representados en la parte superior, a la izquierda. A este objeto se le aplican tres rotaciones simples numeradas I, II y III, como se muestra a la derecha. Son, respectivamente, +90° en el eje x, -60° en el eje z y 180° en un eje entre +x e -y, a 45° desde ambos ejes. (B) La bola de rotación se muestra con los puntos correspondientes a las rotaciones I, II y III. La distancia al centro de la bola es la disparidad de ángulos. Como III alcanza el ángulo de rotación máximo (180°), también se representa en su punto antípoda, ya que son esencialmente iguales. La rotación II, al ser en sentido contrario a las agujas del reloj con respecto a la dirección positiva del eje z, aparece en el lado negativo. Haga clic aquí para ver una versión más grande de esta figura.

Figura 7: Trayectoria de rotación 3D. La trayectoria de rotación dentro de la bola de rotaciones tomada por los dos participantes en la tercera tarea, vista tanto en perspectiva (A) como en proyecciones en los planos de coordenadas (B-D). El grosor de la línea disminuye con el tiempo. Cada columna corresponde a un participante (v1 y v2). A medida que las trayectorias se acercan al centro de la pelota, los participantes están más cerca de resolver la tarea. '0' indica la posición inicial de la tarea. Los números siguientes indican puntos en los que la trayectoria llega al borde de la bola y continúa a través del punto antípoda en el lado opuesto (1 a 2, 2 a 3, 3 a 4, etc.). Haga clic aquí para ver una versión más grande de esta figura.
Tabla complementaria S1: Encabezados de hoja. Lista de encabezados en el archivo de hoja clonado. Cada cabecera corresponde a un nombre de variable y recibirá datos de esta variable formando una columna de valores utilizados en el procesamiento y análisis de nuestros datos. Haga clic aquí para descargar este archivo.
Archivo complementario 1: Guía del paso 1 del protocolo. Una lista de capturas de pantalla que guían los pasos del método de protocolo "1. Elaboración de herramientas de recogida de datos". Haga clic aquí para descargar este archivo.
Archivo complementario 2: Guía del paso 3 del protocolo. Una lista de capturas de pantalla que guían los pasos del método de protocolo "3. Procesamiento y análisis de datos". Haga clic aquí para descargar este archivo.
Video complementario 1: Repetición del mapeo de fijación. Un ejemplo de repeticiones animadas del mapeo de la atención temporal en 3D de iObj y tObj simultáneamente. Grabado con OBS Studios y renderizado con OpenShot Video Editor. Haga clic aquí para descargar este archivo.
Como se indicó anteriormente, este artículo tiene como objetivo presentar un procedimiento detallado de mapeo en tiempo real de datos de fijación y movimiento sacádico en objetos 3D interactivos, que es fácilmente personalizable y solo utiliza software disponible de forma gratuita, que proporciona instrucciones paso a paso para que todo funcione.
Si bien esta configuración experimental implicó una tarea altamente interactiva, como mover un objeto 3D para que coincida con la orientación de otro objeto con PR en dos de los tres ejes posibles, nos aseguramos de una documentación exhaustiva de nuestros scripts a través de comentarios adecuados para facilitar cualquier personalización. Se pueden diseñar otros tipos de experimentos, siendo el dispositivo de seguimiento ocular solo uno de los muchos otros dispositivos posibles utilizados para la adquisición de datos temporales.
Los encabezados del archivo copiado del paso 1.1.3.3 definen el contenido y la ubicación en que se recopilarán los datos en línea. En la tabla complementaria S1 se enumeran los nombres de las variables (todos distinguen entre mayúsculas y minúsculas) y su significado. Estas variables reflejan las que se encuentran en los archivos JavaScript dentro del repositorio de GitHub. El tipo y la variedad de los nombres de datos y variables, tanto de esta hoja como de los archivos JavaScript, deben cambiarse de acuerdo con el alcance y los requisitos de la investigación.
El registro de los datos de rotación en cuaterniones permite al investigador reproducir los mismos movimientos realizados por los participantes durante las tareas, facilitando un análisis del proceso y utilizando el espacio de almacenamiento de forma mucho más eficiente si se compara con una captura de pantalla. Un análisis más detallado, como la trayectoria de rotación en 3D, que se muestra en la Figura 7 utilizando la bola de rotaciones, solo es posible a través de los datos de cuaterniones internos de los objetos interactivos. Expandiéndose a partir del gráfico AD a lo largo del tiempo de Gardony22 y Adams23, este nuevo tipo de gráfico proporciona información más detallada, con las coordenadas de rotación 3D reales en el tiempo.
Otra ventaja proviene del uso de una medida de tiempo estándar para sincronizar todas las fuentes de datos. La combinación de diferentes capas de información dependiente del tiempo con esto se vuelve mucho más fácil, como la superposición de gráficos con múltiples fuentes de datos, como en la Figura 5B con la medición de la dilatación de la pupila, o en la Figura 5A con bandas verticales coloreadas, que denotan posibles patrones en el proceso de resolución de los participantes, incluso cuando casi no había rotación en iObj. El mapa de calor de fijación 3D que se muestra en la Figura 3 solo es posible a partir de los datos de cuaternión y la sincronización de datos.
Es crucial utilizar la sincronización a través de una medida de tiempo estándar para garantizar cualquier integración de datos temporales. El estándar de tiempo elegido para nuestro proyecto fue UNIX Epoch, que se utiliza en JavaScript y en la mayoría de los otros lenguajes de programación. Se debe utilizar algún tipo de estándar de tiempo conocido para cada conjunto de datos, incluso si se utiliza un estándar diferente, que más tarde se puede convertir a UNIX Epoch. Los datos temporales que no utilicen ningún estándar serán, con toda seguridad, incapaces de sincronizarse y perderán su utilidad.
Otra limitación es la frecuencia relativamente baja de 10 Hz utilizada en las pruebas iRT en relación con la frecuencia del eye tracker de 60 Hz. Esto sucede en parte debido a las limitaciones de procesamiento y transferencia de datos dentro del navegador, ya que cualquier frecuencia más alta utilizada reduciría proporcionalmente el límite de tiempo máximo de cada tarea, actualmente en 327 s. Además, renderizar sin problemas animaciones complejas en Jmol a esta velocidad de fotogramas ya presentaba desafíos. El vídeo complementario S1 es una grabación de vídeo de Jmol renderizando una repetición con el cambio de opacidad en el tiempo, mapeando la cantidad de foco que recibió cada vértice. Si bien la duración del video es de casi 2 minutos, la tarea real se completó en 63 segundos. Los futuros desarrollos de software que se adapten específicamente a esas funcionalidades en lugar de adaptar las existentes, podrían abordar estas limitaciones y mejorar las capacidades de recopilación y análisis de datos.
Los autores no tienen conflictos de intereses que revelar.
Los autores agradecen a la Coordinación de Perfeccionamiento del Personal de Nivel Superior (CAPES) - Código de Finanzas 001 y a la Universidad Federal del ABC (UFABC). João R. Sato recibió apoyo financiero de la Fundación de Apoyo a la Investigación Científica del Estado de São Paulo (FAPESP, Becas Nos. 2018/21934-5, 2018/04654-9 y 2023/02538-0).
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| Firefox | Mozilla Foundation (Open Source) | Cualquier navegador moderno actualizado que sea compatible con WebGL (https://caniuse.com/webgl), y a su vez con Jmol, puede ser utilizado | |
| GNU Octave | Open Source | https://octave.org/ | |
| Google Apps Script | Google LLC | script.google.com | |
| Google Sheets | Google LLC | https://www.google.com/sheets/about/ | |
| Laptop | Cualquier computadora que pueda ejecutar el software del sistema de seguimiento ocular. | ||
| Paquete de software Mangold Mangold | Interfaz de software utilizada para el dispositivo de seguimiento ocular. Se puede utilizar cualquier software que genere los datos con valores de tiempo del sistema. | ||
| Ratón | Cualquier ratón capaz de hacer clic y arrastrar con movimientos sencillos debe ser compatible. Las interfaces humanas análogas a un ratón con las mismas capacidades, como una pantalla táctil o un puntero, deben ser compatibles, pero pueden comportarse de forma diferente. | ||
| Vt3mini | EyeTech Sistemas | 60 Hz. Cualquier dispositivo de seguimiento ocular que funcione debe ser compatible. |
Request permission to reuse the text or figures of this JoVE article
Request Permission