Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Neuroscience

Психофизическая парадигма для сбора и анализа суждений о сходстве

Published: March 1, 2022 doi: 10.3791/63461

Summary

Протокол представляет экспериментальную психофизическую парадигму для получения большого количества суждений о сходстве и сопутствующий рабочий процесс анализа. Парадигма исследует контекстные эффекты и позволяет моделировать данные подобия в терминах евклидовых пространств по меньшей мере пяти измерений.

Abstract

Суждения о подобии обычно используются для изучения ментальных представлений и их нейронных коррелятов. Этот подход использовался для характеристики пространств восприятия во многих областях: цвета, объекты, изображения, слова и звуки. В идеале можно было бы сравнить оценки воспринимаемого сходства между всеми парами стимулов, но это часто непрактично. Например, если попросить субъекта сравнить сходство двух предметов с сходством двух других предметов, число сравнений увеличивается с четвертой степенью размера набора стимулов. Альтернативная стратегия состоит в том, чтобы спросить субъекта оценить сходство изолированных пар, например, по шкале Лайкерта. Это гораздо более эффективно (количество рейтингов растет квадратично с размером набора, а не квартически), но эти рейтинги, как правило, нестабильны и имеют ограниченное разрешение, и подход также предполагает, что нет контекстных эффектов.

Здесь представлена новая парадигма ранжирования для эффективного сбора суждений о подобии, а также конвейер анализа (предоставляемый программным обеспечением), который проверяет, учитывают ли данные модели евклидовых расстояний. Типичные испытания состоят из восьми стимулов вокруг центрального эталонного стимула: субъект ранжирует стимулы в порядке их сходства с референтным. Благодаря разумному выбору комбинаций стимулов, используемых в каждом испытании, подход имеет внутренний контроль для согласованности и контекстных эффектов. Подход был одобрен для стимулов, взятых из евклидовых пространств до пяти измерений.

Подход проиллюстрирован экспериментом, измеряющим сходство между 37 словами. Каждое испытание дает результаты 28 парных сравнений формы: «Было ли A более похоже на ссылку, чем B на ссылку?» Хотя непосредственное сравнение всех пар пар стимулов потребовало бы 221445 испытаний, эта конструкция позволяет реконструировать пространство восприятия из 5994 таких сравнений, полученных из 222 испытаний.

Introduction

Люди мысленно обрабатывают и представляют поступающую сенсорную информацию для выполнения широкого спектра задач, таких как распознавание объектов, навигация, делание выводов об окружающей среде и многие другие. Суждения о подобии обычно используются для исследования этих ментальных представлений1. Понимание структуры ментальных представлений может дать представление об организации концептуального знания2. Также можно получить представление о нейронных вычислениях, связав суждения о сходстве с паттернами активации мозга3. Кроме того, суждения о подобии выявляют особенности, которые являются заметными в восприятии4. Изучение того, как ментальные представления изменяются во время развития, может пролить свет на то, как они усваиваются5. Таким образом, суждения о сходстве дают ценное представление об обработке информации в мозге.

Распространенной моделью ментальных представлений, использующих сходства, является геометрическая модель пространства6,7,8. Применительно к сенсорным областям этот вид модели часто называют перцептивным пространством9. Точки в пространстве представляют собой раздражители, а расстояния между точками соответствуют воспринимаемому несходству между ними. Из суждений о сходстве можно получить количественные оценки различий. Эти попарные различия (или расстояния восприятия) затем могут быть использованы для моделирования пространства восприятия с помощью многомерного масштабирования10.

Существует множество методов сбора суждений о сходстве, каждый со своими преимуществами и недостатками. Самый простой способ получить количественные показатели несходства состоит в том, чтобы попросить испытуемых оценить по шкале степень несходства между каждой парой стимулов. Хотя это относительно быстро, оценки, как правило, нестабильны в течение длительных сессий, поскольку субъекты не могут вернуться к предыдущим суждениям, а контекстные эффекты, если они присутствуют, не могут быть обнаружены. (Здесь контекстный эффект определяется как изменение предполагаемого сходства между двумя стимулами, основанное на наличии других стимулов, которые не сравниваются.) В качестве альтернативы испытуемых можно попросить сравнить все пары стимулов со всеми другими парами стимулов. Хотя это дало бы более надежное ранжирование различий, количество сравнений требовало шкал с четвертой степенью числа стимулов, что делало возможным только небольшие наборы стимулов. Более быстрые альтернативы, такие как сортировка по заданному количеству кластеров11 или бесплатная сортировка, имеют свои ограничения. Свободная сортировка (на любое количество куч) интуитивно понятна, но она заставляет субъекта классифицировать стимулы, даже если стимулы нелегко поддаются категоризации. Более поздний метод с несколькими компоновками, обратный MDS, обходит многие из этих ограничений и очень эффективен12. Однако этот метод требует, чтобы испытуемые проецировали свои ментальные представления на 2D-евклидову плоскость и рассматривали сходства определенным геометрическим образом, делая предположение, что структура подобия может быть восстановлена из евклидовых расстояний на плоскости. Таким образом, сохраняется потребность в эффективном методе сбора большого количества суждений о сходстве, не делая предположений о геометрии, лежащей в основе суждений.

Здесь описан метод, который является достаточно эффективным, а также позволяет избежать вышеуказанных потенциальных ловушек. Попросив испытуемых ранжировать стимулы в порядке сходства с центральной ссылкой в каждом испытании13, можно исследовать относительное сходство напрямую, не предполагая ничего о геометрической структуре ответов испытуемых. Парадигма повторяет подмножество сравнений как с идентичными, так и с различными контекстами, что позволяет непосредственно оценивать контекстные эффекты, а также получать градуированные ответы с точки зрения вероятностей выбора. Процедура анализа разлагает эти ранговые суждения на несколько попарных сравнений и использует их для построения и поиска евклидовых моделей перцептивных пространств, которые объясняют суждения. Метод подходит для подробного описания представления наборов стимулов умеренных размеров (например, от 19 до 49).

Чтобы продемонстрировать целесообразность подхода, был проведен эксперимент, использующий в качестве стимулов набор из 37 животных. Данные собирались в течение 10 часовых сессий, а затем анализировались отдельно для каждого субъекта. Анализ выявил согласованность между субъектами и незначительные контекстные эффекты. Он также оценил согласованность воспринимаемых различий между стимулами с евклидовыми моделями их перцептивных пространств. Парадигма и процедуры анализа, изложенные в этой статье, являются гибкими и, как ожидается, будут полезны для исследователей, заинтересованных в характеристике геометрических свойств ряда перцептивных пространств.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Перед началом экспериментов все испытуемые дают информированное согласие в соответствии с институциональными руководящими принципами и Хельсинкской декларацией. В случае этого исследования протокол был одобрен институциональным наблюдательным советом Медицинского колледжа Вайля Корнелла.

1. Установка и настройка

  1. Скачайте код из репозитория GitHub, сходства (https://github.com/jvlab/similarities). В командной строке выполните: git clone https://github.com/jvlab/similarities.git. - Если git не установлен, загрузите код в виде ZIP-папки из репозитория.
    ПРИМЕЧАНИЕ: В репозитории находятся два подкаталога: experiments, который содержит два примера экспериментов, и analysis, который содержит набор скриптов python для анализа собранных данных о подобии. В каталоге экспериментов один (word_exp) использует словесные стимулы, а другой (image_exp) отображает визуальные стимулы. Некоторое знакомство с Python будет полезным, но не необходимым. Предполагается знакомство с командной строкой: несколько шагов требуют запуска скриптов из командной строки.
  2. Установите следующие средства и настройте виртуальную среду.
    1. python 3: Смотрите ссылку для инструкций: https://realpython.com/installing-python/. Для этого проекта требуется Python версии 3.8.
    2. PsychoPy: По ссылке (https://www.psychopy.org/download.html) загрузите последнюю автономную версию PsychoPy для соответствующей операционной системы, используя синюю кнопку, в разделе Установка. Этот проект использует PsychoPy версии 2021.2; предоставленные примеры экспериментов должны быть выполнены с правильной версией PsychoPy, как указано ниже.
    3. conda: По ссылке (https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html#regular-installation) загрузите conda через Miniconda или Anaconda для соответствующей операционной системы.
    4. В командной строке выполните следующую команду, чтобы создать виртуальную среду с необходимыми пакетами Python:
      cd ~/сходства
      conda env create -f environment.yaml
    5. Проверьте, создана ли виртуальная среда, и активируйте ее следующим образом:
      Список conda env # venv_sim_3.8 должен быть указан
      conda активировать venv_sim_3.8 # для входа в виртуальную среду
      conda деактивирует # для выхода из виртуальной среды после выполнения сценариев
      ПРИМЕЧАНИЕ: Запуск скриптов в среде иногда может быть медленным. Пожалуйста, подождите до минуты, чтобы увидеть все напечатанные выходные данные в командной строке при запуске скрипта.
  3. Чтобы убедиться, что загруженный код работает должным образом, выполните предоставленные примеры экспериментов, выполнив следующие действия.
    ПРИМЕЧАНИЕ: Каталог экспериментов (сходства/эксперименты) содержит образцы экспериментов (word_exp и image_exp), в которых используются два вида стимулов: слова и изображения.
    1. Откройте PsychoPy. Перейдите в вид, затем щелкните Кодер, так как построитель PsychoPy по умолчанию не может открывать .py файлы. Перейдите в файл, затем нажмите кнопку Открыть и откройте word_exp.py (сходства/эксперименты/word_exp/word_exp.py).
    2. Чтобы загрузить эксперимент, нажмите зеленую кнопку Запустить эксперимент . Введите инициалы или имя и номер сеанса и нажмите кнопку ОК.
    3. Следуйте инструкциям и пройдите через несколько пробных версий, чтобы проверить, что стимулы серые при нажатии. Нажмите клавишу ESCAPE , когда будете готовы к выходу.
      ПРИМЕЧАНИЕ: PsychoPy откроется в полноэкранном режиме, сначала отображая инструкции, а затем несколько испытаний, с замещающим текстом вместо стимулирующих слов. При нажатии на них слова выпадают серым цветом. Когда все слова будут нажаты, начнется следующее испытание. В любой момент PsychoPy можно отключить нажатием клавиши Escape . Если программа завершает работу во время шагов 1.3.2 или 1.3.3, возможно, операционной системе пользователя требуется доступ к клавиатуре и мыши. Если это так, в окне PsychoPy Runner будет напечатано описательное сообщение об ошибке, которое будет направлять пользователя.
    4. Затем убедитесь, что эксперимент с изображением выполняется с изображениями-заполнителями. Откройте PsychoPy. Перейдите в раздел Файл. Нажмите кнопку Открыть и выберите image_exp.psyexp (сходства/эксперименты/image_exp/image_exp.psyexp).
    5. Чтобы убедиться, что используется правильная версия, щелкните значок Gear . Из опции Использовать версию PsychoPy выберите 2021.2 из выпадающего меню.
    6. Как и раньше, нажмите зеленую кнопку Запустить эксперимент . Введите инициалы или имя и номер сеанса и нажмите кнопку ОК.
      ПРИМЕЧАНИЕ: Как и на шаге 1.3.2, PsychoPy сначала отобразит инструкции, а затем отобразит испытания после загрузки изображений. Каждое испытание будет содержать восемь замещающих изображений, окружающих центральное изображение. Нажатие на изображение приведет к его серому цвету. Программу можно закрыть, нажав клавишу Escape.
    7. Перейдите в каталог данных в каждом из каталогов эксперимента, чтобы увидеть выходные данные:
      сходства/эксперименты/image_exp/данные
      сходства/эксперименты/word_exp/данные
      ПРИМЕЧАНИЕ: Экспериментальные данные записываются в каталог данных. В файле responses.csv содержатся ответы на клики по результатам испытаний. Файл журнала содержит все нажатия клавиш и щелчки мыши. Это полезно для устранения неполадок, если PsychoPy неожиданно прекращает работу.
  4. При необходимости, чтобы убедиться, что сценарии анализа работают должным образом, воспроизведите некоторые цифры в разделе «Репрезентативные результаты» следующим образом.
    1. Создайте каталог для предварительно обработанных данных:
      cd ~/сходства
      mkdir образцы-материалы/предметные данные/предварительно обработанные
    2. Объедините необработанные данные из всех ответов.csv файлы в один JSON-файл. В командной строке выполните следующие действия:
      cd сходства
      Активация conda venv_sim_3.8
      python -m analysis.preprocess.py
    3. При появлении запроса введите следующие значения входных параметров: 1) путь к субъекту-данным: ./sample-materials/subject-data, 2), название эксперимента: sample_word и 3) идентификатор субъекта: S7. Файл json будет находиться в сходстве/образце-материалах/предметных данных/предварительно обработанных.
    4. После предварительной обработки данных выполните действия, описанные в файле README проекта в разделе воспроизведения рисунков. Эти сценарии анализа будут запущены позже для анализа данных, собранных из собственного эксперимента пользователя.

2. Сбор данных путем настройки пользовательского эксперимента

ПРИМЕЧАНИЕ: Процедуры описаны как для экспериментов с изображением, так и для экспериментов со словами вплоть до шага 3.1. После этого шага процесс одинаков для обоих экспериментов, поэтому эксперимент с изображением явно не упоминается.

  1. Выберите эксперимент для запуска. Перейдите к слову эксперимент (сходства/эксперименты/word_exp) или эксперимент с изображением (сходства/эксперименты/image_exp).
  2. Определитесь с количеством раздражителей. По умолчанию размер набора стимулов равен 37. Чтобы изменить это, откройте файл конфигурации (similarities/analysis/config.yaml) в редакторе исходного кода. В параметре num_stimuli конфигурационного файла анализа задайте размер стимула, равный mk + 1, как того требует экспериментальная конструкция для целых чисел k и m.
    ПРИМЕЧАНИЕ: В стандартной конструкции k ≥ 3 и m = 6. Таким образом, допустимые значения для num_stimuli включают 19, 25, 31, 37, 43 и 49 (возможные расширения конструкции см. в таблице 1 ).
  3. Доработайте экспериментальные стимулы. Если выполняется эксперимент со словом, подготовьте список слов. Для эксперимента с изображениями создайте новый каталог и поместите в него все изображения стимулов. Поддерживаются типы изображений png и jpeg. Не используйте точки в качестве разделителей в именах файлов (например, image.1.png недопустим, но image1.png или image_1.png являются допустимыми).
  4. Если используется слово эксперимент, подготовьте стимулы следующим образом.
    1. Создайте новый файл в experiments/word_exp с именем stimuli.txt. Этот файл будет прочитан на шаге 3.3.
    2. В файле запишите слова в наборе стимулов так, как они должны отображаться на дисплее, с каждым словом в отдельной строке. Избегайте лишних пустых строк или лишних пробелов рядом со словами. См. образцы материалов для справки (сходства/образцы-материалы/слово-эксп-материалы/sample_word_stimuli.txt).
  5. Если выполняется эксперимент с изображением, задайте путь к набору стимулов следующим образом.
    1. В каталоге experiments найдите файл конфигурации с именем config.yaml (similarities/experiments/config.yaml).
    2. Откройте файл в редакторе исходного кода и обновите значение переменной files до пути к каталогу, содержащему набор стимулов (шаг 2.3). Именно здесь PsychoPy будет искать стимулы изображения.

3. Создание рейтинговых испытаний

  1. Используйте файл стимулов.txt. Если выполняется word experiment, можно использовать файл, созданный на шаге 2.4. В противном случае используйте список имен файлов (для справки см. сходства/образцы-материалы/image-exp-materials/sample_image_stimuli.txt). Поместите этот файл в соответствующий каталог эксперимента (word_exp или image_exp).
  2. Избегайте лишних пустых строк, а также пробелов в именах. Используйте camelCase или snake_case для названий стимулов.
  3. Затем создайте конфигурации пробной версии. Откройте файл config.yaml в каталоге analysis и задайте для параметра path_to_stimulus_list значение пути к стимулам.txt (создан на шаге 3.1).
    1. Из каталога similarities запустите сценарий, выполнив одну за другой следующие команды:
      cd ~/сходства
      Активация conda venv_sim_3.8
      python -m analysis.trial_configuration
      conda деактивировать
      # выход из виртуальной среды
    2. При этом создается файл с именем trial_conditions.csv в сходствах, в котором каждая строка содержит имена стимулов, появляющихся в пробной версии, а также их позиции на дисплее. Предоставляется образец trial_conditions.csv файла (сходства/образцы-материалы). Дополнительные сведения о входных параметрах для сценариев анализа см. в разделе Использование файла README проекта.

Figure 1
Рисунок 1: Репрезентативные примеры испытаний (этап 3.3). (A) Каждая строка содержит подробную информацию об одном судебном разбирательстве. Заголовки указывают положение стимула вокруг круга. Стимул под ref появляется в центре, а stim от 1 до stim 8 появляется вокруг ссылки. (B) Первое испытание (строка) из A проводится PsychoPy для отображения восьми стимулов вокруг эталонного стимула, обезьяны. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

ПРИМЕЧАНИЕ: На данный момент был сгенерирован полный набор из 222 испытаний для одного полного экспериментального запуска, т.е. для одного полного набора данных. На рисунке 1A показана часть файла условий, сгенерированного приведенным выше скриптом, для слова эксперимент (см. Репрезентативные результаты).

  1. Затем разбейте эти 222 испытания на сессии и рандомизируйте порядок испытаний. В типичной конструкции сеансы состоят из 111 испытаний, каждое из которых требует примерно 1 часа для выполнения.
    1. Для этого в командной строке выполните следующее:
      Активация conda venv_sim_3.8
      cd ~/сходства
      python -m analysis.randomize_session_trials
    2. При появлении запроса введите следующие входные параметры: путь к trial_conditions.csv создан на шаге 3.3.2; выходной каталог; число судебных разбирательств за сессию: 111; количество повторов: 5.
      ПРИМЕЧАНИЕ: Количество повторений также может варьироваться, но повлияет на количество сеансов, проведенных на шаге 4 (см. Обсуждение: Экспериментальная парадигма). При изменении значения по умолчанию количества повторов обязательно измените значение параметра num_repeats в конфигурационном файле (similarities/analysis/config.yaml). При необходимости ознакомьтесь с пошаговыми инструкциями для выполнения вышеуказанных действий вручную в файле README в разделе Создание пробных версий.
  2. Переименуйте и сохраните каждый из созданных файлов в качестве условий.csv, в собственном каталоге. Рекомендуемую структуру каталогов можно посмотреть здесь: сходства/образцы-материалы/предметные данные и в проекте README.
    ПРИМЕЧАНИЕ: Как указано в шаге 4, каждый эксперимент повторяется пять раз в стандартном дизайне в течение сеансов продолжительностью 10 часов, каждый в отдельный день. Испытуемых следует просить приходить только на один сеанс в день, чтобы избежать усталости. В таблице 1 приведено количество испытаний и сеансов, необходимых для наборов стимулов различных размеров.

4. Запуск эксперимента и сбор данных о сходстве

  1. Объясните испытуемым задание и дайте им указания. В каждом испытании испытуемые будут просматривать центральный эталонный стимул, окруженный восемью стимулами, и им будет предложено щелкнуть стимулы в окружающем пространстве в порядке сходства с центральной ссылкой, то есть они должны щелкнуть наиболее похожий первый и наименее похожий последний.
  2. Попросите их попытаться использовать последовательную стратегию. Скажите им, что им будет показана одна и та же конфигурация стимулов несколько раз в течение 10 сеансов. Если исследование исследует представление семантической информации, убедитесь, что испытуемые знакомы со стимулами перед началом.
  3. Перейдите в соответствующий каталог эксперимента (см. шаг 2.1). Если эксперимент выполняется впервые, создайте каталог с именем subject-data для хранения ответов субъекта. Создайте в нем два подкаталога: raw и preprocessed. Для каждого субъекта создайте подкаталог в subject-data/raw.
  4. Скопируйте файл условий.csv подготовленный на шаге 3 для конкретного сеанса, и вставьте его в текущий каталог, т.е. в каталог, содержащий файл psyexp. Если там уже есть файл с именем conditions.csv, обязательно замените его файлом для текущего сеанса.
  5. Откройте PsychoPy, а затем откройте файл psyexp или py в каталоге соответствующего эксперимента. В PsychoPy нажмите на зеленую кнопку Play , чтобы запустить эксперимент. Во всплывающем окне модального направления введите имя субъекта или идентификатор и номер сеанса. Нажмите кнопку ОК , чтобы начать. Инструкции будут отображаться в начале каждого сеанса.
  6. Дайте испытуемому около 1 часа для выполнения задания. Поскольку задача выполняется самостоятельно, поощряйте испытуемых делать перерывы, если это необходимо. Когда субъект закончит сеанс, PsychoPy автоматически завершит работу, и файлы будут сгенерированы в каталоге similarities/experiments/_exp/data.
  7. Перенесите их в каталог subject-data/raw/ (созданный на шаге 4.3). Рекомендуемую структуру каталогов см. в файле README.
    ПРИМЕЧАНИЕ: Как уже упоминалось, файл журнала предназначен для устранения неполадок. Наиболее распространенной причиной неожиданного закрытия PsychoPy является то, что субъект случайно нажимает Escape во время сеанса. Если это произойдет, ответы на судебные разбирательства до последнего завершенного испытания будут по-прежнему записываться в файл ответов.csv.
  8. Если PsychoPy неожиданно закроется, снова откройте его и создайте новые условия.csv файл, с теми испытаниями, которые не были предприняты. Замените файл условий существующего сеанса на этот и повторно запустите эксперимент. Обязательно сохраните сгенерированные файлы в соответствующем месте. В конце сеанса два файла ответов могут быть вручную объединены в один, хотя в этом нет необходимости.
  9. Для каждого из оставшихся сеансов повторите шаги с 4.4 по 4.8.
  10. После завершения всех сеансов объедините необработанные файлы данных и переформатируйте их в один json-файл для дальнейшей обработки. Для этого запустите preprocess.py в терминале (сходства/анализ/препроцесс.py) следующим образом:
    cd ~/сходства
    Активация conda venv_sim_3.8
    python -m анализ.препроцесс
  11. При появлении запроса введите запрошенные входные параметры: путь к каталогу subject-data, идентификаторы субъектов, для которых необходимо предварительно обработать данные, и имя эксперимента (используется для именования выходного файла). Нажмите клавишу ВВОД.
  12. Выйдите из виртуальной среды:
    conda деактивировать
    ПРИМЕЧАНИЕ: Это создаст json-файл в выходном каталоге, который объединяет ответы между повторами для каждой пробной версии. Данные о подобии считываются из субъектных данных / необработанных данных и записываются в субъектные данные / предварительно обработаны.

5. Анализ суждений о сходстве

ПРИМЕЧАНИЕ: Испытуемых просят щелкнуть стимулы в порядке сходства со ссылкой, тем самым обеспечивая ранжирование в каждом испытании. Для стандартных экспериментов повторите каждое испытание пять раз, генерируя пять ранговых упорядочений из одних и тех же восьми стимулов (см. Рисунок 2B). Эти ранговые суждения интерпретируются как серия сравнений, в которых субъект сравнивает пары расстояний восприятия. Предполагается, что субъект задает следующий вопрос перед каждым щелчком: «Является ли (перцептивное) расстояние между эталоном и стимулом А меньше, чем расстояние между эталоном и стимулом В?» Как показано на рисунке 2C, это дает вероятности выбора для нескольких парных сравнений сходства для каждого испытания. Приведенный ниже анализ использует эти вероятности выбора.

Figure 2
Рисунок 2: Получение вероятностей выбора из рейтинговых суждений. (A) Иллюстрация испытания из проведенного нами эксперимента. B) в ходе нескольких сессий было получено пять ранговых указаний для одного и того же испытания. (C) Вероятности выбора для сравнения попарного несходства, которые представляют собой рейтинговые суждения. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

  1. Определите вероятности парного выбора из суждений рангового порядка.
    1. В сходстве/анализе выполните describe_data.py в командной строке.
      cd ~/сходства
      Активация conda venv_sim_3.8
      python -m analysis.describe_data
    2. При появлении запроса введите путь к теме-данным/предварительно обработанным данным и список субъектов, для которых необходимо выполнить анализ.
      ПРИМЕЧАНИЕ: Это создаст три вида графиков: i) распределение вероятностей выбора для полного набора данных данного субъекта, ii) тепловые карты для оценки согласованности вероятностей выбора для пар субъектов и iii) тепловая карта вероятностей выбора для всех сравнений, которые происходят в двух контекстах для оценки контекстных эффектов. В оперативном плане это означает сравнение вероятностей выбора в парах испытаний, которые содержат одну и ту же ссылку и общую пару стимулов в кольце, но отличаются во всех других стимулах в кольце: тепловая карта показывает, как вероятность выбора зависит от этого контекста.
  2. Генерация низкоразмерных евклидовых моделей перцептивных пространств, используя вероятности выбора. Выполните model_fitting.py в командной строке следующим образом:
    cd ~/сходства
    Активация conda venv_sim_3.8
    python -m analysis.model_fitting
    1. При появлении запроса укажите следующие входные параметры: путь к каталогу subject-data/preprocessed; количество стимулов (37 по умолчанию); количество итераций (количество запусков анализа моделирования); выходной каталог; и количество гауссовского шума (0,18 по умолчанию).
      ПРИМЕЧАНИЕ: Выполнение этого скрипта занимает несколько часов. По завершении файлы npy, содержащие наиболее подходящие координаты для 1D, 2D, 3D, 4D и 5D моделей, описывающие данные сходства, будут записаны в выходной каталог. Будет сгенерирован csv-файл, содержащий значения вероятности журнала различных моделей.
  3. Визуализируйте логарифмическую вероятность полученных моделей и оцените их соответствие. Для этого запустите в командной строке функции similarities/analysis/model_fitting_figure.py :
    cd ~/сходства
    python -m analysis.model_fitting_figure
    1. При появлении запроса введите нужный параметр: путь к csv-файлам, содержащим лог-вероятности (из шага 5.2).
    2. Проанализируйте сгенерированную цифру, показывая логарифмические вероятности по оси Y и размеры модели по оси X. В качестве проверки здравомыслия в дополнение к евклидовым моделям включены две модели: модель случайного выбора и наилучшая возможная модель.
      ПРИМЕЧАНИЕ: Модель случайного выбора предполагает, что испытуемые щелкают случайным образом. Таким образом, он обеспечивает абсолютную нижнюю границу логарифмической вероятности для любой модели, которая лучше, чем случайная. Аналогичным образом, в качестве верхней границы для логарифмической вероятности (обозначенной лучшей) существует логарифмическая вероятность модели, которая использует эмпирические вероятности выбора в качестве своих вероятностей модели.
    3. Убедитесь, что ни одна евклидова модель не превосходит лучшую модель, так как лучшая модель по своей конструкции перегружена и не ограничена геометрическими соображениями. Убедитесь, что построенные вероятности относятся к наилучшей логарифмической вероятности.
  4. Визуализируйте пространства восприятия для каждого субъекта. Создайте точечные диаграммы, показывающие точки из 5D-модели, проецируемые на первые два основных компонента. Для этого запустите в командной строке функции similarities/analysis/perceptual_space_visualizations.py :
    cd ~/сходства
    python -m analysis.perceptual_space_visualizations
    1. При появлении запроса введите параметры: идентификаторы субъекта (разделенные пробелами) и путь к файлу npy, содержащему 5D-точки, полученные из шага 5.2.
    2. После завершения выполнения скрипта выйдите из виртуальной среды:
      conda деактивировать
      ПРИМЕЧАНИЕ: Этот скрипт предназначен для визуализации суждений о сходстве. Он создаст 2D-точечную диаграмму, проецируя 5D-точки на первые два основных компонента, нормализованные для равной дисперсии. Два пункта будут находиться дальше друг от друга, если субъект считает их менее похожими и наоборот.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

На рисунке 1A показана часть файла условий, сгенерированного скриптом на шаге 3.3, для слова эксперимент. Каждая строка соответствует пробной версии. Стимул в столбце ref отображается в центре дисплея. Названия столбцов от stim1 до stim8 соответствуют восьми позициям вдоль круга, идущим против часовой стрелки, начиная с позиции справа от центральной ссылки. Пример испытания из слова эксперимент показан на рисунке 1B.

Чтобы продемонстрировать осуществимость и воспроизводимость, был проведен эксперимент, в котором набор стимулов включал имена 37 животных. Полные наборы данных были собраны у восьми здоровых субъектов с нормальным зрением в рамках исследования. Чтобы продемонстрировать метод, здесь показаны данные трех из этих субъектов, двое из которых были наивны к цели исследования. Информированное согласие было получено в соответствии с Хельсинкской декларацией и институциональными руководящими принципами Медицинского колледжа Вайля Корнелла.

После сбора данных была выполнена первоначальная обработка, описанная выше (этап протокола 4.10-4.12). Ответы испытуемых в каждом испытании интерпретировались как набор независимых, бинарных вариантов формы «Расстояние между эталоном и s1 меньше, чем расстояние между эталоном и s2?» для всех пар стимулов в окружающем кольце. Ранговые суждения были разложены на такие парные варианты, как показано на рисунке 2C.

На рисунке 3A показано распределение этих вероятностей выбора, которое было очень согласованным между субъектами (этап протокола 5.1). Поскольку каждое испытание повторялось пять раз, вероятности выбора принимали следующие значения: 0, 0,2, 0,4, 0,6, 0,8 и 1. Наиболее частыми вероятностями выбора являются 0 и 1, составляющие 50%-70% всех решений по каждому из испытуемых; это суждения, для которых каждый раз выбирается один вариант. Например, оценка расстояния между s1 и s2 как меньшего, чем между s1 и s3 0 из 5 раз, будет соответствовать вероятности выбора 0; вынесение этого суждения 5 из 5 раз соответствовало бы вероятности выбора 1. Примечательно, что существует большая согласованность в вероятностях выбора между субъектами, даже для суждений, которые не находятся в крайностях, как видно из кластеризации данных вблизи диагонали в каждой из панелей на рисунке 3B.

Затем была проведена оценка контекстных эффектов. Это стало возможным благодаря важной особенности экспериментальной конструкции: многие триплеты эталонного стимула и два стимула сравнения s1 и s2 повторяются в двух контекстах (т. Е. С различными наборами из шести других стимулов для завершения массива стимулов). Затем вероятность выбора для каждого попарного сравнения была сведена в таблицу в каждом контексте отдельно. Доминирующая диагональ на рисунке 4 указывает на то, что для каждого субъекта вероятности выбора в двух контекстах, включая вероятности выбора, которые являются промежуточными между 0 и 1, близки к идентичным. Если бы вероятности выбора сильно зависели от контекста, они не были бы сильно коррелированы, и эта диагональ не была бы заметной.

Контекстные эффекты также оценивались с помощью статистической меры. Мера контекстного эффекта строится следующим образом. Первым шагом является вычисление статистики дисбаланса для наблюдаемого набора данных (подробно описано ниже), которая количественно определяет степень, в которой наблюдаемые суждения, по-видимому, зависят от контекста. Затем мы строим 10000 смоделированных наборов данных с теми же конфигурациями испытаний, количеством испытаний и общей вероятностью выбора, что и фактические данные, но сгенерированными таким образом, чтобы не содержать контекстных эффектов - путем случайного назначения наблюдаемых суждений двум контекстам. Затем мы вычисляем статистику дисбаланса для этих смоделированных наборов данных так же, как это было сделано для наблюдаемых ответов. Наконец, мы сравниваем статистику дисбаланса для наблюдаемых ответов со статистикой дисбаланса для смоделированных наборов данных, чтобы определить вероятность того, что наблюдаемый дисбаланс мог быть получен из набора данных без контекстного эффекта. Эмпирическое p-значение < 0,05 предполагает, что присутствует контекстный эффект. Для данных на рисунке 4 p-значения составляли 0,98, 0,30 и 0,33, для S4, S7 и S9 соответственно, т.е. все значения были > 0,05.

Статистика дисбаланса для набора данных вычисляется как сумма вкладов по всем триадам, которые встречаются в двух контекстах. Вклад для каждой триады (сравнивая, скажем, d(ref, s1) с d(ref, s2)) определяется следующим образом. Во-первых, суждения по этой триаде подсчитываются в таблицу 2 х 2. Столбцы соответствуют двум контекстам, поэтому суммы столбцов ограничены общим количеством презентаций в этом контексте. Строки соответствуют подсчетам альтернативных суждений, d(ref, s1) < d(ref, s2) или d(ref, s1) > d(ref, s2), поэтому суммы строк ограничены наблюдаемыми вариантами, суммированными по контекстам. Поскольку двухвостый точный тест Фишера14 дает вероятность того, что таблица с наблюдаемым (или большим) взаимодействием между строками и столбцами (суждениями и контекстами) будет видна, если взаимодействие фактически отсутствует, мы используем отрицательный логарифм этой вероятности в качестве вклада этой триады в общую статистику дисбаланса. Суммирование отрицательных логарифмов для создания общей статистики дисбаланса, таким образом, фиксирует общую вероятность наблюдаемого дисбаланса по триадам в соответствии с нулевой гипотезой отсутствия контекстного эффекта.

Для моделирования ментального представления названий животных были выведены евклидовы модели перцептивных пространств 1, 2, 3, 4 и 5 измерений с использованием подхода максимальной вероятности. Ответы испытуемых моделировались как решения, отражающие сравнение двух расстояний с аддитивным гауссовским шумом, представляющим ошибки в оценке, т.е. шум на стадии принятия решения. На рисунке 5 показаны логарифмические вероятности (на решение) пяти евклидовых моделей. Логарифмические вероятности показаны относительно логарифмической вероятности наилучшей модели, т. е. модели, которая присваивает наблюдаемую вероятность выбора каждому сравнению, не ограничивая эти вероятности каким-либо геометрическим соображением. Чтобы представить эти логарифмические вероятности в перспективе, также указывается логарифмическая вероятность модели случайного выбора; это служит нижней границей производительности модели. Подгонка модели улучшается с каждым добавленным измерением. Самый большой скачок происходит между 1D и 2D моделями, что указывает на то, что простая 1D-модель не может полностью объяснить данные. Однако плато вокруг измерений от 4 до 5 указывает на то, что даже 5D-модель не полностью фиксирует расстояния, которые объясняют суждения о подобии. Чтобы проверить подход, конвейер также был запущен на смоделированных данных. Отдельные эксперименты были смоделированы для получения суждений о сходстве между точками, нарисованными из 1D, 2D, 3D, 4D и 5D пространств соответственно. Во всех случаях метод правильно определял размерность. Кроме того, модель с правильной размерностью давала логарифмическую вероятность, которая согласуется с логарифмической вероятностью истинности, полученной из модели.

Наконец, была визуализирована организация точек в моделях перцептивного пространства. На рисунке 6 показаны эти данные для одного субъекта, S7. Анализ главных компонент (PCA) проводился на точках из 5D-модели пространства восприятия. Точки, проецируемые на первые два и первый и третий основные компоненты соответственно, показаны на рисунках 6A и 6B, с осями, нормированными для равной дисперсии. Расстояния между точками соответствовали суждениям о подобии, полученным экспериментально: животные, воспринимаемые как похожие, обозначались точками, которые находились рядом друг с другом.

Figure 3
Рисунок 3: Согласованность между субъектами. (A) Распределение вероятностей выбора по трем субъектам для всех попарных сравнений. (B) Вероятности выбора для одних и тех же парных сравнений по парам субъектов. Цветовая полоса показывает отношение наблюдаемой вероятности сустава к независимой вероятности соединения. Высокие значения вдоль основной диагонали указывают на согласованность между субъектами. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 4
Рисунок 4: Контекстные эффекты. Вероятности выбора для всех парных сравнений, которые были сделаны в двух контекстах, для каждого из трех предметов. A произвольно относится к одному контексту, в котором была представлена триада, а B относится к другому контексту. Цветовая полоса показывает отношение наблюдаемой вероятности сустава к независимой вероятности соединения. Высокие значения по главной диагонали указывают на отсутствие контекстных эффектов. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 5
Рисунок 5: Результаты анализа подгонки модели. Относительные логарифмические вероятности для моделей различных размеров, а также для модели случайного выбора (нижняя граница), показанные для трех субъектов. Относительная логарифмическая вероятность нуля соответствует логарифмической вероятности наилучшей модели, в которой вероятности выбора совпадают с эмпирическими вероятностями выбора без учета геометрии. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 6
Рисунок 6: Пространство восприятия одного субъекта (S7) более подробно. Проекция 5D-координат, полученных в результате моделирования, проецируется на первые два основных компонента в (A) и на первый и третий основные компоненты в (B). Оси масштабируются таким образом, чтобы дисперсия вдоль каждой оси была равной. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Таблица 1: Примеры наборов параметров. Экспериментальная парадигма может быть изменена, чтобы иметь меньше или больше стимулов, испытаний и парных сравнений. Строка, выделенная жирным шрифтом, указывает на параметры, которые мы использовали. Пожалуйста, нажмите здесь, чтобы загрузить эту таблицу.

Таблица 2: Параметры в analysis/config.yaml и experiments/config.yaml. Пожалуйста, нажмите здесь, чтобы загрузить эту таблицу.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Протокол, изложенный здесь, эффективен для получения и анализа суждений о сходстве для стимулов, которые могут быть представлены визуально. Сначала обсуждаются экспериментальная парадигма, анализ и возможные расширения, а затем преимущества и недостатки метода.

Экспериментальная парадигма: Предложенный способ демонстрируется с использованием домена из 37 названий животных, и предоставляется выборочный набор данных перцептивных суждений, чтобы можно было следовать анализу на шаге 5 и воспроизводить части рисунков 3-6 (этап протокола 1.4). Экспериментальный проект группирует эти 37 стимулов в 222 испытания- каждое из которых содержит эталонный стимул в центре и восемь сравнительных стимулов в окружающем кольце - таким образом, что несколько критериев придерживаются: а) каждый из 37 стимулов появляется в качестве эталона равное количество (шесть) раз (222 = 37×6), б) над шестью испытаниями, в которых стимул является эталоном, все остальные 36 стимулов используются в качестве стимулов сравнения по крайней мере один раз, в) 24 стимула встречаются ровно в одном сравнении с данным эталоном, и г) шесть пар стимулов появляются со ссылкой в двух отдельных испытаниях. Этот аспект парадигмы, согласно которому шесть пар стимулов сравнения встречаются в отдельных контекстах для каждого эталонного стимула, позволяет проверить контекстные эффекты на шаге 5 (см. Рисунок 4). Эта стандартная конструкция дает 6216 = 222×28 сравнений формы «Является ли сходство ссылки на s1 больше или меньше, чем сходство ссылки на s2». Эта эффективность возможна, потому что каждое из 222 испытаний дает рейтинг из восьми сходств, а восемь ранжированных сходств генерируют 28 парных сравнений. Из этих 6216 сравнений 222 повторяются, что дает нам 5994 уникальных сравнения.

После того, как область стимула выбрана, следующим наиболее важным проектным решением является количество образцов. Возможны многие альтернативные конструкции (таблица 1), с другими вариантами способа повторения стимулов в разных контекстах. Как упоминалось на рисунке 4, в каждом испытании есть триплет, включающий ссылку и два окружающих стимула, которые появляются вместе в одном другом испытании. Количество окружающих стимулов, перекрывающихся с другим испытанием с общей ссылкой - в данном случае равной двум - контролируется параметром перекрытия в конфигурационном файле анализа. Увеличение этого параметра приведет к большему количеству стимулов, разделяемых между двумя испытаниями, что позволит проводить более обширные сравнения ранжирования расстояний, например, «Является ли s1 более похожим на ссылку, чем s2, и является ли s2 более похожим, чем s3?» в двух контекстах. Примеры других экспериментальных конструкций, возможных с различными значениями этого и других параметров, см. в таблице 1. Дополнительные сведения обо всех параметрах, о том, что они контролируют, и о том, где их изменить, см. в таблице 2. Примечательно, что также можно изменить количество стимулов, которые появляются вокруг ссылки в каждом испытании, изменив параметры num_images_per_trial и num_words_per_trial для экспериментов с изображением и словом соответственно. Увеличение размера объемного пространства приведет к увеличению числа сравнений на одно испытание и улучшению контекстных эффектов исследования; уменьшение его уменьшило бы сложность задач. Количество стимулов сравнения в исследовании (Ncircle), количество стимулов в эксперименте (Nstim), количество испытаний (Ntrials), количество уникальных сравнений (Ncomparisons) и количество повторных сравнений (Nrepeated) взаимосвязаны и зависят от размера ранее упомянутого перекрытия между испытаниями (Noverlap). ) и число испытаний на один эталонный стимул (k). Размер набора стимулов определяется m, который является произвольным целым числом. Эти отношения перечислены ниже:

Equation 1
Equation 2
Equation 3
Equation 4
Equation 5
Equation 6

Существуют и другие детали парадигмы и процедур сбора данных, которые помогают свести к минимуму путаницу. Рандомизация размещения стимулов и порядка испытаний (шаг 3.4) важна для того, чтобы даже при повторении сеансов испытуемый не начинал распознавать пространственные или временные паттерны при размещении стимулов. Также важно не давать испытуемым никаких прямых подсказок о том, как измерить сходство (шаг 4), поскольку это может привести к смещению результатов. Они должны сами решить, что для них означает сходство в контексте конкретного эксперимента. Тем не менее, полезно провести брифинг для испытуемых после того, как они завершат эксперимент, так как это может помочь понять, как результаты различаются у разных субъектов. Если по какой-то причине сеанс поврежден или прерван, то мы рекомендуем удалить весь сеанс, чтобы все испытания были завершены одинаковое количество раз.

Анализ данных о подобии: Эксперимент дает для каждого испытания ранжирование подобия между стимулами сравнения Ncircle и эталоном. При разложении на сравнения пар стимулов эти испытания дают вероятности выбора для каждого из уникальных сравнений. Затем вероятности выбора анализируются для поиска геометрических моделей пространства восприятия (шаг протокола 5). Анализ пытается объяснить вероятности выбора в терминах расстояний между стимулами, d(si, sj), в евклидовом пространстве. То есть цель состоит в том, чтобы присвоить координаты каждому стимулу таким образом, чтобы вероятность выбора щелчка s1 перед s2 отражала вероятность того, что испытуемый оценил d(ref, s1) < d(ref, s2). Эта процедура установки описана здесь как потому, что она содержит некоторые новые элементы, так и для того, чтобы позволить пользователю изменить ее (шаг протокола 5.2).

Анализ представляет собой своего рода многомерную задачу масштабирования, но с некоторыми отличительными признаками. Во-первых, данные обеспечивают ранжирование суждений о несходстве, а не оценки расстояний. Во-вторых, набор данных, хотя и обширен, содержит только подмножество всех возможных сравнений попарных расстояний. Наконец, цель состоит в том, чтобы учесть вероятности выбора, а не просто двоичное решение о том, какое расстояние больше. С учетом этих соображений функция затрат выбирается таким образом, что ее значение сводится к минимуму, когда предсказанные моделью вероятности выбора, скорее всего, дадут экспериментально наблюдаемые вероятности выбора. Поэтому она определяется как отрицательная логарифмическая вероятность наблюдаемых вероятностей выбора в рамках модели, нормируемая общим числом попарных сравнений, и адаптирована из предыдущей работы15:

Equation 7

где N0 = Ncomparisons. Nrepeats, и Nrepeats - это количество повторений протокола (т. Е. Количество повторений каждого уникального испытания), и

Equation 8
Equation 9

Здесь отмечается эталонный стимул в испытании, si и sj и стимулы в кольце вокруг sr. P (d(sr, si) < d(sr, sj)) представляет собой модельную вероятность того, что расстояние между sr и si оценивается как меньшее, чем расстояние между sr и sj, а C обозначает количество раз, когда субъект судил d(sr, si) ) < d(sr, sj). Целью анализа моделирования является нахождение конфигурации точек в евклидовом пространстве, что учитывает эмпирические вероятности выбора. Итеративно минимизация регулирует координаты, присвоенные каждому стимулу, и при этом вероятности выбора модели (P). Минимизация прекращается, когда функция затрат перестает уменьшаться ниже допуска (регулируемый параметр с именем допуск контролирует это) или если достигнуто максимальное количество итераций (контролируется параметром max_iterations).

Чтобы связать координаты стимула с вероятностями выбора модели, предполагается, что субъект - при выборе между двумя стимулами для щелчка в исследовании - сделает внутреннее сравнение своих относительных расстояний до эталона, а именно d(sr, si) и d(sr, sj). Эти расстояния являются (по умолчанию) обычными евклидовыми расстояниями между точками, присвоенными стимулам sr, si и sj. Кроме того, предполагается, что это ментальное сравнение имеет внутренний шум, который мы моделируем как аддитивный гауссов источник стандартного отклонения σ, модель, введенная для одномерных доменов Мэлоуни и др.16,17 и также используемая для многомерных доменов15. Вероятности выбора модели связаны с координатами следующим образом:

Equation 10

Внутренний шум, σ, можно контролировать с помощью изменяющейся сигмы в конфигурационном файле анализа. Для инициализации алгоритма набором координат стимула для получения набора приближенных расстояний использовали ранговые суждения, а затем к этим расстояниям применяли стандартное многомерное масштабирование10 для получения начальных координат. Эти приблизительные расстояния определялись путем подсчета выигрышей и поражений для каждой пары стимулов. То есть, просматривая все попарные сравнения в данных, каждый раз, когда расстояние, d(sr, sk) оценивается больше, чем другое, d(sr, sn), выигрыш регистрируется для большего расстояния d(sr, sk) и проигрыш регистрируется для d(sr, sn) ). Основная идея заключается в том, что чем больше расстояние между двумя стимулами, тем чаще оно будет оцениваться как большее, чем другое расстояние (с точки зрения побед) и наоборот. После перебора всех сравнений и подсчета выигрышей и проигрышей каждой пары стимулов оценки расстояний рассчитываются следующим образом:

Equation 11

Как только это сделано, начальный набор координат определяется путем применения стандартного метрического многомерного масштабирования к dinit (si, sj).

Описанная таким образом процедура минимизации выполняется независимо для получения моделей размеров 1, 2, 3, 4 и 5. В каждом случае возвращаются оптимальные координаты предполагаемых точек стимула, а также значение стоимостной функции, т. е. отрицательная логарифмическая вероятность эмпирических вероятностей выбора. Логарифмическая вероятность построена на рисунке 5 относительно наилучшей возможной логарифмической вероятности, которая вычисляется аналогично, как и в уравнении 1, с

Equation 12,

для всех сравнений. В качестве проверки здравомыслия на рисунке 5 также строится случайная логарифмическая вероятность модели, нижняя граница, по которой можно судить о производительности моделей. При вычислении логарифмической вероятности случайного выбора мы устанавливаем

Equation 13

для всех сравнений.

Возможные расширения: Во-первых, как упоминалось ранее, экспериментальная парадигма может быть изменена для размещения наборов стимулов разных размеров, а количество стимулов в кольце может быть изменено, чтобы получить различное количество парных сравнений на испытание (см. Таблицу 1).

Во-вторых, может быть полезно использовать в анализе неевклидовы метрики расстояний. Например, одно исследование показало, что метрика городского квартала лучше представляет перцептивное пространство поверхностной легкости и освещения18. Предложенный способ может быть обобщен, поэтому модели с другими метриками расстояния, например, расстоянием от города-квартала, расстоянием Минковского или гиперболическим расстоянием19, соответствуют данным о подобии. Для этого необходимо изменить предоставленный код и реализовать альтернативную метрику расстояния. Основное необходимое изменение находится в строке 105 (имя функции: dist_model_ll_vectorized) в файле сходство/анализ/pairwise_likelihood_analysis.py.

Сильные и слабые стороны: Ключевая сила предлагаемого подхода заключается в том, что он обеспечивает гибкую основу для разработки экспериментов с различными размерами набора стимулов, различным количеством сравнений, повторов или количеством стимулов на испытание, а также различными перекрывающимися размерами наборов для измерения контекстных эффектов. Изменяя размер перекрытия между судебными процессами и размер окружения в судебном разбирательстве, можно исследовать роль контекста в суждениях о сходстве, получая при этом большое количество парных сходных суждений на каждое судебное разбирательство. Метод устраняет многие ограничения предыдущих экспериментальных парадигм для сбора данных о подобии. Например, в отличие от методов, основанных на аранжировке12,20 (которые требуют, чтобы стимулы были расположены на 2D-евклидовой плоскости с аналогичными элементами, расположенными вместе, и различными элементами, расположенными отдельно) и методов сортировки (которые требуют, чтобы стимулы были классифицированы в стопки)11, метод ранжирования не побуждает субъектов проецировать свое внутреннее представление на какую-либо геометрическую структуру. Еще одно ограничение некоторых прошлых методов - например, матриц путаницы, в которых два стимула считаются похожими, если они путаются друг с другом в задачах быстрого распознавания21 - заключается в том, что они не дают градуированных показателей. Этот метод дает градуированные меры, то есть вероятности выбора.

Как подчеркивалось выше, метод сбора является гибким в том смысле, что он не предполагает, что внутреннее представление является евклидовым пространством. Здесь метод анализа проверяет только евклидовы модели; однако он может быть расширен для включения неевклидовых моделей, а также путем локализованных модификаций в исходном коде. Однако структура моделирования не предназначена для учета контекстных эффектов. Если бы они были значительными, это поставило бы оговорку о выводах, которые можно было бы сделать.

Предложенный метод является более эффективным по времени, чем парный подход сравнения. Каждое испытание парадигмы занимает около ~ 30 с (испытуемые выполняют 111 испытаний в час), давая 111×28 = 3108 сравнений в час. Испытания с одним сравнением вряд ли займут менее 3 с за испытание, что даст 1200 сравнений в час. Кроме того, существует второй уровень эффективности: настоящий подход не требует сравнения всех попарных расстояний. Для примера в рукописи полный набор попарных расстояний составляет 221445 сравнений, но в настоящем подходе для моделирования данных о подобии достаточно разреженного подмножества из 5994 уникальных сравнений, каждое из которых повторяется 5 или 10 раз. Тем не менее, метод, хотя и эффективный, все еще отнимает много времени и требует значительной приверженности со стороны субъектов. В результате это неосуществимый подход для набора из сотен стимулов, если данные не объединены между субъектами. Наконец, этот подход не применим непосредственно к невизуальным стимулам.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам нечего раскрывать.

Acknowledgments

Работа поддерживается финансированием Национальных институтов здравоохранения (NIH), грантом EY07977. Авторы также хотели бы поблагодарить Усмана Айяза за помощь в тестировании программного обеспечения и Мухаммада Наима Айяза за его комментарии к рукописи.

Materials

Name Company Catalog Number Comments
Computer Workstation N/A N/A OS: Windows/ MacOS 10 or higher/ Linux; 3.1 GHz Dual-Core Intel Core i5 or similar; 8GB or more memory; User permissions for writing and executing files
conda Version 4.11 OS: Windows/ MacOS 10 or higher/ Linux
Microsoft Excel Microsoft Any To open and shuffle rows and columns in trial conditions files.
PsychoPy N/A Version 2021.2 Framework for running psychophysical studies
Python 3 Python Software Foundation Python Version 3.8 Python3 and associated built-in libraries
Required Python Libraries N/A numpy version: 1.17.2 or higher; matplotlib version 3.4.3 or higher; scipy version 1.3.1 or higher; pandas version 0.25.3 or higher; seaborn version 0.9.0 or higher; scikit_learn version 0.23.1 or higher; yaml version 6.0 or higher  numpy, scipy and scikit_learn are computing modules with in-built functions for optimization and vector operations. matplotlib and seaborn are plotting libraries. pandas is used to reading in and edit data from csv files.

DOWNLOAD MATERIALS LIST

References

  1. Edelman, S. Representation is representation of similarities. TheBehavioral and Brain Sciences. 21 (4), 449-498 (1998).
  2. Hahn, U., Chater, N. Concepts and similarity. Knowledge, Concepts and Categories. , The MIT Press. 43-84 (1997).
  3. Kriegeskorte, N., Kievit, R. A. Representational geometry: integrating cognition, computation, and the brain. Trends in Cognitive Sciences. 17 (8), 401-412 (2013).
  4. Hebart, M. N., Zheng, C. Y., Pereira, F., Baker, C. I. Revealing the multidimensional mental representations of natural objects underlying human similarity judgements. Nature Human Behaviour. 4 (11), 1173-1185 (2020).
  5. Deng, W. S., Sloutsky, V. M. The development of categorization: Effects of classification and inference training on category representation. Developmental Psychology. 51 (3), 392-405 (2015).
  6. Shepard, R. N. Stimulus and response generalization: tests of a model relating generalization to distance in psychological space. Journal of Experimental Psychology. 55 (6), 509-523 (1958).
  7. Coombs, C. H. A method for the study of interstimulus similarity. Psychometrika. 19 (3), 183-194 (1954).
  8. Gärdenfors, P. Conceptual Spaces: The Geometry of Thought. , The MIT Press. (2000).
  9. Zaidi, Q., et al. Perceptual spaces: mathematical structures to neural mechanisms. The Journal of Neuroscience The Official Journal of the Society for Neuroscience. 33 (45), 17597-17602 (2013).
  10. Krishnaiah, P. R., Kanal, L. N. Handbook of Statistics 2. , Elsevier. (1982).
  11. Tsogo, L., Masson, M. H., Bardot, A. Multidimensional Scaling Methods for Many-Object Sets: A Review. Multivariate Behavioral Research. 35 (3), 307-319 (2000).
  12. Kriegeskorte, N., Mur, M. Inverse MDS: Inferring dissimilarity structure from multiple item arrangements. Frontiers in Psychology. 3, 245 (2012).
  13. Rao, V. R., Katz, R. Alternative Multidimensional Scaling Methods for Large Stimulus Sets. Journal of Marketing Research. 8 (4), 488-494 (1971).
  14. Hoffman, J. I. E. Hypergeometric Distribution. Biostatistics for Medical and Biomedical Practitioners. , Academic Press. 179-182 (2015).
  15. Victor, J. D., Rizvi, S. M., Conte, M. M. Two representations of a high-dimensional perceptual space. Vision Research. 137, 1-23 (2017).
  16. Knoblauch, K., Maloney, L. T. Estimating classification images with generalized linear and additive models. Journal of Vision. 8 (16), 1-19 (2008).
  17. Maloney, L. T., Yang, J. N. Maximum likelihood difference scaling. Journal of Vision. 3 (8), 573-585 (2003).
  18. Logvinenko, A. D., Maloney, L. T. The proximity structure of achromatic surface colors and the impossibility of asymmetric lightness matching. Perception & Psychophysics. 68 (1), 76-83 (2006).
  19. Zhou, Y., Smith, B. H., Sharpee, T. O. Hyperbolic geometry of the olfactory space. Science Advances. 4 (8), (2018).
  20. Goldstone, R. An efficient method for obtaining similarity data. Behavior Research Methods, Instruments, & Computers. 26 (4), 381-386 (1994).
  21. Townsend, J. T. Theoretical analysis of an alphabetic confusion matrix. Perception & Psychophysics. 9, 40-50 (1971).

Tags

Нейронаука выпуск 181 пространство восприятия визуальная психофизика многомерное масштабирование
Психофизическая парадигма для сбора и анализа суждений о сходстве
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Waraich, S. A., Victor, J. D. AMore

Waraich, S. A., Victor, J. D. A Psychophysics Paradigm for the Collection and Analysis of Similarity Judgments. J. Vis. Exp. (181), e63461, doi:10.3791/63461 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter