Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Behavior

Tâche de décision lexicale pour l'étude de la reconnaissance de la parole écrite chez les adultes atteints ou non de démence ou d'une déficience cognitive légère

Published: June 25, 2019 doi: 10.3791/59753

Summary

Cet article décrit comment mettre en œuvre une expérience de décision lexicale simple pour évaluer la reconnaissance écrite de mot dans les participants neurologiquement sains et dans les individus avec la démence et le déclin cognitif. Nous fournissons également une description détaillée de l'analyse du temps de réaction à l'aide de l'analyse des principaux composants (APC) et de la modélisation des effets mixtes.

Abstract

Les personnes âgées sont plus lentes à reconnaître les objets visuels que les jeunes adultes. Il en va de même pour la reconnaissance qu'une chaîne de lettres est un vrai mot. Les personnes atteintes de la maladie d'Alzheimer (MA) ou d'une déficience cognitive légère (MCI) démontrent des réponses encore plus longues dans la reconnaissance écrite que les témoins âgés. Malgré la tendance générale à une reconnaissance plus lente dans le vieillissement et les troubles neurocognitifs, certaines caractéristiques des mots influencent la vitesse de reconnaissance des mots, peu importe l'âge ou la neuropathologie (p. ex., la fréquence d'utilisation d'un mot). Nous présentons ici un protocole pour examiner l'influence des caractéristiques lexicales sur les temps de réponse de reconnaissance de mot dans une expérience simple de décision lexicale administrée aux adultes plus jeunes et plus âgés et aux personnes avec MCI ou AD. Dans cette expérience, les participants sont invités à décider aussi rapidement et avec précision que possible si une chaîne de lettre donnée est un mot réel ou non. Nous décrivons également des modèles d'effets mixtes et des analyses de composants principaux qui peuvent être utilisés pour détecter l'influence de différents types de variables lexicales ou de caractéristiques individuelles des participants sur la vitesse de reconnaissance des mots.

Introduction

Les mots sont stockés dans le lexique mental dans un réseau très interconnecté. Les liens entre les mots peuvent refléter des propriétés partagées, telles que la similitude sémantique (p. ex., chien et chat),la similitude de forme (chien et brouillard),ou la cooccurrence fréquente dans l'utilisation courante de la langue (p. ex., chien et laisse). Les théories cognitives du langage, telles que la théorie basée sur l'utilisation1, soutiennent que chaque rencontre d'un mot par un utilisateur de langue a un effet sur la représentation mentale du mot. Selon la théorie exemplaire, la représentation d'un mot se compose de nombreux exemples, qui sont construits à partir de jetons individuels de l'utilisation du langage et qui représentent la variabilité qui existe pour une catégorie donnée. La fréquence d'utilisation2 influe sur les représentations dans la mémoire en contribuant à la force d'un exemplaire1.

La vitesse de reconnaissance des mots peut révéler les caractéristiques du lexique mental. Un paradigme expérimental couramment utilisé pour mesurer la vitesse de la reconnaissance des mots est la tâche de décision lexicale. Dans cette tâche, les participants sont présentés avec des chaînes de lettres sur un moniteur, un à la fois. Ils sont chargés de décider le plus rapidement possible si la chaîne de lettre à l'écran est un vrai mot ou non en appuyant sur le bouton correspondant.

En examinant les temps de réaction pour les mots réels, les chercheurs peuvent répondre à un certain nombre de questions importantes sur le traitement du langage. Par exemple, identifier les facteurs qui rendent la reconnaissance plus rapide peut tester des hypothèses sur la structure du lexique mental et révéler son architecture. De plus, les comparaisons du rendement entre différents groupes de participants peuvent nous aider à comprendre l'influence de divers types d'expérience linguistique, ou, dans le cas du vieillissement ou des maladies neurodégénératives (p. ex., la maladie d'Alzheimer), le rôle de la maladie cognitive décliner.

Certains facteurs (p. ex., la fréquence d'utilisation) ont une plus grande influence sur la reconnaissance des mots que d'autres facteurs (p. ex., longueur des mots). Avec l'âge avancé, la façon dont les gens reconnaissent les mots écrits pourrait changer3,4. Les jeunes adultes ont tendance à s'appuyer fortement sur les aspects sémantiques (basés sur le sens) d'un mot, comme le nombre de composés (p. ex. bulldog) ou les mots dérivés (p. ex., doggy) partagent des aspects de la forme et du sens avec le mot cible (dans ce cas, chien). La reconnaissance des mots pour les personnes âgées semble être plus influencée par des aspects fondés sur des formulaires, comme la fréquence à laquelle deux lettres subséquentes coproduisent dans la langue (p. ex., la combinaison de lettres st se produit plus souvent dans les mots anglais que la combinaison sk).

Pour déterminer les facteurs qui influencent la vitesse de reconnaissance des mots entre les différents groupes, le chercheur peut manipuler certaines variables dans l'ensemble de stimulus, puis tester la puissance de ces variables pour prédire la vitesse de reconnaissance des mots. Par exemple, pour vérifier si la reconnaissance des mots est motivée par des facteurs sémantiques ou basés sur la forme, l'ensemble de stimulus devrait inclure des variables qui reflètent le degré de connectivité d'un mot à ses voisins sémantiques dans le lexique mental ou sa connectivité à d'autres mots qui partagent une partie de sa forme.

Cette méthode a été utilisée dans la présente étude pour déterminer si la vitesse de reconnaissance des mots est influencée par différents facteurs chez les adultes plus jeunes et plus âgés et chez les personnes atteintes de la maladie d'Alzheimer (MA) ou d'une déficience cognitive légère (MCI)3. La méthode décrite ici est basée sur la reconnaissance visuelle des mots, mais peut être adaptée à la modalité auditive. Cependant, certaines variables qui sont des prédicteurs significatifs des temps de réaction dans une expérience visuelle typique de décision lexicale pourraient ne pas prévoir les latences de réponse dans une décision lexicale auditive ou peuvent avoir l'effet inverse. Par exemple, le quartier phonologique a l'effet inverse à travers ces deux modalités5: les mots avec de plus grands quartiers phonologiques présentent un effet facilitateur sur la reconnaissance visuelle des mots, mais entraînent des retards de réponse plus longs dans décision lexicale auditive6.

Les difficultés de recherche de mots chez les personnes âgées7 ont généralement été attribuées à la difficulté d'accéder à la forme de mot phonologique plutôt qu'à une ventilation de la représentation sémantique8. Cependant, la recherche aD a principalement porté sur les déclins sémantiques9,10,11,12,13,14. Il est important de démêler comment les facteurs sémantiques et orthographiques influencent la reconnaissance des mots écrits dans le vieillissement avec et sans déclin cognitif. L'influence des facteurs liés à la forme est plus prononcée chez les personnes âgées que chez les jeunes adultes, et elle demeure importante chez les personnes atteintes d'ICM ou d'AD3. Ainsi, cette méthodologie peut nous aider à découvrir des caractéristiques du lexique mental à travers différentes populations et identifier les changements dans l'organisation du lexique avec l'âge et la neuropathologie. Une préoccupation lors du dépistage des patients atteints de neuropathologie est qu'ils peuvent avoir des difficultés à accéder aux connaissances liées aux tâches. Cependant, la tâche de décision lexicale est une tâche simple sans fardeau sur la mémoire de travail ou d'autres compétences cognitives complexes que de nombreux patients présentent des problèmes avec. Il a été jugé approprié pour les populations de la MA et de l'ICM.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Le protocole suit les lignes directrices du Comité d'éthique du district hospitalier de Northern Savo (IRB00006251).

1. Dépistage des participants

  1. Recruter des personnes plus jeunes et plus âgées qui ont une vision normale ou corrigée à la normale et qui sont des locuteurs natifs de la langue testée, à moins que l'étude ne réponde à des questions de recherche précises concernant l'acquisition de la langue seconde.
  2. Pour les groupes témoins en bonne santé, exclure les participants qui ont des antécédents de troubles neurologiques ou psychiatriques.
  3. Pour les groupes cliniques, recruter des personnes qui ont été diagnostiquées avec la maladie d'Alzheimer15 ou une déficience cognitive légère16,17. Recruter uniquement les personnes qui sont en mesure de donner un consentement éclairé, selon le jugement du clinicien. Pour des comparaisons précises, faites correspondre la tranche d'âge et la moyenne des groupes cliniques à celle des participants âgés en bonne santé.
  4. Mesurez la gravité de la démence, par exemple, en utilisant l'échelle d'évaluation clinique de la démence18 (CDR, 0-no démence, 0,5 'très doux, 1 'mild, 2'moderate, 3'severe). Exclure les patients atteints de démence grave parce que la tâche peut être trop difficile pour eux. N'incluez pas les participants qui semblent incapables de suivre les instructions, malgré leur cote de gravité.

2. Construction de stimulus

  1. Sélectionnez des stimuli de mots pour répondre à des questions de recherche spécifiques, par exemple, si les variables sémantiques ou orthographiques/phonologiques ont une influence plus forte sur la reconnaissance des mots19 dans différentes populations.
  2. Calculer à partir d'un corpus20 ou récupérer à partir d'une base de données21 variables reflétant les caractéristiques sémantiques, phonologiques et orthographiques des stimuli afin qu'ils puissent être utilisés soit comme prédicteurs théoriquement motivés expliquant le mot temps de réaction de reconnaissance ou comme variables de contrôle. De plus, utilisez le sexe, l'âge et les années d'éducation des participants comme variables explicatives ou de contrôle.
  3. En plus des vrais mots, construire un ensemble de pseudo-mots assortis. Les pseudo-mots ressemblent à des mots réels en ce sens qu'ils sont conformes aux normes de la langue pour le placement de certaines lettres dans certaines positions de mots (phonotactiques). Afin de contrôler la phonotactique, créez des pseudo-mots, par exemple, en recombinant aléatoirement les premières syllabes de certains mots avec les deuxièmes syllabes d'autres mots. Supprimez tous les éléments qui sont arrivés à produire un mot réel grâce à cette recombinaison et tous les éléments qui violent les phonotactiques de la langue.
  4. Associez les pseudo-mots aux mots cibles en termes de longueur de mot dans les lettres et de fréquence bigram, qui est le nombre moyen de fois que toutes les combinaisons de deux lettres suivantes se produisent dans un corpus de texte. Il a été démontré que ces variables influencent la vitesse de reconnaissance.
    REMARQUE : La manipulation du ratio pseudo-mot (p. ex., le nombre de mots réels par rapport au nombre de pseudo-mots) peut mener à des résultats différents, les réponses aux stimuli moins probables étant plus lentes et moins précises22.
  5. Ajouter un ensemble de remplisseurs de mots réels afin de diminuer l'espérance du participant du prochain stimulus appartenant à un certain type (par exemple, une certaine classe inflexion). Choisissez-les, par exemple, parmi différentes catégories de mots (p. ex., classes inflectionnelles) que ceux utilisés pour construire des stimuli en fonction des caractéristiques d'intérêt.

3. Conception expérimentale

  1. Présenter les cordes de lettre horizontalement, une à la fois, sous-traitant un angle visuel d'environ 5 degrés.
  2. Commencez l'expérience par une séance de pratique qui comprend un petit nombre d'essais, avec un mot présenté par essai (p. ex., 15 mots et 15 pseudo-mots non inclus dans l'expérience réelle). Il s'agit de familiariser le participant avec la tâche et les boutons de réponse. Si le participant ne répond pas avec précision (bouton « oui » pour les mots réels et bouton « non » pour les pseudo-mots) pendant les essais d'entraînement, fournissez des commentaires et refaites la séance d'entraînement.
  3. Divisez l'expérience en blocs et donnez de courtes pauses après la séance d'entraînement et entre les blocs. Ces pauses permettent aux participants de se reposer les yeux et de réduire la fatigue.
  4. Commencez chaque nouveau bloc avec quelques éléments de remplissage qui ne seront pas inclus dans l'analyse (par exemple, les noms communs tels que chien, sœur, année) parce que les premiers essais du bloc sont parfois ignorés par les participants avec MCI ou AD.
  5. Présentez les objets expérimentaux dans un ordre aléatoire pour chaque participant.
  6. Commencer chaque essai avec une marque de fixation (p. ex., un signe) apparaissant au centre de l'écran pendant 500 ms, suivie d'un écran blanc pour un temps fixe (p. ex. 500 ms) ou variable (p. ex. 500-800 ms).
  7. Immédiatement après l'écran blanc, présentez une chaîne de lettre (mot ou pseudo-mot) pour 1 500 ms ou jusqu'à ce que le participant réponde.
  8. Après une réponse est faite ou après 1500 ms du début du mot (selon le premier), suivez à nouveau avec un écran blanc jusqu'à ce que 3000 ms a passé depuis le début de l'essai.
  9. Répétez cette séquence jusqu'à ce que tous les éléments de l'expérience aient été présentés.
    REMARQUE: Les temps pour le délai entre les stimuli servent d'exemple. Les modifier peut affecter le modèle des résultats.

4. Procédure expérimentale

  1. Placez le participant devant un écran d'ordinateur à une distance d'observation d'environ 80 cm dans une pièce normalement éclairée.
  2. Demandez au participant de décider aussi rapidement et avec précision que possible si la chaîne de lettre à l'écran est un vrai mot ou non en appuyant sur l'un des deux boutons correspondants avec leur main dominante (par exemple, l'index pour les mots réels et le majeur pour pseudo-mots) ou en utilisant l'index de chaque main.
    REMARQUE : Les participants essaient d'optimiser leurs performances en fonction des instructions. Ainsi, leurs réponses seront affectées par le stress de la vitesse sur la précision ou vice versa23.

5. Analyser les données à l''égard d'un modèle à effets mixtes en R

REMARQUE : De nombreux programmes statistiques différents peuvent être utilisés pour effectuer l'analyse. Cette section décrit les étapes pour l'analyse des données dans R24.

  1. Obtenir le temps de réaction (RT) mesuré en millisecondes pour chaque essai à partir du fichier de sortie du programme de présentation (par exemple, le logiciel E-Studio).
  2. Installer les paquets lme428 et lmerTest29. Attachez des paquets à la bibliothèque de fonctions ou exigez-
  3. Importer des données dans R en utilisant, par exemple, la fonction read.table.
  4. Vérifiez le besoin de transformation, par exemple, avec la fonction boxcox du paquet MASS 25, car la distribution des données RT est généralement très biaisée.
    Bibliothèque (MASS)
    boxcox (RT - Expnanatory-variable, données - yourdata)

    REMARQUE : Le graphique produit par la fonction boxcox montre un intervalle de confiance de 95 % pour le paramètre de transformation de boxcox. Selon les valeurs lambda situées dans cet intervalle, la transformation nécessaire peut être choisie, par exemple, 1 (transformation inverse), 0 (transformation logarithmique), 1/2 (transformation de la racine carrée) et 1/3 (transformation de la racine du cube).
    1. Transformez les valeurs RT à l'aide de RT transformées inversées (p. ex. -1000/RT) ou de logarithmes binaires de RT (p. ex., log2(RT)) puisque ces transformations ont tendance à fournir des distributions plus normales pour les temps de réaction dans les expériences de décision lexicales que les RT brutes. 26.
    2. Alternativement, utilisez des méthodes statistiques qui ne reposent pas sur des distributions normales et s'adaptent à des modèles linéaires robustes à effets mixtes et fournissez des estimations sur les valeurs aberrantes ou autres sources de contamination qui ont peu d'influence27.
  5. Étant donné que les analyses du temps de réaction sont généralement effectuées sur des réponses précises, exclure les essais dans lesquels la réponse des participants était incorrecte (une réponse « non » aux mots réels) ainsi que les omissions.
    1. En outre, exclure les réponses aux pseudo-mots et les charges à moins qu'il n'y ait des hypothèses spécifiques à leur sujet.
    2. Exclure les essais dont les temps de réponse sont supérieurs à 300 ms parce qu'ils indiquent généralement que le participant a été trop tard pour répondre à un stimulus antérieur ou qu'il a accidentellement appuyé sur le bouton de réponse avant de lire le stimulus.
  6. Construire un modèle linéaire de base à effets mixtes qui identifie RT comme la mesure des résultats et le sujet, l'article, et l'essai comme des effets aléatoires. Notez que les variables dont les valeurs sont échantillonnées au hasard à partir d'un ensemble plus large (population) de valeurs sont incluses comme des effets aléatoires et des variables avec un petit nombre de niveaux ou pour lesquelles tous les niveaux sont inclus dans les données sont des effets fixes. Ajouter les effets aléatoires dans le formulaire (1 Sujet) afin d'estimer les interceptions aléatoires pour chacun des effets aléatoires.
    G1 (RT) (1 Objet) (1 Article) (1 Essai), données et yourdata)
    Résumé (g1)
  7. Ajoutez des variables explicatives dans un ordre théoriquement motivé. Par exemple, ajoutez la fréquence de base des mots comme effet fixe. Certaines variables, telles que la fréquence de base ou de surface, ont des distributions Zipfian, donc les insérer dans le modèle avec une transformation qui se traduit par une forme de distribution plus Gaussian, par exemple, la transformation logarithmique.
    G2 (RT ' journal(BaseFréquence' 1) Objet) (1 Article) (1 Essai), données et yourdata)
    Résumé (g2)
  8. Vérifiez avec la fonction Anova si l'ajout de chaque prédicteur (p. ex., BaseFrequency) a considérablement amélioré la puissance prédictive du modèle par rapport à un modèle sans prédicteur.
    anova (g1, g2)
    1. S'il n'y a pas de différence significative dans l'ajustement du nouveau modèle par rapport au modèle plus simple, préférez le modèle le plus simple avec moins de prédicteurs. Vérifiez également le critère d'information Akaike (AIC)30 de chaque modèle. L'AIC est une mesure de la façon dont les modèles statistiques s'adaptent à un ensemble de données selon la probabilité maximale. Des valeurs inférieures indiquent un meilleur ajustement pour les données31.
      AIC (g1); AIC (g2)
  9. Répétez les étapes 5.7. et 5,8. en ajoutant d'autres variables explicatives, par exemple, certaines de celles qui sont présentées au tableau 1, un par un dans un ordre théoriquement motivé et en ne gardant que celles qui améliorent considérablement la puissance prédictive du modèle. Si l'asynchronie de début variable de stimulus a été employée, l'inclure comme variable à effet fixe dans le modèle.
  10. Vérifiez s'il y a des interactions théoriquement motivées entre les prédicteurs. Par exemple, ajoutez un terme d'interaction le journal de la fréquence de base parâge.
    G3 (RT ' journal(BaseFrequency' 1) ' Age ' log(BaseFrequency' (BaseFrequency) Objet) (1 Article) (1 Essai), données et yourdata)
    REMARQUE : Il est possible qu'un prédicteur soit significatif en tant que terme d'interaction avec une autre variable, mais pas significatif comme prédicteur principal. Dans ce cas, ne supprimez pas ce prédicteur du modèle (incluez-le également comme effet principal).
  11. Ajouter par participant pistes aléatoires32 pour les prédicteurs en incluant "1 " avant le nom variable, puis " Sujet », par exemple, (1 ' journal(BaseFrequency '1) ' Sujet), parce que les temps de réponse des participants peuvent être affectés par les caractéristiques lexicales des mots de différentes façons.
    REMARQUE : S'il existe de nombreux prédicteurs continus, leur permettre à tous d'avoir des pentes aléatoires est irréaliste parce que les modèles de pente aléatoire nécessitent de grandes quantités de données pour estimer avec précision les écarts et les covariances33,34. Dans le cas où le modèle maximal ne converge pas (en d'autres termes, avec succès calculer), simplifier le modèle33. Alternativement, implémentez des versions bayésiennes de modélisation multiniveau35.
  12. Exécutez l'analyse pour chaque groupe de participants séparément. Alternativement, exécutez une analyse sur toutes les données, avec le groupe comme prédicteur d'effet fixe, et puis testez pour une interaction du groupe par des prédicteurs significatifs.
    G4 (RT ' journal(BaseFréquence' 1) ' Age ' log(BaseFrequency ' 1) : Age ' Groupe ' log (BaseFrequency ' 1) : Groupe (BaseFrequency '1) : Groupe (1 ' journal (BaseFrequency 'BaseFrequency '1) Objet) (1 Article) (1 Essai), données et yourdata)
  13. Afin de supprimer l'influence des valeurs aberrantes possibles, excluez les points de données dont les résidus standardisés absolus dépassent, par exemple, 2,5 écarts-types26, et réadèrent le modèle avec les nouvelles données (yourdata2).
    Yourdata2 et yourdata [abs(scale(resid(g4))) 'lt; 2.5, ]
    G5 (RT ' journal(BaseFréquence' 1) ' Age ' log(BaseFrequency '1) : Age 'Groupe 'Groupe 'log'(BaseFrequency '1) : Groupe (1 ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' Objet) (1 Article) (1 Essai), données et yourdata2)
    REMARQUE : Tous les points de données extrêmes ne sont pas nocifs pour le modèle, seulement ceux qui ont un effet de levier excessif sur le modèle.
  14. Dans le cas de l'analyse exploratoire (axée sur les données), utilisez la régression progressive : inclure toutes les variables dans l'analyse initiale, puis supprimer les variables non significatives du modèle d'une manière étape par étape. Alternativement, utilisez la procédure automatique d'élimination des prédicteurs non significatifs avec la fonction d'étape fournie par le paquet lmerTest29.
    étape (g4)

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Le tableau 1 montre une liste de variables qui ont été obtenues à partir de trois sources différentes (un corpus, un dictionnaire et des essais pilotes d'éléments d'essai) qui sont incluses dans l'analyse en tant que prédicteurs à effet fixe. Beaucoup de ces variables ont été précédemment rapportées pour affecter la vitesse de reconnaissance de mot.

corpus:
Fréquence de base le nombre de fois qu'un mot apparaît dans le corpus sous toutes ses formes différentes (p. ex., enfants et enfants)
Fréquence Bigram le nombre moyen de fois que toutes les combinaisons de deux lettres ultérieures se produisent dans le corpus
Taille de la famille morphologique le nombre de mots dérivés et composés qui partagent un morpheme avec le noms
Fréquence familiale morphologique la fréquence de base résumée de tous les membres de la famille morphologique
Taille de la famille pseudo-morphologique comprend non seulement les « vrais » membres de la famille morphologique, mais aussi les mots qui imitent les membres de la famille morphologiques sous leur forme orthographique, qu'il s'agisse ou non de morphémes réels, et représente donc un chevauchement orthographique, mais pas nécessairement un chevauchement sémantique.
Fréquence familiale pseudo-morphologique la fréquence de base résumée de tous les membres de la famille pseudo-morphologique
Fréquence de surface le nombre de fois qu'un mot apparaît dans le corpus sous exactement la même forme (p. ex. enfant).
Fréquence trigramme le nombre moyen de fois que toutes les combinaisons de trois lettres ultérieures se produisent dans le corpus
dictionnaire:
Distance hamming d'un le nombre de mots de la même longueur, mais ne diffèrent que dans une seule lettre36
longueur le nombre de lettres
Densité orthographique de voisinage nombre de mots de la même longueur, mais ne différant que dans la lettre initiale37,38
Essais pilotes : Seize participants ont indiqué sur une échelle de six points (de 0 à 5) leurs estimations pour chacun des mots cibles sur les paramètres suivants.
Comme nom propre la fréquence à laquelle le mot est considéré comme un nom propre (p. ex., comme nom de famille, comme Baker)39
Concret la franchise avec laquelle les mots se réfèrent à des entités concrètes40
Note de familiarité à quel point le mot est familier
Imageability la facilité et la rapidité avec laquelle les mots suscitent des images mentales40

Tableau 1. Les variables incluses dans l'analyse des effets mixtes en tant que prédicteurs à effet fixe, obtenues à partir de trois sources différentes (un corpus, un dictionnaire et des essais pilotes d'éléments d'essai).

Le nombre de variables explicatives peut être plus petit ou plus grand en fonction des questions de recherche et de la disponibilité des variables des bases de données, des dictionnaires ou du corpora. Cependant, l'inclusion d'un grand nombre de caractéristiques lexicales comme prédicteurs pourrait entraîner des complications sous forme de collinearité entre les prédicteurs, lorsque les prédicteurs sont en corrélation les uns avec les autres et exercent ainsi des effets similaires sur la mesure des résultats. Par exemple, la concrétisme et l'imagedes des mots peuvent être fortement corrélées. Une hypothèse dans toute analyse de régression linéaire est que les variables prédictives sont indépendantes les unes des autres. Cependant, à mesure que d'autres variables sont ajoutées au modèle, le risque que certaines variables ne soient pas indépendantes les unes des autres augmente. Plus la corrélation entre les variables est élevée, plus cette collinearité peut être nocive pour le modèle41. Une conséquence potentielle de la collinearité est que le niveau d'importance de certains prédicteurs peut être faux.

Pour éviter l'effet de la collinearité entre les prédicteurs, le nombre de prédicteurs devrait être réduit. Si deux prédicteurs montrent la collinearité, un seul d'entre eux devrait être inclus dans le modèle. Cependant, si plus de deux prédicteurs montrent la collinearité, alors l'exclusion de tous sauf un conduirait à une perte de variance expliqué. D'une part, un chercheur pourrait réduire le nombre de variables explicatives déjà dans la conception expérimentale a priori, ne laissant que celles qui sont motivées par des hypothèses (théoriquement motivées) et qui permettent au chercheur de tester des hypothèses entre populations différentes. D'autre part, il n'existe parfois aucune théorie et, par conséquent, il est raisonnable d'utiliser l'analyse des composantes principales (APC)41 pour réduire le nombre de prédicteurs en combinant des prédicteurs qui ont des effets similaires en composants. Dans cette analyse, l'espace prédicteur a été orthogonalisé et les principaux composants du nouvel espace ont été utilisés comme prédicteurs (suivant les étapes décrites ici41 aux pages 118-126). Un inconvénient de l'utilisation de PCA est que parfois les composants font qu'il est difficile de démêler les effets de plusieurs prédicteurs; ils pourraient tous émerger avec de fortes charges sur le même composant principal.

Nous avons transformé tous les prédicteurs lexicaux en cinq composantes principales afin d'examiner comment la vitesse de reconnaissance des mots pourrait être différente pour les jeunes adultes et les personnes âgées. Cependant, seulement deux d'entre eux étaient significatifs dans les données des jeunes adultes (tableau3) : PC1 et PC4. Trois composantes principales (PC) étaient des prédicteurs importantsdans le modèle pour les témoins âgés (tableau 4), MCI (tableau 5) et les personnes atteintes de la MA (tableau 6).

PC2 (en anglais)
Bigram freq. -0,390
Distance hamming d'un -0,350
Trigramme final freq. -0,330
Densité de voisinage -0,320
longueur -0,226
Trigram freq initial. -0,224
Taille pseudo-famille (finale) -0,124
Pseudo-famille freq.(finale) -0,052
Famille freq. (composés) -0,042
Taille de la famille (composés) -0,039
Famille freq. (mots dérivés) -0,036
Taille de la famille (mots dérivés) -0,034
Surface freq. -0,023
Base freq. -0,008
Taille pseudo-famille (initiale) 0,070
Note de familiarité 0,093
Comme nom propre 0,102
Pseudo-famille freq. (initiale) 0,113
Concret 0,275
Imageability 0,296
Taille pseudo-famille (interne) 0,296
Pseudo-famille freq. (interne) 0,316

Tableau 2. La matrice de rotation pour PC2. Les charges sont la mesure dans laquelle chaque variable contribue à la composante. Cette table a été modifiée avec la permission de Cortex3.

Le tableau 2 présente les variables lexicales avec leurs chargements sur PC2. Les charges positives les plus fortes de PC2 étaient la taille et la fréquence pseudo-famille pour le chevauchement dans la position interne. Les charges négatives les plus fortes étaient la fréquence de bigram, la distance de Hamming d'un, la fréquence finale de trigramme, et la densité orthographique de voisinage. Étant donné que toutes ces variables sont principalement basées sur la forme plutôt que sur le sens, PC2 est interprétée comme reflétant l'influence des aspects basés sur la forme d'un mot sur la vitesse de reconnaissance des mots.

Le tableau 3 montre les résultats de l'analyse des effets mixtes chez les jeunes adultes (31 participants). Étant donné que le PC2 n'était pas un prédicteur important des temps de réponse des jeunes adultes (voir le tableau3), cela semble indiquer que ces variables fondées sur la forme ont moins d'influence sur les temps de réaction des jeunes adultes que les personnes âgées, y compris celles atteintes de la MA ou de l'ICM. .

Effets fixes estimation Std.Erreur t-valeur p-valeur
(Intercept) -1,31 0,05 -26,36 lt;0,001
Allomorphes -0,034 0,015 -2,3 0,024
PC1 (en anglais) -0,021 0,004 -5,179 lt;0,001
PC4 (en anglais) -0,042 0,008 Annonces -5,224 lt;0,001
Effets aléatoires
Groupes nom Variance Rue Dev. Corr
article (Intercept) 0,009 0,095
Objet (Intercept) 0,032 0,179
PC1 (en anglais) 4.765e-05 0,007 Annonces 0,08
résiduel 0,005 Annonces 0,235
Nombre d'obs. 2862; Article, 99; Objet, 31

Tableau 3. Coefficients estimés, erreurs standard et valeurs t- et p pour les modèles mixtes adaptés aux latences de réponse obtenues pour les mots réels pour les jeunes adultes. Cette table a été modifiée avec la permission de Cortex3.

L'estimation d'une variable à effet fixe peut être interprétée comme la quantité par laquelle la variable dépendante (RT) augmente ou diminue si la valeur de cet effet fixe change. Si l'estimation est négative, cela signifie que la variable est en corrélation négative avec les temps de réaction (plus la variable est élevée, plus les temps de réaction sont faibles (plus rapides). La valeur t doit généralement être inférieure à -2 ou supérieure à 2 pour que le prédicteur soit significatif.

Le tableau 4, le tableau 5et le tableau 6 montrent les résultats de l'analyse des effets mixtes pour les témoins âgés (17 participants), les personnes atteintes d'ICM (24 participants) et les personnes atteintes de MA (21 participants).

Une différence intéressante entre les trois groupes de personnes âgées est apparue : l'éducation a considérablement prédit la vitesse de reconnaissance des mots chez les personnes âgées (tableau4; l'estimation de l'éducation est négative, ce qui signifie que plus d'années d'éducation ont été associés à des temps de réaction plus rapides) et les personnes atteintes d'ICM (tableau 5), mais pas chez les personnes atteintes de la MA (tableau6; L'éducation a été supprimée du modèle puisqu'elle n'était pas un prédicteur significatif), bien qu'il n'y ait pas eu de différence évidente dans la variabilité des années d'éducation parmi ces groupes (AD : moyenne 10,8 ans, SD 4.2, gamme 5-19; MCI: moyenne 10,4 ans, SD 3.5, gamme 6-17; contrôles des personnes âgées: moyenne 13,7 ans, SD 3.7, gamme 8-20).

Effets fixes estimation Std.Erreur t-valeur p-valeur
(Intercept) -0,72 0,157 -4,574 lt;0,001
Allomorphes -0,022 0,01 -2,14 0,035
PC1 (en anglais) -0,011 0,003 -4,122 lt;0,001
PC2 (en anglais) -0,011 0,005 Annonces -2,223 0,029
PC4 (en anglais) -0,02 0,006 Annonces -3,687 lt;0,001
enseignement -0,024 0,011 -2,237 0,041
Effets aléatoires
Groupes nom Variance Rue Dev.
article (Intercept) 0,003 0,057
Objet (Intercept) 0,026 0,16
résiduel 0,033 0,181
Nombre d'obs. 1595; Article, 99; Objet, 17

Tableau 4. Coefficients estimés, erreurs standard et valeurs t- et p pour les modèles mixtes adaptés aux latences de réponse obtenues pour les mots réels pour les contrôles des personnes âgées. Cette table a été modifiée avec la permission de Cortex3.

Effets fixes estimation Std.Erreur t-valeur p-valeur
(Intercept) -0,562 0,114 -4,922 lt;0,001
PC1 (en anglais) -0,009 0,003 -3,218 0,002
PC2 (en anglais) -0,013 0,005 Annonces -2,643 0,01
PC4 (en anglais) -0,018 0,006 Annonces -3,078 0,003
enseignement -0,039 0,01 -3,708 0,001
Effets aléatoires
Groupes nom Variance Rue Dev.
article (Intercept) 0,003 0,056
Objet (Intercept) 0,03 0,174
résiduel 0,061 0,248
Nombre d'obs. 2227; Article, 99; Objet, 24

Tableau 5. Coefficients estimés, erreurs standard et valeurs t- et p pour les modèles mixtes adaptés aux latences de réponse obtenues pour les mots réels pour les personnes atteintes d'ICM. Cette table a été modifiée avec la permission de Cortex3.

Effets fixes estimation Std.Erreur t-valeur p-valeur
(Intercept) -0,876 0,051 -17.017 lt;0,001
Allomorphes -0,018 0,009 -2,008 0,048
PC1 (en anglais) -0,011 0,003 -4,097 lt;0,001
PC2 (en anglais) -0,011 0,004 -2,718 0,008 Annonces
PC4 (en anglais) -0,018 0,005 Annonces -3,751 lt;0,001
Effets aléatoires
Groupes nom Variance Rue Dev. Corr
procès (Intercept) 0,001 0,034
article (Intercept) 0,002 0,049
Objet (Intercept) 0,045 0,212
PC1 (en anglais) 4.138e-05 0,006 Annonces 0,83
résiduel 0,026 0,162
Nombre d'obs. 1879; Article, 99; Objet, 21

Tableau 6. Coefficients estimés, erreurs standard, et t- et p-valeurs pour les modèles mixtes adaptés aux latences de réponse obtenues pour les mots réels pour les personnes atteintes de la MA. Cette table a été modifiée avec la permission de Cortex3.

L'étude rapportée ici portait sur une question supplémentaire : le nombre d'allomorphes de tige associés à un mot influence-t-il la vitesse de la reconnaissance des mots42,43. Les allomorphes de tige sont différentes formes d'une tige de mot à travers divers contextes linguistiques. Par exemple, en anglais, le pied a deux allomorphes de tige, pieds et pieds. En d'autres termes, le mot tige change selon qu'il est dans la forme singulière ou plurielle. L'étude décrite ici a testé des locuteurs du finnois, une langue qui a un peu plus de complexité dans ses changements de tige par rapport à l'anglais. Les mots avec une plus grande allomorphie des tiges (c.-à-d. les mots avec plus de changements à leurs tiges) ont suscité des temps de réaction plus rapides dans tous les groupes (tableau3, tableau 4, et tableau 6; les estimations du nombre d'allomorphes étaient négatives, ce qui signifie que le plus le nombre d'allomorphes qu'un mot avait, plus les temps de réaction qu'il a obtenus, plus vite il a obtenu) à l'exception du groupe MCI (tableau5; le nombre d'allomorphes n'était pas un prédicteur significatif et a donc été supprimé du modèle).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

En utilisant une tâche linguistique simple qui ne nécessite pas de production linguistique, la présente étude a étudié l'impact de diverses variables lexicales sur la reconnaissance des mots chez les jeunes et les personnes âgées en santé neurologique, ainsi que chez les personnes atteintes de la maladie d'Alzheimer. ou une déficience cognitive légère. La tranche d'âge utilisée pour recruter des « personnes âgées » peut dépendre des intérêts de recherche spécifiques; cependant, la gamme pour le groupe de personnes âgées en bonne santé devrait correspondre aussi étroitement que possible à la tranche d'âge et à la distribution pour les personnes avec MCI ou AD recrutées pour la même étude.

Pour éviter la collinearité entre les prédicteurs, les variables lexicales ont été orthogonisées en composants principaux et ajoutées aux modèles à effets mixtes, où les temps de réaction ont servi de variable dépendante. La combinaison d'une simple expérience de décision lexicale et d'une analyse de régression mixte a conduit à la conclusion nouvelle que les difficultés linguistiques pour les patients atteints de MA peuvent être attribuées non seulement à des changements dans le système sémantique, mais aussi à une dépendance accrue sur la forme de mot. Fait intéressant, un modèle semblable a été trouvé pour des personnes avec l'affaiblissement cognitif doux et les personnes âgées cognitivement saines. Cela donne à penser qu'une dépendance accrue à l'égard des aspects fondés sur les formulaires du traitement du langage pourrait faire partie d'un changement courant lié à l'âge dans la reconnaissance des mots écrits.

Dans une conception factorielle, les chercheurs créent traditionnellement deux ensembles ou plus de mots qui diffèrent selon la variable d'intérêt et correspondent ensuite à ces ensembles de mots sur un certain nombre d'autres caractéristiques lexicales qui peuvent influencer la vitesse de traitement. L'hypothèse est que toute différence de comportement obtenue entre ces deux ensembles de mots doit être attribuée à la variable manipulée (c.-à-d., inégalée). Un problème avec ce type de conception est qu'il est très difficile de faire correspondre ensembles de mots sur plus de quelques variables. Un autre problème est qu'il pourrait y avoir des variables potentiellement significatives sur lesquelles les ensembles de mots n'ont pas été appariés ou n'ont pas pu être jumelés pour diverses raisons. En outre, la conception factorielle traite les phénomènes continus comme s'ils étaient des facteurs dichotomiques. L'utilisation de modèles d'effets mixtes pour l'analyse statistique des données comportementales permet au chercheur d'inclure des variables lexicales potentiellement importantes comme variables explicatives sans avoir à faire correspondre les mots ou les listes de mots selon ces variables. Dans un modèle d'effets mixtes, les variables Sujet (code/nombre participant), Objet (stimuli expérimentaux) et Trial (numéro d'essai) sont ajoutées en tant qu'effets aléatoires. Les interceptions aléatoires ont été incluses parce qu'on suppose que les sujets varient dans leurs temps de réaction globaux (c.-à-d. que certains participants sont naturellement plus lents ou plus rapides dans l'ensemble)

Cette méthodologie peut être appliquée à d'autres types de questions et à d'autres populations, par exemple des multilingues ou des personnes atteintes d'aphasie. Pour le premier groupe, le traitement de la langue peut différer des monolingues, de sorte que cette variable devrait être prise en considération si l'on recrute une population de langue mixte, soit en limitant le recrutement à un seul type de groupe, soit en comparant les résultats plus tard pour déterminer si l'arrière-plan linguistique a influencé les résultats.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Les auteurs n'ont rien à révéler.

Acknowledgments

Nous remercions Minna Lehtonen, Tuomo Honninen, Merja Hallikainen et Hilkka Soininen pour leur contribution à la collecte et au traitement des données signalées ici. La collecte de données a été soutenue par VPH Dementia Research, rendue possible par l'accord de subvention no 601055 de l'UE.

Materials

Name Company Catalog Number Comments
E-Prime Psychology Software Tools version 2.0.10.356.
PC with Windows and Keyboard
R R Foundation for Statistical Computing R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

DOWNLOAD MATERIALS LIST

References

  1. Bybee, J. From Usage to Grammar: The Mind's Response to Repetition. Language. 82 (4), 711-733 (2006).
  2. Oldfield, R. C., Wingfield, A. Response latencies in naming objects. The Quarterly Journal of Experimental Psychology. 17, 273-281 (1965).
  3. Nikolaev, A., et al. Effects of morphological family on word recognition in normal aging, mild cognitive impairment, and Alzheimer’s disease. Cortex. 116, 91-103 (2019).
  4. Milin, P., Feldman, L. B., Ramscar, M., Hendrix, P., Baayen, R. H. Discrimination in lexical decision. PLoS ONE. 12 (2), 1-42 (2017).
  5. Andrews, S. Frequency and neighborhood size effects on lexical access: activation or search? Journal of Experimental Psychology: Learning, Memory, and Cognition. 15, 802-814 (1989).
  6. Grainger, J., Muneaux, M., Farioli, F., Ziegler, J. C. Effects of phonological and orthographic neighbourhood density interact in visual word recognition. The Quarterly Journal of Experimental Psychology. 58 (6), 981-998 (2005).
  7. Ossher, L., Flegal, K. E., Lustig, C. Everyday memory errors in older adults. Aging, Neuropsychology, and Cognition. 20, 220-242 (2013).
  8. Barresi, B. A., Nicholas, M., Connor, L. T., Obler, L. K., Albert, M. Semantic degradation and lexical access in age-related naming failures. Aging, Neuropsychology, and Cognition. 7, 169-178 (2000).
  9. Chertkow, H., Whatmough, C., Saumier, D., Duong, A. Cognitive neuroscience studies of semantic memory in Alzheimer's disease. Progress in Brain Research. 169, 393-407 (2008).
  10. Cuetos, F., Arce, N., Martínez, C. Word recognition in Alzheimers’s disease: Effects of semantic degeneration. Journal of Neuropsychology. 11, 26-39 (2015).
  11. Stilwell, B. L., Dow, R. M., Lamers, C., Woods, R. T. Language changes in bilingual individuals with Alzheimer’s disease. International Journal of Language & Communication Disorders. 51, 113-127 (2016).
  12. Obler, L. K. Language and brain dysfunction in dementia. Language functions and brain organization. Segalowitz, S. , Academic Press. New York, NY. 267-282 (1983).
  13. Obler, L. K., Albert, M. L. Language in the elderly aphasic and in the demented patient. Acquired aphasia. Sarno, M. T. , Academic Press. New York. 385-398 (1981).
  14. Obler, L. K., Gjerlow, K. Language and the brain. , Cambridge University Press. Cambridge. (1999).
  15. McKhann, G. M., et al. The diagnosis of dementia due to Alzheimer’s disease: Recommendations from the National Institute on Aging - Alzheimer’s Association workgroups on diagnostic guidelines for Alzheimer’s disease. Alzheimer’s Dementia. 7, 263-269 (2011).
  16. Winblad, B., et al. Mild cognitive impairment - beyond controversies, towards a consensus: Report of the International Working Group on Mild Cognitive Impairment. Journal of Internal Medicine. 256, 240-246 (2004).
  17. Albert, M. S., et al. The diagnosis of mild cognitive impairment due to Alzheimer’s disease: Recommendations from the National Institute on Aging - Alzheimer’s Association workgroups on diagnostic guidelines for Alzheimer’s disease. Alzheimer’s & Dementia: The Journal of the Alzheimer’s Association. 7, 270-279 (2011).
  18. Hughes, C. P., Berg, L., Danziger, W. L., Coben, L. A., Martin, R. L. A new clinical scale for the staging of dementia. The British Journal of Psychiatry. 140, 566-572 (1982).
  19. Baayen, R. H. Data Mining at the Intersection of Psychology and Linguistics. Twenty-first century psycholinguistics: Four cornerstones. Cutler, A. , Lawrence Erlbaum Associates Publishers. Mahwah, NJ, US. 69-83 (2005).
  20. Brants, T., Franz, A. Web 1T 5-gram, version 1. , Linguistic Data Consortium. Philadelphia. (2006).
  21. Baayen, R. H., Piepenbrock, R., Gulikers, L. The CELEX lexical database (CD-ROM). , Linguistic Data Consortium. Philadelphia, PA. (1995).
  22. Wagenmakers, E. J., Ratcliff, R., Gomez, P., McKoon, G. A diffusion model account of criterion shifts in the lexical decision task. Journal of Memory and Language. 58, 140-159 (2008).
  23. Dufau, S., Grainger, J., Ziegler, J. C. How to say “no” to a non-word: a leaky competing accumulator model of lexical decision. Journal of Experimental Psychology: Learning, Memory, and Cognition. 38, 1117-1128 (2012).
  24. R Core Team. R: A language and environment for statistical computing. , R Foundation for Statistical Computing. Vienna, Austria. (2018).
  25. Venables, W. N., Ripley, B. D. Modern applied statistics with S. , 4th ed, Springer. New York, NY. (2002).
  26. Baayen, R. H., Milin, P. Analyzing reaction times. International Journal of Psychological Research. 3 (2), 12-28 (2010).
  27. Koller, M. robustlmm: An R package for robust estimation of linear mixed-effects models. Journal of Statistical Software. 75 (6), 1-24 (2016).
  28. Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting Linear Mixed-Effects Models Using lme4. Journal of Statistical Software. 67, 1-48 (2015).
  29. Kuznetsova, A., Brockhoff, P. B., Christensen, R. H. B. lmerTest Package: Tests in Linear Mixed Effects Models. Journal of Statistical Software. 82, 1-26 (2017).
  30. Akaike, H. Information theory and an extension of the maximum likelihood principle. Second International Symposium on Information Theory. Petrov, B. N., Csaki, B. F. , Academiai Kiado. Budapest. 267-281 (1973).
  31. Sakamoto, Y., Ishiguro, M., Kitagawa, G. Akaike Information Criterion Statistics. , D. Reidel Publishing Company. (1986).
  32. Barr, D. J., Levy, R., Scheepers, C., Tily, H. J. Random effects structure for confirmatory hypothesis testing: Keep it maximal. Journal of Memory and Language. 68, 255-278 (2013).
  33. Bates, D., Kliegl, R., Vasishth, S., Baayen, H. Parsimonious mixed models. arXiv:1506.04967v2. , (2015).
  34. Harrison, X. A., et al. Brief introduction to mixed effects modelling and multi-model inference in ecology. PeerJ. 6, 1-32 (2018).
  35. Kimball, A. E., Shantz, K., Eager, C., Roy, C. E. J. Confronting quasi-separation in logistic mixed effects for linguistic data: a Bayesian approach. Journal of Quantitative Linguistics. , (2018).
  36. Coltheart, M., Davelaar, E., Jonasson, J. T., Besner, D. Access to the internal lexicon. Attention and performance, vol. VI. Dornick, S. , Hillsdale, New Jersey. Erlbaum. 535-556 (1977).
  37. Caselli, N. K., Caselli, M. K., Cohen-Goldberg, A. M. Inflected words in production: Evidence for a morphologically rich lexicon. The Quarterly Journal of Experimental Psychology. 69, 432-454 (2016).
  38. Yarkoni, T., Balota, D., Yap, M. Moving beyond Coltheart’s N: A new measure of orthographic similarity. Psychonomic Bulletin & Review. 15 (5), 971-979 (2008).
  39. Cohen, G. Recognition and retrieval of proper names: Age differences in the fan effect. European Journal of Cognitive Psychology. 2 (3), 193-204 (1990).
  40. Kemmerer, D. Cognitive neuroscience of language. , Psychology Press. New York. (2015).
  41. Baayen, R. H. Analyzing linguistic data: A practical introduction to statistics using R. , Cambridge University Press. Cambridge. (2008).
  42. Nikolaev, A., Lehtonen, M., Higby, E., Hyun, J., Ashaie, S. A facilitatory effect of rich stem allomorphy but not inflectional productivity on single-word recognition. Applied Psycholinguistics. 39, 1221-1238 (2018).
  43. Nikolaev, A., et al. Behavioural and ERP effects of paradigm complexity on visual word recognition. Language, Cognition and Neuroscience. 10, 1295-1310 (2014).

Tags

Comportement Numéro 148 Reconnaissance des mots Décision lexicale Psycholinguistique Vieillissement Démence Maladie d'Alzheimer Déficience cognitive légère Modèles d'effets mixtes Analyse des composants principaux
Tâche de décision lexicale pour l'étude de la reconnaissance de la parole écrite chez les adultes atteints ou non de démence ou d'une déficience cognitive légère
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Nikolaev, A., Higby, E., Hyun, J.,More

Nikolaev, A., Higby, E., Hyun, J., Ashaie, S. Lexical Decision Task for Studying Written Word Recognition in Adults with and without Dementia or Mild Cognitive Impairment. J. Vis. Exp. (148), e59753, doi:10.3791/59753 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter