Summary
本研究では、主観評価と客観評価を組み合わせたユーザビリティテストの実験パラダイムを提示する。客観的評価はニューロ情報システム(NeuroIS)法を採用し、主観的評価はユーザビリティアンケートとNASA-タスク負荷指数(NASA-TLX)スケールを採用しました。
Abstract
本研究では、経営情報システム(MIS)における新技術のユーザビリティテストのための実験パラダイムを紹介する。ユーザビリティテストには、主観的評価と客観的評価の両方が含まれていました。主観的評価には、ユーザビリティアンケートとNASA-TLXスケールを採用しました。客観的評価のために、神経情報システム(NeuroIS)の方法が使用されました。NeuroISの観点から、本研究では、モバイルfNIRSとアイトラッキングメガネを使用してマルチモーダル測定を行い、実世界の行動実験で使用される認知神経科学ツールの生態学的妥当性の問題を解決しました。本研究では、モノのインターネット(IoT)に統合された拡張現実(AR)を実験対象として使用しました。ニューロイメージングデータ,生理データ,ユーザビリティ質問紙,NASA-TLX尺度データの違いを2つの情報検索モード(ARとWebサイト)で比較すると、ARによる情報検索は、消費意思決定過程において、Webサイトによる情報検索と比較して、効率が高く、認知負荷が低かった。ユーザビリティ実験の結果は、小売業の新興技術としてのARが、消費者体験を効果的に向上させ、購入意向を高めることができることを示しています。本研究における主観的評価と客観的評価の両方を組み合わせた実験パラダイムは、拡張現実、仮想現実、人工知能、ウェアラブル技術、ロボット工学、ビッグデータなどの新興技術のユーザビリティテストに適用できます。これは、新しいテクノロジーの採用による人間とコンピューターの相互作用におけるユーザーエクスペリエンスのための実用的な実験ソリューションを提供します。
Introduction
通常、拡張現実、仮想現実、人工知能、ウェアラブル技術、ロボット工学、ビッグデータに代表される、消費者と対話する6つのフロンティアテクノロジーは、消費者行動の多くの理論モデルを再形成しています1。拡張現実(AR)は、消費者体験を向上させ、消費者満足度を向上させる可能性のある新しいテクノロジーです。文字情報、画像、映像などの仮想アイテムを現実のシナリオに重ね合わせて仮想性と現実性を融合させ、説明・指導・評価・予測を通じて実世界の情報を強化します2。ARは、新しい種類の人間とコンピューターの相互作用を提供し、消費者に没入型のショッピング体験を生み出し、多くのアプリケーションの開発につながりました3,4。ただし、ARサービスに対する消費者の受け入れはまだ最小限であり、多くの企業はARテクノロジーの採用に慎重です5,6。技術受容モデル(TAM)は、新しい情報技術の採用行動を説明および予測するために広く使用されています7,8。TAMによると、新技術の採用意向はその使いやすさに大きく依存します9。したがって、TAMの観点からARサービスに対する消費者の受け入れが遅いことの考えられる説明は、買い物中にARのユーザビリティを評価する必要性を強調する新しい技術のユーザビリティに関連している可能性があります10,11。
ユーザビリティは、指定されたユーザー12によって指定されたコンテキストで特定の目標を達成することの有効性、効率、および満足度として定義されます。現在、ユーザビリティを評価するには、主観的評価と客観的評価の2つの主要な方法があります13。主観的評価は、主に質問紙と尺度を用いた自己申告方法に依存しています。この一連の研究に続いて、本研究で使用したアンケートには、目標を達成するための情報検索モードに関連する5つの特徴が含まれていました:(1)効率、(2)使いやすさ、(3)記憶力(覚えやすい)、(4)満足度(情報検索モードが快適で快適)、および(5)他のオブジェクトへの一般化可能性14、15、16.加えて、学習者17の認知システム上で特定のタスクを実行する間の負荷を表す認知的負荷は、ユーザビリティ18、19の別の中核的指標である。したがって、この研究では、ARを使用したショッピングとWebサイトサービスを使用したショッピングの認知負荷を測定するための主観的な指標として、NASAタスク負荷指数(NASA-TLX)13,20を追加で使用しました。自己報告の方法は、個人の態度や以前の行動を正確に報告する能力と意欲に依存しており21、誤った報告、過少報告、またはバイアスの可能性を残していることは注目に値します。したがって、客観的尺度は、従来の主観的方法22を補完する貴重なものとなり得る。
ニューロ情報システム(NeuroIS)手法は、ARのユーザビリティを客観的に評価するために使用されます。NeuroISは、2007年のICIS会議でDimokaらによって造られ、情報システム(IS)の分野でますます注目を集めています23。NeuroISは、認知神経科学の理論とツールを使用して、ISテクノロジーの開発、採用、および影響をよりよく理解します24,25。今日まで、機能的磁気共鳴画像法(fMRI)、脳波(EEG)、陽電子放出コンピュータ断層撮影、脳磁図(MEG)、機能的近赤外分光法(fNIRS)などの認知神経科学ツールは、NeuroIS研究で一般的に使用されています26,27。たとえば、DimokaとDavisは、fMRIを使用して、被験者がWebサイトを操作したときの活性化を測定し、知覚された使いやすさが前頭前野(PFC)の活性化に影響を与えることを明らかにしました28。同様に、EEGを使用して、Moridisらは、正面の非対称性が有用性と密接に関連していることを発見しました29。これらの結果は、PFCがユーザビリティにおいて重要な役割を果たす可能性があることを示しています。
以前のNeuroIS研究で成果が出ていますが、これらの研究で使用されたパラダイムは、生態学的妥当性の低い被験者の体の動きが制限されており、理論的および実際的な貢献が制限されていました。買い物中にARなどのテクノロジーと相互作用するには、自由な身体の動きが必要であり、Heらで議論されているように、被験者の制約は消費者体験を大きく損ないます22。したがって、情報システムのユーザビリティテストには、生態学的妥当性の高い脳イメージングツールが必要です。この点で、fNIRSには独自の技術的利点があります:fNIRS実験中、被験者はある程度自由に30 回動くことができます。たとえば、以前の研究では、ポータブルfNIRS31を使用して、サイクリングなどのいくつかの屋外活動中の被験者の脳の活性化を測定しました。また、fNIRSは低コストであり、長期間の脳活性化の測定が可能です32。本研究では、fNIRSを用いて、ARとWebサイトのショッピングサービスを利用した被験者の認知負荷レベルを客観的に測定した。
アイトラッキングは、近年のユーザビリティテスト中にユーザーの視覚的注意を検出するための貴重な心理生理学的手法であり33、NeuroIS研究でも広く使用されています34。この手法は、観察者の焦点が注意が向けられている場所に行き、視覚的注意が精神的プロセスを表し、視覚的注意のパターンが人間の認知戦略を反映していると仮定する目と心の仮説に依存しています35,36,37。AR研究の分野では、Yangらはアイトラッキングを使用して、AR広告が消費者の好奇心と注意を高めることによって広告に対する態度を改善することを発見しました38。現在の研究では、アイトラッキングを使用して、総固視時間、平均固視時間、固視頻度、サッカード頻度、平均サッカード持続時間、平均スキャンパス長などのパラメーターを含む被験者の注意を測定しました。
要約すると、本研究では、ARアプリケーションを例として、主観評価と客観評価を組み合わせたユーザビリティテスト手法を提案します。主観的評価にはユーザビリティ質問票とNASA-TLX尺度を用い,客観的評価にはfNIRSとアイトラッキングを組み合わせたマルチモーダル測定を用いた39,40。
実験計画
実験材料:実際のショッピングのコンテキストをシミュレートするために、実験室に製品棚を構築し、実験材料として2つの異なるブランドのミネラルウォーターを棚に配置しました。必需品としてミネラルウォーターを選定したのは、職業背景、性別、購買力による主観的評価に偏りがないことからである。ブランドの価格、容量、および親しみやすさは、無関係な変数の干渉を排除するために管理されました( 材料表を参照)。
ユーザビリティテストには、スマートフォンベースのARアプリケーション(補足図1)とWebサイト(補足図2)の2つの条件が含まれていました。ARアプリケーションは、ARエンジンに基づいてプログラムされました。このウェブサイトは、フロントエンド用のブートストラップとバックエンド用のフラスコに基づいて、Pythonを使用して開発されました。ARアプリケーションとウェブサイトをスマートフォンで実行し、閲覧しました。2つの異なるブランドのミネラルウォーターのうち、1つはAR条件で実験材料として使用され、もう1つはWebサイト条件で使用されました。
実験タスク:参加者は、IoTアプリケーションのコンテキストから派生した4つの情報検索タスク(水質、保管温度、一致する食事、およびリットルあたりの価格)を実行するように求められました。これらの4つの情報項目は、消費者がミネラルウォーターを購入するときに通常注意を払うものです。参加者がタスクを完了するための時間の制約はありませんでした。
水質:ミネラルウォーターの品質には、一般に、総溶解固形分(TDS)とpH値の2つの指標が含まれます。TDSはミネラル含有量を反映し、pH値は水の酸性度/アルカリ度を表します。これら2つの指標は、ミネラルウォーターに含まれる微量元素に関連しており、味に影響を与えます。たとえば、ブルボルドとオンガースは、水の官能品質をTDS含有量に応じて5つのグレードに分けました41。Marcussenらは、水が100-400 mg/L TDS42の範囲で良好な感覚的性質を有することを見出した。本研究で使用した2銘柄のミネラルウォーターのTDSとpH値をそれぞれTDSとpHメーターで測定し、ARアプリケーションとウェブサイトにマークしました。タスクの実行中に、参加者はミネラルウォーターのTDS値とpH値を報告し、これらの値が公称範囲内にあるかどうかを確認する必要がありました。AR条件では、参加者は水のボトルをスキャンすることでこの情報を取得できます。ウェブサイト条件では、参加者は、(1)ミネラルウォーターのボトルの裏面にある数値コードを見つける、(2)クエリボックスに数値コードを入力してミネラルウォーターのTDSとpH値を取得する、(3)ウェブサイトでミネラルウォーターの公称範囲を検索する、(4)TDSとpH値が製品の公称範囲内にあるかどうかを口頭で報告する、の4つのステップを実行する必要がありました。
保管温度:ミネラルウォーターは、温度変化により輸送中および保管中に品質が低下する場合があります。実験によると、ミネラルウォーターの適切な温度は、輸送および保管中の5°Cから25°Cの間です。この温度範囲では、水は悪臭を有さない43。本実験では、2種類のミネラルウォーターの保存温度を異なる場所にARアプリとウェブサイトで表示しました。タスクの実行中に、参加者は水の貯蔵場所と対応する温度を報告する必要がありました。AR条件では、参加者は水のボトルをスキャンすることでこの情報を取得できます。ウェブサイト条件では、参加者はクエリボックスに数値コードを入力することでこの情報を取得できます。
マッチングダイエット:さまざまなブランドのミネラルウォーターは、その独特のミネラル組成と泡の含有量により、さまざまなメニューに適しています44。今回の実験では、2つのミネラルウォーターの食事に関する推奨事項がARアプリケーションとWebサイトにマークされました。タスクを実行している間、参加者はミネラルウォーターがメニューの食べ物とどのように一致するかを報告する必要がありました。AR条件では、参加者は水筒をスキャンすることでこの情報を取得できます。ウェブサイトの条件では、参加者はウェブサイトでこの情報を検索することができます。
リットルあたりの価格:現在、中国のミネラルウォーターボトルのラベルには、リットルあたりの価格情報は表示されません。これにより、消費者はさまざまな種類のミネラルウォーターの単価の違いを区別することが困難になります。したがって、本実験では、参加者は1リットルあたりの価格を報告する必要がありました。ARアプリケーションでは、参加者は水のボトルをスキャンすることで、リットルあたりの価格を直接取得できます。Webサイトの条件では、ラベルの単価とボリュームから情報を計算できます。
この研究では、 表1に記載されているように、参加者の包含基準と除外基準を使用して、参加者内デザインを使用しました。合計40人の参加者(男性20人、女性20人、平均年齢= 21.31±1.16歳)が実験を完了しました。すべての参加者は江蘇科技大学の学部生であり、ランダムに2つのグループ(AとB)に配置されました。順序効果を回避するために、実験順序は2つのグループ間で相殺されました(A / B)。具体的には、一方のグループが最初にAR条件を実行し、次にWebサイトの条件を実行し、もう一方のグループが最初にWebサイトを実行してからAR条件を実行しました。参加者は、実験の準備を完了し、機器を装着し、実験タスクを実行する必要がありました。実験間隔を10秒に設定して、皮質活性化をベースラインレベルに戻して、後続のタスクでの相互影響を回避しました。AR / Webサイトの実験の最後に、参加者はユーザビリティアンケートとNASA-TLXスケールに回答する必要がありました。実験フローチャートを 図1に示します。実験セットアップの写真を 図2に示します。
表1:研究の包含基準と除外基準。この表をダウンロードするには、ここをクリックしてください。
図1:実験フローチャート。 各実験は~45分続き、タスクの間に10秒の休憩時間がありました。 この図の拡大版を表示するには、ここをクリックしてください。
図2:実験シーンのセットアップ例。 実験材料、参加者、および機器が表示されます。 この図の拡大版を表示するには、ここをクリックしてください。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
この研究は、ヘルシンキ宣言の原則に従って実施されました。すべての参加者は、実験の目的と安全性を知らされ、参加前にインフォームドコンセントフォームに署名しました。この研究は、江蘇省科学技術大学の治験審査委員会によって承認されました。
1. 実験手順
- 実験の準備
- 参加者にインフォームドコンセントを説明し、同意書に署名してもらいます。
- 参加者の色覚テストを実行して、正常な色識別があることを確認します。
- 参加者に30のミネラルウォーターブランドを提示し、実験で使用したミネラルウォーターのブランドに慣れていないことを確認するために、なじみのあるブランドを選んでもらいます。
- 実験の手順を参加者に紹介します。
- 調査で使用したブランド以外のミネラルウォーターブランドを使用している参加者に対して事前実験を実施し、ARとWebサイトの操作に精通していることを確認します。
- グループAの各参加者に、最初にAR実験を実行し、次にWebサイトの実験を実行するように指示します。グループBの各参加者に、最初にWebサイトの実験を実行してから、AR実験を実行するように指示します。
- 楽器の着用
- fNIRSプローブ
- 皮膚調製ジェルで参加者の額の皮膚をきれいにします( 材料の表を参照)。
- 汗をかく状況のために、プローブ( 材料表を参照)をラップで包みます。黒いヘッドバンド1を備えた国際2-10システムに従って、プローブをFP2およびFP45の位置に固定します。黒いバンダナを使用してプローブを覆い、周囲光からプローブを保護し、信号品質を向上させます。
- 実験終了後、70%イソプロピルアルコールパッドを使用してプローブの送信機と受信機を清掃します。
- アイトラッカー:アイトラッキングメガネを使用して、実際の環境での目の動きをキャプチャします( 材料表を参照)。アイトラッキングメガネのヘッドユニットに処方レンズを磁気的に取り付け(必要な場合)、参加者が矯正された視力で自由に歩き回れるようにします。
注:アイトラッキングメガネは標準的なメガネと組み合わせて動作するようには設計されていないため、眼鏡をかけている参加者は、近視または遠視のいずれかを矯正するためにオプションの処方レンズを使用して研究に含めることができます。参加者は、ノイズをわずかに増加させる可能性がありますが、通常はデータにエラーを導入しないため、標準のコンタクトレンズを着用することもできます。参加者は、瞳孔や虹彩の外観を変えるカラーレンズやその他のレンズを使用することはできません。
- fNIRSプローブ
2. 施策
- fNIRS
- 録音ソフトウェアを開きます( 材料表を参照)。プローブをBluetoothアダプター を介して ラップトップに接続し、ラップトップを介して参加者の前頭前野における酸素化ヘモグロビン(O2Hb)の濃度の変化を10 Hzのサンプリング周波数で記録します。
- 受信光強度と組織飽和指数(TSI)の品質をチェックして、データ品質を制御します。受信信号が1%から95%の間にあることを確認してください。
- 参加者が椅子に快適な位置に座り、2分間安静状態を維持して、実際の実験の前にベースラインデータを収集します。
- ソフトウェアインターフェイスの [スタート ]ボタンをクリックして、fNIRSデータを記録します。
- アイトラッキング
- 視線追跡メガネのハードウェアをセットアップします。アイトラッキングメガネのUSBプラグをラップトップのUSBポートに接続します。録音ソフトウェア( 材料表を参照)を開き、サンプリング周波数を120Hzに設定します。
- キャリブレーション: 1 点キャリブレーションを実行します。参加者に、0.6 mの視野ではっきりと識別できるオブジェクトに焦点を合わせるように依頼します。シーンビデオで参加者がフォーカスしているオブジェクトに十字カーソルを移動し、オブジェクトをクリックします。
- ソフトウェアインターフェイスの[録音]ボタンを押して、 録音 を開始します。
- アンケートとスケール:AR / Webサイトのタスクを完了した後、参加者にユーザビリティアンケートとNASA-TLXスケールを提示します。
3.データ分析
- fNIRSデータ処理
- fNIRS記録ソフトウェアから取得した光学濃度値を、修正ランベルトベール法則46に従って濃度(μmol)に変換します。
- ローパス0.5Hzで生データをフィルタリングして、心拍や呼吸などの体系的なノイズを除去します。
- 時系列47全体より3標準偏差を超えたデータセグメントを削除して、モーションアーチファクトのデータを確認して修正します。
- AR 条件と Web サイト条件で平均および最大 fNIRS データをエクスポートし、ベースライン データから減算します。
- アイトラッキングデータ処理
- 参加者の固定頻度(カウント/秒)、総固視時間(ミリ秒)、平均固視時間(ミリ秒)、サッカード頻度(カウント/秒)、平均サッカード時間(ミリ秒)、および平均スキャンパス長(px / s)をエクスポートします。
- 統計解析
- 有意水準0.05で両側検定を実行します。Shapiro-Wilk検定を使用してデータの正規性を確認し、差検定を実行します。誤発見率(FDR)法を使用して、p値の多重比較補正を実行します。
注: 差検定の実行中に、正規分布に従うデータは対応のあるサンプルの t検定を使用して分析され、正規分布に従わないデータはウィルコクソン符号順位検定を使用して分析されました。
- 有意水準0.05で両側検定を実行します。Shapiro-Wilk検定を使用してデータの正規性を確認し、差検定を実行します。誤発見率(FDR)法を使用して、p値の多重比較補正を実行します。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
本研究の代表的な結果としては、ユーザビリティアンケート結果、アイトラッキングデータ解析、NASA-TLXスケールデータ、fNIRSデータ解析、動的認知負荷変化などがある。ユーザビリティ質問票の結果については、アイトラッキングデータ解析、NASA-TLXスケールデータおよびfNIRSデータ解析、正規性検定、差分検定を実施した。動的な認知負荷の変化について、この研究では、マルチモーダル測定の有効性を実証するために、1人の参加者からfNIRSとアイトラッキングデータを選択しました。
ユーザビリティアンケート結果
ユーザビリティアンケートの項目はいずれも正規分布に従わなかった(表2)。ユーザビリティアンケートでARとウェブサイトの信頼性をテストし、クロンバックのアルファスコアは許容できると見なされました(クロンバックのアルファ= 0.974)。
表2:ユーザビリティアンケートの正規性検定。 ユーザビリティアンケートの項目はいずれも正規分布に従わなかった。データは、ウィルコクソン符号順位検定を用いて分析した。 この表をダウンロードするには、ここをクリックしてください。
ARとWebサイトのユーザビリティアンケートの差スコアの中央値を表3に示します。ARとWebサイトの条件のデータ分布を図3に示します。ARとウェブサイトの条件には有意差が認められ、ARのスコアの中央値はウェブサイトよりも高かった。結果は、参加者がウェブサイト条件よりもAR条件でより良いユーザーエクスペリエンスを持っていたことを示しました。
表3:ARとWebサイトの条件によるユーザビリティアンケートの差スコアの中央値。 ARのスコアの中央値は、ウェブサイトのスコアよりも有意に高かった。 この表をダウンロードするには、ここをクリックしてください。
図3:ユーザビリティアンケートのデータ分布。 ユーザビリティアンケートのデータ分布の模式図。 この図の拡大版を表示するには、ここをクリックしてください。
アイトラッキングデータ分析
すべてのアイトラッキング指標の正常性を試験し、結果を 表4に示す。タスク1と3では、固定頻度のみが正規分布に従い、他のすべての指標は正規分布に従わなかった。タスク2では、固視頻度とサッカード頻度は正規分布に従いましたが、残りの指標は正規分布に従いませんでした。タスク4では、サッカード頻度のみが正規分布に従いました。AR条件とウェブサイト条件の違いを比較する場合、データは正規性/非正規性に基づいて別々に報告されました。 表5 は、タスク1(水質)のAR条件とWebサイト条件の視線追跡インジケーターの違いを示しています。ARとウェブサイトの条件の間では、すべての視線追跡指標に有意差があり、 p < 0.001でした。平均固定期間は、ウェブサイト条件よりもAR条件で有意に長かった(AR中央値= 586.85、四分位範囲(IQR)= 482.55-714.6;ウェブサイトの中央値= 398.05、IQR = 362.775-445.275)。その他の指標は、AR条件の方がウェブサイト条件よりも有意に低かった。
表4:視線追跡指標の正規性検定。 正規分布に従う視線追跡データは対応のあるサンプルの t検定を使用して分析され、正規分布に従わない視線追跡データはウィルコクソン符号順位検定を使用して分析されました。 この表をダウンロードするには、ここをクリックしてください。
表5:タスク1のARとWebサイトの視線追跡インジケーターの違い。 ARとウェブサイトの条件の間では、すべての視線追跡指標に有意差がありました( p < 0.001)。平均固定期間は、ウェブサイト条件よりもARで有意に長かった(中央値AR = 586.85、四分位範囲(IQR)= 482.55-714.6;ウェブサイト の中央値= 398.05、IQR = 362.775-445.275)。その他の指標は、ウェブサイトの状態よりもARの方が有意に低かった。 この表をダウンロードするには、ここをクリックしてください。
表6 は、タスク2(保管温度)のAR条件とWebサイト条件の視線追跡インジケーターの違いを示しています。すべてのアイトラッキング指標は、ARとウェブサイトの状態の間に有意差を示し、 p < 0.001でした。平均固視時間は、ウェブサイト条件よりもAR条件で有意に長かった(中央値AR = 477.2、IQR = 398.675-596.575;ウェブサイトの中央値= 397.1、IQR = 353.35-451.075)。その他の指標は、AR条件の方がウェブサイト条件よりも有意に低かった。
表6:タスク2のARとWebサイトの視線追跡インジケーターの違い。 ARとウェブサイトの条件の間では、すべてのアイトラッキング指標に有意差がありました( p < 0.001)。平均固視時間は、ウェブサイト条件よりもARの方が有意に長かった(AR 中央値= 477.2、IQR = 398.675-596.575;ウェブサイト の中央値= 397.1、IQR = 353.35-451.075)。その他の指標は、ウェブサイトの状態よりもARの方が有意に低かった。 この表をダウンロードするには、ここをクリックしてください。
表7 は、タスク3(マッチングダイエット)におけるARとウェブサイト条件の視線追跡指標の違いを示しています。ARとウェブサイトの条件の間では、すべての視線追跡指標に有意差があり、 p < 0.001でした。平均固視時間は、ウェブサイト条件よりもAR条件で有意に長かった(中央値AR = 420.45、IQR = 352.275-467.8;ウェブサイトの中央値= 360.6、IQR = 295-399.075)。その他の指標は、AR条件の方がウェブサイト条件よりも有意に低かった。
表7:タスク3のARとWebサイトの視線追跡インジケーターの違い。 ARとウェブサイトの条件の間では、すべての視線追跡指標に有意差があり、 p < 0.001でした。平均固視時間は、ウェブサイト条件よりもARで有意に長かった(中央値AR = 420.45、IQR = 352.275-467.8;ウェブサイト の中央値= 360.6、IQR = 295-399.075)。その他の指標は、ウェブサイトの状態よりもARの方が有意に低かった。 この表をダウンロードするには、ここをクリックしてください。
表8 は、タスク4(リットルあたりの価格)のARとWebサイトの条件の視線追跡インジケーターの違いを示しています。ARとウェブサイトの条件の間では、すべての視線追跡指標に有意差があり、 p < 0.001でした。平均固視時間は、ウェブサイト条件よりもAR条件で有意に長かった(中央値AR = 495.25、IQR = 404.8-628.65;ウェブサイトの中央値= 263.1、IQR = 235.45-326.2)。ただし、他の指標は、AR条件の方がWebサイト条件よりも大幅に低かった。
表8:タスク4のARとWebサイトの視線追跡インジケーターの違い。 ARとウェブサイトの条件の間では、すべての視線追跡指標に有意差があり、 p < 0.001でした。平均固視時間は、ウェブサイト条件よりもARで有意に長かった(中央値AR = 495.25、IQR = 404.8-628.65;ウェブサイト の中央値= 263.1、IQR = 235.45-326.2)。その他の指標は、ウェブサイトの状態よりもARの方が有意に低かった。 この表をダウンロードするには、ここをクリックしてください。
視覚的検索タスクでは、視線追跡指標が低いほど、情報検索の効率が高くなりました(平均固視時間を除く)。まとめると、アイトラッキングデータは、参加者がWebサイトを使用するときよりもARを使用する方が情報検索効率が高いことを示しました。
NASA-TLXスケールデータ
NASA-TLXスケールの項目はいずれも正規分布に従わなかった(表9)。クロンバックのアルファスコアは許容できると見なされました(クロンバックのアルファ= 0.924)。
表9:NASA-TLXスケールの正規性検定。 NASA-TLXスケールの項目はどれも正規分布に従わなかった。データは、ウィルコクソン符号順位検定を用いて分析した。 この表をダウンロードするには、ここをクリックしてください。
ARとウェブサイトの条件の間のNASA-TLXスケールの差スコアの中央値を 表10に示します。ARとWebサイトの条件のデータ分布を 図4に示します。ARとウェブサイトの条件には有意差が認められた。NASA-TLX尺度のAR条件のスコアはウェブサイト条件よりも低く,AR技術がウェブサイトよりも認知負荷が低いことが示唆された。
表10:ARとウェブサイト間のNASA-TLXスケールの差スコアの中央値。 AR条件のNASA-TLXスケールスコアは、ウェブサイト条件のスコアよりも有意に低かった。 この表をダウンロードするには、ここをクリックしてください。
図4:NASA-TLXスケールのデータ分布。 NASA-TLXスケールのデータ分布の模式図。 この図の拡大版を表示するには、ここをクリックしてください。
fNIRSデータ解析
平均O2Hb値を正規性について試験し、結果を表11に示す。AR条件とウェブサイト条件の違いを比較する場合、データは正規性/非正規性に基づいて別々に報告されました。ARとウェブサイト条件との間の平均O2Hbの差を表12に示す。参加者がタスク1(調整済みp = 0.002)、タスク3(調整済みp = 0.007)、およびタスク4(調整済みp < 0.001)を実行した場合、2つの条件の間に有意差がありました。AR条件で実施したタスクの平均O2Hbは、ウェブサイト条件よりも有意に低かった(タスク1:平均AR = -1.012、SDAR = 0.472、平均ウェブサイト= 0.63、SDウェブサイト= 0.529;タスク3:平均AR = -0.386、SDAR = 0.493、平均ウェブサイト = 1.12、SDウェブサイト = 0.554;タスク4:平均AR = -0.46、SDAR = 0.467、平均ウェブサイト= 2.27、SDウェブサイト= 0.576)。タスク2の実行中、ARとWebサイトの条件の差は有意なレベルに達しませんでした(調整済みp = 0.154 > 0.05)。これらの結果は、参加者がAR技術を使用した場合、Webサイトを使用した場合よりも認知負荷が低いことを示しています。
表11:平均O2Hbの正規性検定。 正規分布に従うfNIRSデータは対応のあるサンプルの t検定を使用して分析され、正規分布に従わないfNIRSデータはウィルコクソン符号順位検定を使用して分析されました。 この表をダウンロードするには、ここをクリックしてください。
表12:ARとウェブサイトの平均O2Hbの違い。 参加者がタスク1(調整済みp = 0.002)、タスク3(調整済みp = 0.007)、およびタスク4(調整済みp < 0.001)を行った場合、2つの条件の間に有意差があった。AR条件で実施したタスクの平均O2Hbは、ウェブサイト条件よりも有意に低かった(タスク1:平均AR = -1.012、SDAR = 0.472、平均ウェブサイト= 0.63、SDウェブサイト= 0.529;タスク3:平均AR = -0.386、SDAR = 0.493、平均ウェブサイト = 1.12、SDウェブサイト = 0.554;タスク4:平均AR = -0.46、SDAR = 0.467、平均ウェブサイト= 2.27、SDウェブサイト= 0.576)。タスク2の実行中、ARとWebサイトの条件の差は有意なレベルに達しませんでした(調整済みp = 0.154>0.05)。この表をダウンロードするには、ここをクリックしてください。
動的な認知負荷の変化
図5は、参加者がWebサイトの条件でタスク4を実行したときのO2Hb濃度の変化を示しています。ポイント1では、参加者はリットルあたりの価格を計算するのに苦労しました。激しい探索過程はO2Hb濃度の増加を誘発し、それは瞬間的負荷の増加を示した。参加者が合図を受け取ると、O 2 Hb濃度はポイント2まで低下し、瞬間荷重はその瞬間に谷値に達した。その後、参加者はリットルあたりの価格を計算するために一生懸命働き始め、できるだけ早くタスクを完了したいと考えました。これに関連して、O2Hb濃度は増加し続け、最大に達した(ポイント3)。要約すると、アイトラッキングとfNIRSのマルチモーダル測定は、情報システムと相互作用しながら認知負荷の動的変化を効果的に測定でき、消費者行動の個人差を調べることもできます。
図5:fNIRSの瞬時負荷。 fNIRS瞬時負荷を用いた動的認知負荷変化の模式図である。 この図の拡大版を表示するには、ここをクリックしてください。
本研究では、IoTに統合されたARの4つのタスクを例にとり、NeuroISアプローチと主観的評価手法を組み合わせた。実験結果から,(1)ユーザビリティ質問紙では,AR条件の方がWebサイト条件よりも主観的評価が良好であることが示唆された(表3,図3)。(2)アイトラッキングデータについては、参加者はウェブサイト利用時よりもAR利用時の情報検索効率が高かった(表5、表6、表7、表8)。(3)NASA-TLXスケールデータおよびfNIRSデータについては、AR手法はWebサイトよりも認知負荷が低い(表10および表12)。(4)動的認知負荷については、アイトラッキングとfNIRSのマルチモーダル計測により、情報システムと相互作用しながら認知負荷の動的変化を効果的に測定し、消費者行動の個人差を調べることができます(図5)。AR手法は、ARとWebサイトの条件を、ユーザビリティ質問票とNASA-TLXスケールを用いて、ニューロイメージングデータ、生理データ、自己申告データの違いを比較することで、情報検索の効率化と買い物時の認知負荷の軽減につなげることができます。したがって、新興の小売技術として、ARは消費者のユーザーエクスペリエンスを効果的に向上させ、ひいては購入意向を高める可能性があります。
補足図1:研究で使用されたARアプリケーションに表示される情報のスクリーンショット。 このファイルをダウンロードするには、ここをクリックしてください。
補足図2:調査で使用されたWebサイトに表示される情報のスクリーンショット。 このファイルをダウンロードするには、ここをクリックしてください。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
プロトコル内の重要なステップ
実験中、結果の信頼性を確保するためにいくつかのステップが考慮されました。まず、実験で使用されたミネラルウォーターのブランドに精通している参加者は、ブランドに関する知識に基づいてタスクを実行したため、除外されました。次に、ARやWebサイトの運用に慣れるために採用された他のブランドのミネラルウォーターを使用して事前実験を完了しました。第三に、fNIRSプローブを装着する場合、プローブを覆うために黒いバンダナを使用してプローブを周囲光から保護し、信号品質を向上させました。第四に、コンタクトレンズを着用している参加者は、瞳孔または虹彩の外観を変えるカラーレンズまたは他のレンズを使用することを許可されなかった。第五に、実際の実験の前に、参加者は椅子に快適な姿勢で座り、2分間安静状態を維持してベースラインデータを収集し、fNIRSデータ47のベースライン補正に使用しました。
変更とトラブルシューティング
本研究で提案した実験パラダイムは、実世界の商用アプリケーションに拡張することができる。認知神経科学の手法をビジネス上の問題に適用する際の最大の課題は、生態学的妥当性です48,49。モバイル脳/身体イメージングを用いた実験プロトコルは、この問題50を解決する実現可能性を実証した。Krampeらは、ポータブルfNIRSを使用して、現実的な食料品の買い物シナリオにおける消費者行動を研究し、「買い物客神経科学」の概念を提示しました51。マルチモーダルアプローチは、生態学的妥当性を大幅に向上させます。この研究は、ポータブルfNIRSとアイトラッカーメガネを適用することにより、製品棚の前でさまざまな情報検索モードを使用して消費者体験を調査した最初の調査です。実験を通じて、この研究はNeuroISの研究範囲を小売およびショッピングシナリオに拡張し、研究者が認知プロセスをよりよく理解できるようにします。実際のショッピングのコンテキストでは、fNIRS測定は位置オフセットと環境光の影響を受ける可能性が高いことに注意してください。したがって、包帯、テープ、および/またはストラップを使用してプローブを参加者にしっかりと取り付け、環境光の影響を避けるために黒い布を使用して組織とデバイスを覆うことをお勧めします。
テクニックの制限
実験にはいくつかの制限があります。まず、実験ではアイトラッカーを使用したため、近視と乱視が高い参加者は実験から除外されました。この場合、プロトコルは視覚障害者には使用できません。第二に、この研究は視覚感覚体験のみを調べます。将来の実験は、聴覚や触覚などの他の感覚チャネルにまで及ぶ可能性があります。第三に、この研究はAR技術のみを調べており、他の新興技術は将来の研究で同じ実験パラダイムを使用して評価する必要があります。
既存手法との意義
この研究の意義は2つの側面に反映されています。まず、ユーザビリティの客観的評価のためにマルチモーダルアプローチを使用しました。図5に示すように、アイトラッカーは買い物の過程で参加者の視点から動画を同時に録画するため、研究者は買い物シナリオをfNIRSデータに簡単に一致させることができました。したがって、マルチモーダルアプローチを使用したこの実験手法は、生態学的妥当性の高い継続的なリアルタイム測定の利点があるだけでなく、さまざまな手法の利点を組み合わせて、ショッピングシナリオの動的な変化を特定します。この調査は、製品メーカーが製品設計を改善し、小売業者が棚の製品のレイアウトを最適化し、消費者がユーザーエクスペリエンスを向上させるための効果的なユーザビリティテスト方法を提供しました。第2に,本研究では,客観的評価と主観的評価を組み合わせたユーザビリティテスト手法を提案した.一部の研究者は、自己報告法が一般的な方法バイアス(CMB)に苦しむ可能性があることを明らかにしました52,53。認知神経科学からの測定値は通常、主観的バイアス、社会的望ましさバイアス、および需要効果の影響を受けにくいため、これらの客観的評価データは主観的評価データを補完し、実験結果の頑健性を強化する可能性があります25,34。Liangらは、EEGと自己報告の方法を使用して、フローエクスペリエンスの実験を通じてWebサイトの品質とユーザー満足度の関係を調査しました。結果は、認知神経科学的方法がCMB53を減少させることを示した。この研究では、客観的評価と主観的評価の両方の組み合わせにより、(1)消費者は主観的評価に基づいてARショッピング条件を好むことが示されました。(2)AR技術は、アイトラッキングデータに基づいて視覚的検索の効率とユーザビリティを促進した。(3)AR技術は、fNIRSとNASA-TLXスケールデータに基づいて、消費者の認知負荷を軽減し、ユーザーエクスペリエンスを向上させました。(4)アイトラッキングによる映像情報と組み合わせることで、個人差の検討や消費者行動の状態差の把握が可能となった。
将来のアプリケーション
この研究は、MISにおける新興技術のユーザビリティテストのための実験パラダイムを提案します。ユーザビリティテストは、人間とコンピュータの相互作用における新興技術のユーザーエクスペリエンスを評価するために使用されます54。新しいテクノロジー(拡張現実、仮想現実、人工知能、ウェアラブルテクノロジー、ロボット工学、ビッグデータなど)がMISでますます使用されるにつれて、ユーザビリティテストの実験パラダイムを使用して、将来のユーザーエクスペリエンスに対する新しいテクノロジーの技術的利点を検証できます。
結論として、本研究では、ARなどの新興技術のユーザビリティを効果的に評価できるMISにおける主観的評価と客観的評価の両方を組み合わせた実験パラダイムを提案します。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
著者は開示するものは何もありません。
Acknowledgments
この研究は、江蘇省教育局の哲学および社会科学研究プロジェクト(2018SJA1089)、江蘇省海外研究奨学金(JS-2018-262)、浙江省自然科学財団(LY19G020018)、および中国国家自然科学財団(NSFC)(72001096)の支援を受けました。
Materials
Name | Company | Catalog Number | Comments |
AR Engine | Unity Technologies | 2020.3.1 | AR development platform |
AR SDK | PTC | Vuforia Engine 9.8.5 | AR development kit |
Eye Tracker (eye tracking glasses) | SMI, Germany | SMI ETG | Head-mounted eye tracking system |
Eye Tracker Recording software | SMI, Germany | iViewETG Software | Eye Tracker Recording software |
fNIRS probes | Artinis Medical Systems BV, Netherlands | Artinis PortaLite | Light source: Light emitting diodes Wavelengths: Standard nominal 760 and 850 nm |
fNIRS software | Artinis Medical Systems BV, Netherlands | OxySoft 3.2.70 | fNIRS data recording and analysis software |
Mineral Water | Groupe Danone | Badoit | Experimental material in the AR condition Capacity: 330ml Price: 6 |
Mineral Water | Nestlé | Acqua Panna | Experimental material in the website condition Capacity: 250ml Price: 5.4 |
Skin Preparation Gel | Weaver and Company | Nuprep | Clean the forehead skin of the participants |
Smartphone | Xiaomi | Redmi K30 Ultra | Smartphone-based AR application and website |
References
- Ameen, N., Hosany, S., Tarhini, A. Consumer interaction with cutting-edge technologies: Implications for future research. Computers in Human Behavior. 120, 106761 (2021).
- Javornik, A. Augmented reality: Research agenda for studying the impact of its media characteristics on consumer behaviour. Journal of Retailing and Consumer Services. 30, 252-261 (2016).
- Caboni, F., Hagberg, J. Augmented reality in retailing: a review of features, applications and value. International Journal of Retail & Distribution Management. 47 (11), 1125-1140 (2019).
- Kumar, H. Augmented reality in online retailing: a systematic review and research agenda. International Journal of Retail & Distribution Management. 50 (4), 537-559 (2022).
- Yim, M. Y. C., Park, S. Y. I am not satisfied with my body, so I like augmented reality (AR): Consumer responses to AR-based product presentations. Journal of Business Research. 100, 581-589 (2019).
- Chylinski, M., et al. Augmented reality marketing: A technology-enabled approach to situated customer experience. Australasian Marketing Journal. 28 (4), 374-384 (2020).
- Davis, F. D. A Technology Acceptance Model for Empirically Testing New End-User Information Systems: Theory and Results. , Massachusetts Institute of Technology. Doctoral dissertation (1985).
- Venkatesh, V., Morris, M. G., Davis, G. B., Davis, F. D. User acceptance of information technology: Toward a unified view. MIS Quarterly. 27 (3), 425-478 (2003).
- Davis, F. D. Perceived usefulness, perceived ease of use, and user acceptance of information technology. MIS Quarterly. 13 (3), 319-340 (1989).
- Chen, R., Perry, P., Boardman, R., McCormick, H. Augmented reality in retail: a systematic review of research foci and future research agenda. International Journal of Retail & Distribution Management. 50 (4), 498-518 (2022).
- Poushneh, A., Vasquez-Parraga, A. Z. Discernible impact of augmented reality on retail customer's experience, satisfaction and willingness to buy. Journal of Retailing and Consumer Services. 34, 229-234 (2017).
- ISO. ISO 1998. Ergonomic requirements for office work with visual display terminals (VDTs)-Part 11: guidance on usability. ISO. , (2022).
- Hornbæk, K. Current practice in measuring usability: Challenges to usability studies and research. International Journal of Human-Computer Studies. 64 (2), 79-102 (2006).
- Tullis, T., Albert, B. Measuring the User Experience: Collecting, Analyzing, and Presenting Usability Metrics. , Morgan Kaufmann. Amsterdam, Boston. (2008).
- Shneiderman, B., Plaisant, C., Cohen, M., Jacobs, S. M., Elmqvist, N. Designing the User Interface: Strategies for Effective Human-Computer Interaction. , Pearson. Boston. (2017).
- Morillo, P., Orduña, J. M., Casas, S., Fernández, M. A comparison study of AR applications versus pseudo-holographic systems as virtual exhibitors for luxury watch retail stores. Multimedia Systems. 25 (4), 307-321 (2019).
- Paas, F. G., Van Merriënboer, J. J. Instructional control of cognitive load in the training of complex cognitive tasks. Educational Psychology Review. 6 (4), 351-371 (1994).
- Ismail, R., Fabil, N., Saleh, A. Extension of pacmad model for usability evaluation metrics using goal question metrics (Gqm) approach. Journal of Theoretical and Applied Information Technology. 79 (1), 90-100 (2015).
- Fan, X., Chai, Z., Deng, N., Dong, X. Adoption of augmented reality in online retailing and consumers' product attitude: A cognitive perspective. Journal of Retailing and Consumer Services. 53, 101986 (2020).
- Hart, S. G., Staveland, L. E. Development of NASA-TLX (Task Load Index): Results of empirical and theoretical research. Advances in Psychology. 52, 139-183 (1988).
- Petty, R. E., Cacioppo, J. T., Schumann, D. Central and peripheral routes to advertising effectiveness: The moderating role of involvement. Journal of Consumer Research. 10 (2), 135-146 (1983).
- He, L., Pelowski, M., Yu, W., Liu, T. Neural resonance in consumers' right inferior frontal gyrus predicts attitudes toward advertising. Psychology & Marketing. 38 (9), 1538-1549 (2021).
- Riedl, R., Fischer, T., Léger, P. M., Davis, F. D. A decade of NeuroIS research: Progress, challenges, and future directions. ACM SIGMIS Database: the DATA BASE for Advances in Information Systems. 51 (3), 13-54 (2020).
- Vom Brocke, J., Liang, T. P. Guidelines for Neuroscience Studies in Information Systems Research. Journal of Management Information Systems. 30 (4), 211-234 (2014).
- Dimoka, A., Pavlou, P. A., Davis, F. NeuroIS: The potential of cognitive neuroscience for information systems research. Information Systems Research. 22 (4), 687-702 (2011).
- de Guinea, A. O., Titah, R., Léger, P. M. Explicit and implicit antecedents of users' behavioral beliefs in information systems: A neuropsychological investigation. Journal of Management Information Systems. 30 (4), 179-210 (2014).
- Dimoka, A. How to conduct a Functional Magnetic Resonance (fmri) study in social science research. MIS Quarterly. 36 (3), 811-840 (2012).
- Dimoka, A., Davis, F. D. Where does TAM reside in the brain? The neural mechanisms underlying technology adoption. ICIS 2008 Proceedings. , 1-19 (2008).
- Moridis, C. N., Terzis, V., Economides, A. A., Karlovasitou, A., Karabatakis, V. E. Using EEG frontal asymmetry to predict IT user's perceptions regarding usefulness, ease of use and playfulness. Applied Psychophysiology and Biofeedback. 43 (1), 1-11 (2018).
- Pinti, P., et al. A review on the use of wearable functional near-infrared spectroscopy in naturalistic environments. Japanese Psychological Research. 60 (4), 347-373 (2018).
- Piper, S. K., et al. A wearable multi-channel fNIRS system for brain imaging in freely moving subjects. Neuroimage. 85, 64-71 (2014).
- Quaresima, V., Ferrari, M. Functional Near-Infrared Spectroscopy (fNIRS) for assessing cerebral cortex function during human behavior in natural/social situations: A concise review. Organizational Research Methods. 22 (1), 46-68 (2019).
- Wang, J., et al. Exploring relationships between eye tracking and traditional usability testing data. International Journal of Human-Computer Interaction. 35 (6), 483-494 (2019).
- Dimoka, A., et al. On the use of neurophysiological tools in IS research: Developing a research agenda for NeuroIS. MIS Quarterly. 36, 679-702 (2012).
- Just, M. A., Carpenter, P. A. Eye fixations and cognitive processes. Cognitive Psychology. 8 (4), 441-480 (1976).
- Alex, P., Ball, L. J. Eye Tracking in Human-Computer Interaction and Usability Research: Current Status and Future. Encyclopedia of Human Computer Interaction, IGI Global. , 211-219 (2006).
- Just, M. A., Carpenter, P. A. A theory of reading: from eye fixations to comprehension. Psychological Review. 87 (4), 329 (1980).
- Yang, S., Carlson, J. R., Chen, S. How augmented reality affects advertising effectiveness: The mediating effects of curiosity and attention toward the ad. Journal of Retailing and Consumer Services. 54, 102020 (2020).
- Debie, E., et al. Multimodal fusion for objective assessment of cognitive workload: A review. IEEE Transactions on Cybernetics. 51 (3), 1542-1555 (2021).
- Işbilir, E., Çakır, M. P., Acartürk, C., Tekerek, A. Ş Towards a multimodal model of cognitive workload through synchronous optical brain imaging and eye tracking measures. Frontiers in Human Neuroscience. 13, 375 (2019).
- Bruvold, W. H., Ongerth, H. J.
Taste quality of mineralized water. Journal-American Water Works Association. 61 (4), 170-174 (1969). - Marcussen, H., Holm, P. E., Hansen, H. Chr.B. Composition, flavor, chemical food safety, and consumer preferences of bottled water. Comprehensive Reviews in Food Science and Food Safety. 12 (4), 333-352 (2013).
- Whelton, A. J., Dietrich, A. M. Relationship between intensity, concentration, and temperature for drinking water odorants. Water Research. 38 (6), 1604-1614 (2004).
- (LIFESTYLE) What your choice of water says about you. FT live. , Available from: https://m.ftchinese.com/story/001006284/en?archive (2006).
- Pellegrini-Laplagne, M., et al. Effect of simultaneous exercise and cognitive training on executive functions, baroreflex sensitivity, and pre-frontal cortex oxygenation in healthy older adults: a pilot study. GeroScience. , (2022).
- Delpy, D. T., et al. Estimation of optical pathlength through tissue from direct time of flight measurement. Physics in Medicine & Biology. 33 (12), 1433-1442 (1988).
- Han, W., Gao, L., Wu, J., Pelowski, M., Liu, T. Assessing the brain 'on the line': An ecologically-valid assessment of the impact of repetitive assembly line work on hemodynamic response and fine motor control using fNIRS. Brain and Cognition. 136, 103613 (2019).
- Spiers, H. J., Maguire, E. A. Decoding human brain activity during real-world experiences. Trends in Cognitive Sciences. 11 (8), 356-365 (2007).
- Spence, C. Neuroscience-Inspired Design: From Academic Neuromarketing to Commercially Relevant Research. Organizational Research Methods. 22 (1), 275-298 (2019).
- Grasso-Cladera, A., Costa-Cordella, S., Rossi, A., Fuchs, N. F., Parada, F. J. Mobile brain/body imaging: Challenges and opportunities for the implementation of research programs based on the 4E perspective to cognition. Adaptive Behavior. 0 (0), 1-26 (2022).
- Krampe, C., Strelow, E., Haas, A., Kenning, P. The application of mobile fNIRS to "shopper neuroscience" - first insights from a merchandising communication study. European Journal of Marketing. 52, 244-259 (2018).
- Meade, A. W., Watson, A. M., Kroustalis, C. M. Assessing common methods bias in organizational research. 22nd annual meeting of the society for industrial and organizational psychology. , New York. 1-10 (2007).
- Liang, T. P., Lin, Y. L., Shiau, W. L., Chen, S. F. Investigating common method bias via an EEG study of the flow experience in website design. Journal of Electronic Commerce Research. 22 (4), 305-321 (2021).
- Kim, Y. M., Rhiu, I., Yun, M. H. A systematic review of a virtual reality system from the perspective of user experience. International Journal of Human-Computer Interaction. 36 (10), 893-910 (2020).