Behavior

Um método de avaliação e kit de ferramentas para avaliar o design do teclado em smartphones

Published: October 5, 2020 doi: 10.3791/61796

Yincheng Wang¹, Ke Wang¹, Yuqi Huang¹, Di Wu², Jian Wu³, Jibo He¹

¹Department of Psychology, School of Social Sciences, Tsinghua University, ²Department of Computer Science, Beijing Normal University, ³Haier Innovation Design Center, Haier Company

ERRATUM NOTICE

Important: There has been an erratum issued for this article. Read more …

Summary

O protocolo apresentado integra vários métodos de avaliação e demonstra um método para avaliar o design do teclado em smartphones. Pares combinados com caracteres ingleses são propostos como material de entrada, e o tempo de transição entre duas teclas é usado como variável dependente.

Abstract

A entrada do teclado desempenhou um papel essencial na interação humano-computador com uma vasta base de usuários, e o design do teclado sempre foi um dos objetos fundamentais de estudos sobre dispositivos inteligentes. Com o desenvolvimento da tecnologia de tela, dados e indicadores mais precisos poderiam ser coletados pelos smartphones para avaliar em profundidade o design do teclado. O alargamento da tela do telefone levou a uma experiência de entrada insatisfatória e dor nos dedos, especialmente para uma entrada com uma mão. A eficiência de entrada e o conforto têm atraído a atenção de pesquisadores e designers, e o teclado curvo com botões de tamanho ajustável, que aproximadamente de acordo com a estrutura fisiológica dos polegares, foi proposto para otimizar o uso com uma mão em smartphones de tela grande. No entanto, seus efeitos reais permaneceram ambíguos. Portanto, este protocolo demonstrou um método geral e resumido para avaliar o efeito do design curvo do teclado QWERTY em um smartphone de 5 polegadas através de um software autodesenvolvido com variáveis detalhadas, incluindo dados comportamentais objetivos, feedback subjetivo e os dados de coordenação de cada ponto de toque. Existe literatura suficiente sobre a avaliação de teclados virtuais; no entanto, apenas alguns deles sistematicamente resumiram e fizeram reflexão sobre os métodos e processos de avaliação. Portanto, este protocolo preenche a lacuna e apresenta um processo e método de avaliação sistemática do design do teclado com códigos disponíveis para análise e visualização. Não precisa de equipamentos adicionais ou caros e é fácil de conduzir e operar. Além disso, o protocolo também ajuda a obter possíveis razões para as desvantagens do design e esclarece a otimização dos projetos. Em conclusão, este protocolo com os recursos de código aberto poderia não apenas ser um experimento demonstrativo em sala de aula para inspirar o novato a iniciar seus estudos, mas também contribui para melhorar a experiência do usuário e a receita das empresas de editores de métodos de entrada.

Introduction

A entrada do teclado é o método mainstream da interação homem-smartphone^1,², e com a penetração dos smartphones, a entrada do teclado recebe bilhões de usuários. Em 2019, a taxa global de penetração de smartphones atingiu 41,5%³, enquanto os Estados Unidos, com maior penetração, chegaram a 79,1%⁴. Até o primeiro trimestre de 2020, o teclado móvel Sogou tinha cerca de 480 milhões de usuários ativos diários⁵. Até 6 de maio de 2020, o Google Gboard havia sido baixado mais de 1 bilhão de^{vezes 6}.

A experiência de entrada insatisfatória do teclado aumenta com o alargamento da tela do telefone. Embora a tela ampliada tenha como objetivo melhorar a experiência de visualização, ela mudou a gravidade, o tamanho e o peso dos smartphones, fazendo com que os usuários mudassem a postura detenção repetidamente para alcançar áreas remotas (por exemplo, botão A e Q para usuários destros), levando assim à ineficiência de entrada. O estiramento muscular pode fazer com que os usuários sofram de distúrbios musculoesqueléticos, dores nas mãos e diferentes tipos de doença (por exemplo, síndrome do túnel do carpo, osteoartrite do polegar e tenossinoite do polegar^7,⁸^,^9,¹⁰). Os usuários que preferem o uso com uma mão estão em piores condições¹¹^,¹².

Portanto, a avaliação e otimização do design do teclado tornaram-se temas quentes de pesquisas psicológicas, técnicas e ergonômicas. Designs e conceitos de teclados variáveis têm sido constantemente propostos por empresas e pesquisadores do editor de métodos de entrada (IME) para otimizar a experiência e eficiência de entrada, incluindo teclados de mudança de layout e reordenados de caracteres: Microsoft WordFlow Keyboard^13,Área de Botão Funcional em Glory of Kings¹⁴, IJQWERTY¹⁵e Quasi-QWERTY¹⁶.

Os métodos de avaliação existentes de design de teclado variam de pesquisador para pesquisador, exceto por vários indicadores altamente aceitos, e indicadores mais precisos são propostos. No entanto, com uma variedade de indicadores, não há um protocolo resumido e sistemático fornecido para demonstrar o processo de avaliação e análise do design do teclado. A Lei¹⁷ e sua versão estendida FFitts Law¹⁸, que descrevia a interação homem-computador, foram amplamente adotadas para avaliar o desempenho do teclado^19,^20,^21,²². Além disso, a área funcional do polegar foi proposta para melhorar o design do teclado, e descreveu uma área de movimento curva para que o polegar completasse confortavelmente a tarefa de entrada²³. Com base nessas teorias, indicadores incluindo palavra por minuto, taxa de erro de palavras e feedback subjetivo (usabilidade percebida, desempenho percebido, velocidade percebida, carga de trabalho subjetiva, esforço e dor percebidos, e intenção de uso, etc.), que foram altamente adotados, foram parcialmente utilizados em estudos anteriores²⁴^,^25,²⁶^,^27,^28,²⁹ exceto para métodos de modelagem e simulação. Além disso, a elipse instalada de pontos de toque em cada botão e seu deslocamento³⁰^,³¹ foram utilizados nos últimos anos para investigar o desempenho preciso dos eventos de entrada. Além disso, foram adotadas a resposta galvânica da pele, a frequência cardíaca, a atividade eletromiográfica, o gesto das mãos e o movimento corporal^32,^33,³⁴^,³⁵ para avaliar direta ou indiretamente a fadiga muscular, o conforto e a satisfação dos usuários. No entanto, esses diversos métodos carecem de reflexão sobre a adequação dos indicadores utilizados, e um pesquisador novato pode se confundir ao selecionar os indicadores apropriados para sua pesquisa.

A pesquisa sobre design de teclado também é fácil de ser conduzida, operada e analisada. Com o boom da tecnologia de tela, dados mais comportamentais poderiam ser facilmente coletados para avaliar o design do teclado em profundidade (por exemplo, o tempo de transição entre duas teclas e os dados de coordenadas de cada ponto de toque). Com base nos dados mencionados, os pesquisadores puderam explorar com precisão os detalhes do design do teclado e analisar suas desvantagens e vantagens. Quando comparada com outras pesquisas de interação homem-computador, a pesquisa de design de teclado em smartphones portáteis também tem alto valor de aplicação para sua vasta base de usuários sem equipamentos caros, materiais complicados ou enorme espaço de laboratório necessário. Os questionários, escalas e script Python sobre a pesquisa são de código aberto e de fácil acesso.

O objetivo desta pesquisa é resumir os métodos anteriores para demonstrar um protocolo sistemático, preciso e geral para avaliar e analisar o design do teclado em smartphones. O experimento exemplar e os resultados visam mostrar se o teclado QWERTY curvo com botões ajustáveis de tamanho poderia otimizar a experiência de entrada de uma mão em um smartphone de 5 polegadas quando comparado com o teclado QWERTY tradicional e compartilhar o método de visualização e o script Python de análise de dados.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

O estudo foi conduzido de acordo com o princípio ético e aprovado pelo Comitê de Ética da Universidade de Tsinghua. A Figura 1 mostra o processo de avaliação do design do teclado dos smartphones.

Figura 1: Processo geral de condução de um experimento de teclado e avaliação do design do teclado. Clique aqui para ver uma versão maior desta figura.

1. Preparação

Design de experimento
1. Defina a questão da pesquisa e proponha a hipótese.
2. Projete o experimento de acordo com a hipótese e defina as variáveis independentes (por exemplo, layout do teclado, postura de digitação). Use o desenho dentro do assunto para reduzir os fatores de confusão e a variância causada pela diferença entre os participantes.
Variáveis dependentes
1. Use dados físicos, incluindo o comprimento da mão, o comprimento do dedo de entrada e a circunferência do dedo de entrada, que foram medidos por uma fita métrica, como mostrado na Figura 2.
2. Use dados fisiológicos, incluindo resposta à pele galvânica (medida pelo detector fisiológico sem fio portátil), frequência cardíaca (medida pelo detector fisiológico sem fio portátil), atividade eletromiográfica (medida por eletromyografia superficial), etc.
3. Use o desempenho de entrada: palavra por minuto, taxa de erro de palavra e tempo de transição entre duas teclas.
  1. Palavra por minuto refere-se à velocidade de entrada dos participantes (ou seja, o número de palavras digitadas corretamente por minuto).
  2. A taxa de erro da palavra refere-se à precisão de entrada dos participantes (ou seja, o número de palavras incorretas divididas pelo número total de palavras sob uma condição). A taxa de erro corrigida, a taxa de erro não corrigida e a taxa de erro total também foram utilizadas em estudos anteriores³⁶.
  3. O tempo de transição entre duas teclas refere-se ao tempo de reação dos participantes entre dois pontos de contato de uma palavra²² de entrada correta (ou seja, o tempo de início do segundo ponto de toque menos o tempo de partida do primeiro caractere).
4. Use dados de movimento corporal, como gesto da mão e movimento do corpo (dedo). Eles poderiam ser coletados pelo sistema de captura de movimento³⁵.
5. Use dados subjetivos como usabilidade percebida, intenção de uso, precisão e velocidade percebidas, esforço e dor percebidos, e carga de trabalho subjetiva, etc. Os dados subjetivos podem ser obtidos através de escalas e questionários existentes, que são altamente confiáveis e válidos para avaliar melhor o feedback subjetivo dos participantes sobre o design do teclado.
  1. Use a NASA-TLX, uma escala de 21 pontos que é usada para medir a carga de trabalho subjetiva através de dimensões mentais, físicas, tempo, desempenho, esforço e frustração. Uma pontuação alta indica uma alta carga de trabalho subjetiva²⁶.
  2. Use a Escala de Usabilidade do Sistema, um questionário de 5 pontos com 10 itens, e as respostas de um participante serão calculadas como uma pontuação única de 0 a 100. Uma pontuação alta indica uma alta usabilidade percebida²⁴.
  3. Use a Escala Borg CR10, que varia de 0 a 10 para medir a dor e o esforço percebidos. Uma pontuação alta indica dor e esforço percebidos de alto nível²⁵.
  4. Use a Escala de Intenção de Uso: um questionário de 10 pontos que é usado para medir a probabilidade de os participantes usarem a tecnologia ou produtos. Uma pontuação alta indica uma probabilidade de alto nível²⁸.
  5. A velocidade percebida e a precisão percebida são todas medidas por escalas de 50 pontos, e uma pontuação alta indica um bom desempenho percebido²⁸.
6. Colete os dados de coordenadas de cada ponto de contato e altere-os na elipse equipada (IC95%) de pontos de toque em cada botão³⁰^,³¹. Adote a área de cada elipse encaixada e o deslocamento do centro da elipse instalada para o centro de destino de cada botão como variáveis dependentes.
  NOTA: Os dados da coordenada podem ser coletados precisamente pelo aplicativo auto-desenvolvido no smartphone. Se for difícil obter os dados da coordenada, dados objetivos e subjetivos são suficientes para avaliar aproximadamente o design do teclado.

Figura 2: A medição da mão. Clique aqui para ver uma versão maior desta figura.

Materiais
1. Escolha o smartphone experimento. Leve em consideração o peso, a resolução e o tamanho da tela.
2. Projete e desenvolva o software de experimento em smartphones (etapa opcional).
  NOTA: O tempo de transição entre duas teclas pode ser registrado automaticamente por este software ou sensores de captura de movimento (ou seja, o sensor de acelerômetro). Pode ser difícil recolhê-lo manualmente (por exemplo, um relógio ou cronômetro).
3. Selecione a tarefa de entrada a partir das seguintes sugestões com base na hipótese e revise-a para corresponder ao propósito da pesquisa.
  1. Para a tarefa de entrada do par de caracteres, emparelhe aleatoriamente 26 letras em inglês em 676 pares e divida-as em vários grupos com base no design do experimento.
  2. Para a tarefa de entrada da frase (frase), use frases de comprimento moderadas, fáceis de lembrar e representativas da linguagem alvo. Se a língua-alvo for inglês, extraia frases ou palavras de 15 a 20 (ou com base no propósito da pesquisa) de 500 frases definidas³⁷.
Recrutamento de participantes
1. Use o software G*Power para calcular o tamanho da amostra.
2. Postar questionários para recrutar potenciais participantes.
3. Filtrar potenciais participantes com características desejadas, por exemplo, idade, saúde, visão, destreza e experiência de entrada. Certifique-se de que a experiência de entrada dos participantes seja equilibrada.

2. Procedimento

Leia o formulário de consentimento informado do experimento aos participantes, incluindo o procedimento de experimento, tarefa e se eles encontrarão alguma lesão mental ou física. Se os participantes concordarem em participar, eles precisam assinar o termo de consentimento livre e esclarecido. Se não, eles podem retirar-se imediatamente. De acordo com o termo de consentimento livre e esclarecido, os participantes também podem retirar-se em qualquer fase do experimento.
Coletar dados físicos e demográficos. Use uma fita métrica para medir a mão de cada participante (Figura 2) a fim de eliminar o efeito da diferença de tamanho da mão e também fornecer dados repetitivos para pesquisas futuras. Coletar dados demográficos como idade, sexo, experiência precisa de entrada e ocupação.
Desinfete todos os dispositivos e limpe as partes do corpo do participante que tocarão nos dispositivos.
1. Peça aos participantes que lavem as mãos e limpem a tela dos smartphones para que os sensores dos smartphones possam ser mais sensíveis.
2. Peça aos participantes que usem detectores fisiológicos sem fio portáteis ou um sistema de captura de movimento. Peça aos participantes que usem a pulseira de detecção fisiológica sem fio portátil na mão não dominante para registrar a resposta galvânica da pele e a frequência cardíaca com a interferência de ruído evitada.
  1. Coloque marcadores passivos do sistema de captura de movimento nas unhas, na falange proximal do dedo, das vértebras cervicais (C3-C5) e do braço, para coletar o movimento preciso do corpo e dos dedos. Coloque eletrodos sem fio na pele de dois braços e dois antebraços para detectar a atividade eletromiográfica (passo opcional).
3. Calibrar todos os dispositivos usados no experimento.
Parte prática
1. Deixe os participantes completarem a tarefa de treinamento. A tarefa de treinamento é usada para melhorar a familiaridade dos participantes com tarefas de entrada e teclados para reduzir o efeito da prática ou a falta de familiaridade no resultado do experimento. É composto por 50 pares ou 20 palavras selecionadas aleatoriamente entre o conjunto de 676 pares ingleses ou 500 frases definidas. Somente quando sua precisão de entrada atinge 80% ou mais em 150 segundos é que eles podem entrar nos testes formais. A pesquisa exemplar adotou a entrada de 50 pares como tarefa de treinamento.
Tarefa principal
1. Deixe que os participantes completem os ensaios formais em todas as condições experimentais. Eles precisam garantir sua precisão o mais rápido possível durante o tempo da tarefa de entrada. Ensaios formais são tarefas reais de entrada que serão avaliadas e analisadas na pesquisa. Cada par, palavra ou frase representa um julgamento, e diferentes desenhos experimentais produzem diferentes condições experimentais.
2. Que os participantes completem a tarefa de entrada em ordem aleatória ou uma ordem equilibrada. Os métodos da divisão dos materiais de entrada são os seguintes. Primeiro, 676 pares podem ser divididos aleatoriamente em cada condição experimental (ou seja, os participantes entraram em todos os pares quando completam todas as condições experimentais). Em segundo lugar, em cada condição experimental, 676 pares podem ser divididos em vários blocos aleatoriamente, e os participantes precisam completar esses blocos aleatoriamente. Em terceiro lugar, para inserir palavras, os participantes precisam concluir cerca de 20 ensaios sob cada condição. Em quarto lugar, para inserir sentenças, os participantes precisam concluir cerca de 10 a 15 ensaios em cada condição. Os pesquisadores não devem garantir nenhuma diferença significativa entre o número de caracteres e o número de palavras inseridas pelo participante em cada condição. A pesquisa exemplar adotou o primeiro método e teve quatro condições experimentais.
3. Após cada condição, peça aos participantes que completem todos os questionários (escalas avaliando sua experiência subjetiva) aleatoriamente e lhes dê 1 min ou mais para descansar.
Ao final do experimento, deixe cada participante terminar o questionário abrangente (Q & A) para obter feedback subjetivo.
Expressa apreço aos participantes com recompensas monetárias ou materiais.

3. Análise de dados

Teste de hipóteses por testes paramétricos ou não paramétricos apropriados
1. Analisar os dados físicos, fisiológicos e de movimentação corporal para testar se a diferença entre os participantes influenciaria significativamente os resultados e a experiência de entrada inexpressiva dos usuários (etapa opcional).
2. Analise o desempenho de entrada dos participantes para testar a eficiência de entrada no teclado.
3. Analise dados subjetivos para testar a usabilidade percebida e o feedback subjetivo do teclado.
4. Descubra se o efeito da prática e o efeito da fadiga influenciam significativamente o resultado. Para cada condição, os ensaios são divididos em duas partes de acordo com o timetamp (ou seja, a primeira metade e a segunda metade). Especificamente, em cada condição, examine a diferença de desempenho da entrada entre a primeira metade e a segunda parte para testar se existem efeitos de prática ou efeito de fadiga.
5. Analise a área da elipse instalada de pontos de toque em cada botão, bem como o deslocamento do centro para o centro de destino de cada botão (etapa opcional).
  1. Colete todos os pontos de contato de cada botão com o software, e eles estão aproximadamente de acordo com a distribuição gaussiana bivariada. O intervalo de confiança de 95% de cada botão em ambas as direções x e y é derivado através dos dados de coordenadas de cada ponto de toque em pixel, e as elipses de confiança de 95% sobre um contorno de 1:1 do botão para cada teclado são montados através de scripts Python na coordenada do pixel (ver Arquivo de Codificação 2).
  2. Use elipses instaladas (IC 95%) e suas áreas para demonstrar a dispersão de pontos de toque em cada botão. Em cada botão, o deslocamento da elipse encaixada calculada pelos scripts Python é definido como o ponto central da elipse instalada até o ponto alvo do botão, e pode ser representado a partir de classes x e y (ou seja, no eixo X e no eixo Y, ver Arquivo de Codificação 3).
Modelagem e simulação
1. Use o modelo baseado em dados em função da localização e orientação do teclado para prever o movimento do dedo pelos scripts Python. Todos os movimentos dos dedos são divididos em oito direções³⁸ (a parte superior para a parte inferior, a inferior para a superior, a esquerda para a direita, a direita para a esquerda, a superior esquerda para a direita-inferior, a direita-inferior para a superior esquerda, a inferior esquerda para a superior direita, a direita-superior para a inferior esquerda). Para cada direção, o tempo médio de transição entre duas teclas é calculado para representar a eficácia do movimento do dedo, que é usado para avaliar o design do teclado (etapa opcional).
2. Use a análise de regressão linear para construir um modelo aprimorado da Lei de Fitts (ou sua versão estendida, FFitts's Law) para prever o tempo de transição entre duas teclas usando uma arquitetura cognitiva integrada³⁹ por scripts Python. O modelo aprimorado da Lei dos Fitts poderia fornecer uma melhor previsão e avaliação sobre o design do teclado com base em suas análises sobre a localização e largura efetiva das teclas, bem como a distância de duas teclas (etapa opcional).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

O estudo representativo segue principalmente o protocolo mencionado. O estudo adota um 2 (Layout do teclado: Curved QWERTY vs. QWERTY tradicional) × 2 (Tamanho do botão: grande, 6,3 mm × 9 mm vs. pequeno, 4,9 mm × 7 mm) design dentro do assunto para avaliar se o QWERTY curvo poderia melhorar a eficiência de entrada e o conforto quando comparado com o QWERTY tradicional em diferentes tamanhos de botões pela tarefa de entrada do par de caracteres através do nosso software auto-desenvolvido (Figura 3 ). Este estudo não adotou o caro equipamento de detector fisiológico ou sistema de captura de movimento, e a análise dos dados não continha a modelagem ou simulação.

Figura 3: A interface do teclado QWERTY tradicional e o software de teclado QWERTY curvo.
(A) Teclado QWERTY tradicional com grande tamanho de botão (tamanho da tecla de letra: 6,3 mm × 9 mm). (B) Teclado QWERTY curvo com grande tamanho de botão (tamanho da tecla de letra: 6,3 mm × 9 mm). (C) Teclado QWERTY tradicional com pequeno tamanho de botão (tamanho da tecla de letra: 4,9 mm × 7 mm). (D) Teclado QWERTY curvo com pequeno tamanho de botão (tamanho da tecla de letra: 4,9 mm × 7 mm). A proporção de cada tecla de letra é 7:10, e a largura de cada tecla funcional (Delete, Space, Enter) é duas vezes maior que a da tecla de letra. Delete e Space não são trabalhadas. Os participantes clicam na tecla Enter para mudar para o próximo teste. Clique aqui para ver uma versão maior desta figura.

Participaram do estudo 24 estudantes saudáveis destros da Universidade de Tsinghua (12 mulheres, M = 22,46 anos, SD = 3,04 anos). Para eles, foram medidos o comprimento da mão direita (M = 17,98 cm SD = 1,20 cm), o comprimento do polegar direito (M = 6,00 cm, SD = 0,68 cm) e a circunferência do polegar direito (M = 5,14 cm, SD = 0,52 cm). O tamanho da amostra foi calculado por G*Power 3.1.9.2 (tamanho de efeito f = 0,25, α = 0,05, potência = 0,80, correlação entre as medidas repetidas = 0,5). O smartphone experimento é um smartphone de 5 polegadas (peso 138 g, tamanho de tela de 5,0 polegadas, ppi 294, px 1280 × 720, tamanho do telefone 143,5 × 69,9 × 7,6 mm).

O desempenho de entrada (tempo de transição entre duas teclas, taxa de erro de palavra), feedback subjetivo e elipse instalada de cada botão foram coletados e analisados por ANOVA de medidas repetidas. O tempo de transição entre duas teclas em vez de palavra por minuto é usado neste estudo porque o material de entrada são os pares de caracteres, e o tempo de transição entre duas teclas poderia avaliar o evento de toque de transição com mais precisão. Os resultados representativos são os seguintes(Tabela 1).

		Layout do teclado			Tamanho do botão			Layout do teclado × tamanho do botão
		F	p		F	p		F	p
Taxa de erro de palavra		48.90	<.001**	0.68	30.57	<.001**	0.57	2.63	0.12	0.10
Tempo de transição entre duas chaves		10.19	.004**	0.31	43.57	<.001**	0.66	12.75	.002**	0.36
Esforço e dor percebidos		2.33	0.14	0.09	1.36	0.26	0.06	0.28	0.60	0.01
Intenção de usar		7.41	.012*	0.24	3.62	0.07	0.14	0.63	0.44	0.03
Precisão percebida		1.32	0.26	0.54	2.94	0.10	0.11	0.69	0.42	0.03
Velocidade percebida		0.56	0.47	0.02	0.98	0.33	0.04	0.25	0.62	0.01
Usabilidade percebida		0.63	0.44	0.03	5.48	.028*	0.19	0.03	0.87	0.001
Carga de trabalho subjetiva	Mental	19.30	<.001**	0.46	8.88	.007**	0.28	0.01	0.91	0.001
	Físico	2.41	0.13	0.10	5.55	.027*	0.19	0.07	0.78	0.003
	Hora	0.02	0.9	0.001	10.26	.004**	0.31	0.37	0.55	0.02
	Desempenho	11.51	.003**	0.33	12.25	.002**	0.35	0.02	0.90	0.001
	Esforço	4.66	.042*	0.17	16.33	.001**	0.42	0.13	0.72	0.006
	Frustração	9.32	.006**	0.29	8.87	.007**	0.28	2.11	0.16	0.08
Área de elipse equipada		90.00	<.001**	0.78	1368.78	<.001**	0.98	31.99	<.001**	0.56
Compensação da elipse equipada	Sentido X	10.94	.003**	0.30	1.4	0.25	0.05	6.08	0.21	0.19
Compensação da elipse equipada	Y-direção	23.49	<.001**	0.48	0.48	0.50	0.02	13.74	.001**	0.36

Tabela 1: Análise estatística do desempenho da entrada, feedback subjetivo e elipse instalada de cada botão. Item com * significa p < 0,05, item com ** significa p < 0,01, e item com *** significa p < 0,001.

No desempenho de entrada, a interação entre o layout do teclado e o tamanho do botão é apenas significativa no tempo de transição entre duas teclas(Figura 4), e mostra que no QWERTY curvo, o tempo de transição entre duas teclas de tamanho de botão pequeno foi significativamente maior do que o de tamanho de um botão grande(p < 0,001). O principal efeito do layout do teclado é significativo tanto na taxa de erro de palavra (Figura 5) quanto no tempo de transição entre duas teclas, e indica que estas das QWERTY tradicionais são significativamente inferiores às do QWERTY curvo. O principal efeito do tamanho do botão é significativo tanto na taxa de erro da palavra quanto no tempo de transição entre duas teclas, e indica que estes do tamanho do botão grande são significativamente menores do que os do tamanho do botão pequeno. Nenhum outro resultado significativo é encontrado.

Figura 4: O gráfico da barra 3D é a visualização do tempo de transição entre duas teclas (a esquerda é o primeiro caractere, enquanto a direita é o segundo caractere) em quatro teclados.
A altura de cada barra representa o valor do tempo de transição. As cores gradientes (azul, verde, amarelo e vermelho) são usadas para mostrar a situação da distribuição numérica (ver Arquivo de Codificação Suplementar 1). Clique aqui para ver uma versão maior desta figura.

Figura 5: A taxa de erro da palavra de cada teclado. As barras de erro representam 95% de IC. Clique aqui para ver uma versão maior desta figura.

No feedback subjetivo(Figura 6 e Figura 7), todas as interações entre o layout do teclado e o tamanho do botão não são significativas. O principal efeito do layout do teclado é significativo na intenção de usar e carga de trabalho subjetiva (mental, desempenho, esforço e frustração), e mostra que os participantes percebem carga de trabalho menos subjetiva (as quatro facetas acima) e têm mais probabilidade de usar o QWERTY curvo quando comparado com o QWERTY tradicional. O principal efeito do tamanho do botão é significativo na usabilidade percebida e em todas as facetas da carga de trabalho subjetiva, e indica que os participantes percebem menos carga de trabalho subjetiva e maior usabilidade no tamanho do botão grande quando comparados com o pequeno tamanho do botão. Nenhum outro resultado significativo é encontrado.

Figura 6: O esforço e a dor percebidos, a intenção de usar (eixo Y esquerdo), a precisão percebida, a usabilidade percebida e percebida (eixo Y direito) de cada teclado.
O alto escore de esforço e dor percebidos indica a experiência insatisfatória, enquanto os outros indicadores mostram o contrário. As barras de erro representam 95% de IC. Clique aqui para ver uma versão maior desta figura.

Figura 7: As seis dimensões da carga de trabalho subjetiva.
As barras de erro representam 95% de IC. Clique aqui para ver uma versão maior desta figura.

Na área da elipse equipada(Figura 8),a interação entre o layout do teclado e o tamanho do botão é significativa, e mostra que, tanto para o tamanho do botão pequeno quanto para o grande, a área do QWERTY tradicional é maior que a do QWERTY curvo(p < 0,001), enquanto para ambos os layouts do teclado, a área do botão pequeno é menor que a do botão grande(p < 0,001). O principal efeito do tamanho do botão e do layout do teclado é significativo, e indica que as áreas do QWERTY tradicional e do botão grande são maiores do que as do QWERTY curvo e do botão pequeno, respectivamente. Nenhum outro resultado significativo é encontrado.

Figura 8: As elipses equipadas (95% IC) de quatro teclados.
Eles são desenhados ajustando as posições de pixel dos pontos de toque em quatro teclados. A coordenada do centro da elipse é o valor médio de todos os pontos de toque em cada botão (ver Arquivo de Codificação Suplementar 2). Clique aqui para ver uma versão maior desta figura.

Na compensação da elipse equipada (Figura 9 e Figura 10),a interação entre o layout do teclado e o tamanho do botão é apenas significativa na compensação na direção y, e mostra que na curva QWERTY, o deslocamento na direção y do botão pequeno é significativamente menor do que o do botão grande(p < 0,001), enquanto em ambos os tamanhos do botão, o deslocamento na direção y do QWERTY curvo é significativamente mais curto do que o do QWERTY tradicional. O principal efeito do layout do teclado é significativo em ambas as direções x e y, e indica que o deslocamento na direção y do QWERTY curvo é significativamente menor do que o do QWERTY tradicional. Nenhum outro resultado significativo é encontrado.

Figura 9: O deslocamento das elipses instaladas na direção x.
O comprimento da seta, que é ampliada 1,2 vezes em proporção na figura por causa da visualização, representa o valor da compensação. E cores diferentes visualizam o valor do desvio padrão (±) desde o deslocamento médio de cada botão até o deslocamento na direção x. O valor inferior a -1σ é verde, e o valor mais de +1σ é vermelho, enquanto o valor entre -1σ e +1σ é laranja (ver Arquivo de Codificação Suplementar 3). Clique aqui para ver uma versão maior desta figura.

Figura 10: O deslocamento das elipses instaladas na direção y.
O comprimento da seta, que é ampliada 1,2 vezes em proporção na figura por causa da visualização, representa o valor da compensação. E cores diferentes visualizam o valor do desvio padrão (±) desde o deslocamento médio de cada botão até o deslocamento na direção y. O valor inferior a -1σ é verde, e o valor mais de +1σ é vermelho, enquanto o valor entre -1σ e +1σ é laranja (ver Arquivo de Codificação 3, e o script da direção y é familiar ao da direção x). Clique aqui para ver uma versão maior desta figura.

O efeito de prática é testado usando o teste tpara comparar o desempenho de entrada (taxa de erro de palavra e tempo de transição entre duas teclas) entre a primeira metade e a segunda metade dos pares de caracteres. Quanto à taxa de erro, não há diferença significativa entre os dois grupos de pares de caracteres no QWERTY curvo com tamanho de botão pequeno, t₍₄₆₎ = 2,03, p = 0,05, o QWERTY curvo com tamanho de botão grande, t₍₄₆₎ = -0,47, p = 0,64, o QWERTY tradicional com tamanho de botão grande, t₍₄₆₎ = 0,31, p = 0,76, e o QWERTY tradicional com pequeno tamanho de botão, t₍₄₆₎ = 0,05, p = 0,97. Quanto ao tempo de transição entre duas teclas, não há diferença significativa entre os dois grupos de pares de caracteres no QWERTY curvo com tamanho de botão grande, t₍₄₆₎ = 0,33, p = 0,74, o QWERTY curvo com tamanho de botão pequeno, t₍₄₆₎ = 0,22, p = 0,83, o QWERTY tradicional com tamanho de botão grande t₍₄₆₎ = 0,66, p = 0,51, e o QWERTY tradicional com pequeno tamanho de botão, t₍₄₆₎ = 0,09, p = 0,93. Os resultados indicam que não há efeito de prática ou efeito de fadiga durante o processo principal da tarefa de entrada, e os participantes alcançaram e mantiveram o maior esforço para cada teclado. O valor absoluto do maior esforço para diferentes teclados pode ser diferente porque o maior esforço só indica que eles estão familiarizados com o teclado em 100%.

Este estudo representativo indica que no smartphone de 5 polegadas, o QWERTY curvo é pior do que o QWERTY tradicional, e o tamanho do botão grande é melhor do que o tamanho do botão pequeno. Neste estudo representativo, o melhor teclado é o teclado QWERTY tradicional com grande tamanho de botão, enquanto o pior teclado é o teclado QWERTY curvo com tamanho de botão pequeno. Todos os resultados não foram afetados pelo efeito da prática e pelo efeito da fadiga. A taxa de erro da palavra e o tempo de transição entre duas teclas indicam que o design QWERTY curvo aumenta o tempo de reação dos participantes entre dois caracteres e pode aumentar a carga de trabalho de reconhecimento para caracteres devido à posição das teclas e rotação mental, levando assim a um desempenho de entrada insatisfatório, e os resultados são os mesmos que o tamanho do botão reduzido de tamanho (teclado QWERTY com pequeno tamanho de botão) em um smartphone de 5 polegadas. Embora a maioria dos indicadores e dimensões do feedback subjetivo não sejam significativos, a carga de trabalho subjetiva mostra a maior carga de trabalho percebida do teclado QWERTY com o botão reduzido de tamanho e o teclado QWERTY curvo. No entanto, a partir da análise das elipses instaladas, os resultados, e a Figura 8 e a Figura 10 mostram que o QWERTY curvo tem menos deslocamento e seus pontos de contato são menos dispersivos, e seu deslocamento é principalmente para o canto superior esquerdo para uso destro. Os resultados indicam que o design QWERTY curvo poderia ser otimizado ajustando a curvatura do teclado, adicionando a função de correção automática e moderando o tamanho dos botões. Além disso, da Figura 8 e Figura 10,um teclado T9 curvo, que toma o lugar de "R, T, Y, U, I, O, D, F, G, H, J, K, X, C, V, B, N e M" do teclado QWERTY curvo, pode ser um teclado potencial otimizado, ou seja, cada tecla do teclado T9 curvo toma o lugar de duas teclas de letras do teclado curvado QWERTY.

Portanto, este estudo representativo apenas demonstra aproximadamente o protocolo da avaliação do design do teclado com scripts Python de código aberto, e o método de análise e otimização poderia ser discutido em profundidade com base no propósito de pesquisa dos pesquisadores nos estudos futuros.

Arquivo de codificação suplementar 1: parcelas 3D do tempo de transição entre duas teclas. Clique aqui para baixar este arquivo.

Arquivo de codificação suplementar 2: A elipse instalada e sua área. Clique aqui para baixar este arquivo.

Arquivo de codificação suplementar 3: O deslocamento da elipse instalada. Clique aqui para baixar este arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Neste estudo, baseado no desenvolvimento da tecnologia de tela, apresentamos um protocolo resumido e geral de avaliação de design de teclado para avaliar o design do teclado de forma sistemática e precisa. Os indicadores e métodos existentes de estudos anteriores, pares combinados com caracteres ingleses e tempo de transição entre duas teclas são integrados e modificados para gerar um protocolo eficaz.

Vários pontos críticos precisam ser notados neste protocolo. A seleção de variáveis e indicadores é essencial porque eles decidem a perspectiva da análise, e poderiam ser usados para construir o modelo de avaliação no estágio posterior do experimento de avaliação de design de teclado. Com exceção das variáveis objetivas, as variáveis subjetivas também devem ser cuidadosamente consideradas no desenho experimental a partir de múltiplas dimensões, uma vez que os dados subjetivos desempenham um papel vital para nos ajudar a melhorar a experiência do usuário. Os dados de coordenadas podem ser coletados e calculados opcionalmente no protocolo através do aplicativo auto-desenvolvido e scripts Python, por exemplo, elipse equipada (IC 95%) de pontos de toque em cada botão e o deslocamento do centro da elipse instalada para o centro de destino de cada botão. A análise e visualização da elipse equipada pode iluminar o método de otimização do design do teclado. Além disso, embora a medição fisiológica e a medição do movimento, que dependem do equipamento vestível, também sejam opcionais, eles poderiam realmente ajudar a explorar a experiência inexprimível dos usuários de teclado em profundidade.

Um passo crucial no procedimento do estudo do teclado é pedir aos participantes que lavem as mãos e limpem a tela antes do experimento (o mesmo que os detectores vestíveis), uma vez que a graxa da mão e o suor podem afetar a sensibilidade da tela sensorial, influenciando assim os resultados. Os dados físicos (comprimento da mão, comprimento dos dedos e circunferência do polegar) dos participantes também precisam ser medidos ou relatados, pois as diferenças físicas entre os participantes podem afetar os resultados do experimento e a reprodutibilidade também.

O protocolo também não pode escapar das seguintes limitações. Todos os materiais de entrada propostos neste estudo podem concentrar-se principalmente na língua do inglês sem a consideração de outros idiomas. Além disso, o auto-desenvolvimento de um software de teclado para coletar os dados do experimento pode ser sugerido neste protocolo, em vez de usar o método tradicional de coleta e medição manual. Como um software auto-desenvolvido poderia coletar e calcular indicadores mais precisos e atribuitivos e ajudar a fornecer uma sugestão clara de otimização sobre o design do teclado, em vez de apenas concluir o efeito do design atual do teclado em condições experimentais. Além disso, outros dispositivos ou equipamentos caros adotados por estudos anteriores não foram incluídos nos resultados representativos, como o detector fisiológico sem fio portátil ou sistema de captura de movimento, e os pesquisadores devem escolher seus dispositivos experimentais específicos com base em seu problema de pesquisa e hipótese. Finalmente, os seguidores das Novas Estatísticas ou entusiastas bayesianos poderiam tentar adotar mais métodos estatísticos para analisar e avaliar o design do teclado.

Para aplicações e direções futuras, este protocolo pode ser adotado no processo de avaliação de design de teclado em outros dispositivos inteligentes. Além dos smartphones, cada vez mais dispositivos inteligentes ganharam popularidade, por exemplo, smartwatches e pulseiras vestíveis (iWatch), tablet PC (iPad) e dispositivos de realidade virtual (óculos VR). Este protocolo pode ser usado para avaliar vários designs de teclado nesses dispositivos e ajuda a otimizações (indicadores e processos podem ser ligeiramente ajustados). Nesse sentido, este estudo abre novas oportunidades para reexaminar os benefícios e a importância do estudo de avaliação de design de teclado na tela sensível ao toque de dispositivos inteligentes. Portanto, fornece um método de pesquisa barato e fácil de conduzir com os recursos de código aberto no campo da interação homem-computador, ciência da computação e psicologia, fazendo contribuições para ajudar os pesquisadores e estudantes iniciantes a iniciar seus estudos ou ser um experimento demonstrativo em sala de aula.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores declararam não divulgação financeira ou conflitos de interesse.

Acknowledgments

Esta pesquisa é apoiada pelo Tsinghua University Initiative Scientific Research Program (design ergonômico de teclado curvo em dispositivos inteligentes). Os autores apreciam Tianyu Liu por suas sugestões gentis e assistência de codificação em números.

Materials

Name	Company	Catalog Number	Comments
Changxiang 6S smartphone	Huawei		Smartphone used in the examplar study
Curved QWERTY keyboard software	Tsinghua University		Developed by authors
SPSS software	IBM		Data analysis software
G*Power software	Heinrich-Heine-Universität Düsseldorf		Sample size calculation
E4 portable wireless wristband	Empatica		Recording galvanic skin response and heart rate
Arqus	Qualysis		Motion capture camera platform
Passive marker	Qualysis		Appropriate sizes: 2.5 mm, 4 mm, and 6.5 mm
Trigno sEMG	Delsys		Recording electromyographic activity
Visual Studio Code	Microsoft		Python editor

DOWNLOAD MATERIALS LIST

References

Lee, S., Zhai, S. The performance of touch screen soft buttons. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. , USA. (2009).
Smith, B. A., Bi, X., Zhai, S. Optimizing touchscreen keyboards for gesture typing. Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems. , USA. (2015).
Statista. Global smartphone penetration rate as share of population from 2016 to 2020 [Fact sheet]. , Available from: https://www.statista.com/statistics/203734/global-smartphone-penetration-per-capita-since-2005 (2020).
Newzoo. Top Countries by Smartphone Users [Fact sheet]. Newzoo. , Available from: https://newzoo.com/insights/rankings/top-countries-by-smartphone-penetration-and-users (2019).
Sogou. Sogou Announces Fourth Quarter and Full Year 2019 Results. Sogou. , Available from: http://ir.sogou.com/2020-03-09-Sogou-Announces-Fourth-Quarter- and-Full-Y ear-2019-Results (2020).
Google Play. Gboard - the Google Keyboard [Press release]. Google Play. , Available from: https://play.google.com/store/apps/details?id=com.google.android.inputmethod.latin &hl=en (2020).
Eitivipart, A. C., Viriyarojanakul, S., Redhead, L. Musculoskeletal disorder and pain associated with smartphone use: A systematic review of biomechanical evidence. Hong Kong Physiotherapy Journal. 38 (2), 77-90 (2018).
Chang, J., Choi, B., Tjolleng, A., Jung, K. Effects of button position on a soft keyboard: Muscle activity, touch time, and discomfort in two-thumb text entry. Applied Ergonomics. 60, 282-292 (2017).
Gehrmann, S. V., et al. Motion deficit of the thumb in CMC joint arthritis. Journal of Hand Surgery. 35 (9), 1449-1453 (2010).
Kim, G., Ahn, C. S., Jeon, H. W., Lee, C. R. Effects of the Use of Smartphones on Pain and Muscle Fatigue in the Upper Extremity. Journal of Physical Therapy Science. 24 (12), 1255-1258 (2012).
Girouard, A., et al. One-handed bend interactions with deformable smartphones. Proceedings of the 33rd annual ACM conference on human factors in computing systems. , USA. (2015).
Lee, M., Hong, Y., Lee, S., Won, J., Yang, J., Park, S. The effects of smartphone use on upper extremity muscle activity and pain threshold. Journal of Physical Therapy Science. 27 (6), 1743-1745 (2015).
Microsoft Garage. Word Flow keyboard [Press release]. Microsoft Garage. , Available from: https://www.microsoft.com/en-us/garage/profiles/word-flow-keyboard/ (2020).
Tencent Games. The glory of kings [Press release]. Tencent Games. , Available from: https://pvp.qq.com/ (2020).
Bi, X., Zhai, S. Ijqwerty: what difference does one key change make? Gesture typing keyboard optimization bounded by one key position change from qwerty. Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems. , USA. (2016).
Bi, X., Smith, B. A., Zhai, S. Quasi-qwerty soft keyboard optimization. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. , USA. (2010).
Fitts, P. The information capacity of the human motor system is controlled by the amplitude of movement. Journal of Experimental Psychology. 47, 381-391 (1954).
Bi, X., Li, Y., Zhai, S. FFitts law: modeling finger touch with fitts' law. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. , USA. (2013).
Dunlop, M., Levine, J. Multidimensional pareto optimization of touchscreen keyboards for speed, familiarity and improved spell checking. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. , USA. (2012).
Li, Y., Chen, L., Goonetilleke, R. S. A heuristic-based approach to optimize keyboard design for single-finger keying applications. International Journal of Industrial Ergonomics. 36 (8), 695-704 (2006).
Benligiray, B., Topal, C., Akinlar, C. SliceType: fast gaze typing with a merging keyboard. Journal on Multimodal User Interfaces. 13 (4), 321-334 (2019).
Wang, Y., Ai, H., Liang, Q., Chang, W., He, J. How to optimize the input efficiency of keyboard buttons in large smartphone? A comparison of curved keyboard and keyboard area size [Conference presentation]. International Conference on Human-Computer Interaction. , Berlin, Germany. (2019).
Bergstrom-Lehtovirta, J., Oulasvirta, A. Modeling the functional area of the thumb on mobile touchscreen surfaces. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. , Canada. (2014).
Brooke, J. SUS: A retrospective. Journal of Usability Studies. 8 (2), 29-40 (2013).
Borg, G. Principles in scaling pain and the Borg CR Scales. Psychologica. 37, 35-47 (2004).
Hart, S. G., Staveland, L. E. Development of NASA-TLX (task load index): results of empirical and theoretical research. Human mental workload. Hancock, P. A., Meshkati, N. , Oxford. 139-183 (1988).
Trudeau, M. B., Asakawa, D. S., Jindrich, D. L., Dennerlein, J. T. Two-handed grip on a mobile phone affords greater thumb motor performance, decreased variability, and a more extended thumb posture than a one-handed grip. Applied Ergonomics. 52, 24-28 (2016).
Turner, C. J., Chaparro, B. S., He, J. Text input on a smartwatch qwerty keyboard: tap vs. trace. International Journal of Human Computer Interaction. 33 (1-3), 143-150 (2017).
Zhai, S., Kristensson, P. O. The word-gesture keyboard: reimagining keyboard interaction. Communications of the ACM. 55 (9), 91-101 (2012).
Azenkot, S., Zhai, S. Touch behavior with different postures on soft smartphone keyboards. Proceedings of the 14th international conference on Human-computer interaction with mobile devices and services. , New York, USA. (2012).
Yi, X., Yu, C., Shi, W., Shi, Y. Is it too small?: Investigating the performances and preferences of users when typing on tiny qwerty keyboards. International Journal of Human Computer Studies. 106, 44-62 (2017).
Li, Y., You, F., Ji, M., You, X. Smartphone text input: effects of experience and phrase complexity on user performance, physiological reaction, and perceived usability. Applied Ergonomics. 80, 200-208 (2019).
Gerard, M. J., Jones, S. K., Smith, L. A., Thomas, R. E., Wang, T. An ergonomic evaluation of the Kinesis ergonomic computer keyboard. Ergonomics. 37 (10), 1661-1668 (1994).
Van Galen, G. P., Liesker, H., Haan, A. Effects of a vertical keyboard design on typing performance, user comfort and muscle tension. Applied Ergonomics. 38 (1), 99-107 (2007).
Baker, N. A., Cham, R., Cidboy, E. H., Cook, J., Redfern, M. S. Kinematics of the fingers and hands during computer keyboard use. Clinical Biomechanics. 22 (1), 34-43 (2007).
Soukoref, R. W., MacKenzie, I. S. Metrics for text input research: an evaluation of MSD and KSPC, and a new unified error metric. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. , 113-120 (2003).
Mackenzie, I. S., Soukoreff, R. W. Phrase sets for evaluating text entry techniques. CHI'03 Extended Abstracts on Human Factors in Computing Systems. , 754-755 (2003).
Trudeau, M. B., Sunderland, E. M., Jindrich, D. L., Dennerlein, J. T., Federici, S. A data-driven design evaluation tool for handheld device soft keyboards. Plos One. 9 (9), 107070 (2014).
Cao, S., Ho, A., He, J. Modeling and predicting mobile phone touchscreen transcription typing using an integrated cognitive architecture. International Journal of Human-Computer Interaction. 34 (4-6), 544-556 (2018).

Erratum

Formal Correction: Erratum: An Assessment Method and Toolkit to Evaluate Keyboard Design on Smartphones
Posted by JoVE Editors on 09/01/2022. Citeable Link.

An erratum was issued for: An Assessment Method and Toolkit to Evaluate Keyboard Design on Smartphones. The Authors section was updated.

Yincheng Wang1
Ke Wang1
Yuqi Huang1
Di Wu2
Jian Wu3
Jibo He4,1
1Department of Psychology, School of Social Sciences, Tsinghua University
2Department of Computer Science, Beijing Normal University
3Haier Innovation Design Center, Haier Company
4Key Laboratory of Emotion and Mental Health in Chongqing, User Experience and Human-computer Interaction Technology Institute, Chongqing University of Arts and Sciences

to:

Yincheng Wang1
Ke Wang1
Yuqi Huang1
Di Wu2
Jian Wu3
Jibo He1
1Department of Psychology, School of Social Sciences, Tsinghua University
2Department of Computer Science, Beijing Normal University
3Haier Innovation Design Center, Haier Company

Behavior

Um método de avaliação e kit de ferramentas para avaliar o design do teclado em smartphones

ERRATUM NOTICE

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Erratum

Cite this Article

ERRATUM NOTICE

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Erratum

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.