RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
pt_BR
Menu
Menu
Menu
Menu
Please note that some of the translations on this page are AI generated. Click here for the English version.
Fonte: Laboratório de Jonathan Flombaum - Universidade Johns Hopkins
A língua falada, uma conquista humana singular, depende fortemente de mecanismos perceptivos especializados. Uma característica importante dos mecanismos de percepção da linguagem é que eles dependem simultaneamente de informações auditivas e visuais. Isso faz sentido, porque até os tempos modernos, uma pessoa poderia esperar que a maioria da linguagem fosse ouvida em interações cara a cara. E como produzir sons de fala específicos requer uma articulação precisa, a boca pode fornecer boas informações visuais sobre o que alguém está dizendo. Na verdade, com uma visão de perto e desobstruída do rosto de alguém, a boca pode muitas vezes fornecer melhores sinais visuais do que sinais auditivos de fala. O resultado é que o cérebro humano favorece a entrada visual, e o usa para desambiguar a ambiguidade inerente na língua falada.
Essa dependência da entrada visual para interpretar o som foi descrita por Harry McGurk e John Macdonald em um artigo em 1976 chamado Ouvir lábios e ver vozes. 1 Nesse artigo, eles descreveram uma ilusão que surge através de uma incompatibilidade entre uma gravação de som e uma gravação de vídeo. Essa ilusão tornou-se conhecida como o efeito McGurk. Este vídeo demonstrará como produzir e interpretar o efeito McGurk.
1. Estímulos
2. Induzir a Ilusão
A percepção da linguagem — de forma falada — beneficia-se das interações presenciais, já que a boca fornece boas informações visuais para articular sons específicos.
Por exemplo, em uma situação de perto e desobstruída, um indivíduo pode ver seu amigo mencionar ir à praia. Neste caso, eles usam a entrada visual — observando o movimento ao redor dos lábios e da língua — para compreender claramente o que foi dito.
No entanto, se o amigo continuar a falar fora de vista em outra sala, eles podem ser tentados a assistir a televisão silenciada e, portanto, devem depender apenas da voz obstruída para dar sentido à mensagem.
Neste caso, o que foi realmente dito na extremidade traseira, pick, interferiu com o chute silencioso e foi mal interpretado como carrapato. Este é um exemplo do Efeito McGurk — uma ilusão perceptiva que surge através de uma incompatibilidade entre sinais sonoros e visuais.
Este vídeo demonstra como construir os estímulos audiovisuais para testar o fenômeno originalmente descoberto por McGurk e Macdonald. Também investiga como a visão interage com a produção sonora para entender como os indivíduos aprendem a língua em uma idade muito jovem.
Neste experimento, os participantes são convidados a assistir vídeos silenciados, nos quais uma palavra como ganho é falada, enquanto um som como bane é reproduzido simultaneamente ao fundo. Depois, eles são convidados a compartilhar o que ouviram.
Para entender o resultado, como a ilusão é produzida, vamos primeiro discutir como os fonemas — as unidades mínimas de sons da fala — são articulados.
Por exemplo, bane e ganhe compartilhar os mesmos elementos em todas as posições, exceto o primeiro, que são os sons /b/ e /g/.
Embora as palavras com esses foneões iniciais possam soar semelhantes, quando /g/ é mostrado e /b/ é reproduzido, espera-se que os indivíduos ouçam um terceiro som completamente diferente —/d/— em vez disso.
A razão de ser ouvida é devido ao fato de que todos os três são basicamente produzidos da mesma forma, com apenas uma pequena diferença em que o alto-falante coloca uma obstrução no fluxo de ar, chamado de pontos de articulação, ou POA.
Por exemplo, quando um /b/ som é feito, os lábios fornecem a obstrução, resultando em um POA labial, enquanto para /g/, é referido como palatal — na parte de trás da boca. Quanto ao /d/, o POA é dental, uma consequência da língua tocando os dentes superiores.
Quando o cérebro integra o visual conflitante /g/ e auditivo /b/, conclui que o som final deve estar em algum lugar no meio dos POAs, ouvindo /d/ e relatando a palavra Dane.
Em preparação para a demonstração, obtenha um computador para apresentar vídeos e um smartphone com uma câmera de vídeo.
Primeiro posicione a câmera para que sua cabeça preencha o visor. Agora, grave quatro clipes de 10 s, cada um contendo palavras diferentes que devem ser repetidas 10 vezes a uma taxa de 1 palavra/s. Certifique-se de transferir o ganho e pode fazer vídeos para o computador para reprodução visual.
Para realizar o experimento, sente-se um participante na frente do computador. Abra o arquivo de vídeo para o ganho de palavra e desligue o áudio.
No telefone, abra o vídeo para bane. Coloque-o atrás do computador para que sua tela esteja escondida e apenas o som possa ser ouvido claramente.
Instrua o participante a observar o monitor do computador e ouvir. Em seguida, reprodução ambos os vídeos simultaneamente.
Quando os clipes terminarem, pergunte ao participante o que eles ouviram. [Participante diz: "Dane"]. Repita o procedimento reproduzindo o vídeo da palavra no computador e apresentando o áudio para panela no telefone. Mais uma vez, questione o participante sobre o que ouviu. [Participante diz: "bronzeado"].
Aqui, as palavras bane e pan foram tocadas em voz alta enquanto o participante assistia ganho e pode ser falado. Normalmente, quando um termo com o /g/ phoneme é mostrado visualmente e emparelhado com o som /b/, os indivíduos ouvirão /d/.
Da mesma forma, quando uma palavra que começa com /k/ é emparelhada com o som /p/, os indivíduos ouvirão /t/.
A razão por trás dessa percepção auditiva deve-se à forma como os sons são produzidos. O cérebro tenta resolver informações conflitantes dos olhos vendo movimentos labiais —/b/ e /p/— enquanto os ouvidos ouvem unidades palatais —/g/ e /k/. Como resultado, conclui-se que os sons devem estar no meio, resultando na percepção das fonemes dentárias —/d/ e /t/.
Agora que você está familiarizado com como produzir o efeito McGurk, vamos olhar para algumas outras maneiras que os pesquisadores usam este fenômeno perceptivo para investigar o desenvolvimento da linguagem e casos em que o efeito é alterado.
Os bebês podem até ser testados no efeito McGurk a partir dos cinco meses de idade, quando são pré-linguísticos, usando um paradigma de habitação de tempo.
Neste procedimento, Rosenblum e colegas apresentaram repetidamente aos bebês uma sílaba particular, como va, tanto nos domínios audiovisuais quanto no visual antes de introduzir fonemas incompatíveis em uma fase de teste.
Os bebês apresentaram sinais de habituação ao va — tempos de aparência reduzidos — e desabitação, notado como aumento da aparência, quando algo além de va foi percebido. Assim, mesmo antes de os bebês poderem falar, eles apresentam resultados semelhantes aos adultos, nos quais dependem do uso de informações visuais para discriminação linguística.
No entanto, crianças com autismo têm maior dificuldade em exibir o efeito McGurk tão facilmente quanto os controles devido à sua capacidade prejudicada de entender e atender aos componentes faciais visuais. Isso indica diferenças fundamentais no processamento da fala audiovisual, o que pode contribuir para sua dificuldade com a linguagem e a comunicação.
Por fim, pacientes com lesões no hemisfério esquerdo — o lado tipicamente predominante para compreensão e aprendizado de linguagem — geralmente usam características faciais visuais para ajudar durante a fonoaudiologia. Curiosamente, quando testados sobre o efeito McGurk, eles mais frequentemente relataram ouvir sons dentários em comparação com controles. Tais percepções são prováveis devido ao seu maior foco em informações visuais.
Você acabou de ver o vídeo do JoVE no Efeito McGurk. Agora você deve saber como conduzir essa ilusão audiovisual e relacionar fonemes à produção sonora. Além disso, você também deve ter uma melhor compreensão das interações entre visão e audição, e como elas podem ser afetadas durante o desenvolvimento e a idade adulta.
Obrigado por assistir!
A percepção da linguagem - na forma falada - se beneficia das interações face a face, pois a boca fornece boas informações visuais para articular sons específicos.
Por exemplo, em uma situação próxima e desobstruída, um indivíduo pode ver seu amigo mencionar ir à praia. Nesse caso, eles usam a entrada visual - observando o movimento ao redor dos lábios e da língua - para compreender claramente o que foi dito.
No entanto, se o amigo continuar a falar fora da vista em outra sala, ele pode ficar tentado a assistir à televisão silenciada e, portanto, deve confiar apenas na voz obstruída para entender a mensagem.
Nesse caso, o que foi realmente dito no final da cauda, palheta, interferiu no chute silencioso e foi mal interpretado como carrapato. Este é um exemplo do Efeito McGurk - uma ilusão perceptiva que surge por meio de uma incompatibilidade entre pistas sonoras e visuais.
Este vídeo demonstra como construir os estímulos audiovisuais para testar o fenômeno originalmente descoberto por McGurk e Macdonald. Também investiga como a visão interage com a produção sonora para entender como os indivíduos aprendem a linguagem em uma idade muito jovem.
Neste experimento, os participantes são convidados a assistir a vídeos silenciados, nos quais uma palavra como ganho é pronunciada, enquanto um som como maldição é reproduzido simultaneamente em segundo plano. Depois, eles são convidados a compartilhar o que ouviram.
Para entender o resultado, como a ilusão é produzida, vamos primeiro discutir como os fonemas - as unidades mínimas dos sons da fala - são articulados.
Por exemplo, bane e gain compartilham os mesmos elementos em todas as posições, exceto na primeira, que são os sons /b/ e /g/.
Embora palavras com esses fonemas iniciais possam soar semelhantes, quando /g/ é mostrado e /b/ é tocado, espera-se que os indivíduos ouçam um terceiro som completamente diferente?/d/?em vez disso.
A razão pela qual /d/ é ouvido é devido ao fato de que todos os três são basicamente produzidos da mesma maneira, com apenas uma pequena diferença em onde o falante coloca uma obstrução no fluxo de ar, chamada de pontos de articulação, ou POA.
Por exemplo, quando um som de /b/ é emitido, os lábios fornecem a obstrução, resultando em um POA labial, enquanto para /g/, é chamado de palatal na parte de trás da boca. Quanto ao /d/, o POA é odontológico, consequência da língua tocar os dentes superiores.
Quando o cérebro integra o /g/ visual conflitante e o /b/ auditivo, ele conclui que o som final deve estar em algum lugar no meio dos POAs, ouvindo assim /d/ e relatando a palavra dinamarquês.
Em preparação para a demonstração, obtenha um computador para apresentar vídeos e um smartphone com câmera de vídeo.
Primeiro posicione a câmera de forma que sua cabeça preencha a tela. Agora, grave quatro clipes de 10 segundos, cada um contendo palavras diferentes que devem ser repetidas 10 vezes a uma taxa de 1 palavra/s. Certifique-se de transferir o ganho e os vídeos de lata para o computador para reprodução visual.
Para realizar o experimento, sente-se um participante na frente do computador. Abra o arquivo de vídeo para a palavra ganho e desligue o áudio.
No telefone, abra o vídeo para bane. Coloque-o atrás do computador para que sua tela fique oculta e apenas o som possa ser ouvido com clareza.
Instrua o participante a observar o monitor do computador e ouvir. Em seguida, reproduza os dois vídeos simultaneamente.
Quando os clipes terminarem, pergunte ao participante o que ele ouviu. [O participante diz: "Dane"]. Repita o procedimento reproduzindo o vídeo da palavra lata no computador e apresentando o áudio para pan no telefone. Mais uma vez, questione o participante sobre o que ele ouviu. [O participante diz: "bronzeado"].
Aqui, as palavras bane e pan foram tocadas em voz alta enquanto o participante observava o ganho e a lata sendo pronunciada. Normalmente, quando um termo com o fonema /g/ é mostrado visualmente e emparelhado com o som /b/, os indivíduos ouvirão /d/.
Da mesma forma, quando uma palavra que começa com /k/ é emparelhada com o som /p/, os indivíduos ouvirão /t/.
A razão por trás dessa percepção auditiva é devido à maneira como os sons são produzidos. O cérebro tenta resolver informações conflitantes dos olhos que veem movimentos labiais?/b/ e /p/?enquanto os ouvidos ouvem unidades palatinas?/g/ e /k/. Como resultado, conclui-se que os sons devem estar no meio, resultando na percepção dos fonemas dentários?/d/ e /t/.
Agora que você está familiarizado com a forma de produzir o efeito McGurk, vejamos algumas outras maneiras pelas quais os pesquisadores usam esse fenômeno perceptivo para investigar o desenvolvimento da linguagem e os casos em que o efeito é alterado.
Os bebês podem até ser testados no efeito McGurk a partir dos cinco meses de idade, quando são pré-linguísticos, usando um paradigma de habituação do tempo de olhar.
Nesse procedimento, Rosenblum e colegas apresentaram repetidamente aos bebês uma sílaba específica, como va, nos domínios áudio e visual antes de introduzir fonemas incompatíveis em uma fase de teste.
Os bebês mostraram sinais de habituação a tempos de olhar reduzidos e deshabituação, observada como aumento da aparência, quando algo diferente de va foi percebido. Assim, mesmo antes que os bebês possam falar, eles exibem resultados semelhantes aos dos adultos, nos quais contam com o uso de informações visuais para discriminação de linguagem.
No entanto, crianças com autismo têm maior dificuldade em exibir o efeito McGurk tão prontamente quanto os controles devido à sua capacidade prejudicada de entender e atender aos componentes visuais faciais. Isso indica diferenças fundamentais no processamento da fala audiovisual, o que pode contribuir para sua dificuldade com a linguagem e a comunicação.
Por fim, pacientes com lesões no hemisfério esquerdo - o lado tipicamente predominante para compreensão e aprendizagem da linguagem - costumam usar características faciais visuais para ajudar durante a terapia fonoaudiológica. Curiosamente, quando testados no efeito McGurk, eles relataram com mais frequência ouvir sons dentários em comparação com os controles. Tais percepções são provavelmente devido ao seu maior foco na informação visual.
Você acabou de assistir ao vídeo de JoVE sobre o Efeito McGurk. Agora você deve saber como conduzir essa ilusão audiovisual e relacionar os fonemas à produção sonora. Além disso, você também deve ter uma melhor compreensão das interações entre visão e audição e como elas podem ser afetadas durante o desenvolvimento e a idade adulta.
Obrigado por assistir!
Related Videos
09:20
Sensation and Perception
11.9K Visualizações
10:45
Sensation and Perception
18.2K Visualizações
11:32
Sensation and Perception
13.9K Visualizações
06:03
Sensation and Perception
7.5K Visualizações
08:09
Sensation and Perception
19.7K Visualizações
06:36
Sensation and Perception
18.4K Visualizações
14:51
Sensation and Perception
14.1K Visualizações
07:51
Sensation and Perception
16.1K Visualizações
08:52
Sensation and Perception
16.8K Visualizações
10:23
Sensation and Perception
6.2K Visualizações
06:13
Sensation and Perception
16.2K Visualizações
07:30
Sensation and Perception
15.8K Visualizações
06:48
Sensation and Perception
25.0K Visualizações
10:14
Sensation and Perception
6.9K Visualizações