13.16: Wald-Wolfowitz executa o teste II

Wald-Wolfowitz Runs Test II
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wald-Wolfowitz Runs Test II
Please note that all translations are automatically generated. Click here for the English version.

202 Views

01:17 min
January 09, 2025

Overview

O teste de corridas de Wald-Wolfowitz, comumente referido como teste de corridas, é um teste não paramétrico usado para avaliar a aleatoriedade de dados ordenados. O teste avalia o número de execuções, que são sequências consecutivas de elementos semelhantes nos dados. Se o número de execuções for significativamente maior ou menor do que o esperado, os dados serão considerados não aleatórios, indicando um padrão ou estrutura detectável.

Para dados binários, as execuções são identificadas usando símbolos como + e −, ou equivalentemente, 1s e 0s. No caso de dados categóricos com duas categorias, essas categorias são convertidas em escolhas binárias. No entanto, em casos como sequências de DNA, onde categorias como A, T, G e C são inerentes, nenhuma conversão é necessária e o teste pode ser aplicado diretamente às sequências. Para dados numéricos, os valores são frequentemente convertidos atribuindo um + (ou 1) àqueles acima de um determinado limite (como a média ou mediana) e um − (ou 0) para aqueles abaixo dele, permitindo a identificação de execuções.

A hipótese nula do teste (H0) afirma que os dados seguem uma sequência aleatória, enquanto a hipótese alternativa (H1) sugere que os dados têm um padrão ou ordem subjacente. A estatística de teste, denotada como G, representa o número de execuções observadas nos dados. Esse valor é então comparado aos valores críticos em um teste bicaudal. Se G estiver fora da faixa crítica (ou seja, for muito alta ou muito baixa), rejeitamos a hipótese nula, concluindo que os dados não são aleatórios e exibem uma sequência específica. Por outro lado, se G estiver dentro do intervalo crítico, não rejeitaremos a hipótese nula, sugerindo que os dados são provavelmente aleatórios sem qualquer ordem específica.

Os valores críticos são obtidos a partir de um quadro normalizado de ensaios quando o número de elementos nos dados com uma característica específica (por exemplo, valores menores que a mediana), denotado por n1, e o número de elementos nos dados com uma característica diferente (por exemplo, valores maiores que a mediana) denotado por n2 é menor ou igual a 20 e ao nível de significância α= 0,05 (Nota: não confunda esses números com o tamanho da amostra n).

Quando essas condições não são atendidas, ou seja, quando n1 e n2 e maiores que 20 ou quando o nível de significância α é diferente de 0,05, a estatística de teste z é usada e é calculada usando a seguinte equação:

Equação 1

Onde μG e σG são calculados pelas seguintes equações:

Equação 2

Equação 3

Os valores z críticos, ou seja, valores z críticos negativos (cauda esquerda) e positivos (cauda direita), são obtidos a partir da tabela de distribuição z padrão. Quando a estatística de teste z (calculada a partir das equações acima) está além do intervalo de –z e +z, a aleatoriedade é rejeitada, concluindo-se que há evidência de uma sequência específica nos dados. Se a estatística de teste estiver dentro do intervalo, a aleatoriedade nos dados não será rejeitada.

O teste de execuções não é afetado pelo tamanho da amostra ou pela distribuição subjacente da população e da amostra, tornando-o versátil para vários tipos de dados sequenciais para detectar aleatoriedade. No entanto, embora possa identificar se uma sequência é aleatória, ela não mede o grau ou a magnitude da aleatoriedade nos dados.

Transcript

Um cientista coletou dados sobre o comprimento do corpo de 30 babuínos que se aproximavam de uma fonte de água.

Assim, o teste de Wald-Wolfowitz pode determinar se a sequência em que os babuínos se aproximaram da fonte de água é aleatória ou está relacionada ao comprimento do corpo.

Aqui, a hipótese nula afirma que os dados estão em uma sequência aleatória, enquanto a hipótese alternativa afirma que os dados não estão em uma sequência aleatória.

Para esses dados numéricos, as corridas – G – são calculadas atribuindo sinais binários aos valores maiores e menores que a mediana 74,5.

Aqui, o valor de G é 17.

Observe que o número de valores menores que a mediana — n1 — e maiores que a mediana — n2 — são menores que 20.

Assim, os valores críticos em α = 0,05 podem ser obtidos na tabela padrão.

O teste de Wald-Wolfowitz é bicaudal. Portanto, para rejeitar a aleatoriedade, a estatística de teste precisa estar além do intervalo de valores críticos.

Aqui, G se enquadra nesse intervalo, fornecendo evidências a favor da hipótese nula.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for