O teste de corridas de Wald-Wolfowitz, comumente referido como teste de corridas, é um teste não paramétrico usado para avaliar a aleatoriedade de dados ordenados. O teste avalia o número de execuções, que são sequências consecutivas de elementos semelhantes nos dados. Se o número de execuções for significativamente maior ou menor do que o esperado, os dados serão considerados não aleatórios, indicando um padrão ou estrutura detectável.
Para dados binários, as execuções são identificadas usando símbolos como + e −, ou equivalentemente, 1s e 0s. No caso de dados categóricos com duas categorias, essas categorias são convertidas em escolhas binárias. No entanto, em casos como sequências de DNA, onde categorias como A, T, G e C são inerentes, nenhuma conversão é necessária e o teste pode ser aplicado diretamente às sequências. Para dados numéricos, os valores são frequentemente convertidos atribuindo um + (ou 1) àqueles acima de um determinado limite (como a média ou mediana) e um − (ou 0) para aqueles abaixo dele, permitindo a identificação de execuções.
A hipótese nula do teste (H0) afirma que os dados seguem uma sequência aleatória, enquanto a hipótese alternativa (H1) sugere que os dados têm um padrão ou ordem subjacente. A estatística de teste, denotada como G, representa o número de execuções observadas nos dados. Esse valor é então comparado aos valores críticos em um teste bicaudal. Se G estiver fora da faixa crítica (ou seja, for muito alta ou muito baixa), rejeitamos a hipótese nula, concluindo que os dados não são aleatórios e exibem uma sequência específica. Por outro lado, se G estiver dentro do intervalo crítico, não rejeitaremos a hipótese nula, sugerindo que os dados são provavelmente aleatórios sem qualquer ordem específica.
Os valores críticos são obtidos a partir de um quadro normalizado de ensaios quando o número de elementos nos dados com uma característica específica (por exemplo, valores menores que a mediana), denotado por n1, e o número de elementos nos dados com uma característica diferente (por exemplo, valores maiores que a mediana) denotado por n2 é menor ou igual a 20 e ao nível de significância α= 0,05 (Nota: não confunda esses números com o tamanho da amostra n).
Quando essas condições não são atendidas, ou seja, quando n1 e n2 e maiores que 20 ou quando o nível de significância α é diferente de 0,05, a estatística de teste z é usada e é calculada usando a seguinte equação:
Onde μG e σG são calculados pelas seguintes equações:
Os valores z críticos, ou seja, valores z críticos negativos (cauda esquerda) e positivos (cauda direita), são obtidos a partir da tabela de distribuição z padrão. Quando a estatística de teste z (calculada a partir das equações acima) está além do intervalo de –z e +z, a aleatoriedade é rejeitada, concluindo-se que há evidência de uma sequência específica nos dados. Se a estatística de teste estiver dentro do intervalo, a aleatoriedade nos dados não será rejeitada.
O teste de execuções não é afetado pelo tamanho da amostra ou pela distribuição subjacente da população e da amostra, tornando-o versátil para vários tipos de dados sequenciais para detectar aleatoriedade. No entanto, embora possa identificar se uma sequência é aleatória, ela não mede o grau ou a magnitude da aleatoriedade nos dados.
Um cientista coletou dados sobre o comprimento do corpo de 30 babuínos que se aproximavam de uma fonte de água.
Assim, o teste de Wald-Wolfowitz pode determinar se a sequência em que os babuínos se aproximaram da fonte de água é aleatória ou está relacionada ao comprimento do corpo.
Aqui, a hipótese nula afirma que os dados estão em uma sequência aleatória, enquanto a hipótese alternativa afirma que os dados não estão em uma sequência aleatória.
Para esses dados numéricos, as corridas – G – são calculadas atribuindo sinais binários aos valores maiores e menores que a mediana 74,5.
Aqui, o valor de G é 17.
Observe que o número de valores menores que a mediana — n1 — e maiores que a mediana — n2 — são menores que 20.
Assim, os valores críticos em α = 0,05 podem ser obtidos na tabela padrão.
O teste de Wald-Wolfowitz é bicaudal. Portanto, para rejeitar a aleatoriedade, a estatística de teste precisa estar além do intervalo de valores críticos.
Aqui, G se enquadra nesse intervalo, fornecendo evidências a favor da hipótese nula.
Related Videos
Nonparametric Statistics
676 Visualizações
Nonparametric Statistics
231 Visualizações
Nonparametric Statistics
736 Visualizações
Nonparametric Statistics
117 Visualizações
Nonparametric Statistics
78 Visualizações
Nonparametric Statistics
100 Visualizações
Nonparametric Statistics
107 Visualizações
Nonparametric Statistics
112 Visualizações
Nonparametric Statistics
166 Visualizações
Nonparametric Statistics
592 Visualizações
Nonparametric Statistics
685 Visualizações
Nonparametric Statistics
734 Visualizações
Nonparametric Statistics
628 Visualizações
Nonparametric Statistics
612 Visualizações
Nonparametric Statistics
623 Visualizações
Nonparametric Statistics
201 Visualizações
Nonparametric Statistics
72 Visualizações
Nonparametric Statistics
404 Visualizações
Nonparametric Statistics
163 Visualizações
Nonparametric Statistics
261 Visualizações
Nonparametric Statistics
175 Visualizações
Nonparametric Statistics
284 Visualizações