13.16: Wald-Wolfowitz realiza la prueba II

Wald-Wolfowitz Runs Test II
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wald-Wolfowitz Runs Test II
Please note that all translations are automatically generated. Click here for the English version.

227 Views

01:17 min
January 09, 2025

Overview

La prueba de carreras de Wald-Wolfowitz, comúnmente conocida como prueba de carreras, es una prueba no paramétrica que se utiliza para evaluar la aleatoriedad de datos ordenados. La prueba evalúa el número de ejecuciones, que son secuencias consecutivas de elementos similares dentro de los datos. Si el número de ejecuciones es significativamente mayor o menor de lo esperado, los datos se consideran no aleatorios, lo que indica un patrón o estructura detectable.

En el caso de los datos binarios, las ejecuciones se identifican mediante símbolos como + y -, o equivalentemente, 1 y 0. En el caso de datos categóricos con dos categorías, estas categorías se convierten en opciones binarias. Sin embargo, en casos como las secuencias de ADN, donde categorías como A, T, G y C son inherentes, no es necesaria la conversión y la prueba se puede aplicar directamente a las secuencias. En el caso de los datos numéricos, los valores a menudo se convierten asignando un + (o 1) a los que están por encima de un determinado umbral (como la media o la mediana) y un –(o 0) a los que están por debajo, lo que permite la identificación de las ejecuciones.

La hipótesis nula de la prueba (H0) establece que los datos siguen una secuencia aleatoria, mientras que la hipótesis alternativa (H1) sugiere que los datos tienen un patrón u orden subyacente. El estadístico de prueba, denotado como G, representa el número de ejecuciones observadas en los datos. A continuación, este valor se compara con los valores críticos en una prueba de dos colas. Si G cae fuera del rango crítico (es decir, es demasiado alto o demasiado bajo), rechazamos la hipótesis nula, concluyendo que los datos no son aleatorios y exhiben una secuencia particular. Por el contrario, si G cae dentro del rango crítico, no podemos rechazar la hipótesis nula, lo que sugiere que los datos son probablemente aleatorios sin ningún orden específico.

Los valores críticos se obtienen a partir de una tabla estándar de corridas cuando el número de elementos de los datos que tienen una característica determinada (por ejemplo, valores menores que la mediana), denotados por n1, y el número de elementos de los datos que tienen una característica diferente (por ejemplo, valores mayores que la mediana) denotados por n2 es menor o igual que 20 y en el nivel de significación α= 0,05 (Nota: no confunda estos números con el tamaño de la muestra n).

Cuando estas condiciones no se cumplen, es decir, cuando n1 y n2 son mayores que 20 o cuando el nivel de significación α es distinto de 0,05, se utiliza el estadístico de prueba z, y se calcula utilizando la siguiente ecuación:

Ecuación 1

Donde μ G y σG se calculan mediante las siguientes ecuaciones:

Ecuación 2

Ecuación 3

Los valores z críticos, es decir, los valores z críticos negativos (de cola izquierda) y positivos (de cola derecha), se obtienen de la tabla de distribución z estándar. Cuando el estadístico de prueba z (calculado a partir de las ecuaciones anteriores) está más allá del rango de –z y +z, se rechaza la aleatoriedad, concluyendo que hay evidencia de una secuencia específica en los datos. Si el estadístico de prueba está dentro del rango, no se rechaza la aleatoriedad de los datos.

La prueba de ejecución no se ve afectada por el tamaño de la muestra o la distribución subyacente de la población y la muestra, lo que la hace versátil para varios tipos de datos secuenciales para detectar la aleatoriedad. Sin embargo, aunque puede identificar si una secuencia es aleatoria, no mide el grado o la magnitud de la aleatoriedad dentro de los datos.

Transcript

Un científico recopiló datos sobre la longitud del cuerpo de 30 babuinos que se acercaban a una fuente de agua.

Por lo tanto, la prueba de Wald-Wolfowitz puede determinar si la secuencia en la que los babuinos se acercaron a la fuente de agua es aleatoria o se relaciona con la longitud de su cuerpo.

Aquí, la hipótesis nula establece que los datos están en una secuencia aleatoria, mientras que la hipótesis alternativa establece que los datos no están en una secuencia aleatoria.

Para estos datos numéricos, las ejecuciones (G) se calculan asignando signos binarios a los valores mayores y menores que la mediana 74,5.

Aquí, el valor de G es 17.

Observe que el número de valores menores que la mediana (n1) y mayores que la mediana (n2) son menores que 20.

Por lo tanto, los valores críticos a α = 0,05 se pueden obtener de la tabla estándar.

La prueba de Wald-Wolfowitz es de dos colas. Por lo tanto, para rechazar la aleatoriedad, el estadístico de prueba debe estar más allá del rango de valores críticos.

Aquí, G cae dentro de este rango, proporcionando evidencia a favor de la hipótesis nula.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for