13.16:
Wald-Wolfowitz realiza la prueba II
La prueba de carreras de Wald-Wolfowitz, comúnmente conocida como prueba de carreras, es una prueba no paramétrica que se utiliza para evaluar la aleatoriedad de datos ordenados. La prueba evalúa el número de ejecuciones, que son secuencias consecutivas de elementos similares dentro de los datos. Si el número de ejecuciones es significativamente mayor o menor de lo esperado, los datos se consideran no aleatorios, lo que indica un patrón o estructura detectable.
En el caso de los datos binarios, las ejecuciones se identifican mediante símbolos como + y -, o equivalentemente, 1 y 0. En el caso de datos categóricos con dos categorías, estas categorías se convierten en opciones binarias. Sin embargo, en casos como las secuencias de ADN, donde categorías como A, T, G y C son inherentes, no es necesaria la conversión y la prueba se puede aplicar directamente a las secuencias. En el caso de los datos numéricos, los valores a menudo se convierten asignando un + (o 1) a los que están por encima de un determinado umbral (como la media o la mediana) y un –(o 0) a los que están por debajo, lo que permite la identificación de las ejecuciones.
La hipótesis nula de la prueba (H0) establece que los datos siguen una secuencia aleatoria, mientras que la hipótesis alternativa (H1) sugiere que los datos tienen un patrón u orden subyacente. El estadístico de prueba, denotado como G, representa el número de ejecuciones observadas en los datos. A continuación, este valor se compara con los valores críticos en una prueba de dos colas. Si G cae fuera del rango crítico (es decir, es demasiado alto o demasiado bajo), rechazamos la hipótesis nula, concluyendo que los datos no son aleatorios y exhiben una secuencia particular. Por el contrario, si G cae dentro del rango crítico, no podemos rechazar la hipótesis nula, lo que sugiere que los datos son probablemente aleatorios sin ningún orden específico.
Los valores críticos se obtienen a partir de una tabla estándar de corridas cuando el número de elementos de los datos que tienen una característica determinada (por ejemplo, valores menores que la mediana), denotados por n1, y el número de elementos de los datos que tienen una característica diferente (por ejemplo, valores mayores que la mediana) denotados por n2 es menor o igual que 20 y en el nivel de significación α= 0,05 (Nota: no confunda estos números con el tamaño de la muestra n).
Cuando estas condiciones no se cumplen, es decir, cuando n1 y n2 son mayores que 20 o cuando el nivel de significación α es distinto de 0,05, se utiliza el estadístico de prueba z, y se calcula utilizando la siguiente ecuación:
Donde μ G y σG se calculan mediante las siguientes ecuaciones:
Los valores z críticos, es decir, los valores z críticos negativos (de cola izquierda) y positivos (de cola derecha), se obtienen de la tabla de distribución z estándar. Cuando el estadístico de prueba z (calculado a partir de las ecuaciones anteriores) está más allá del rango de –z y +z, se rechaza la aleatoriedad, concluyendo que hay evidencia de una secuencia específica en los datos. Si el estadístico de prueba está dentro del rango, no se rechaza la aleatoriedad de los datos.
La prueba de ejecución no se ve afectada por el tamaño de la muestra o la distribución subyacente de la población y la muestra, lo que la hace versátil para varios tipos de datos secuenciales para detectar la aleatoriedad. Sin embargo, aunque puede identificar si una secuencia es aleatoria, no mide el grado o la magnitud de la aleatoriedad dentro de los datos.
Un científico recopiló datos sobre la longitud del cuerpo de 30 babuinos que se acercaban a una fuente de agua.
Por lo tanto, la prueba de Wald-Wolfowitz puede determinar si la secuencia en la que los babuinos se acercaron a la fuente de agua es aleatoria o se relaciona con la longitud de su cuerpo.
Aquí, la hipótesis nula establece que los datos están en una secuencia aleatoria, mientras que la hipótesis alternativa establece que los datos no están en una secuencia aleatoria.
Para estos datos numéricos, las ejecuciones (G) se calculan asignando signos binarios a los valores mayores y menores que la mediana 74,5.
Aquí, el valor de G es 17.
Observe que el número de valores menores que la mediana (n1) y mayores que la mediana (n2) son menores que 20.
Por lo tanto, los valores críticos a α = 0,05 se pueden obtener de la tabla estándar.
La prueba de Wald-Wolfowitz es de dos colas. Por lo tanto, para rechazar la aleatoriedad, el estadístico de prueba debe estar más allá del rango de valores críticos.
Aquí, G cae dentro de este rango, proporcionando evidencia a favor de la hipótesis nula.
Related Videos
Nonparametric Statistics
700 Vistas
Nonparametric Statistics
236 Vistas
Nonparametric Statistics
797 Vistas
Nonparametric Statistics
124 Vistas
Nonparametric Statistics
91 Vistas
Nonparametric Statistics
113 Vistas
Nonparametric Statistics
117 Vistas
Nonparametric Statistics
119 Vistas
Nonparametric Statistics
176 Vistas
Nonparametric Statistics
601 Vistas
Nonparametric Statistics
702 Vistas
Nonparametric Statistics
759 Vistas
Nonparametric Statistics
664 Vistas
Nonparametric Statistics
675 Vistas
Nonparametric Statistics
639 Vistas
Nonparametric Statistics
226 Vistas
Nonparametric Statistics
75 Vistas
Nonparametric Statistics
451 Vistas
Nonparametric Statistics
180 Vistas
Nonparametric Statistics
295 Vistas
Nonparametric Statistics
204 Vistas
Nonparametric Statistics
317 Vistas