9 votos

Supuesto de simetría de rango con signo de Wilcoxon

La suposición de simetría para la prueba de rango con signo (y su relevancia) se está volviendo extremadamente confusa para mí. Tengo la hipótesis de que la subpoblación A (antes del tratamiento) y la subpoblación B (después del tratamiento) proceden de la misma población (sin efecto del tratamiento). ¿Es necesario que mi diferencia emparejada se ajuste al supuesto de simetría?

jbowman señaló en su respuesta aquí que "Tenga en cuenta que bajo la hipótesis nula típica, si usted asume que las subpoblaciones A y B se extraen de la misma distribución, la simetría de las diferencias emparejadas entre A y B está asegurada independientemente de la falta de simetría de la distribución subyacente". Mientras que en otros textos se dice "Si se está probando la hipótesis nula de que la media (= mediana) de las diferencias pareadas es cero, entonces las diferencias pareadas deben proceder todas de una distribución continua simétrica. "

9voto

bheklilr Puntos 113

Aunque a primera vista las dos afirmaciones anteriores puedan parecer contradictorias, no lo son. La prueba de rango con signo de Wilcoxon requiere que el diferencias emparejadas provienen de una distribución continua simétrica (bajo la hipótesis nula, como señala Michael Chernick en los comentarios.) En el caso especial de que las dos subpoblaciones $A$ y $B$ de donde se extraerán las muestras pareadas (una de cada $A$ y $B$ ) tienen la misma distribución (continua), se garantiza que las diferencias por pares entre las muestras $a_i,b_i$ procederá de una distribución continua simétrica.

Se puede ver esto observando que si las dos muestras provienen de la misma distribución, $p(a_i = x, b_i = y) = p(a_i = y, b_i = x)$ . En el primer caso, la diferencia emparejada $\delta_{i,1} = x-y$ y en este último caso la diferencia emparejada $\delta_{i,2} = y-x = -\delta_{i,1}$ . Como las probabilidades de los dos casos son iguales, se deduce que $p(\delta_i) = p(-\delta_i)$ es decir, que la distribución es simétrica en torno a 0.

Por lo tanto, si puede suponer que las dos subpoblaciones tienen la misma distribución continua bajo la hipótesis nula, habrá satisfecho los requisitos de la hipótesis de rango con signo de Wilcoxon. A menudo es más fácil ver por qué este supuesto podría ser cierto que ver por qué el más general "las diferencias entre pares provienen de una distribución continua simétrica" podría ser cierto, de ahí su uso ocasional.

0 votos

Debería matizar esto para decir que la simetría se requiere bajo la hipótesis nula.

0 votos

@MichaelChernick - gracias, he añadido esa aclaración.

8voto

AdamSane Puntos 1825

Tenga en cuenta que el muestras puede no decir nada sobre la idoneidad del supuesto que se requiere para la null . Si el nulo es falso, no se requiere necesariamente la simetría (y es fácil demostrar ejemplos en los que todo funciona como se desea sin necesitar la simetría bajo la alternativa).

La gente parece gastar mucho esfuerzo en preocuparse por probando una suposición utilizando datos que pueden no ser relevantes para la cuestión de si la suposición es razonable. La suposición podría tratarse mejor considerando su plausibilidad antes incluso de ver los datos (la excelente respuesta de jbowman cubre esto con cierto detalle; bajo el supuesto de que el tratamiento no cambia la distribución en absoluto, debería seguirse inmediatamente).

[Esto no significa que la situación bajo la alternativa sea arbitraria (es una prueba sensible a determinados tipos de desviaciones de la simetría en torno a cero en las diferencias de pares y es insensible a otros tipos de desviaciones) - se sigue buscando una tendencia a que las diferencias sean típicamente mayores que 0 o típicamente menores que 0].

Además, probar la hipótesis (y luego elegir lo que se hace en función de si se rechaza o no la nulidad en esa prueba previa) afectará a las propiedades de los procedimientos posteriores que se consideren (los valores p ya no serán uniformes bajo la nulidad, por ejemplo).

En algunos casos puede ser conveniente asumir una alternativa de cambio de ubicación (ciertamente es posible estimar su tamaño e incluso dar un intervalo de confianza para ello). Por ejemplo, simplificaría la discusión del efecto del tratamiento. Sin embargo, eso no lo convierte en un supuesto de la prueba en sí, sino en un supuesto adicional que hemos hecho por otras razones. En esta situación, los datos pueden ser relevantes para evaluar si esa suposición era adecuada, pero seguimos teniendo el problema de que si elegimos una prueba basándonos en los datos, ya no tenemos nuestro nivel de significación deseado (también hay impactos en la potencia).

2voto

Sal Mangiafico Puntos 26

Esto es menos una respuesta y más una solicitud de aclaración por parte de los encuestados, y quizás una aclaración en sí misma.

A continuación se presentan un par de ejemplos de libros de texto que muestran cómo se maneja a veces el supuesto de simetría para la prueba de rango con signo. En mi estantería no pude encontrar nada más claro ni más explicativo.

También hay numerosos ejemplos de Internet y de Cross Validated en los que la suposición de simetría se establece simplemente y sin más explicaciones.

La prueba de Wilcoxon [signed-rank] asume que la población muestreada es simétrica (en cuyo caso la mediana y la media son idénticas y este procedimiento se convierte en una prueba de hipótesis sobre la media y sobre la la mediana, pero la prueba t de una muestra suele ser una prueba más potente prueba sobre la media).

-- Zar, Bioestadística, 5º, 2010, § 7.9

.

La diferencia importante entre la prueba de signos y esta [Wilcoxon signed-rank] es un supuesto adicional de simetría de la distribución de las diferencias.

...

Supuestos:

  1. La distribución de cada Di [diferencia de observaciones pareadas] es simétrica.
  2. Los Dis son independientes entre sí.
  3. Los Dis tienen todos la misma media.
  4. La escala de medición del Dis es al menos de intervalo.

-- Conover, Practical Nonparametric Statistics, 3rd, 1999, § 5.7

Sin embargo, creo que las respuestas de @jbowman y @Glen_b explican esta suposición bajo una luz diferente.

Si el nulo es falso, no se requiere necesariamente la simetría.

...

En algunos casos puede ser conveniente asumir una alternativa de cambio de ubicación... Sin embargo, eso no lo convierte en una suposición de la prueba, sino en una suposición adicional que hemos hecho por otras razones.

-- @Glen_b

.

La prueba de rango con signo de Wilcoxon requiere que las diferencias emparejadas provengan de una distribución simétrica continua (bajo la hipótesis nula, como señala Michael Chernick en los comentarios).

-- @jbowman

Una forma de resumir mi entendimiento es la siguiente. La hipótesis nula para la prueba de rango con signo es que las diferencias están distribuidas simétricamente en torno a un valor. Hay dos maneras de que esta hipótesis sea errónea. 1) Las diferencias podrían ser simétricas respecto a un valor diferente. 2) Las diferencias podrían no ser simétricas. Si es el caso #1, entonces las diferencias tienen una ubicación diferente a la de la hipótesis nula, lo cual es un resultado útil y fácil de interpretar. Si es el caso #2, entonces los datos están sesgados de una manera que es un resultado útil. Esto puede ser un poco menos fácil de interpretar que en #1, pero un examen de un histograma de las diferencias debería revelar información útil sobre la distribución.

Con este entendimiento, creo que no hay ninguna suposición sobre la distribución de los datos originales, las diferencias o los rangos de las diferencias.

¿Qué te parece esto?

1voto

Ryan Boch Puntos 11

Llego tarde a la fiesta, pero estaba investigando esta cuestión y quería añadir algo (espero) útil.

En Nonparametric Statistical Inference quinta edición de Gibbons y Chakraborti encontré esto:

Los estadísticos con signo de Wilcoxon también pueden utilizarse como pruebas de simetría si la única suposición que se hace es que la muestra aleatoria se extrae de una distribución continua... Si se acepta la hipótesis nula, podemos concluir que la población es simétrica y tiene una mediana M 0 . Pero si se rechaza la hipótesis nula, no podemos decir qué parte (o toda) de la afirmación compuesta [nula y alternativa] no es coherente con el resultado de la muestra. Con la alternativa de dos caras, por ejemplo, debemos concluir que o bien la población es simétrica con una mediana no igual a M 0 o la población es asimétrica con una mediana igual a M 0 o la población es asimétrica con una mediana no igual a M 0 . Una conclusión tan amplia no suele ser satisfactoria, y por eso en la mayoría de los casos las hipótesis que justifican un procedimiento de prueba se separan del enunciado de la hipótesis nula.

Creo que esto ayuda a reforzar las otras respuestas aquí para explicar por qué la hipótesis de simetría es considerada como plausible por los investigadores que utilizan este método, pero sin desear necesariamente una prueba formal de la misma basada en los datos de la muestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X