8 votos

prueba de dos muestras de Kolmogorov-Smirnov p-valor en R confusión

Estoy confundido sobre la interpretación apropiada de los valores p devueltos por la prueba de Kolmogorov-Smirnov de dos muestras (ks.test) en R.

En la diapositiva 23 de esta presentación sobre las pruebas no paramétricas de dos muestras, el autor afirma que al analizar los resultados de la prueba ks:

ks.test(male, female)
Two-sample Kolmogorov-Smirnov test
data: male and female 
D = 0.8333, p-value = 0.02597

el valor p

debe multiplicarse por 2 para una prueba de 2 colas. Así pues, P = 0,05194

¿Es eso cierto?

Si utilizáramos la p original = 0,02597, rechazaríamos la hipótesis de que las distribuciones son similares, porque p < 0,05, ¿correcto? Mientras que si la multiplicamos por 2, la p sugeriría que no hay diferencia entre las distribuciones, ya que p > 0,05?

¿Qué me estoy perdiendo?

0 votos

La página del manual de ks.test documenta un parámetro opcional alternative que especifica el tipo de prueba. ¿Por qué no lo usas y ves cuál es la respuesta? (O puedes fiarte de la cuenta de la prueba en la sección "Detalles" de esa página).

0 votos

He mirado el ejemplo en el archivo de ayuda ks.test(). Tanto si utilizaba la opción 'alternative="two-sided"' como si no, el valor p resultante era el mismo. Lo que significa que no es necesario multiplicar, ¿correcto? Entonces, ¿por qué el autor de las diapositivas afirmó que sí lo era?

2 votos

alternative="two-sided" es el por defecto Por eso no ha cambiado nada. Pruebe las otras alternativas. No voy a especular sobre lo que podría haber estado pensando el autor de esa presentación.

5voto

AdamSane Puntos 1825

No, está mal. El Kolmogorov-Smirnov por defecto en R ya tiene dos caras (es decir, ya prueba $F_X\neq F_Y$ en lugar de $F_X<F_Y$ o $F_X>F_Y$ (en los tres casos, habría que añadir "en alguna parte").

Si había hecho una prueba de una cola pero pretendía hacer una prueba de dos colas ( y si la muestra resultó tener una diferencia en la dirección que usted probó), suele ser razonablemente casi correcto duplicar el valor p para una prueba de dos colas, pero estrictamente hablando, sigue siendo incorrecto.

Mientras que en el caso de la prueba t los eventos de rechazo en cada cola son mutuamente excluyentes -por lo que basta con sumar sus probabilidades, y son simétricos, por lo que sumar es duplicar-, en el caso de la prueba de Kolmogorov-Smirnov no son mutuamente excluyentes: cada una de las pruebas de Kolmogorov-Smirnov de una cola puede rechazar la misma muestra. Sin embargo, bajo el nulo es relativamente raro poder rechazar ambas direcciones, por lo que no suele ser una mala aproximación duplicar.

Es simplemente innecesario, ya que el ks.test nos calculará alegremente valores p de dos colas sin hacer nada; de hecho, tenemos que pedir explícitamente uno de una cola.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X