30 votos

Prueba de Kolmogorov-Smirnov frente a la prueba t

Tengo algunas dificultades para entender la interpretación de la prueba KS de 2 muestras, y en qué se diferencia de una prueba t normal entre 2 grupos.

Digamos que tengo hombres y mujeres haciendo alguna tarea y recojo algunas puntuaciones de esa tarea. Mi objetivo final es determinar si los hombres y las mujeres tienen un rendimiento diferente en esa tarea

Así que una cosa que podría hacer es correr una prueba t entre los 2 grupos. Otra cosa que podría hacer es calcular la ECDF para hombres y mujeres, representarla gráficamente y realizar la prueba KS de 2 muestras. Obtendría algo así:

enter image description here

Prueba K-S

La hipótesis nula para la prueba KS es que los dos conjuntos de distribuciones de puntuación continua proceden de la misma población

Al realizar la prueba KS, obtengo: D = 0,18888, valor p = 0,04742

En primer lugar, quiero comprobar que mi interpretación de los resultados es correcta. En este caso, rechazaría la hipótesis nula y diría que las distribuciones de puntuaciones de hombres y mujeres proceden de poblaciones diferentes. O, en otras palabras, que la distribución de las puntuaciones masculinas y femeninas son diferentes entre sí.

Más concretamente, los varones tienden a tener una mayor probabilidad de obtener puntuaciones más bajas en esta tarea, y esa es la diferencia entre los 2 sexos según interpreto del gráfico

Prueba T

Ahora una prueba t probará la diferencia entre las medias de hombres y mujeres en la variable de puntuación.

Imaginemos el caso de que el rendimiento de los hombres sea peor que el de las mujeres en esta tarea. En ese caso, la distribución de las puntuaciones masculinas se centrará en una media baja, mientras que la distribución de las puntuaciones femeninas se centrará en una media alta. Este escenario estaría en consonancia con el gráfico anterior, ya que los hombres tendrán una mayor probabilidad de obtener puntuaciones más bajas

Si la prueba t resulta significativa, llegaría a la conclusión de que las mujeres obtienen una puntuación media significativamente superior a la de los hombres. O, en términos poblacionales, las puntuaciones de las mujeres proceden de una población cuya media es superior a la de los hombres, lo que suena muy parecido a la conclusión de la EK de que proceden de poblaciones diferentes.

¿Cuál es la diferencia?

Por lo tanto, la conclusión que yo sacaría tanto en el caso de la prueba KS como en el de la prueba t es la misma. Los varones obtienen malos resultados en comparación con las mujeres. Entonces, ¿cuál es el beneficio de utilizar una prueba sobre la otra? ¿Hay algún conocimiento nuevo que pueda obtener al utilizar la prueba KS?

A mi modo de ver, los varones con una distribución centrada en una media baja, y las mujeres centradas en una media alta es lo que provoca la prueba t significativa. Pero por ese mismo hecho Los hombres tendrán una mayor probabilidad de obtener valores más bajos, lo que haría que el gráfico fuera como el de arriba y diera una prueba KS significativa. Así que los resultados de ambas pruebas tienen la misma causa subyacente, pero tal vez se podría argumentar que una prueba KS tiene en cuenta algo más que las medias de las distribuciones y también considera la forma de la distribución, pero ¿es posible analizar la causa de la prueba KS significativa a partir de los resultados de la prueba?

Entonces, ¿qué valor tiene realizar una prueba KS en lugar de una prueba t? Y supongamos que puedo cumplir los supuestos de la prueba t para esta pregunta

28voto

AdamSane Puntos 1825

Como ejemplo de por qué querría utilizar la prueba de Kolmogorov-Smirnov de dos muestras:

Imagina que las medias de la población fueran similares pero las varianzas fueran muy diferentes. La prueba de Kolmogorov-Smirnov podría detectar esta diferencia, pero la prueba t no.

O imagina que las distribuciones tienen medias y sd similares pero los hombres tienen una distribución bimodal (rojo) mientras que las mujeres (azul) no:

enter image description here

¿Los hombres y las mujeres tienen un rendimiento diferente? Sí, los hombres tienden a puntuar en torno a 7,5-8 o 12,5-13, mientras que las mujeres tienden a puntuar más hacia el medio (cerca de 10 o así), pero están mucho menos agrupadas en torno a ese valor que los dos valores a los que tienden los hombres.

Así que el Kolmogorov-Smirnov puede encontrar tipos de diferencias en la distribución mucho más generales que la prueba t.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X