Al utilizar la prueba de Shapiro-Wilk, ¿debo fijarme en los valores p o en los valores W para averiguar el valor "más" normal entre mis diferentes muestras (por ejemplo, el coeficiente intelectual, la edad, el peso si estoy realizando la prueba de Shapiro-Wilk sobre el coeficiente intelectual, la edad y el peso y quiero averiguar cuál es el valor más normal, debo fijarme en el valor p o en el W? ¿Y a qué número debería acercarse?)
Respuestas
¿Demasiados anuncios?Estás pidiendo algo así como un tamaño del efecto (una pregunta del tipo "¿cómo de grande?").
Los valores P no miden eso; en un valor dado de W, el valor p tiende a bajar a medida que aumenta n.
El estadístico de Shapiro-Wilk, W, es en cierto sentido una medida de "cercanía a lo que se esperaría ver con la normalidad", similar a una correlación al cuadrado (si no recuerdo mal, la prueba de Shapiro-Francia, estrechamente relacionada, es en realidad una correlación al cuadrado entre los datos y las puntuaciones normales, mientras que el Shapiro Wilk tiende a ser ligeramente mayor; creo recordar que tiene en cuenta las correlaciones entre los estadísticos de orden).
Concretamente, los valores más cercanos a 1 indican "más cerca de lo que se esperaría si la distribución de la que se extrajeron los datos fuera normal".
Sin embargo, hay que tener en cuenta que se trata de una variable aleatoria; las muestras pueden presentar fluctuaciones aleatorias que no representan a sus poblaciones, y los estadísticos de resumen seguirán el mismo camino.
No está claro que tenga necesariamente sentido comparar los estadísticos de Shapiro-Wilk entre conjuntos de datos para declarar que un conjunto es "más normal" que otro; menos aún con variables muy diferentes y tamaños de muestra distintos.
Además, elegir el más cercano a 1 entre una colección de muestras puede ser, en realidad, elegir algo distinto a los valores seleccionados al azar de una distribución normal, por diversas razones. Por ejemplo, las pruebas de bondad de ajuste generalmente tienden a ser pruebas sesgadas; lo que hace que su criterio sea el "más cercano" no es necesariamente lo que la prueba está realmente diseñada para recoger. (Sin embargo, no sé qué tipo de sesgos de muestras pequeñas puede tener específicamente el Shapiro-Wilk).
Por último, no veo ninguna utilidad a este ejercicio. ¿Qué valor puede tener ese procedimiento?
No se puede encontrar el "mayor" valor de la Normal: para eso no está Shapiro-Wilk. Tampoco puedes encontrar el "menor" valor Normal. Todo lo que puede hacer es establecer un umbral de rechazo de errores, por ejemplo, el 5%, y luego utilizar S-W para rechazar (con esa tasa de error) su muestra para la no normalidad. Es el $p$ -valor que hay que mirar: demasiado pequeño (por ejemplo $<0.05$ ) y sus datos pueden ser rechazados como no normales.