Como @whuber preguntó en los comentarios, una validación para mi NO categórico. edición: con la prueba de shapiro, ya que la prueba ks de una muestra se está utilizando incorrectamente. Whuber tiene razón: Para el uso correcto de la prueba de Kolmogorov-Smirnov, tienes que especificar los parámetros de distribución y no extraerlos de los datos. Sin embargo, esto es lo que se hace en paquetes estadísticos como SPSS para una prueba ks de una muestra.
Intentas decir algo sobre la distribución, y quieres comprobar si puedes aplicar una prueba t. Por lo tanto, esta prueba se realiza para confirmar que los datos no se desvían significativamente de la normalidad lo suficiente como para hacer inválidas las suposiciones subyacentes del análisis. Por lo tanto, no estás interesado en el error de tipo I, sino en el error de tipo II.
Ahora hay que definir "significativamente diferente" para poder calcular el n mínimo para una potencia aceptable (digamos 0.8). Con distribuciones, eso no es fácil de definir. Por lo tanto, no respondí a la pregunta, ya que no puedo dar una respuesta sensata aparte de la regla empírica que uso: n > 15 y n < 50. ¿Basado en qué? Básicamente en la intuición, por lo que no puedo defender esa elección aparte de la experiencia.
Pero sé que con solo 6 valores tu error de tipo II está casi en 1, lo que hace que tu potencia sea casi 0. Con 6 observaciones, la prueba de Shapiro no puede distinguir entre una distribución normal, de poisson, uniforme o incluso exponencial. Con un error de tipo II casi en 1, tu resultado de la prueba no tiene sentido.
Para ilustrar la prueba de normalidad con la prueba de shapiro:
shapiro.test(rnorm(6)) # prueba una distribución normal
shapiro.test(rpois(6,4)) # prueba una distribución poisson
shapiro.test(runif(6,1,10)) # prueba una distribución uniforme
shapiro.test(rexp(6,2)) # prueba una distribución exponencial
shapiro.test(rlnorm(6)) # prueba una distribución log-normal
La única en la que cerca de la mitad de los valores son menores que 0.05, es la última. Que también es el caso más extremo.
si quieres averiguar cuál es el n mínimo que te da una potencia que te gusta con la prueba de shapiro, se puede hacer una simulación como esta:
results <- sapply(5:50,function(i){
p.value <- replicate(100,{
y <- rexp(i,2)
shapiro.test(y)$p.value
})
pow <- sum(p.value < 0.05)/100
c(i,pow)
})
que te da un análisis de potencia como este:
de lo cual concluyo que necesitas aproximadamente mínimo 20 valores para distinguir una distribución exponencial de una normal en el 80% de los casos.
código de plot:
plot(lowess(results[2,]~results[1,],f=1/6),type="l",col="red",
main="Simulación de potencia para distribución exponencial",
xlab="n",
ylab="potencia"
)
0 votos
es.wikipedia.org/wiki/Significancia_estadística
0 votos
Realmente me gusta la respuesta de whuber en general (en lo que se refiere a pruebas estadísticas y muestras pequeñas). En este caso, sin embargo, creo que se debería animar al usuario a dar más detalles sobre el contexto. Sin más información, creo que la respuesta de Joris Meyer anterior está justificada.
6 votos
Yo, por mi parte, tengo dificultades para imaginar un contexto en el que n=6 y la normalidad sería una hipótesis que valga la pena probar. Me temo que este es un caso de un usuario inexperto haciendo pruebas de hipótesis múltiples (correr una regresión y luego probar la normalidad de los residuos) y que estamos abordando los síntomas pero ignorando los esqueletos en el armario, por así decirlo.
3 votos
@user Es injusto especular sobre el que pregunta. ¡Abordemos la pregunta, ¿de acuerdo? Entonces, supongamos que planeas calcular un límite de predicción superior para un valor que se utilizará para tomar una decisión costosa. El valor del LP será sensible a las suposiciones de normalidad. Estás bastante seguro de que el proceso de generación de datos no es normal, pero los datos son caros y tardan mucho tiempo en generarse. Experimentos previos sugieren que $n=6$ será lo suficientemente potente para rechazar la normalidad. (Acabo de describir un marco estándar para programas de monitoreo de aguas subterráneas en los EE. UU.)
3 votos
User603 (sobre tu primer comentario): Me gustaría señalar que @Joris no ha proporcionado una respuesta, ni su comentario está acompañado de ninguna justificación. Si un "no" enfático es una respuesta válida en general a esta pregunta, vamos a verlo escrito así, con un argumento de apoyo, para que la comunidad pueda evaluarlo de arriba abajo.
2 votos
@whuber: He añadido un argumento para la enfática "no".
1 votos
@Joris ¡Gracias! Eso es útil e ilustrativo.
1 votos
De alguna manera relacionado: Prueba de normalidad: '¿Esencialmente inútil?'
0 votos
@nico Buena referencia, gracias. La respuesta aceptada (por Joris Meys, por cierto) tiene ejemplos claros de la situación para grandes $n$, donde las dificultades se invierten: las pruebas de normalidad se vuelven demasiado poderosas.
0 votos
Esto está fuera de tema porque el OP pregunta sobre pruebas t y normalidad. ¿Pero vale la pena discutir algunas alternativas no paramétricas que no asumen normalidad? ¿Y (solo un tiro al aire), ¿hay alguna posibilidad de que los mismos sujetos te estén dando tanto una muestra A como una muestra B? Si es así, entonces algunas pruebas que aprovechen esto podrían tener más poder en la pregunta científica en la que estás interesado. ¡Whuber y @Joris maravillosas respuestas! Los novatos como yo pueden mirar estos ejemplos de cómo tratar de ser útiles en este sitio.
0 votos
@whuber: gracias por el ejemplo. Me preguntaba, ¿es un rechazo de la normalidad, en el caso que presentas, un fin en sí mismo? es decir, ¿no se asume un H_1 a priori en este caso? El siguiente ejemplo: supongamos que en una muestra se rechaza la normalidad porque 2 observaciones están ubicadas muy a la derecha de las otras, mostrando evidencia de una asimetría derecha en las concentraciones de toxinas, mientras que en otro ejemplo la prueba rechaza la normalidad porque todas las observaciones están agrupadas cerca una de otra ('platikúrtico').
0 votos
Mi pregunta entonces es: en el primer caso, se podría concluir presumiblemente que ya hay suficiente evidencia de más riesgos que normalidad y, por lo tanto, no es necesario realizar más muestreos. Pero, ¿qué pasa con el segundo caso? En ese caso hipotético, ¿interpretarías el segundo caso como indicando la misma acción (no se necesitan más muestras)? Si no es así, ¿no estás utilizando implícitamente la información previa de que, por ejemplo, la muestra es normal o tiene sesgo hacia la derecha cuando realizas la prueba de normalidad en tu ejemplo?
0 votos
Lo que mi pregunta intenta aclarar es lo siguiente: una prueba de normalidad cuando se tiene información previa sobre cuál es la alternativa probable tiene sentido incluso cuando n es tan pequeño como 6 (y parte de tu respuesta es señalar esto). Pero la necesidad de esa información (sobre la alternativa probable asumida) es precisamente la razón por la que hubiera preferido que el OP diera más contexto a su pregunta, ya que, como indica la respuesta de Joris Meys, el curso de acción seguro (cuando n = 6) depende en gran medida de cómo se pondera la importancia respectiva de los errores T1 y T2.
1 votos
@usuario Excelentes puntos en tus últimos tres comentarios. Responder las preguntas sobre la evaluación de riesgos llevaría demasiado tiempo y nos llevaría demasiado lejos; tendré que contentarme con señalar que probar las distribuciones no es un objetivo, pero es necesario (¡por ley!) como parte de evaluar las características de rendimiento del procedimiento de decisión, ya sea determinando que se ha liberado contaminación en el medio ambiente o simplemente calculando un LSC de una media para un análisis posterior. La prueba de normalidad se lleva a cabo de forma continua para identificar posibles fallas de un procedimiento de decisión predeterminado.
0 votos
¿Es el título de la publicación (vs. el texto) el problema? @whuber responde que se puede probar con tamaño controlado incluso con $n=6$. Joris responde (esencialmente) que no se debe hacer selección de modelos de esta manera. Creo que ambos dieron respuestas excelentes y correctas a diferentes preguntas (título vs. texto). También sugeriría el libro de Good para pruebas con pequeñas $n$ (permutación, bootstrap), si no estás ligado por regulaciones gubernamentales (que me han hecho querer retirarme al mundo teórico de la estadística por el resto del día).
0 votos
@David Estoy teniendo problemas para interpretar el título o el texto como principalmente relacionados con la "selección de modelos". El texto pregunta sobre cómo encontrar un procedimiento de decisión apropiado. Concedo que uno podría concebir este proceso como uno iterativo de selección de modelos y selección de procedimientos, pero no tiene por qué serlo (y en aplicaciones formales, como ensayos clínicos, cumplimiento normativo, etc., no puede involucrar la selección de modelos en absoluto). Por supuesto, si la pregunta se reinterpreta como "¿es n=6 suficiente para la selección de modelos?", ¡la respuesta a menudo (¡pero no siempre!) es "no".