En R, tengo una muestra de 348 medidas, y quiero saber si me puede asumir que está normalmente distribuida para pruebas futuras.
Fundamentalmente, tras otra Pila respuesta, estoy buscando en la densidad de la trama y de la Q de parcela con:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
No tengo una gran experiencia en las Estadísticas, pero se ven como ejemplos de distribuciones normales que he visto.
Entonces estoy ejecutando el test de Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
Si interpreto correctamente, me dice que es seguro para rechazar la hipótesis nula, que es que la distribución es normal.
Sin embargo, me he encontrado con dos Pila de posts (aquíy aquí), que fuertemente socavar la utilidad de esta prueba. Parece como si la muestra es grande (es de 348 considerado como grande?), es decir siempre que la distribución no es normal.
¿Cómo debo interpretar eso? Debo seguir con el QQ plot y asumir mi distribución es normal?