Como soy completamente nuevo en las estadísticas y los ensayos clínicos, quisiera pedir su ayuda y aclaración.
Supongamos que tenemos 2 muy pequeñas muestras (cada uno de n = 2, o así) que se derivan de dos distribuye normalmente, infinito poblaciones (con sigma de cada ser desconocido). Nos gustaría comprobar si el medio de esas poblaciones son significativamente diferentes (alfa = 0,05). Para ello, llevamos a cabo una prueba t para diferencia de los medios y alcanzar la significación estadística (valor de p = 0.04).
Me dijeron, que este enfoque es erróneo y no se puede inferir a partir de la p-valor derivado de la prueba de un tamaño pequeño de la muestra. Yo no entiendo por qué.
Sé, que si el tamaño de la muestra es tan pequeña:
- no podemos prueba de normalidad para la población (y t-test se basa en este la asunción)
- la media de nuestra muestra es más probable que se aleje de la media de la población es
- la varianza de la muestra es más probable que se subestime
Pero pensé, que si:
- Ya sé, que mi población está distribuida normalmente
- SD de la media depende del tamaño de la muestra
- t-test tiene en cuenta el número con el subestima la varianza de la población (por el hecho de que la distribución t depende del tamaño de la muestra y el más pequeño es el tamaño de la muestra, más la varianza es subestimado; estoy en lo cierto?)
esto resuelve todos los problemas. Sé que de esta manera voy a recibir realmente enorme intervalos de confianza, pero todavía soy capaz de alcanzar la trascendencia, cuando las diferencias son lo suficientemente grandes. Como yo lo entiendo, más amplios intervalos de confianza son "una pena" de la inexactitud de las estimaciones de población media y la varianza. Pero, ¿por qué p-valor debe ser considerado mal así? La distribución es normal, así que no estoy violando ninguna hipótesis.
Si el valor de p no significativo (p>0.05) yo definitivamente no inferir que la hipótesis nula es verdadera, porque sé que esta prueba es probable que sea de poca potencia. Yo sólo quiero saber cómo puedo interpretar el obtenido importantes p-valor y por qué no es tan valioso, como significativa una p-valor derivado de la muestra de n=30?
Para ampliar este problema, ¿qué pasaría si la distribución de la población no eran conocidos, y he utilizado algún tipo de test no paramétrico de la prueba, en lugar de la mencionada prueba de t?
Gracias!