7 votos

Es el significado de la p-valor fiable con muy pequeños tamaños de muestra?

Como soy completamente nuevo en las estadísticas y los ensayos clínicos, quisiera pedir su ayuda y aclaración.

Supongamos que tenemos 2 muy pequeñas muestras (cada uno de n = 2, o así) que se derivan de dos distribuye normalmente, infinito poblaciones (con sigma de cada ser desconocido). Nos gustaría comprobar si el medio de esas poblaciones son significativamente diferentes (alfa = 0,05). Para ello, llevamos a cabo una prueba t para diferencia de los medios y alcanzar la significación estadística (valor de p = 0.04).

Me dijeron, que este enfoque es erróneo y no se puede inferir a partir de la p-valor derivado de la prueba de un tamaño pequeño de la muestra. Yo no entiendo por qué.

Sé, que si el tamaño de la muestra es tan pequeña:

  • no podemos prueba de normalidad para la población (y t-test se basa en este la asunción)
  • la media de nuestra muestra es más probable que se aleje de la media de la población es
  • la varianza de la muestra es más probable que se subestime

Pero pensé, que si:

  • Ya sé, que mi población está distribuida normalmente
  • SD de la media depende del tamaño de la muestra
  • t-test tiene en cuenta el número con el subestima la varianza de la población (por el hecho de que la distribución t depende del tamaño de la muestra y el más pequeño es el tamaño de la muestra, más la varianza es subestimado; estoy en lo cierto?)

esto resuelve todos los problemas. Sé que de esta manera voy a recibir realmente enorme intervalos de confianza, pero todavía soy capaz de alcanzar la trascendencia, cuando las diferencias son lo suficientemente grandes. Como yo lo entiendo, más amplios intervalos de confianza son "una pena" de la inexactitud de las estimaciones de población media y la varianza. Pero, ¿por qué p-valor debe ser considerado mal así? La distribución es normal, así que no estoy violando ninguna hipótesis.

Si el valor de p no significativo (p>0.05) yo definitivamente no inferir que la hipótesis nula es verdadera, porque sé que esta prueba es probable que sea de poca potencia. Yo sólo quiero saber cómo puedo interpretar el obtenido importantes p-valor y por qué no es tan valioso, como significativa una p-valor derivado de la muestra de n=30?

Para ampliar este problema, ¿qué pasaría si la distribución de la población no eran conocidos, y he utilizado algún tipo de test no paramétrico de la prueba, en lugar de la mencionada prueba de t?

Gracias!

4voto

Ted Puntos 854

Si usted sabe que ellos están distribuidos normalmente, usted está a la derecha (con la adición, como @gung señala, que las desviaciones deben ser qual). El uso de la t estadística con los grados de libertad apropiados significa que este enfoque está bien a pesar del pequeño tamaño de la muestra.

Sobre su segunda pregunta acerca de qué hacer si la distribución de la población no se conoce, no dependería de que no paramétrica de la prueba utilizada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X