Estoy utilizando una prueba ranksum para comparar la mediana de dos muestras ( $n=120000$ ) y han descubierto que son significativamente diferentes con: p = 1.12E-207
. ¿Debería sospechar de un $p$ -valor o debo atribuirlo a la elevada potencia estadística asociada al hecho de tener una muestra muy grande? ¿Existe un valor sospechosamente bajo? $p$ -¿Valor?
Respuestas
¿Demasiados anuncios?Los valores P en ordenadores estándar (que utilizan valores flotantes de doble precisión IEEE) pueden llegar a ser tan bajos como aproximadamente $10^{-303}$ . Éstos pueden ser cálculos legítimamente correctos cuando los tamaños del efecto son grandes y/o los errores estándar son bajos. Su valor, si se calcula con una distribución T o normal, corresponde a un tamaño del efecto de unos 31 errores estándar. Recordando que los errores estándar suelen escalar con la raíz cuadrada recíproca de $n$ que refleja una diferencia inferior a 0,09 desviaciones típicas (suponiendo que todas las muestras sean independientes). En la mayoría de las aplicaciones, no habría nada sospechoso o inusual en tal diferencia.
Interpretar estos valores p es otra cuestión. Considerando un número tan pequeño como $10^{-207}$ o incluso $10^{-10}$ como probabilidad está sobrepasando los límites de la razón, dadas todas las formas en que la realidad puede desviarse del modelo de probabilidad que sustenta este cálculo del valor p. Una buena opción es informar de que el valor p es inferior al umbral más pequeño que el modelo pueda soportar razonablemente: a menudo entre $0.01$ y $0.0001$ .
No hay nada sospechoso: los valores p extremadamente bajos como el suyo son bastante comunes cuando el tamaño de las muestras es grande (como el suyo para comparar medianas). Como whuber mencionó, normalmente tales p-valores son reportados como siendo menos que algún umbral (por ejemplo <0.001).
Una cosa con la que hay que tener cuidado es que los valores p sólo indican si la diferencia en la mediana es estadísticamente significativo. Si la diferencia es lo suficientemente significativa en magnitud es algo que tendrá que decidir usted: por ejemplo, para conjuntos de muestras grandes, diferencias extremadamente pequeñas en medias/medias pueden ser estadísticamente significativas, pero puede que no signifiquen mucho.
Un valor p puede alcanzar un valor de 0.
Supongamos que estoy probando la hipótesis compuesta sobre el valor de un rango de un 0 uniforme, $\theta$ variable aleatoria. Si establezco $\mathcal{H}_0: \theta = 1$ y muestrear un valor de $X=1.1$ , ya ves que es imposible observar tal valor o superior bajo la hipótesis nula. El valor p es 0.