11 votos

¿Cuál es la diferencia entre los Z-scores y los p-values?

En los algoritmos de motivos de red, parece bastante común devolver tanto un valor p como un puntaje Z para una estadística: "La red de entrada contiene X copias del subgrafo G". Se considera que un subgrafo es un motivo si cumple

  • valor p < A,
  • puntaje Z > B y
  • X > C, para algunos valores de A, B y C definidos por el usuario (o la comunidad).

Esto motiva la pregunta:

Pregunta: ¿Cuáles son las diferencias entre valor p y puntaje Z?

Y la subpregunta:

Pregunta: ¿Existen situaciones en las que el valor p y el puntaje Z de la misma estadística podrían sugerir hipótesis opuestas? ¿Son las primeras y segundas condiciones mencionadas anteriormente esencialmente lo mismo?

9voto

patfla Puntos 1

Basándome en tu pregunta, diría que no hay diferencia entre las tres pruebas. Es decir, siempre puedes elegir A, B y C de tal manera que se llegue a la misma decisión independientemente del criterio que estés utilizando. Aunque necesitas que el valor p se base en la misma estadística (es decir, el Z-score)

Para usar el Z-score, se asume que tanto la media $\mu$ como la varianza $\sigma^2$ son conocidas, y se asume que la distribución es normal (o asintóticamente/aproximadamente normal). Supongamos que el criterio del valor p es el usual 5%. Entonces tenemos:

$$p=Pr(Z>z)<0.05\rightarrow Z>1.645\rightarrow \frac{X-\mu}{\sigma}>1.645\rightarrow X > \mu+1.645\sigma$$

Así que tenemos el triple $(0.05, 1.645, \mu+1.645\sigma)$ que representan todos los mismos límites.

Nota que la misma correspondencia se aplicará al t-test, aunque los números serán diferentes. La prueba de dos colas también tendrá una correspondencia similar, pero con números diferentes.

6voto

Tom Jalinki Puntos 11

El valor de $p$ indica qué tan improbable es la estadística. El puntaje $z$ indica qué tan lejos está de la media. Puede haber una diferencia entre ellos, dependiendo del tamaño de la muestra.

Para muestras grandes, incluso pequeñas desviaciones de la media se vuelven improbables. Es decir, el valor de $p$ puede ser muy pequeño incluso para un bajo puntaje $z$. Por el contrario, para muestras pequeñas, incluso grandes desviaciones no son improbables. Es decir, un puntaje $z$ grande no necesariamente significará un valor de $p$ pequeño.

3voto

Ben Puntos 1464

Un $Z$-score describe su desviación de la media en unidades de desviación estándar. No es explícito si usted acepta o rechaza su hipótesis nula.

Un valor $p$ es la probabilidad de que bajo la hipótesis nula pudiéramos observar un punto tan extremo como su estadística. Esto le dice explícitamente si rechaza o acepta su hipótesis nula dado un tamaño de prueba $\alpha$.

Considere un ejemplo donde $X\sim \mathcal{N}(\mu,1)$ y la hipótesis nula es $\mu=0$. Luego observa $x_1=5$. Su $Z$-score es 5 (lo que solo le dice qué tan lejos se desvía de su hipótesis nula en términos de $\sigma$) y su valor $p$ es 5.733e-7. Para una confianza del 95%, tendrá un tamaño de prueba $\alpha=0.05$ y dado que $p<\alpha$, entonces rechaza la hipótesis nula. Pero para cualquier estadística dada, debería haber algún equivalente $A$ y $B$ tal que las pruebas sean las mismas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X