5 votos

La aplicación de las correcciones de continuidad elimina la equivalencia entre la condición del valor p y la condición de la estadística de la prueba?

Supongamos que la población sigue $Poi(\lambda)$ distribución, quiero probar $H_0: \lambda \geq \lambda_0$ frente a $H_1:\lambda<\lambda_0$ . La variable que solemos utilizar en este tipo de pruebas es $$\frac{\bar X - \lambda}{\left(\frac{\lambda}{n}\right)^{1/2}}\sim^aN(0,1).$$

Yo calcularía el valor p con la corrección como tal:

$$\text{p-value}\approx P\left(N(0,1) \leq \frac{\bar x - \lambda_0 + \frac{1}{2n}}{\left(\frac{\lambda_0}{n}\right)^{1/2}}\right)$$

Este cálculo, lo obtenemos de $P(\sum X_i\leq\sum x_i)=P(\sum X_i\leq\sum x_i+1/2)$ y luego restar y dividir por los términos obvios.

Sin embargo, creo que me confundo un poco al calcular la región de rechazo. Para la dimensión $\alpha$ la región de rechazo se obtendría normalmente a partir de $\alpha=P(\sum X_i < c|H_0)$ , donde $c$ es una constante a determinar. A partir de aquí se procedería como $P(\sum X_i < c-1/2|H_0)$ dando $\alpha=P\left(\frac{\bar X - \lambda_0}{\left(\frac{\lambda_0}{n}\right)^{1/2}}\leq \frac{\bar x - \lambda_0-\frac{1}{2n}}{\left(\frac{\lambda_0}{n}\right)^{1/2}}\right)\approx P(N(0,1)\leq q_{\alpha})$

Pero ahora, parece que la corrección de la continuidad no ha cambiado nada, ya que sigo obteniendo la misma condición ( $z_0<q_{\alpha}$ ) con o sin... ( aunque obtenemos diferentes constantes $c$ 's ).

Así,

  • Sin corrección de continuidad: $z_0<q_{\alpha}$ es equivalente al valor p no corregido $<\alpha$ .
  • Con corrección de continuidad: todavía tenemos $z_0<q_{\alpha}$ que equivale al valor p no corregido $<\alpha$ sin embargo, puede que ya no sea equivalente al valor p corregido $<\alpha$ porque al calcular con el valor p corregido puedo obtener un valor mayor (añadiendo un $1/(2n)$ término) que $\alpha$ en cuyo caso no lo rechazaría, pero aún podría conseguir $z_0<q_{\alpha}$ diciéndome que rechace...

¿Qué estoy haciendo mal?

Edición: Para que quede claro, mi problema es no sin darse cuenta de que obtenemos diferentes constantes $c$ 's. Me doy cuenta de ello, y quizás debería haberlo dicho de forma más explícita. Todo el problema reside en el hecho de que casi todos los programas estadísticos, al hacer las pruebas, además de hacer el valor p, también muestran el estadístico de la prueba $Z_0$ . Sin embargo, como muestro más arriba, el valor p ya no parece equivalente a la condición del test-estadístico. El valor p seguirá siendo equivalente a la condición con las constantes c (corregidas o no).

2voto

manku Puntos 111

Suponga que está probando $H_0: \lambda \le 5$ contra $H_a: \lambda_X < 5)$ con $n = 10$ observaciones aleatorias $X_i$ de la población de Poisson. Sea $T = \sum_{i=1}^{10} X_i,$ donde $T\sim\mathsf{Pois}(\lambda_T = n\lambda_X = 50),$ según $H_0.$

Quieres rechazar $H_0$ a favor de $H_a$ al nivel del 5% para valores pequeños de $T.$ En particular, se quiere rechazar cuando $T \le c,$ donde el valor crítico $c$ se elige de manera que $P(T \le c\,|\,\lambda_T = 50) \le 0.05,$ pero lo más cercano a $0.05,$ estando por debajo de $0.05.$ En R, encontramos que $P(T \le 38\,|\,\lambda_T=50) = 0.474,$ para que pueda probar en el nivel $\alpha = 4.74\%,$ pero no exactamente en $\alpha = 5\%.$

qpois(.05, 50)
[1] 39
ppois(38, 50)
[1] 0.04737066

Si está utilizando una aproximación normal en R, podría aproximar $c$ como $c^\prime = 28.37$ como se indica a continuación, donde $T \stackrel{aprx}{\sim}\mathsf{Norm}(\mu = 50, \sqrt{50}).$

qnorm(.05, 50, sqrt(50))
[1] 38.36913
pnorm(38.37, 50, sqrt(50))
[1] 0.05001271

Esto da la ilustración de una prueba exactamente al nivel del 5%, pero por supuesto el recuento de enteros $T$ no puede ser exactamente 38,37.

Ahora, suponga que sus diez observaciones le dan $T = 35$ o $\bar X = 35/10 = 3.5.$ Entonces el valor P exacto es $P(T \le 35 \,|\, \lambda_T = 50) = 0.0162 < 0.05 = 5\%,$ y rechazas $H_0$ al nivel del 5%.

ppois(35, 50)
[1] 0.01621388

En términos de $T,$ su método usando una aproximación normal, estandarizando, y refiriéndose a tablas impresas de tablas CDF normales sería el siguiente (utilizando la corrección de continuidad):

$$P(T \le 35) = P(T \le 35.5) = P\left(\frac{T-\lambda_T}{\sqrt{\lambda_T}} \le \frac{35.5-50}{7.0711}\right)\\ \approx P(Z \le -2.05) = 0.0202,$$

de las tablas normales de CDF, o de R (como a continuación). A efectos prácticos de decidir si rechazar $H_0$ al nivel del 5%, esto es casi lo mismo que el valor P exacto de Poisson.

pnorm(-2.05)
[1] 0.02018222

Alternativamente, en términos de $\bar X,$ podría encontrar el valor P, utilizando su ecuación, de la siguiente manera:

$$P\left(Z < \frac{\bar X - \lambda_x + 1/2n}{\sqrt{\lambda_x/n}} = \frac{3.5 - 5 + 1/20}{\sqrt{5/10}} = -2.05\right) = 0.0202,$$

como antes.

(3.5 - 5 + 1/20)/sqrt(5/10)
[1] -2.05061

El valor P es la probabilidad en la cola inferior a la izquierda de la línea vertical de puntos.

enter image description here

R odo para la figura:

t = 0:80;  PDF = dpois(t, 50)
hdr = "POIS(50) with Density of NORM(50, 7.0711)"
plot(t, PDF, type="h", lwd=2, main=hdr)
 abline(h = 0, col="green2")
 abline(v = 35.5, col="red", lwd=2, lty="dotted")
 curve(dnorm(x, 50, sqrt(50)), add=T, col="orange")

Adenda: Sin decirlo explícitamente, hemos estado hablando de tres cosas similares, pero no idénticas. Es importante no mezclarlas:

(1) Prueba exacta de Poisson. El valor crítico es $c = 38,$ por lo que su rechazo en el nivel $\alpha = P(T \le 38) = 0.0474.$

ppois(38, 50)
[1] 0.04737066

Si observa $T = 35,$ entonces Rechazar $H_0$ porque $35 \le 38.$ Como alternativa, si desea utilizar un valor P, es $P(T \le 35) = 0.0162,$ y rechazar porque $0.0152 < 0.0474.$

ppois(35, 50)
[1] 0.01621388

(2) Aproximación normal sin corrección de continuidad. ¿Cuál es el valor crítico?

qnorm(.05, 50, sqrt(50))
[1] 38.36913

Se podría decir que es una prueba al nivel del 5% con valor crítico $c = 38.3691.$ Pero eso no puede ser cierto porque $T$ toma valores enteros. Así que el valor crítico real tiene que ser $c = 38$ en el nivel $\alpha = 0.0448.$

pnorm(38, 50, sqrt(50))
[1] 0.04484301

Entonces, si observa $T =35,$ entonces usted rechaza $H_0$ porque $35 \le 38.$ O encuentra el valor P $0.0169$ y usted rechaza porque $0.169 < 0.558.$

pnorm(35, 50, sqrt(50))
[1] 0.01694743

(3) Aproximación normal con corrección de continuidad (en todo).

Como antes, se observa que $38.3691$ corta 5% de la cola inferior de la distribución normal aproximada. Pero, de nuevo $T$ es un número entero y por lo que se decide $c = 38.$ Entonces el nivel verdadero de la prueba (con corrección de continuidad) es $\alpha = P(T \le 38) = P(T < 38.5) = 0.0519 > 0.05.$

pnorm(38.5, 50, sqrt(50))
[1] 0.05193808

Por coherencia, en este punto podría decidir que está bien tener $\alpha$ un poco por encima del 5% debido a la aproximación normal.

Entonces, al observar $T = 35$ podrías rechazar $H_0$ porque $35 \le 38.5$ o puede obtener un valor P aproximado (con corrección de continuidad) $0.0202 < 0.0519,$ y utilizarlo para rechazar.

pnorm(35.5, 50, sqrt(50))
[1] 0.02015249

Por el contrario, si se siente culpable de hacer pruebas en el nivel $5.2\%$ en lugar de $5\%,$ entonces podría revisar el valor crítico a $c = 37,$ $\alpha = 0.0385,$ y el valor P para el observado $T = 35$ a $0.0202.$ Entonces se rechaza debido al pequeño valor observado de $T$ o su pequeño valor P.

pnorm(37.5, 50, sqrt(50))
[1] 0.03854994
pnorm(35.5, 50, sqrt(50))
[1] 0.02015249

Es importante elegir un método y ser coherente en su aplicación a lo largo de todo el proceso.

Desgraciadamente, muchas pruebas pretenden que es posible tener nivel exactamente 5% cuando se utiliza la aproximación aproximación normal. Además, la aproximación normal para pruebas de Poisson suele reservarse para valores hipotéticos valores de $\lambda$ que son lo suficientemente grandes como para que las aproximaciones normales están bien sin la corrección de continuidad corrección.

Casi todos los programas de software estadístico ignoran los valores críticos e informan de los valores P. Algunos utilizan aproximaciones normales (con o sin aviso en la salida), a veces con correcciones de continuidad (con o sin aviso).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X