Suponga que está probando $H_0: \lambda \le 5$ contra $H_a: \lambda_X < 5)$ con $n = 10$ observaciones aleatorias $X_i$ de la población de Poisson. Sea $T = \sum_{i=1}^{10} X_i,$ donde $T\sim\mathsf{Pois}(\lambda_T = n\lambda_X = 50),$ según $H_0.$
Quieres rechazar $H_0$ a favor de $H_a$ al nivel del 5% para valores pequeños de $T.$ En particular, se quiere rechazar cuando $T \le c,$ donde el valor crítico $c$ se elige de manera que $P(T \le c\,|\,\lambda_T = 50) \le 0.05,$ pero lo más cercano a $0.05,$ estando por debajo de $0.05.$ En R, encontramos que $P(T \le 38\,|\,\lambda_T=50) = 0.474,$ para que pueda probar en el nivel $\alpha = 4.74\%,$ pero no exactamente en $\alpha = 5\%.$
qpois(.05, 50)
[1] 39
ppois(38, 50)
[1] 0.04737066
Si está utilizando una aproximación normal en R, podría aproximar $c$ como $c^\prime = 28.37$ como se indica a continuación, donde $T \stackrel{aprx}{\sim}\mathsf{Norm}(\mu = 50, \sqrt{50}).$
qnorm(.05, 50, sqrt(50))
[1] 38.36913
pnorm(38.37, 50, sqrt(50))
[1] 0.05001271
Esto da la ilustración de una prueba exactamente al nivel del 5%, pero por supuesto el recuento de enteros $T$ no puede ser exactamente 38,37.
Ahora, suponga que sus diez observaciones le dan $T = 35$ o $\bar X = 35/10 = 3.5.$ Entonces el valor P exacto es $P(T \le 35 \,|\, \lambda_T = 50) = 0.0162 < 0.05 = 5\%,$ y rechazas $H_0$ al nivel del 5%.
ppois(35, 50)
[1] 0.01621388
En términos de $T,$ su método usando una aproximación normal, estandarizando, y refiriéndose a tablas impresas de tablas CDF normales sería el siguiente (utilizando la corrección de continuidad):
$$P(T \le 35) = P(T \le 35.5) = P\left(\frac{T-\lambda_T}{\sqrt{\lambda_T}} \le \frac{35.5-50}{7.0711}\right)\\ \approx P(Z \le -2.05) = 0.0202,$$
de las tablas normales de CDF, o de R (como a continuación). A efectos prácticos de decidir si rechazar $H_0$ al nivel del 5%, esto es casi lo mismo que el valor P exacto de Poisson.
pnorm(-2.05)
[1] 0.02018222
Alternativamente, en términos de $\bar X,$ podría encontrar el valor P, utilizando su ecuación, de la siguiente manera:
$$P\left(Z < \frac{\bar X - \lambda_x + 1/2n}{\sqrt{\lambda_x/n}} = \frac{3.5 - 5 + 1/20}{\sqrt{5/10}} = -2.05\right) = 0.0202,$$
como antes.
(3.5 - 5 + 1/20)/sqrt(5/10)
[1] -2.05061
El valor P es la probabilidad en la cola inferior a la izquierda de la línea vertical de puntos.
R odo para la figura:
t = 0:80; PDF = dpois(t, 50)
hdr = "POIS(50) with Density of NORM(50, 7.0711)"
plot(t, PDF, type="h", lwd=2, main=hdr)
abline(h = 0, col="green2")
abline(v = 35.5, col="red", lwd=2, lty="dotted")
curve(dnorm(x, 50, sqrt(50)), add=T, col="orange")
Adenda: Sin decirlo explícitamente, hemos estado hablando de tres cosas similares, pero no idénticas. Es importante no mezclarlas:
(1) Prueba exacta de Poisson. El valor crítico es $c = 38,$ por lo que su rechazo en el nivel $\alpha = P(T \le 38) = 0.0474.$
ppois(38, 50)
[1] 0.04737066
Si observa $T = 35,$ entonces Rechazar $H_0$ porque $35 \le 38.$ Como alternativa, si desea utilizar un valor P, es $P(T \le 35) = 0.0162,$ y rechazar porque $0.0152 < 0.0474.$
ppois(35, 50)
[1] 0.01621388
(2) Aproximación normal sin corrección de continuidad. ¿Cuál es el valor crítico?
qnorm(.05, 50, sqrt(50))
[1] 38.36913
Se podría decir que es una prueba al nivel del 5% con valor crítico $c = 38.3691.$ Pero eso no puede ser cierto porque $T$ toma valores enteros. Así que el valor crítico real tiene que ser $c = 38$ en el nivel $\alpha = 0.0448.$
pnorm(38, 50, sqrt(50))
[1] 0.04484301
Entonces, si observa $T =35,$ entonces usted rechaza $H_0$ porque $35 \le 38.$ O encuentra el valor P $0.0169$ y usted rechaza porque $0.169 < 0.558.$
pnorm(35, 50, sqrt(50))
[1] 0.01694743
(3) Aproximación normal con corrección de continuidad (en todo).
Como antes, se observa que $38.3691$ corta 5% de la cola inferior de la distribución normal aproximada. Pero, de nuevo $T$ es un número entero y por lo que se decide $c = 38.$ Entonces el nivel verdadero de la prueba (con corrección de continuidad) es $\alpha = P(T \le 38) = P(T < 38.5) = 0.0519 > 0.05.$
pnorm(38.5, 50, sqrt(50))
[1] 0.05193808
Por coherencia, en este punto podría decidir que está bien tener $\alpha$ un poco por encima del 5% debido a la aproximación normal.
Entonces, al observar $T = 35$ podrías rechazar $H_0$ porque $35 \le 38.5$ o puede obtener un valor P aproximado (con corrección de continuidad) $0.0202 < 0.0519,$ y utilizarlo para rechazar.
pnorm(35.5, 50, sqrt(50))
[1] 0.02015249
Por el contrario, si se siente culpable de hacer pruebas en el nivel $5.2\%$ en lugar de $5\%,$ entonces podría revisar el valor crítico a $c = 37,$ $\alpha = 0.0385,$ y el valor P para el observado $T = 35$ a $0.0202.$ Entonces se rechaza debido al pequeño valor observado de $T$ o su pequeño valor P.
pnorm(37.5, 50, sqrt(50))
[1] 0.03854994
pnorm(35.5, 50, sqrt(50))
[1] 0.02015249
Es importante elegir un método y ser coherente en su aplicación a lo largo de todo el proceso.
Desgraciadamente, muchas pruebas pretenden que es posible tener nivel exactamente 5% cuando se utiliza la aproximación aproximación normal. Además, la aproximación normal para pruebas de Poisson suele reservarse para valores hipotéticos valores de $\lambda$ que son lo suficientemente grandes como para que las aproximaciones normales están bien sin la corrección de continuidad corrección.
Casi todos los programas de software estadístico ignoran los valores críticos e informan de los valores P. Algunos utilizan aproximaciones normales (con o sin aviso en la salida), a veces con correcciones de continuidad (con o sin aviso).