6 votos

La prueba de hipótesis con Neyman–Pearson (encontrar el corte de los cuantiles de la distribución de Poisson dist)

Actualmente estoy tratando de resolver un problema que debe ser muy fácil, pero estoy perplejo, y ayuda sería muy apreciada!!

El fondo de la cuestión es este:

P: El número de errores de escritura en un periódico puede ser modelada por una distribución de Poisson con media $μ$. Cada una de las $31$ a los estudiantes en un curso de periodismo son asignados al azar a una edición pasada de la Guardia periódico y preguntó a encontrar el número de errores de escritura que contiene. El número total de errores encontrados por los estudiantes es $120$, es decir,$\sum_{i=1}^{n}y_i=120$.

Se ha postulado por el instructor del curso que hay un promedio de $5$ errores de escritura en cada edición de La Guardia. El editor del periódico se opuso, alegando que el promedio es menor que $5$ por edición. Quieres probar esto con al $5\%$ de nivel de significación.

Aquí es donde empiezo mi trabajo

Así que quiero probar: $H_0:\mu_o=5$$H_a:\mu_a<5$.

De acuerdo a la Neyman Pearson lema, podemos crear el más poderoso de la prueba buscando en la razón de verosimilitud (LR). He simplificado el LR y obtuve lo siguiente, que creo que es correcto, ¡ojalá!

$$LR= e^{-n\mu_a+n\mu_0}(\frac{\mu_a}{\mu_0})^{\sum_{i=1}^{n}y_i}$$

Now looking at the ratio, and the fact that $\mu_a<\mu_0$, we can see that effectively our test statistic is $\sum_{i=1}^{n}y_i$, and as it increases, we get less comfortable rejecting $H_0$, since it makes our LR smaller.

Now this is where I am stuck:

Now I know that to reject $H 0$, I need to find the cut off value where $\sum_{i=1}^{n}y_i \le k$ where $k$ is the cutoff value.

So since $\sum_{i=1}^{n}y_i$ is our test statistic, we can say that we have $n=31$ independent Poisson distributions which leads our test statistic to have $n\mu_0$ Poisson distribution. I am unsure if what I just did is correct or not, but assuming it is, we next want to find $k$. Using $R$, we have our test statistic model $n\mu_0$ $=$ $31\cdot4=124$ which we can use in $R$.

qpois(0.05 ( = nivel de significación) ,124) ( = nuestro nuevo parámetro para la media de la virtud H_0) = 106

lo cual es incorrecto. Espero que esto aclare la confusión! Muchas gracias a todos!!

4voto

AdamSane Puntos 1825

Aparte de un par de oddnesses con la notación, que parecen tener casi tengo resuelto.

Este bit está mal, aunque:

Ahora para encontrar el valor de k donde se podría rechazar H0 cuando el número total de errores no es mayor que k, podemos no sólo el uso de R con el siguiente código:

qpois(0.05 = the alpha level,5 = value of null)

Usted tiene que pegarse con el número observado de errores a través de la muestra. Con 31 personas, no se observa sólo un par de errores. Si intenta trabajar con el número de errores por persona (es decir, se divide el número total de errores por el número de personas), es ya no una distribución de Poisson, pero a la escala de Poisson (toma valores que son múltiplos de $\frac{1}{31}$), y el ignorar la distinción que se le dará a usted la pena. Es mejor trabajar con la variable de tipo entero, "el número total de errores".

Bajo la hipótesis nula, la distribución de $\sum_i y_i$ tiene una distribución puede trabajar fácilmente.

Usted puede utilizar la inversa de la cdf, o cuantil de la función (qpois R) para calcular el valor crítico que usted necesita para su rechazo de la regla, pero tenga cuidado acerca de lo que se le da. Si no está claro por qué debe restar 1 como whuber sugerido, usted debe utilizar el cdf (ppois R) para calcular el real nivel de significación para el rechazo de la regla que proponemos; que debe hacer es obvio el por qué. (Alternativamente, se puede dibujar un diagrama de lo que está pasando, y que pronto debe quedar claro.)

Aquí he dibujado la función de probabilidad para el recuento total de una similar, pero con problemas diferentes (uno con diferentes números):

enter image description here

El objetivo es encontrar el valor de$C$, con lo cual el rendimiento de un tipo de la tasa de error de no más de 0,05 (la suma de todas las probabilidades hasta, e incluyendo, como se sugiere por el corsé debajo del diagrama). Si mantiene esa recta, que debe tener pocos problemas de trabajo lo que está pasando

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X