6 votos

¿Cómo preocupado debería estar acerca de la conveniencia de mi antes de?

Como yo lo entiendo, la selección de un previo proporciona algo de un punto de partida para su análisis. A partir de allí, la distribución está formado por los datos observados. Obviamente, cuantos más datos se observa, la mayor discrepancia es posible entre el estado y las distribuciones posteriores (especialmente si el anterior no es apropiado). Como resultado, no tendría sentido que, para algunos de los grandes de n, la selección de una previa es esencialmente irrelevante, ya que los datos observados se abrumar a los anteriores. Es esta, de hecho, el caso? Si es así, ¿esta realmente ocurren en la práctica (o hace que el valor de n necesario ser tan ridículamente grande que el punto es puramente teórico)?

El problema de fondo que me estoy enfrentando es que si tengo el m de puntos de datos y estoy preocupado acerca de la pertinencia de mi antes, ¿cuáles son algunas de las herramientas a mi disposición para determinar si mi preocupación es legítima?

Nota: me doy cuenta de que esta pregunta es muy teórico y que una respuesta concreta no es realmente posible (estoy seguro de que mucho de esto depende de los tipos de distribuciones, cómo inapropiado el prior, etc.), así que me preocupa que esto podría violar la condición de que las preguntas deben ser prácticos", de responder a preguntas basadas en problemas reales que enfrentan." Si este es el caso, por favor hágamelo saber. Soy nuevo en el sitio y en realidad no tienen un agarre firme sobre la etiqueta y sin embargo...

6voto

Jonathan Christensen Puntos 2388

Siempre es posible crear una antes de que le abruman los datos, no importa cómo muchas de las observaciones que usted tiene. Sin embargo, para cualquier fecha anterior, como el número de observaciones crece, la influencia de la previa se reduce (excepto el 0-misa caso de que el Macro señaló en su comentario).

Para algunos antes de distribuciones hay un concepto de "estado de la tamaño de la muestra": si en su anterior tamaño de la muestra es $n_p$ e tiene $n$ observaciones, a continuación, la parte posterior es, en cierto sentido, un promedio ponderado de la previa y datos, ponderada con $n_p$ $n$ respectivamente. La manera más sencilla de ver esto es cuando la distribución Beta se utiliza como una previa para la distribución Binomial, donde el anterior tamaño de la muestra es $\alpha+\beta$. Si yo uso un $\operatorname{Beta}(4,1)$ antes, eso es como decir que yo creo que mi información previa es tan buena como la de 5 observaciones, y espero que el éxito del 80% del tiempo. Si yo, a continuación, observe 5 puntos de datos (digamos 3 éxitos, 2 fallos) mi posterior será entonces $\operatorname{Beta}(7,3)$--ahora mi posterior tiene un valor de 10 observaciones (5 antes de + 5 datos), con una media de .7. La previa es todavía muy fuertemente ponderado aquí. Pero si observo 500 observaciones luego de mi anterior es básicamente irrelevante, debido a que mis datos tamaño de la muestra es 100 veces más grande que la de mi anterior el tamaño de la muestra.

Por otro lado, podría utilizar una $\operatorname{Beta}(8000,2000)$ anterior. En este caso, incluso si he observado 5000 puntos de datos, mi posterior todavía está determinado principalmente por mi antes.

Si estás en un caso en el que es fácil calcular que este tipo de "antes el tamaño de la muestra" (que también incluye modelos comunes, tales como la Normal, Normal, InverseGamma-Normal y Gamma-Poisson), entonces esto te puede dar una idea de la influencia que la previa es en relación a sus datos. De lo contrario, trato de errar en el lado de la difusa de los priores, sobre la base de que es (en general) es mejor sobreestimar su posterior incertidumbre que subestimar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X