4 votos

la forma de pensar frecuentista vs bayesiano?

Estoy aprendiendo acerca de la inferencia bayesiana y he oído que también hay otra inferencia llamada inferencia frecuentista. Todavía no puedo entender la diferencia de la misma forma en que frequentist y bayesian cuentan la probabilidad, ¿alguien puede darme un ejemplo simple de un problema, y ​​cómo frecuentista y bayesiano resuelven el problema?

7voto

BruceET Puntos 7117

Supongamos que se tienen los datos de las encuestas sobre la Proposición de Una en una próxima elección. En una muestra aleatoria de $n = 1000$ espera que los votantes $x = 620$ de personas a favor de la proposición.

Frecuentista de análisis. Hay algunos desconocidos parámetro fijo $\theta,$ cual es la probabilidad de que una persona elegida al azar favorece a la proposición. Se tienen datos de una distribución binomial con parámetros de $n = 1000$ y $\theta,$ y se desea estimar el $\theta.$

La costumbre (máxima verosimilitud) estimación puntual es $\hat \theta = x/n = 620/1000 = 0.62.$ Esta estimación se basa en la maximización de la función de probabilidad $$p(x| \theta) = {n \choose x}\theta^x(1-\theta)^{n-x} \propto \theta^x(1-\theta)^{n-x}$$ con respecto a $\theta.$, por supuesto, no esperamos que la $\theta$ a ser exactamente 0.62, así que buscamos un intervalo que expresa nuestra incertidumbre acerca de este resultado.

Sin entrar en detalles (disponible en casi todas las estadísticas elementales de los textos), un 95% intervalo de confianza (IC), basada en la aproximación normal a la binomial, es de la forma $\hat \theta \pm 1.96\sqrt{\hat \theta(1-\hat \theta)/n}.$ Algo más precisamente, podemos usar $\tilde n = n+4,$ $\tilde \theta = (x+2)/\tilde n,$ para obtener la 'Agresti' intervalo de confianza $\tilde \theta \pm 1.96\sqrt{\tilde \theta(1-\tilde \theta)/\tilde n}.$ La Agresi intervalo de confianza para nuestra encuesta es $(0.5895, 0.6496).$

A grandes rasgos, la idea es que no se $n+1$ posible CIs, uno para cada uno de los posibles valores de $x.$ Algunos de ellos 'cubrir' (incluir) el "verdadero" valor de $\theta,$ y otros no. Para valores dados de $n$ $\theta,$ el binomial de probabilidad ${n \choose x}\theta^x(1-\theta)^{n-x}$ está asociado con cada uno de los CI. Lo ideal (y para la Agresi-estilo intervalo de casi hecho), los intervalos que cubren el verdadero valor de $\theta$ total probabilidad El 95%.

Así, el proceso por el cual el CI se construye implica que cubre el verdadero valor de $\theta$ con una probabilidad de 95%. A un frecuentista, este significa que el proceso de 'obras' 95% del tiempo, en el largo plazo.

Por lo tanto, una vez $x$ es observar y un particular CI se construye, no se debe decir que el verdadero $\theta$ se encuentra en los que la IC con un 95% de probabilidad. Ya sea que se encuentra en el intervalo o no. Pero se nos permite decir que hemos 95% de confianza de que el CI cubre la verdadera $\theta.$

El análisis bayesiano. Usted dice que usted está familiarizado con Bayesiano de ideas, por lo Voy a ser más breve aquí. La distinción crucial es que empezamos con respecto a $\theta$ como una variable aleatoria (no un desconocido constante fija). Si usted no tiene ninguna utilidad antes de información sobre La proposición de Una o de las actitudes de los electores, puede seleccionar un poco informativo previo como $Unif(0,1) \equiv Beta(\alpha_0=1, \beta_0 =1).$

La probabilidad de la función es como en el frecuencial de la discusión anterior. De modo que la parte posterior de la distribución está dada por $$ p(\theta|x) = p(\theta)\times p(x|\theta) \propto \theta^{\alpha_0 -1}(1-\theta)^{\beta_0-1} \times \theta^x(1-\theta)^{n-x} \propto \theta^{621-1}(1-\theta)^{381-1},$$

which we recognize as the kernel of $Beta(621, 381)$. Podríamos usar el media, mediana, modo o de la distribución posterior como una estimación de punto para $\theta$. Una probabilidad simétrica Baysian probabilidad intervalo de $\theta$ es $(0.5895, 0.6496).$

qbeta(c(.025,.975), 621, 381)
## 0.5894984 0.6495697

Sin embargo, debido a una inicial de probabilidad de distribución para el azar variable $\theta$ es proporcionado por el estado, podemos decir que existe la probabilidad de 95% que $\theta$ se encuentra en un determinado intervalo, en el caso particular a la mano.

Por supuesto, si usted tiene algunos significativos de información previa, usted puede elegir un informativo antes. quizás el ligeramente optimista $Beta(330, 270)$. Luego la probabilidad Bayesiana intervalo de' ser $(0.5696, 0.6177).$ A veces los intervalos que se llaman 'los intervalos de credibilidad Bayesianos'.

Reconocimiento: El Bayesiana ejemplo es condensado a partir de Suess Y Trumbo (2010), capítulo 8. La cobertura de las probabilidades para frecuentista binomio CIs se discuten en el capítulo 1.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X