5 votos

¿Por qué son Bayesiano métodos ampliamente considerado como particularmente "conveniente"?

Varias veces me he encontrado (en conferencias, artículos, etc.) informal de la tangencial de los comentarios que tiene la siguiente forma:

Cuestiones filosóficas aparte, métodos Bayesianos son extremadamente conveniente.

...con la implicación es que son más "conveniente" (o "a la mano", "fácil", etc.) de competencia ("frecuentista"?) métodos1. Como se puede deducir de la afirmación del preámbulo, los comentarios suelen provenir de personas que no se describen a sí mismos como "Bayesians". (Esto es lo que yo significaba para sugerir por el adverbio "ampliamente" en este post del título: es decir, incluso entre los "no-Bayesians", Bayesiano métodos son considerados particularmente conveniente.)

Lo que se trata de métodos Bayesianos que los hacen tan conveniente?

La mejor respuesta a esta pregunta que se me ocurre es que Bayesiano métodos de obviar la necesidad de hacer algunos por lo demás, bastante arbitrarias decisiones acerca de los parámetros, y el conjunto de modelos. En su lugar, el Bayesiano formalismo sirve como una forma de principios para ocuparse al mismo tiempo de toda conjuntos de parámetros y modelos (ponderado por su correspondiente priores).

Ahora, mi conocimiento de "estadística Bayesiana" es tenue en el mejor, así que no ponen mucha fe en esta explicación. Me encantaría ver un mayor conocimiento de elaboración.


1 Un ejemplo que puedo citar es un ensayo reciente por Gelman y Shalizi, donde los autores rechazan la "historia habitual" (es decir, la interpretación convencional de la estadística Bayesiana) como su razón para el uso de métodos Bayesianos, y dicen que en lugar de que el uso de ellos, ya que con ellos se puede "encajar lo suficientemente rico como modelos" (presumiblemente más rica que la que podría encajar con la no-Bayesiano métodos). Por desgracia, este es el único duro de referencia que pueda proporcionar. Los otros fueron en forma de charla comentarios, o en el pasado de la lectura que ya no puedo recordar específicamente.

8voto

En mi opinión personal, creo que los métodos bayesianos son extremadamente convenientes en el sentido de que sólo hay que especificar cuatro ingredientes principales para resolver problemas de inferencia, predicción y toma de decisiones.

Estas preguntas abarcan casi toda la disciplina de la estadística: describir un conjunto de datos $D$ generalizando hacia fuera de forma inferencial a partir de $D$ , predecir nuevos datos $D^*$ y ayudar a las personas a tomar decisiones en presencia de la incertidumbre.

Dado el conjunto $\mathcal{B}$ de proposiciones que resumen sus antecedentes suposiciones y juicios sobre cómo funciona el mundo en cuanto a $\theta$ , $D$ y datos futuros $D^*$ están preocupados:

(a) Es natural (y de hecho debes estar preparado como bayesiano) especificar dos distribuciones de probabilidad condicional:

  • $p(\theta|\mathcal{B})$ para cuantificar toda la información sobre el exterior a $D$ que Usted juzgue pertinente; y
  • $p(D|\theta,\mathcal{B})$ para cuantificar su incertidumbre predictiva, dado $\theta$ sobre el conjunto de datos $D$ antes de que llegue.

(b) Dadas las distribuciones de (a), la distribución $p(\theta|D,\mathcal{B})$ cuantifica toda la información relevante sobre $\theta$ tanto internos como externos a $D$ , y debe calcularse mediante el Teorema de Bayes: $$p(\theta|D,\mathcal{B})=c\times p(D|\theta,\mathcal{B})p(\theta|\mathcal{B})\hspace{.75cm}\text{(inference)}$$ donde $c > 0$ es una constante de normalización elegida para que el lado izquierdo de la ecuación anterior integre (o sume) sobre $\Theta$ a 1.

(c) Su distribución predictiva $p(D^*|\theta,D,\mathcal{B})$ para datos futuros $D^*$ dado el conjunto de datos observados $D$ debe ser expresable de la siguiente manera:

$$p(D^*|D,\mathcal{B})=\int_{\Theta}p(D^*|\theta,D,\mathcal{B})p(\theta|D,\mathcal{B})d\theta$$ a menudo no hay información sobre $D^*$ ontenido en $D$ si se conoce, en cuyo caso esta expresión se simplifica a $$p(D^*|\mathcal{B})=\int_{\Theta}p(D^*|\theta,D,\mathcal{B})p(\theta|D,\mathcal{B})d\theta\hspace{.75cm}\text{(prediction)}$$ (d) tomar una decisión sensata sobre qué acción $a$ que debes tomar ante ante su incertidumbre sobre $\theta$ Sin embargo, debe estar preparado para especificar

(i) el conjunto $\mathcal{A}$ de acciones factibles entre las que está eligiendo, y

(ii) una función de utilidad $U(a,\theta)$ , tomando valores en $\mathbb{R}$ y cuantificar sus juicios sobre las recompensas (monetarias o de otro tipo) que si se opta por la acción. $a$ y la incógnita tomó realmente el valor $\theta$ (sin pérdida de generalidad se pueden tomar valores grandes de $U(a,\theta$ ) sea mejor que los valores pequeños) entonces la decisión óptima es elegir la acción $a$ que maximiza la expectativa de $U(a,\theta)$ en $p(\theta|D,\mathcal{B})$ es decir, $$a=\arg\max_{a\in\mathcal{A}}\mathbb{E}_{(\theta|D,\mathcal{B})}U(a,\theta)=\arg\max_{a\in\mathcal{A}}\int_{\Theta}U(a,\theta)p(\theta|D,\mathcal{B})d\theta\hspace{.75cm}\text{(decision making)}$$

Y, por lo tanto, existe un marco muy simple y sencillo para llevar a cabo el análisis estadístico en el marco bayesiano. Una vez más, todo lo que hay que especificar son los siguientes cuatro ingredientes: $p(\theta|\mathcal{B}),p(D|\theta,\mathcal{B})$ las posibles acciones $a$ y la función de utilidad $U(a,\theta)$ .

Ahora bien, por muy conveniente que sea, no hay una guía completa en el marco bayesiano que realmente diga cómo spefficy esos cuatro ingredientes y esto es realmente la parte subjetiva y difícil desde el punto de vista bayesiano. La verdadera conveniencia del marco bayesiano viene del hecho de que si se está preparado para especificar esos cuatro ingredientes, entonces hay una rutina clara para llevar a cabo la mayor parte del razonamiento estadístico. Pero, una vez más, esto es sólo mi opinión.

1voto

Brettski Puntos 5485

Razones por las que I Creo que son convenientes, trabajando en un campo que todavía está dominado por la estadística frecuentista, pero donde un análisis "bayesiano" tiene cierto caché:

  • Los intervalos creíbles son increíbles, en el sentido de que pueden interpretarse como la gente realmente quiere interpretar los intervalos de confianza del análisis frecuentista. En general, esta es una ventaja de los métodos bayesianos, ya que son más fáciles de traducir en declaraciones en "inglés sencillo".
  • Por "bayesiano" a veces la gente quiere decir "MCMC". Es bastante fácil argumentar que esto es incorrecto, pero un análisis "bayesiano" que utiliza MCMC y priores no informativos puede ocasionalmente superar problemas computacionales con los que los métodos basados en la verosimilitud tendrían dificultades.
  • Un análisis bien hecho, con un conjunto de factores previos muy cuidadosamente considerados, puede preparar el escenario para "cómo este hallazgo cambia la comprensión del campo de $TOPIC" sin ninguna aportación adicional de esfuerzo.

Dicho esto, no sé si realmente los consideraría más conveniente que la estadística frecuentista convencional desde el punto de vista del análisis/codificación, aunque los paquetes bien escritos y cosas como la sentencia BAYES en SAS ayudan mucho.

1voto

Loren Pechtel Puntos 2212

Soy un novato en todo esto, pero me parece que el modelo bayesiano "Prior * Likelihood = Posterior" es simple y flexible, lo que significa "conveniente".

Por ejemplo, sus priores están explícitamente indicados y su procedimiento no cambia porque usted elija diferentes priores. Yo podría mirar su análisis y decidir que otras priores parecen más realistas y podría utilizar el mismo procedimiento que usted. Puede que esté simplificando demasiado, pero mi sensación sobre los métodos frecuentistas es que tienden a tener suposiciones implícitas de tipo a priori y uno elige su método en función de las suposiciones que acepta.

Los priores se pueden utilizar fácilmente para mantener los posteriors alejados de las condiciones límite incómodas (valores negativos para los recuentos, por ejemplo). El procedimiento bayesiano también es naturalmente iterativo y refleja el proceso científico: los resultados de los experimentos/teoría previos se convierten en sus priores, y los posteriors de su experimento se convierten naturalmente en priores para la experimentación posterior.

Los posterios son convenientes porque no son puntos o incluso intervalos, sino distribuciones. Esto hace que sea conveniente hacer varias cosas sin un complicado análisis posterior. Por ejemplo, si quiere determinar si dos parámetros son iguales, puede simplemente mirar las diferencias de sus muestras posteriores, tomar los cuantiles apropiados y decidir si son iguales (diferencia cercana a cero) o no.

Una prueba frecuentista puede rechazar o no rechazar el nulo. Un análisis bayesiano tiene tres posibilidades: aceptar, rechazar y no tener suficiente información. Es conveniente cuando se puede aceptar una hipótesis en lugar de no rechazarla.

Como dice EpiGrad, los intervalos creíbles coinciden con la intuición humana y responden realmente a la pregunta que la mayoría de nosotros nos hacemos. Son sencillos de calcular y no requieren un modelo para hacerlo: para un IC del 95% se toman los cuantiles 0,025 y 0,975 de su posterior. Es sencillo.

Como también dice EpiGrad, algunas personas pueden estar confundiendo MCMC y los métodos bayesianos, ya que el análisis bayesino del mundo real casi siempre estará basado en MCMC. MCMC es un bonito procedimiento genérico de caja negra, lo que es conveniente - usted podría vivir toda su vida bayesiana en BUGS, JAGS, o Stan. Conveniente. Aunque, por supuesto, puede haber una gran cantidad de ajustes y análisis involucrados en la determinación de que el procedimiento MCMC ha convergido realmente y realmente explora toda la densidad. Lo que podría ser el lado oscuro de la estadística bayesiana.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X