67 votos

Cuando hice el frecuentista-Bayesiano debate ir?

El mundo de la estadística se divide entre frequentists y Bayesians. Estos días parece que todo el mundo hace un poco de ambos. ¿Cómo puede ser esto? Si los distintos enfoques que son adecuados para diferentes problemas, ¿por qué los padres fundadores de la estadística no ver esto? Alternativamente, se tiene que el debate lo ganó Frequentists y la verdad subjetiva Bayesians se trasladó a la teoría de la decisión?

61voto

bheklilr Puntos 113

De hecho, me medianamente en desacuerdo con la premisa. Todo el mundo es un Bayesiano, si realmente se tiene una distribución de probabilidad dado a ellos como antes. El problema viene cuando no es así, y creo que todavía hay un buen tamaño se dividen en ese tema.

Habiendo dicho que, sin embargo, estoy de acuerdo en que más y más personas están menos dispuestos a luchar guerras santas y acaba de obtener con hacer lo que le parezca apropiada en cualquier situación dada.

Yo diría que, como la profesión de avanzada, de ambos lados di cuenta de que había méritos en el otro lado de enfoques. Bayesians se dio cuenta de que evaluar cuán bien Bayesiano procedimientos haría si se utiliza una y otra vez (por ejemplo, no esta de credibilidad de 95% intervalo (CI) que contienen en realidad el verdadero parámetro de alrededor de 95% del tiempo?) se requiere un frecuentista de outlook. Sin esto, no hay calibración de que "el 95%" a cualquiera en el mundo real número. La robustez? La construcción de modelos a través de la iterativo de ajuste, etc.? Ideas que surgieron en el frecuentista mundo, y fueron adaptados por Bayesians a partir de la década de 1980. Frequentists se dio cuenta de que la regularización era buena, y el uso es bastante común en estos días - y Bayesiana de los priores puede ser fácilmente interpretado como la regularización. No paramétrica de modelado a través de splines cúbicos, con una función de penalización? Tu pena es mi antes! Ahora todos podemos conseguir a lo largo.

La otra influencia importante, creo yo, es la asombrosa cifra de mejora en la disponibilidad de software de alta calidad que le permiten hacer el análisis de forma rápida. Este viene en dos partes: algoritmos, por ejemplo, el muestreo de Gibbs y de Metropolis-Hastings, y el software en sí, R, SAS, ... yo podría estar más de una pura Bayesiano si tuviera que escribir todo el código en C (que simplemente no tienen el tiempo para intentar otra cosa), sino como lo que es, voy a utilizar gam en el mgcv paquete en R cualquier momento de mi modelo, parece que puede encajar en ese marco, sin demasiado opresivo, y yo soy mejor estadístico. La familiaridad con el de tu oponente, métodos, y dándose cuenta de cuánto esfuerzo se puede guardar / mejor calidad puede proporcionar el uso de ellos en algunas situaciones, incluso a pesar de que puede no ajustarse al 100% en su defecto marco para pensar acerca de un problema, es un gran antídoto contra el dogmatismo.

37voto

StasK Puntos 19497

Esta es una pregunta difícil de responder. El número de personas que realmente lo tanto, es todavía muy limitado. Núcleo duro Bayesians despreciar a los usuarios de la corriente principal de las estadísticas de su uso de los $p$-valores, un sentido, internamente inconsistentes estadística para Bayesians; y la corriente principal de los estadísticos no sé Bayesiano métodos lo suficientemente bien como para comentar sobre ellos. A la luz de esto, usted verá un montón de críticas de la hipótesis nula pruebas de significación en Bayesiana de la literatura (van tan lejos como en cerca de la pura biología o puro revistas de psicología), con poca o ninguna respuesta de mainstreamers.

Se produce un conflicto de manifestación como "¿quién ganó el debate" en las estadísticas de la profesión. Por un lado, la composición promedio de un departamento de estadística es que en la mayoría de los lugares, usted encontrará 10-15 mainstreamers vs 1-2 Bayesians, a pesar de que algunos departamentos son puramente Bayesiano, sin mainstreamers en todo, salvo quizá para los puestos de consultoría (Harvard, Duque, Carnegie Mellon, British Columbia, la ciudad de Montreal en América del Norte; soy menos familiarizados con la escena Europea). Por otro lado, se verá que en las revistas como JASA o JRSS, probablemente el 25-30% de los documentos son Bayesiano. En cierto modo, el Bayesiano renacimiento puede ser algo así como la explosión de ANOVA papeles en la década de 1950: en aquel entonces, la gente pensaba que casi cualquier estadística problema puede enmarcarse como un ANOVA problema; ahora, la gente piensa que casi cualquier cosa puede ser resuelto con el derecho MCMC.

Mi sensación es que las áreas aplicadas, no se molestan en averiguar los detalles filosóficos, y sólo tiene que ir con lo que es más fácil trabajar con. Bayesiana a la metodología es demasiado complicado: en la parte superior de estadística, también es necesario aprender el arte de la computación (configuración de la muestra, el bloqueo, la convergencia de diagnóstico, bla-bla-bla) y estar preparados para defender su priores (en caso de uso objetivo de los priores, o en caso de que el uso informativo de los priores si el campo está muy asentado en la velocidad de la luz se 3e8 m/s, o incluso si la elección de la previa afecta si su posterior será adecuada o no). Así que en la mayoría de los médicos o de la psicología o la economía de las aplicaciones, usted verá los enfoques prevalecientes en los documentos escritos por los sustantivos a los investigadores, aunque también se puede ver ocasional de la visión de un Bayesiano de papel, que ha sido escrito por más sofisticados que los metodólogos, o en colaboración con un estadístico Bayesiano, el solo hecho de que era la persona en una oficina local del departamento para hacer este trabajo de colaboración.

Un área en la que, creo, marco Bayesiano es todavía corto es el modelo de diagnóstico-y que es un área importante para los profesionales. En Bayesiano mundo, para diagnosticar un modelo, usted necesita para construir una más complicado y elige la que tiene un mejor ajuste Bayesiano factor o BIC. Así que si no te gusta el supuesto de normalidad para su regresión lineal, se puede construir una regresión con los Estudiantes de los errores, y dejar que los datos de generar una estimación de los grados de libertad, o que pueden llegar a ser todo de lujo y tienen un proceso de Dirichlet para tu términos de error y hacer algo de M-H saltos entre los diferentes modelos. El enfoque convencional sería construir un Q-Q plot de studentized de residuos y eliminar los valores extremos, y este es, de nuevo, de una manera mucho más simple.

He editado un capítulo en un libro sobre esto -- ver http://onlinelibrary.wiley.com/doi/10.1002/9780470583333.ch5/summary. Es un arquetipo de papel, en que se dio alrededor de 80 referencias en este debate, todo el apoyo a la Bayesiana punto de vista. (Le pregunté al autor para extenderla en una versión revisada, lo cual dice mucho de ti :) ). Jim Berger de Duke, uno de los principales Bayesiano teóricos, dio una serie de conferencias, y escribió un número de muy pensativo artículos sobre el tema.

14voto

John Richardson Puntos 1197

Hay una buena razón para tener ambos, y es que un buen artesano que desee seleccionar la mejor herramienta para la tarea a la mano, y el método Bayesiano y frecuentista métodos tienen aplicaciones donde son la mejor herramienta para el trabajo.

Sin embargo, a menudo la herramienta equivocada para el puesto de trabajo se utiliza porque frecuentista estadísticas son más susceptibles a una "estadísticas de libro de cocina" que hace que sean más fáciles de aplicar en la ciencia y la ingeniería de sus Bayesiano homólogos, aunque el Bayesiano métodos de proporcionar una respuesta directa a la pregunta planteada (que es generalmente lo que podemos inferir a partir de la muestra particular de datos). No estoy mucho en favor de este como el "libro de cocina" enfoque conduce a la utilización de las estadísticas sin una sólida comprensión de lo que estamos haciendo, que es por qué las cosas como el p-valor de la falacia de los cultivos de nuevo y de nuevo.

Sin embargo, a medida que avanza el tiempo, las herramientas de software para el enfoque Bayesiano mejorarán y serán utilizados con más frecuencia como jbowman afirma con razón.

Soy un Bayesiano por inclinación (parece tener mucho más sentido para mí que el enfoque frecuentista), sin embargo me terminan usando frecuentista estadísticas en mis papeles, en parte, porque voy a tener problemas con los revisores, si yo uso la estadística Bayesiana, ya que será "no estándar".

Por último (un poco en broma ;o), la cita de Max Plank "Una nueva verdad científica no triunfa convenciendo a sus oponentes y haciéndoles ver la luz, sino más bien porque sus oponentes llegan a morir y crece una nueva generación que está familiarizada con él."

10voto

Aaron McDaid Puntos 335

No creo que el Frequentists y Bayesians dar diferentes respuestas a las mismas preguntas. Yo creo que ellos están preparados para responder a diferentes preguntas. Por lo tanto, creo que no tiene sentido hablar mucho acerca de un lado ganar, o incluso a hablar de compromiso.

Considerar todas las preguntas que podría pedir. Muchos son, sencillamente, imposible de preguntas ("¿Cuál es el verdadero valor de $\theta$?"). Es más útil considerar el subconjunto de estas preguntas que pueden ser contestadas dado varios supuestos. El subgrupo más grande es la pregunta que puede ser contestada en donde se permita el uso de los priores. Llamar a este conjunto de BF. Existe un subconjunto de BF, que es el conjunto de preguntas que no dependen de ninguna antes. Llamar a este segundo subconjunto F. F es un subconjunto de BF. Definir B = BF \ B.

Sin embargo, no podemos elegir que las preguntas a responder. Con el fin de hacer inferencias útiles sobre el mundo, a veces tenemos que responder a las preguntas que están en la B y que significa el uso previo.

Idealmente, dado un estimador que iba a hacer un análisis exhaustivo. Usted podría utilizar una antes, pero también sería genial si se pudiera probar cosas buenas acerca de su estimador que no dependen de ninguna antes. Eso no significa que usted puede deshacerse de la anterior, tal vez las preguntas más interesantes requieren previamente.

Todo el mundo está de acuerdo en cómo responder a las preguntas de la F. La preocupación es si el realmente interesantes preguntas están en F o en B?

Un ejemplo: un paciente camina hacia el doctor y es saludable(H) o enfermo(S). Hay una prueba que corremos, que volverá positivo(+) o negativo(-). La prueba nunca se da falsos negativos - yo.e $\mathcal{P}(-|S) = 0$. Pero a veces dan falsos positivos - de $\mathcal{P}(+|H) = 0.05$

Tenemos una pedazo de tarjeta y la prueba de la máquina de escribir + o - en un lado de la tarjeta. Imagínese, si puede, que tenemos un oráculo que de alguna manera sabe la verdad, y este oráculo escribe el verdadero estado, H o S, en el otro lado de la tarjeta antes de poner la tarjeta en un sobre.

Como estadísticamente-médico capacitado, ¿qué podemos decir acerca de la tarjeta en el envolope antes de abrir la tarjeta? Las siguientes instrucciones pueden ser realizadas (estos se encuentran en F por encima de la):

  • Si en un lado de la tarjeta, entonces el otro lado será de +. $\mathcal{P}(+|S) = 1$
  • Si H, entonces el otro lado será de + 5% de probabilidad, con un 95% de probabilidad. $\mathcal{P}(-|H) = 0.95$
  • (resumen de los dos últimos puntos) La probabilidad de que los dos lados de partido es al menos el 95%. $\mathcal{P}( (-,S) \cup (+,H) ) \geq 0.95$

No sabemos lo que $\mathcal{P}( (-,S) )$ o $\mathcal{P}( (+,H) )$ es. En realidad no podemos contestar que sin algún tipo de antes para $\mathcal{P}(S) de dólares. Pero podemos hacer declaraciones acerca de la suma de las dos probabilidades.

Esto es lo más lejos que podemos ir tan lejos. Antes de abrir el sobre, se puede hacer muy declaraciones positivas acerca de la precisión de la prueba. Hay (al menos) un 95% de probabilidad de que el resultado de la prueba coincide con la verdad.

Pero, ¿qué pasa cuando realmente nos abra la tarjeta? Dado que el resultado de la prueba es positivo (o negativo), ¿qué podemos decir acerca de si están sanos o enfermos?

Si la prueba es positiva (+), no hay nada que podamos decir. Tal vez ellos están sanos, y tal vez no. Dependiendo de la actual prevalencia de la enfermedad ($\mathcal{P}(S)$) podría darse el caso de que la mayoría de los pacientes que den positivo son saludables, o podría darse el caso de que la mayoría de los enfermos. No podemos poner fronteras en el este, sin antes dejarnos poner algunos límites en $\mathcal{P}(S) de dólares.

En este sencillo ejemplo, es claro que a todo el mundo con un resultado negativo de la prueba es saludable. No hay resultados falsos negativos, y por lo tanto todos estadístico estará feliz de enviar el paciente a casa. Por lo tanto, no tiene sentido pagar por el asesoramiento de un especialista en estadística, a menos que el resultado de la prueba ha sido positiva.

Los tres puntos de las viñetas anteriores son correctas, y bastante simple. Pero también son inútiles! La pregunta realmente interesante, en este, ciertamente, se las ingenió modelo, es:

$$ \mathcal{P}(S|+) $$

y esto no puede ser contestada sin $\mathcal{P}(S)$ i.e antes, o al menos algunos límites en la previa)

No voy a negar que esta es quizás una de la simplificación del modelo, sino que demuestra que si queremos hacer útiles las declaraciones acerca de la salud de los pacientes, debemos empezar nosotros algunos antes de creencia acerca de su salud.

6voto

Omar Salinas Puntos 350

Como verás, hay un buen montón de frecuentista-Bayesiano debate. De hecho, creo que es más caliente que nunca, y menos dogmática. Usted podría estar interesado en mi blog: http://errorstatistics.com

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X