12 votos

¿Por qué la estadística bayesiana es un tema de investigación cada vez más popular?

Si se examina el área de investigación de los 100 mejores programas de estadística del US News, casi todos ellos se dedican a la estadística bayesiana. Sin embargo, si voy a una escuela de nivel inferior, la mayoría de ellas siguen haciendo investigación estadística clásica/frecuentista. Por ejemplo, mi escuela actual (clasificada entre 150 y 200 en el ranking mundial QS de estadística, por lo que no se considera una escuela de alto nivel) sólo tiene un profesor que se centra en la estadística bayesiana y hay casi un resentimiento hacia la estadística bayesiana. Algunos estudiantes de posgrado con los que he hablado incluso dicen que los estadísticos bayesianos hacen estadísticas bayesianas porque sí, algo con lo que, por supuesto, no estoy en absoluto de acuerdo.

Sin embargo, me pregunto por qué es así. Tengo varias conjeturas:

(a) no hay suficiente espacio para los avances en la metodología de la estadística clásica/frecuentadora y la única investigación viable en la investigación de la estadística clásica/frecuentadora es la de las aplicaciones, que será el foco principal de la escuela de nivel inferior, ya que la escuela de nivel superior debería inclinarse más hacia la investigación teórica y metodológica.

(b) Depende en gran medida del campo. Cierta rama de la estadística es simplemente más adecuada para la estadística bayesiana, como muchas aplicaciones científicas del método estadístico, mientras que otra rama es más adecuada para la estadística clásica, como el área financiera. (Corrígeme si me equivoco) Teniendo en cuenta esto, me parece que las escuelas de alto nivel tienen muchas facultades de estadística que hacen aplicaciones en el campo científico, mientras que los departamentos de estadística de las escuelas de bajo nivel se centran principalmente en las aplicaciones en el área financiera, ya que les ayuda a generar ingresos y financiación.

(c) Hay grandes problemas con el método frecuentista que no pueden ser resueltos, por ejemplo, la tendencia al sobreajuste del MLE, etc. Y el bayesiano parece proporcionar una solución brillante.

(d) La potencia de cálculo está aquí, por lo que el cálculo bayesiano ya no es un cuello de botella como lo era hace 30 años.

(e) Esta puede ser la conjetura más opinable que tengo. Hay una resistencia por parte de los estadísticos clásicos/frecuentadores a los que no les gusta una nueva ola de metodología que puede llegar a superar el papel de las estadísticas clásicas. Pero, como dijo Larry Wasserman, depende de lo que intentemos hacer y todo el mundo debería mantener la mente abierta, especialmente como investigador.

1 votos

Aunque las opiniones de los habitantes de la CV varían, y esta opinión se considera fuera de tema, vale la pena señalar que exactamente esta pregunta se responde en los capítulos introductorios de los textos modernos sobre el análisis bayesiano. En particular, el capítulo 1 de Gelman, et al Análisis bayesiano de datos 3ª Ed. Se reduce a: a) el "sentido común" y b) el muy problemático intervalo de confianza frecuentista que el 99% de nosotros no puede evitar malinterpretar. El camino lo malinterpretamos es intrínsecamente bayesiano, así que también podríamos hacer un análisis bayesiano desde el principio.

3 votos

@Peter Leopold Medio en serio: ¿el 99%? y ¿quiénes son "nosotros"? Muchos usuarios ingenuos de la estadística tienen, en efecto, graves ideas erróneas sobre los IC, pero si te diriges a la comunidad de CV, espero que el 99% no encaje realmente. Los estadísticos pueden ser tan malos como cualquier otra persona a la hora de inventarse números en ausencia de datos concretos.

0 votos

@NickCox Me dirigía al OP, y el "nosotros" pretende ser empático e inclusivo. Esperemos que el "99%" se reconozca como una estimación de orden de magnitud $\sim 10^{-2}$ . También es la fracción más grande del tener/no tener tropo en la cultura popular, donde los que no tienen en este contexto indican el evento: "Hice estadística 101, pero no he interiorizado del todo la interpretación frecuentista frente a la bayesiana de los intervalos de confianza frente a los intervalos creíbles". Y ahora que me has llamado la atención, ¡afirmaré (:D) que es mi previa oficial para ese evento! Naturalmente, ¡estoy dispuesto a que me convenzan de lo contrario! :D

9voto

Cliff AB Puntos 3213

Personalmente, me atrevería a hacer algunas conjeturas:

(1) La estadística bayesiana ha experimentado un enorme aumento de popularidad en las dos últimas décadas. Esto se debe, en parte, a los avances en MCMC y a la mejora de los recursos informáticos. La estadística bayesiana ha pasado de ser un método teóricamente muy bueno, pero sólo aplicable a problemas de juguete, a un enfoque que puede aplicarse de forma más universal. Esto significa que, hace varios años, decir que se trabajaba en estadística bayesiana probablemente hacía que se fuera a contratar a alguien muy competitivo.

Ahora bien, yo diría que la estadística bayesiana sigue siendo una ventaja, pero también lo es trabajar en problemas interesantes sin utilizar métodos bayesianos. A falta La falta de formación en estadística bayesiana sería sin duda un inconveniente para la mayoría de los comités de contratación, pero obtener un doctorado en estadística sin una formación suficiente en métodos bayesianos sería bastante sorprendente.

(2) Los estadísticos bayesianos mencionarán "bayesiano" en su CV. Los frecuentistas no suelen poner "frecuentista" en su CV, sino más bien el área en la que trabajan (es decir, análisis de supervivencia, modelización predictiva, previsión, etc.). Por ejemplo, gran parte de mi trabajo consiste en escribir algoritmos de optimización, lo que supongo que implica que usted diría que hago trabajo frecuencial. También he escrito una buena parte de algoritmos bayesianos, pero es ciertamente una minoría de mi trabajo. La estadística bayesiana está en mi CV, la frecuencial no.

(3) Hasta cierto punto, lo que has dicho en tu pregunta también es cierto. La computación bayesiana general eficiente tiene más problemas abiertos que el ámbito frecuentista. Por ejemplo, el Hamiltonian Monte Carlo se ha convertido recientemente en un algoritmo muy interesante para el muestreo genérico de modelos bayesianos. No hay mucho margen de mejora de genérico optimización hoy en día; los algoritmos Newton Raphson, L-BFGS y EM cubren muchas bases. Si se quiere mejorar estos métodos, generalmente hay que especializarse mucho en el problema. Así, es más fácil decir "trabajo en la optimización de modelos geoespaciales en alta dimensión" que "trabajo en la estimación de máxima verosimilitud en alta dimensión". El mundo del aprendizaje automático es un poco una excepción a esto, ya que hay mucho entusiasmo en descubrir nuevos métodos de optimización estocástica (es decir, SGD, Adam, etc.), pero eso es una bestia ligeramente diferente por algunas razones.

Del mismo modo, hay que trabajar en la elaboración de buenas preconcepciones para los modelos. Métodos frecuenciales hacer tienen un equivalente a esto (dar con buenas penalizaciones, es decir, LASSO, glmnet), pero probablemente hay un terreno más fértil para los antecedentes sobre las penalizaciones.

(4) Por último, y esto es sin duda una opinión personal, mucha gente asocia el frecuentismo con los valores p. Dado el mal uso generalizado de los valores p que se observa en otros campos, a muchos estadísticos les encantaría distanciarse lo máximo posible de los usos erróneos actuales de los valores p.

3 votos

Así que la respuesta a por qué se ha vuelto más popular incluye (1) se ha vuelto más popular. Eso me deja perplejo, pero me imagino que sólo es cuestión de necesitar una nueva redacción.

0 votos

@NickCox: mi punto es que es más popular, pero también su popularidad puede ser algo exagerada. Es decir, la OP vio que la Estadística Bayesiana estaba en el CV de casi todos los profesores de una muestra de universidades de primer nivel. Pero eso no significa que cada uno de esos profesores sólo haga estadística bayesiana. Otro punto sobre (1) es que creo que hay fue una época en la que hacer estadística bayesiana como área de investigación era muy importante para conseguir un puesto de alto nivel. Ya no es un requisito tan estricto, pero muchos de los profesores que se ven ahora fueron contratados en esa época.

0 votos

Oh, veo su punto. Me estaba centrando en la discusión del "¿Es porque no hay suficiente espacio para avanzar en la estadística clásica/frecuentadora?" y no tanto en el "¿por qué está pasando esto?".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X