21 votos

¿Es la estadística bayesiana una mejora real con respecto a la estadística tradicional (frecuentista) para la investigación del comportamiento?

Mientras asistía a conferencias, los defensores de la estadística bayesiana para evaluar los resultados de los experimentos han dado un poco de impulso. Se considera que es más sensible, adecuada y selectiva con respecto a los resultados genuinos (menos falsos positivos) que la estadística frecuentista.

He explorado un poco el tema, y hasta ahora no estoy convencido de las ventajas de utilizar la estadística bayesiana. Los análisis bayesianos se utilizaron para refutar Daryl Bem Sin embargo, la investigación de la empresa en apoyo de la precognición, por lo que sigo teniendo una cautelosa curiosidad por saber cómo los análisis bayesianos podrían beneficiar incluso a mi propia investigación.

Así que tengo curiosidad por lo siguiente:

  • Potencia en un análisis bayesiano frente a un análisis frecuentista
  • Susceptibilidad al error de tipo 1 en cada tipo de análisis
  • La compensación de la complejidad del análisis (el bayesiano parece más complicado) frente a los beneficios obtenidos. Los análisis estadísticos tradicionales son sencillos, con pautas bien establecidas para sacar conclusiones. La simplicidad podría considerarse una ventaja. ¿Merece la pena renunciar a ello?

Gracias por cualquier información.

15voto

James Sutherland Puntos 2033

Una respuesta rápida al contenido de las viñetas:

1) Potencia / Error de tipo 1 en un análisis bayesiano frente a un análisis frecuentista

Preguntar por el tipo 1 y la potencia (es decir, uno menos la probabilidad de error de tipo 2) implica que puede poner su problema de inferencia en un marco de muestreo repetido. ¿Puede hacerlo? Si no se puede, no hay más remedio que alejarse de las herramientas de inferencia frecuentista. Si se puede, y si el comportamiento de su estimador a lo largo de muchas muestras es relevante, y si no está particularmente interesado en hacer declaraciones de probabilidad sobre eventos particulares, entonces no hay ninguna razón de peso para cambiar.

El argumento no es que esas situaciones no se den nunca -sin duda lo hacen-, sino que normalmente no se dan en los ámbitos en los que se aplican los métodos.

2) La compensación de la complejidad del análisis (el bayesiano parece más complicado) frente a los beneficios obtenidos.

Es importante preguntarse a dónde va la complejidad. En los procedimientos frecuentistas la aplicación puede ser muy simple, por ejemplo, minimizar la suma de cuadrados, pero la principios pueden ser arbitrariamente complejas, y suelen girar en torno a qué estimador(es) elegir, cómo encontrar la(s) prueba(s) adecuada(s), qué pensar cuando no están de acuerdo. Para un ejemplo, véase el debate aún vivo, recogido en este foro, sobre los diferentes intervalos de confianza para una proporción.

En los procedimientos bayesianos el aplicación pueden ser arbitrariamente complejas incluso en modelos que parecen que "deberían" ser simples, normalmente debido a integrales difíciles, pero el principios son extremadamente simples. Depende más bien de dónde quieras que esté el desorden.

3) Los análisis estadísticos tradicionales son sencillos, con pautas bien establecidas para sacar conclusiones.

Personalmente ya no me acuerdo, pero ciertamente mis alumnos nunca han sido sencillas, sobre todo debido a la proliferación de principios descrita anteriormente. Pero la cuestión no es realmente si un procedimiento es sencillo, sino si está más cerca de ser correcto dada la estructura del problema.

Por último, estoy en total desacuerdo con que haya "pautas bien establecidas para sacar conclusiones" en cualquiera de los dos paradigmas. Y creo que eso es un buena cosa. Seguro que "encontrar p<.05" es una directriz clara, pero ¿para qué modelo, con qué correcciones, etc.? ¿Y qué hago cuando mis pruebas no coinciden? En este caso, como en todos los demás, se necesita un criterio científico o de ingeniería.

5voto

patfla Puntos 1

La estadística bayesiana puede derivarse de algunos principios lógicos. Intente buscar "probabilidad como lógica extendida" y encontrará un análisis más profundo de los fundamentos. Pero básicamente, la estadística bayesiana se apoya en tres "desiderata" o principios normativos básicos:

  1. La verosimilitud de una proposición debe ser representada por un único número real
  2. La verosimilitud de una proposición debe tener una correspondencia cualitativa con el "sentido común". Si se da una verosimilitud inicial $p(A|C^{(0)})$ , a continuación, cambiar de $C^{(0)}\rightarrow C^{(1)}$ tal que $p(A|C^{(1)})>p(A|C^{(0)})$ (A se vuelve más plausible) y también $p(B|A C^{(0)})=p(B|AC^{(1)})$ (dado A, B sigue siendo igual de plausible) entonces debemos tener $p(AB| C^{(0)})\leq p(AB|C^{(1)})$ (A y B deben ser al menos igual de plausibles) y $p(\overline{A}|C^{(1)})<p(\overline{A}|C^{(0)})$ (no A debe ser menos plausible).
  3. La verosimilitud de una proposición debe calcularse sistemáticamente . Esto significa que a) si una verosimilitud puede razonarse de más de una manera, todas las respuestas deben ser iguales; b) en dos problemas en los que se nos presente la misma información, debemos asignar las mismas verosimilitudes; y c) debemos tener en cuenta toda la información disponible. No debemos añadir información que no existe, ni ignorar la que sí tenemos.

Estos tres desiderata (junto con las reglas de la lógica y la teoría de conjuntos) determinan de forma única las reglas de suma y producto de la teoría de la probabilidad. Por tanto, si se quiere razonar según los tres desiderata anteriores, se debe adoptar un enfoque bayesiano. No es necesario adoptar la "filosofía bayesiana", pero sí los resultados numéricos. Los tres primeros capítulos de este libro describirlos con más detalle, y proporcionar la prueba.

Y por último, pero no menos importante, la "maquinaria bayesiana" es la herramienta de procesamiento de datos más potente que tiene. Esto se debe principalmente al desiderátum 3c) de utilizar toda la información que se tiene (esto también explica por qué Bayes puede ser más complicado que no Bayes). Puede ser bastante difícil decidir "qué es relevante" utilizando tu intuición. El teorema de Bayes lo hace por ti (y lo hace sin añadir suposiciones arbitrarias, también debido a 3c).

EDIT: para abordar la cuestión de forma más directa (como se sugiere en el comentario), suponga que tiene dos hipótesis $H_0$ y $H_1$ . Usted tiene una pérdida "falsa negativa" $L_1$ (Rechazar $H_0$ cuando es verdadero: error de tipo 1) y la pérdida de "falso positivo" $L_2$ (Aceptar $H_0$ cuando es falsa: error de tipo 2). la teoría de la probabilidad dice que debe:

  1. Calcular $P(H_0|E_1,E_2,\dots)$ , donde $E_i$ son todas las pruebas relacionadas con la prueba: datos, información previa, lo que que desea que el cálculo incorpore en el análisis
  2. Calcular $P(H_1|E_1,E_2,\dots)$
  3. Calcular las probabilidades $O=\frac{P(H_0|E_1,E_2,\dots)}{P(H_1|E_1,E_2,\dots)}$
  4. Aceptar $H_0$ si $O > \frac{L_2}{L_1}$

Aunque realmente no es necesario introducir las pérdidas. Si sólo miras las probabilidades, obtendrás uno de estos tres resultados: i) definitivamente $H_0$ , $O>>1$ ii) definitivamente $H_1$ , $O<<1$ o iii) "no concluyente". $O\approx 1$ .

Ahora bien, si el cálculo resulta "demasiado difícil", hay que aproximar las cifras o ignorar alguna información.

Para un ejemplo real con números elaborados ver mi respuesta a esta pregunta

2voto

No estoy familiarizado con la Estadística Bayesiana pero sé que el Episodio 294 de la Guía Escéptica del Universo tiene una entrevista con Eric-Jan Wagenmakers donde se habla de la Estadística Bayesiana. Aquí hay un enlace al podcast: http://www.theskepticsguide.org/archive/podcastinfo.aspx?mid=1&pid=294

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X