136 votos

Lo que está mal con XKCD del Frequentists vs Bayesians cómic?

xkcd comic number 1132

Este comic de xkcd (Frequentists vs Bayesians) hace que la diversión de un frecuentista estadístico que se deriva de una, obviamente, el resultado es incorrecto.

Sin embargo a mí me parece que su razonamiento es realmente correcto en el sentido de que sigue el estándar frecuentista de la metodología.

Así que mi pregunta es "¿de aplicar correctamente los frecuentista metodología?"

  • Si no: ¿qué sería correcta frecuentista de la inferencia en este escenario? Cómo integrar a los "conocimientos previos" sobre el sol, la estabilidad en el frecuentista de la metodología?
  • Si sí: wtf? ;-)

50voto

Wandang Puntos 120

El principal problema es que el primer experimento (Sol ido nova) no es repetible, lo que la hace altamente inadecuado para frecuentista metodología que interpreta la probabilidad como la estimación de la frecuencia de un evento es dar que podemos repetir el experimento muchas veces. En contraste, la probabilidad bayesiana se interpreta como nuestro grado de creencia de dar todo el conocimiento previo disponible, por lo que es adecuado para el sentido común, el razonamiento acerca de uno de los eventos del tiempo. La tirada de dados experimento se puede repetir, pero me parece muy raro que cualquier frecuentista intencionalmente ignorar la influencia del primer experimento y tan confiados en la significación de los resultados obtenidos.

Aunque parece que el autor se burla de la dependencia frecuencial en experimentos repetibles y su desconfianza de los priores, dando la falta de adecuación de la instalación experimental para el frecuentista metodología diría que el verdadero tema de este cómic no es frecuentista metodología pero ciega siguiente de la inadecuada metodología en general. Si es gracioso o no, depende de usted (para mí lo es) pero creo que más engaña a la que aclara las diferencias entre los dos enfoques.

41voto

Sathish Puntos 13

¿Por qué este resultado parece "mal?" Un Bayesiano diría que el resultado parece contra-intuitivo porque tenemos "antes de" creencias acerca de cuando el sol va a explotar, y la evidencia proporcionada por esta máquina no es suficiente para lavar esas creencias (sobre todo porque es de incertidumbre debido a la moneda de volteo). Pero un frecuentista es capaz de hacer una evaluación, simplemente se debe hacer en el contexto de los datos, en contraposición a la creencia.

El verdadero origen de la paradoja es el hecho de que la estadística frecuentista de la prueba realizada no tienen en cuenta todos los datos disponibles. No hay ningún problema con el análisis en el cómic, pero el resultado parece extraño, porque sabemos que el sol lo más probable es que no explotan por un largo tiempo. Pero, ¿CÓMO sabemos esto? Porque hemos hecho las mediciones, observaciones y simulaciones que puede limitar cuando el sol va a explotar. Así, nuestro conocimiento completo debe hacer las mediciones y los datos de los puntos en cuenta.

En un análisis Bayesiano, esto se hace mediante el uso de las medidas para la construcción de un antes (aunque, el procedimiento para convertir las mediciones en un previo no está bien definido: en algún punto debe haber una inicial antes, o de lo contrario "las tortugas todo el camino hacia abajo"). Así, cuando el Bayesiano utiliza su antes, él realmente tomar en cuenta una gran cantidad de información adicional que el frecuentista de la p-análisis de valor no es privado.

Así, permanecer en pie de igualdad, un completo frecuentista análisis del problema debe incluir la misma información adicional sobre el sol, la explosión que se utiliza para construir los bayesiana anterior. Pero, en lugar de utilizar los priores, un frecuentista sólo tiene que ampliar la probabilidad de que él está usando para incorporar esas otras mediciones, y su p-valor se calcula mediante los que el pleno de la probabilidad.

$L = L$(De la máquina Dijo que Sí | Sol se Ha disparado) * $L$(Todos los demás datos sobre el sol | Sol se Ha disparado)

Un completo análisis frecuentista más probable es que muestran que la segunda parte de la probabilidad será mucho más restrictiva y será la contribución dominante a el p-valor de cálculo (porque tenemos una gran cantidad de información acerca de el sol, y los errores en esta información son pequeñas (con suerte)).

Prácticamente, uno no necesita salir y recoger todos los puntos de datos obtenidos a partir de los últimos 500 años para hacer un cálculo frecuencial, uno puede aproximarse a ellas como algunos simples de probabilidad término que codifica la incertidumbre en cuanto a si el sol se ha disparado o no. De esta forma, se convierten similar a la Bayesiana de la previa, pero es ligeramente diferente filosóficamente porque es una probabilidad, es decir, que codifica algunos medición anterior (a diferencia de antes, que codifica algunos a priori de la creencia). Este nuevo plazo se convertirá en una parte de la probabilidad y se utilizan para construir los intervalos de confianza (o p-valores o lo que sea), como contraposición a la bayesiana anterior, el cual está integrado en el formulario intervalos de credibilidad o posteriores.

29voto

John Richardson Puntos 1197

Tan lejos como puedo ver el frecuentista de bits que es razonable en este momento:

Deje $H_0$ ser la hipótesis de que el sol no se ha disparado y $H_1$ ser la hipótesis de que la tiene. El p-valor es por lo tanto la probabilidad de observar el resultado (la máquina diciendo "sí") en $H_0$. Suponiendo que la máquina detecta correctamente la presencia de la ausencia de los neutrinos, entonces, si la máquina dice "sí" en $H_0$ es porque la máquina está mintiendo a nosotros como resultado de lanzar dos seises. Por lo tanto el valor de p es de 1/36, por lo que siguiendo normal cuasi-Fisher de la práctica científica, un frecuentista podría rechazar la hipótesis nula, en el 95% de nivel de significación.

Pero rechazar la hipótesis nula no significa que usted tiene derecho a aceptar la hipótesis alternativa, por lo que el frequentists conclusión no está justificada por el análisis. Frecuentista pruebas de hipótesis encarnan la idea de falsacionismo (más o menos), no se puede probar que algo es verdad, sólo refutar. Así que si usted quiere hacer valer $H_1$, usted asume la $H_0$ es verdad y sólo procederá si usted puede demostrar que $H_0$ es incompatible con los datos. Sin embargo eso no quiere decir $H_1$ es verdad, solo que sobrevive a la prueba y sigue como una hipótesis viable, al menos, hasta la siguiente prueba.

El Bayesiano es también el mero sentido común, señalando que no hay nada que perder por hacer la apuesta. Estoy seguro de que frecuentista enfoques, cuando los falsos positivos y falsos negativos de los costos se toman en cuenta (Neyman-Peason?) llegarían a la misma conclusión, como la mejor estrategia en términos de largo plazo de la ganancia.

En resumen: Tanto la frecuentista y Bayesiano están siendo descuidado aquí: El frecuentista para seguir ciegamente una receta sin tener en cuenta el adecuado nivel de significación de falsos positivos/falsos-negativos en los costos o la física del problema (es decir, no utilizando su sentido común). El Bayesiano es ser descuidado para que no se acredite su priores de forma explícita, pero, de nuevo usando el sentido común de los priores que él está utilizando, obviamente, son correctos (que es mucho más probable que la máquina es mentira que en realidad, el sol de haber explotado), el descuido es quizás excusable.

13voto

StasK Puntos 19497

El mayor problema que yo veo es que no hay ninguna prueba estadística de derivados. $p$-valor (con todas las críticas que Bayesiano estadísticos de montaje en su contra) por un valor de $t$ de un estadístico de prueba $T$ se define como ${\rm Prob}[T \ge t| H_0]$ (suponiendo que el valor null es rechazado por mayor los valores de $T$, como sería el caso con $\chi^2$ estadísticas, dicen). Si usted necesita para llegar a una decisión de mayor importancia, puede aumentar el valor crítico y empuje el rechazo a la región más arriba. Efectivamente, eso es lo que varias correcciones de pruebas de Bonferroni como hacer, instrucciones para el uso de un mucho menor umbral para $p$-valores. En su lugar, el frecuentista de estadística es atrapado aquí con las pruebas de tamaños en la cuadrícula de $0, 1/36, 2/36, \ldots$.

Por supuesto, este "frecuentista" enfoque no es científico, ya que el resultado será difícilmente reproducible. Una vez que el Sol se va supernova, permanece supernova, por lo que el detector debe seguir diciendo "Sí" de nuevo y de nuevo. Sin embargo, en la repetición de una ejecución de esta máquina es raro para dar el "Sí" resultado de nuevo. Esto es reconocido en áreas en las que desea presentarse como riguroso y tratar de reproducir sus resultados experimentales... que, como tengo entendido, que ocurre con una probabilidad de entre el 5% (la publicación de los originales en papel en un puro error de tipo I) y en algún lugar alrededor de 30-40% en algunos campos de la medicina. Meta-análisis de la gente puede rellenar con mejores números, esto es sólo el rumor de que viene a través de mí de vez en cuando a través de las estadísticas del grapevine.

Otro problema de la "correcta" frecuentista es que la perspectiva de rodar un dado es el menos potente de la prueba, con potencia = nivel de significación (si no es menor; el 2.7% de la potencia para el 5% de nivel de significación es nada para presumir). Neyman-Pearson teoría de la prueba t agonizes sobre lo que demuestra que este es un UMPT, y un montón de alta en la ceja de la teoría estadística (que yo apenas entiendo, tengo que admitir) está dedicado a derivar las curvas de potencia y la búsqueda de las condiciones cuando una prueba es la más fuerte en una clase dada. (Créditos: @Dikran Marsupial menciona la cuestión de la energía en uno de los comentarios.)

No sé si esto te incomoda, pero el estadístico Bayesiano se muestra aquí como el chico que no sabe de matemáticas y tiene un problema de juego. Una adecuada estadístico Bayesiano postularía la previa, discutir su grado de objetividad, se derivan de la posterior, y demostrar lo mucho que han aprendido a partir de los datos. Nada de eso se hizo, por lo que Bayesiano proceso ha sido simplificada al igual que el frecuentista de que uno ha sido.

Esta situación demuestra la clásica de detección para el cáncer problema (y estoy seguro de que biostatisticians puede describir mejor que yo). Cuando la detección de una enfermedad rara con un instrumento imperfecto, la mayoría de los aspectos positivos vienen a ser falsos positivos. Smart estadísticos sabe, y sabe mejor seguimiento barato y sucio inspectores con más caras y más precisas que las biopsias.

5voto

churnd Puntos 2888

No hay nada malo con este cómic, y la razón no tiene nada que ver con las estadísticas. Es la economía. Si el frecuentista es correcta, la Tierra será equivalente a inhabitable dentro de las 48 horas. El valor de \$50 will be effectively null. The Bayesian, recognizing this, can make the bet knowing that his benefit is \$50 en el caso normal, y marginalmente nada en el sol-estalló el caso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X