28 votos

¿Tienen algún significado las barras de error de las probabilidades?

La gente suele decir que algún acontecimiento tiene un 50-60% de posibilidades de ocurrir. A veces incluso veo que la gente da barras de error explícitas en las asignaciones de probabilidad. ¿Tienen estas afirmaciones algún significado o son sólo un capricho lingüístico de la incomodidad de elegir un número específico para algo que es intrínsecamente desconocido?

38voto

Dipstick Puntos 4869

No tendría sentido si se tratara de conocido probabilidades, por ejemplo, con una moneda justa la probabilidad de sacar cara es 0,5 por definición. Sin embargo, a menos que se trate de un ejemplo de libro de texto, la probabilidad exacta nunca se conoce, sólo la conocemos de forma aproximada.

La historia diferente es cuando estimación las probabilidades a partir de los datos, por ejemplo, usted observó 13 boletos ganadores entre los 12563 boletos que compró, por lo que a partir de estos datos se estima que la probabilidad es de 13/12563. Esto es algo que has estimado a partir de la muestra, por lo que es incierto, ya que con una muestra diferente podrías observar un valor diferente. La estimación de la incertidumbre no se refiere a la probabilidad, sino a la estimación de la misma.

Otro ejemplo sería cuando la probabilidad no es fija, sino que depende de otros factores. Digamos que estamos hablando de la probabilidad de morir en un accidente de coche. Podemos considerar la probabilidad "global", un valor único que se margina de todos los factores que directa e indirectamente conducen a los accidentes de coche. Por otro lado, se puede considerar cómo varían las probabilidades entre la población dados los factores de riesgo.

Se pueden encontrar muchos más ejemplos en los que las propias probabilidades se consideran como variables aleatorias Por lo tanto, varían en lugar de ser fijos.

25voto

Lev Puntos 2212

Una ilustración muy relevante de xkcd :

enter image description here

con la leyenda asociada:

...un tamaño del efecto de 1,68 (IC 95%: 1,56 (IC 95%: 1,52 (IC 95%: 1,504 (95% CI: 1,494 (95% CI: 1,488 (95% CI: 1,485 (95% CI: 1,482 (95% CI: 1,481 (95% CI: 1,4799 (95% CI: 1,4791 (95% CI: 1,4784...

7voto

Leonhard Puntos 375

Conozco dos interpretaciones. La primera la dijo Tim: Hemos observado $X$ éxitos de $Y$ ensayos, por lo que si creemos que los ensayos fueron i.i.d. podemos estimar la probabilidad del proceso en $X/Y$ con algunas barras de error, por ejemplo del orden $1/\sqrt{Y}$ .

La segunda implica "probabilidades de orden superior" o incertidumbres sobre un proceso generador. Por ejemplo, digamos que tengo una moneda en la mano fabricada por un jugador artesano, que con $0.5$ probabilidad hizo una moneda de 60% de cabezas, y con $0.5$ probabilidad hizo una moneda de 40% de cabezas. Mi mejor estimación es una probabilidad del 50% de que la moneda salga cara, pero con grandes barras de error: la "verdadera" probabilidad es del 40% o del 60%.

En otras palabras, se puede imaginar que se ejecuta el experimento mil millones de veces y se toma la fracción de éxitos $X/Y$ (en realidad la fracción límite). Tiene sentido, al menos desde una perspectiva bayesiana, dar, por ejemplo, un intervalo de confianza del 95% en torno a esa cifra. En el ejemplo anterior, dados los conocimientos actuales, esto es $[0.4,0.6]$ . Para una moneda real, tal vez sea $[0.47,0.53]$ o algo así. Para más información, véase:

¿Necesitamos probabilidades de orden superior y, si es así, qué significan? Judea Pearl. UAI 1987. https://arxiv.org/abs/1304.2716

4voto

Farhan Puntos 106

Todas las mediciones son inciertas.

Por lo tanto, cualquier medición de la probabilidad también es incierta.

Esta incertidumbre en la medición de la probabilidad puede representarse visualmente con una barra de incertidumbre. Tenga en cuenta que las barras de incertidumbre suelen denominarse barras de error. Esto es incorrecto o, al menos, engañoso, porque muestra la incertidumbre y no el error (el error es la diferencia entre la medición y la verdad desconocida, por lo que el error es desconocido; la incertidumbre es una medida de la amplitud de la densidad de probabilidad después de realizar la medición).

Un tema relacionado es meta-incertidumbre . La incertidumbre describe la amplitud de una función de distribución de probabilidad a posteriori, y en el caso de una incertidumbre de tipo A (incertidumbre estimada por mediciones repetidas), es inevitable una incertidumbre sobre la incertidumbre; los metrólogos me han dicho que la práctica metrológica dicta ampliar la incertidumbre en este caso (IIRC, si la incertidumbre se estima por la desviación estándar de N mediciones repetidas, uno debe multiplicar la desviación estándar resultante por $\frac{N}{N-2}$ ), que es esencialmente una metaincertidumbre.

4voto

Ben Puntos 11

¿Cómo puede surgir una barra de error en una probabilidad? Supongamos que podemos asignar $\mathrm{prob}(\mathcal{A} | \Theta = \theta, \mathcal{I})$ . Si $\mathcal{I}$ implica $\Theta = \theta_0$ entonces $\mathrm{prob}(\Theta = \theta | \mathcal{I}) = \delta_{\theta \theta_0}$ y \begin{align} \mathrm{prob}(\mathcal{A} | \mathcal{I}) &= \sum_\theta \mathrm{prob}(\mathcal{A} | \Theta = \theta, \mathcal{I}) \: \delta_{\theta \theta_0} \\ &= \mathrm{prob}(\mathcal{A} | \Theta = \theta_0, \mathcal{I}) \end{align}

Ahora bien, si $\Theta$ no se puede deducir de $\mathcal{I}$ entonces es tentador pensar que la incertidumbre en $\mathrm{prob}(\Theta = \theta | \mathcal{I})$ debe conducir a la incertidumbre en $\mathrm{prob}(\mathcal{A} | \mathcal{I})$ . Pero no es así. Simplemente implica una probabilidad conjunta para $\mathcal{A}$ y $\Theta = \theta$ que, cuando $\Theta$ se margina, da una probabilidad definitiva para $\mathcal{A}$ : \begin{align} \mathrm{prob}(\mathcal{A}, \Theta = \theta | \mathcal{I}) &= \mathrm{prob}(\mathcal{A} | \Theta = \theta, \mathcal{I}) \: \mathrm{prob}(\Theta = \theta | \mathcal{I}) \\ \mathrm{prob}(\mathcal{A} | \mathcal{I}) &= \sum_\theta \mathrm{prob}(\mathcal{A} | \Theta = \theta, \mathcal{I}) \: \mathrm{prob}(\Theta = \theta | \mathcal{I}) \end{align}

Por lo tanto, añadir barras de error a una probabilidad es como añadir incertidumbre a los parámetros molestos, que pueden modificar la probabilidad, pero no pueden hacerla incierta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X