La versión corta es que la distribución Beta puede entenderse como la representación de una distribución de probabilidades es decir, representa todos los valores posibles de una probabilidad cuando no sabemos cuál es esa probabilidad. Aquí está mi explicación intuitiva favorita de esto:
Cualquiera que siga el béisbol está familiarizado con promedios de bateo -simplemente el número de veces que un jugador recibe un batazo de base dividido por el número de veces que sube a batear (por lo que es sólo un porcentaje entre 0
y 1
). .266
se considera en general una media de bateo, mientras que .300
se considera excelente.
Imagina que tenemos un jugador de béisbol y queremos predecir cuál será su media de bateo a lo largo de la temporada. Podríamos decir que podemos utilizar su promedio de bateo hasta ahora, pero esto será una medida muy pobre al principio de la temporada. Si un jugador va a batear una vez y consigue un sencillo, su promedio de bateo es brevemente 1.000
, mientras que si se poncha, su promedio de bateo es 0.000
. No es mucho mejor si subes a batear cinco o seis veces: podrías tener una racha de suerte y obtener un promedio de 1.000
o una racha de mala suerte y obtener una media de 0
Ninguno de los dos es un predictor remotamente bueno de cómo batearás esa temporada.
¿Por qué el promedio de bateo en los primeros golpes no es un buen predictor de su promedio de bateo final? Cuando el primer at-bat de un jugador es un strikeout, ¿por qué nadie predice que nunca conseguirá un hit en toda la temporada? Porque vamos con expectativas previas. Sabemos que en la historia, la mayoría de los promedios de bateo durante una temporada han oscilado entre algo así como .215
y .360
con algunas excepciones extremadamente raras en ambos lados. Sabemos que si un jugador consigue unos cuantos strikeouts seguidos al principio, eso puede indicar que acabará siendo un poco peor que la media, pero sabemos que probablemente no se desviará de ese rango.
Dado nuestro problema de la media de bateo, que se puede representar con un distribución binomial (una serie de éxitos y fracasos), la mejor manera de representar estas expectativas previas (lo que en estadística llamamos simplemente un antes ) es con la distribución Beta - está diciendo, antes de que hayamos visto al jugador hacer su primer swing, lo que esperamos aproximadamente que sea su promedio de bateo. El dominio de la distribución Beta es (0, 1)
, al igual que una probabilidad, por lo que ya sabemos que estamos en el camino correcto, pero la idoneidad de la Beta para esta tarea va mucho más allá.
Esperamos que la media de bateo de la temporada del jugador sea probablemente de alrededor de .27
pero que razonablemente podría oscilar entre .21
a .35
. Esto se puede representar con una distribución Beta con parámetros α=81 y β=219 :
curve(dbeta(x, 81, 219))
![Beta(81, 219)]()
He ideado estos parámetros por dos razones:
- La media es αα+β=8181+219=.270
- Como se puede ver en el gráfico, esta distribución se encuentra casi por completo dentro de
(.2, .35)
- el rango razonable para un promedio de bateo.
Usted ha preguntado qué representa el eje x en un gráfico de densidad de distribución beta: aquí representa su promedio de bateo. Observe que, en este caso, no sólo el eje Y es una probabilidad (o, más exactamente, una densidad de probabilidad), sino que el eje X también lo es (al fin y al cabo, la media de bateo no es más que una probabilidad de acierto). La distribución Beta representa una distribución de probabilidad de probabilidades .
Pero he aquí por qué la distribución Beta es tan apropiada. Imagina que el jugador recibe un solo golpe. Su récord de la temporada es ahora 1 hit; 1 at bat
. Entonces tenemos que actualización nuestras probabilidades- queremos desplazar toda esta curva un poco para reflejar nuestra nueva información. Aunque las matemáticas para demostrar esto son un poco complicadas ( se muestra aquí ), el resultado es muy simple . La nueva distribución Beta será:
Beta(α0+hits,β0+misses)
Dónde α0 y β0 son los parámetros con los que empezamos, es decir, 81 y 219. Así, en este caso, α ha aumentado en 1 (su único golpe), mientras que β no ha aumentado en absoluto (todavía no hay fallos). Eso significa que nuestra nueva distribución es Beta(81+1,219) o:
curve(dbeta(x, 82, 219))
![enter image description here]()
Fíjese en que apenas ha cambiado, ¡el cambio es realmente invisible a simple vista! (Eso es porque un golpe no significa realmente nada).
Sin embargo, cuanto más batee el jugador a lo largo de la temporada, más se desplazará la curva para adaptarse a las nuevas pruebas y, además, más se estrechará por el hecho de que tenemos más pruebas. Digamos que a mitad de la temporada ha subido a batear 300 veces, bateando 100 de esas veces. La nueva distribución sería Beta(81+100,219+200) o:
curve(dbeta(x, 81+100, 219+200))
![enter image description here]()
Obsérvese que la curva es ahora más fina y está desplazada hacia la derecha (mayor promedio de bateo) de lo que solía ser: tenemos una mejor idea de cuál es el promedio de bateo del jugador.
Uno de los resultados más interesantes de esta fórmula es el valor esperado de la distribución Beta resultante, que es básicamente su nueva estimación. Recordemos que el valor esperado de la distribución Beta es αα+β . Así, después de 100 aciertos de 300 real en bateo, el valor esperado de la nueva distribución Beta es 81+10081+100+219+200=.303 - Obsérvese que es inferior a la estimación ingenua de 100100+200=.333 pero mayor que la estimación con la que empezó la temporada ( 8181+219=.270 ). Puedes notar que esta fórmula es equivalente a añadir una "ventaja" al número de hits y no hits de un jugador - estás diciendo "empieza la temporada con 81 hits y 219 no hits en su historial").
Así, la distribución Beta es la mejor para representar una distribución probabilística de probabilidades : el caso en el que no sabemos de antemano cuál es la probabilidad, pero tenemos algunas conjeturas razonables.
19 votos
El eje y no es una probabilidad (lo cual es obvio, porque por definición una probabilidad no puede estar fuera del intervalo [0,1] pero esta trama se extiende hasta 50 y -en principio- para ∞ ). Es un densidad de probabilidad una probabilidad por unidad de x (y usted ha descrito x como tasa).
8 votos
@whuber: sí, entiendo lo que es el PDF - eso fue sólo un error en mi descripción. ¡Gracias por una nota válida!
1 votos
Intentaré encontrar la referencia pero conozco algunas de las formas más extrañas para la distribución Beta generalizada con forma a+(b−a)Beta(α1,α2) tienen aplicaciones como la física. Además, puede ajustarse a los datos de los expertos (mínimo, moda, máximo) en entornos con pocos datos y suele ser mejor que utilizar una distribución triangular (desgraciadamente utilizada a menudo por las IE).
5 votos
Es evidente que nunca has viajado con la compañía ferroviaria Deutsche Bahn. Serías menos optimista.