Supongamos que estamos estimando una proporción o tasa de "aciertos". Si tenemos $h$ éxitos y $m$ falla, el estimador obvio es
$\dfrac{h}{h + m}$
Para evitar estimaciones poco razonables de $0$ o $1$ cuando el tamaño de nuestra muestra es pequeño, podemos hacer un poco de suavizado (Add-1/Laplaciano):
$\dfrac{h+1}{h+m+2}$
He leído que esto tiene una interpretación bayesiana de tener un 50/50 a priori sobre la tasa de aciertos. Se me ocurren un par de ideas para generalizar esto, pero no estoy seguro de la teoría.
-
Nivel de confianza
Si estoy muy seguro de que los porcentajes de acierto son 50/50, podría añadir $2$ en lugar de $1$ a los aciertos y desaciertos. O si tengo menos confianza, podría añadir $1/2$ . Sin embargo, lo que no tiene sentido de inmediato para mí es cuál es la interpretación bayesiana (si es que hay alguna). ¿No es la prioridad simplemente $p = 0.5$ ¿Y ya está? ¿O hay una forma natural de representar la concentración? Si es así, ¿a qué nivel de concentración corresponde el alisado de adición de Laplaciano? Si no es así, ¿por qué no tiene sentido este esquema de confianza variable?
-
Diferentes probabilidades a priori
En lugar de una previa uniforme, podríamos tener alguna otra previa sobre la tasa de aciertos. Para conseguirlo, podríamos añadir un número a los aciertos y otro a los fallos, de forma que la proporción funcionara. Sin embargo, no sé inmediatamente cómo parametrizarlo. Por ejemplo, si tengo una prioridad de 1/4, ¿debo añadir $0.5$ y $1.5$ a los aciertos y errores, o debería añadir $1$ y $3$ ? Esto está relacionado con la pregunta anterior sobre el nivel de confianza. Me gustaría parametrizar esto para poder cambiar la probabilidad previa sin alterar la confianza (si tal concepto tiene sentido).