7 votos

Generalización del alisado Add-one/Laplaciano

Supongamos que estamos estimando una proporción o tasa de "aciertos". Si tenemos $h$ éxitos y $m$ falla, el estimador obvio es

$\dfrac{h}{h + m}$

Para evitar estimaciones poco razonables de $0$ o $1$ cuando el tamaño de nuestra muestra es pequeño, podemos hacer un poco de suavizado (Add-1/Laplaciano):

$\dfrac{h+1}{h+m+2}$

He leído que esto tiene una interpretación bayesiana de tener un 50/50 a priori sobre la tasa de aciertos. Se me ocurren un par de ideas para generalizar esto, pero no estoy seguro de la teoría.

  1. Nivel de confianza

    Si estoy muy seguro de que los porcentajes de acierto son 50/50, podría añadir $2$ en lugar de $1$ a los aciertos y desaciertos. O si tengo menos confianza, podría añadir $1/2$ . Sin embargo, lo que no tiene sentido de inmediato para mí es cuál es la interpretación bayesiana (si es que hay alguna). ¿No es la prioridad simplemente $p = 0.5$ ¿Y ya está? ¿O hay una forma natural de representar la concentración? Si es así, ¿a qué nivel de concentración corresponde el alisado de adición de Laplaciano? Si no es así, ¿por qué no tiene sentido este esquema de confianza variable?

  2. Diferentes probabilidades a priori

    En lugar de una previa uniforme, podríamos tener alguna otra previa sobre la tasa de aciertos. Para conseguirlo, podríamos añadir un número a los aciertos y otro a los fallos, de forma que la proporción funcionara. Sin embargo, no sé inmediatamente cómo parametrizarlo. Por ejemplo, si tengo una prioridad de 1/4, ¿debo añadir $0.5$ y $1.5$ a los aciertos y errores, o debería añadir $1$ y $3$ ? Esto está relacionado con la pregunta anterior sobre el nivel de confianza. Me gustaría parametrizar esto para poder cambiar la probabilidad previa sin alterar la confianza (si tal concepto tiene sentido).

7voto

matt Puntos 11

El término "uniforme" de la prioridad uniforme no sólo significa que los aciertos y los fallos tienen la misma probabilidad. Significa que se asume que se tiene una medida de probabilidad sobre las tasas $[0,1]$ y esta medida es la medida uniforme. Por ejemplo, significa que la probabilidad de que la tasa verdadera esté entre $0.9$ y $1.0$ es $0.1$ . Hay otras medidas en $[0,1]$ que tienen un valor medio $1/2$ .

Por ejemplo, si se comienza con el previo uniforme y luego se observa $1$ golpe y $1$ de la pérdida, la distribución actualizada está más concentrada en torno a una tasa de $1/2$ que el uniforme anterior. En lugar de una probabilidad de $\Delta r $ para que la tasa esté entre $r$ y $r+\Delta r$ se estimaría que la probabilidad es de aproximadamente $6 r (1-r) \Delta r$ . (El factor de $6$ hace que la medida total $1$ .) Esta nueva distribución también predeciría que la probabilidad de acertar la próxima vez es $1/2$ . Si observa un $h$ éxitos y $m$ falla, la probabilidad esperada de acierto es

$$\frac{h+2}{h+m+4}.$$

Esto está más cerca de $1/2$ que $\frac{h+1}{h+m+2}$ . Esto concuerda con el hecho de que usted comenzó con una distribución más concentrada cerca de $1/2$ . Por supuesto, si se incluye ese primer acierto y error, entonces ha habido $h+1$ éxitos y $m+1$ fallas en total.

La distribución que se obtiene a partir de la prioridad uniforme observando un cierto número de aciertos y fallos se denomina distribución beta . La distribución uniforme en $[0,1]$ es $\text{Beta}(1,1)$ . Las distribuciones beta tienen la bonita propiedad de que si se actualiza una distribución beta con una observación, el resultado sigue estando en esa familia. A partir de una observación, la $\text{Beta}(a,b)$ La distribución se actualiza a $\text{Beta}(a+1,b)$ o $\text{Beta}(a,b+1)$ . La media de un $\text{Beta}(a,b)$ la distribución es $\frac{a}{a+b}$ . Es perfectamente razonable tener una distribución a priori que no sea una distribución beta, pero las respuestas podrían no salir tan bien.

If I'm very confident that the hit rates are 50/50, I could add 2 instead of 1 
to the hits and misses. Or if I'm less confident, I could add 1/2.

Eso puede o no estar de acuerdo con la confianza. Se trata de si crees que es probable que la tasa se acerque a $1/2$ . En algunas situaciones, usted puede creer que la tasa debe estar cerca de $0$ o cerca de $1$ y la primera prueba debería ser muy informativa. Es posible que crea que la mitad de sus alumnos saben resolver un tipo de problema, y que si da a un alumno al azar $5$ de estos problemas, es muy probable que el alumno resuelva todos $5$ o no resolver ninguna. Esto podría ser aproximado por un $\text{Beta}(\epsilon,\epsilon)$ distribución para que después de $h$ correcto y $m$ incorrecto, el valor medio es

$$\frac{h+\epsilon}{h+m+2\epsilon},$$

que está cerca de $0$ o $1$ después de una observación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X