Dado que la precisión, en este caso, es la proporción de muestras correctamente clasificadas, podemos aplicar la prueba de hipótesis relativa a un sistema de dos proporciones.
Sea $\hat p_1$ y $\hat p_2$ son las precisiones obtenidas de los clasificadores 1 y 2 respectivamente, y $n$ el número de muestras. El número de muestras clasificadas correctamente en los clasificadores 1 y 2 son $x_1$ y $x_2$ respectivamente.
$ \hat p_1 = x_1/n,\quad \hat p_2 = x_2/n$
La estadística de la prueba viene dada por
$\displaystyle Z = \frac{\hat p_1 - \hat p_2}{\sqrt{2\hat p(1 -\hat p)/n}}\qquad$ donde $\quad\hat p= (x_1+x_2)/2n$
Nuestra intención es demostrar que la precisión global del clasificador 2, es decir, $p_2$ es mejor que la del clasificador 1, que es $p_1$ . Esto enmarca nuestra hipótesis como
- $H_0: p_1 = p_2\quad$ (hipótesis nula según la cual ambos son iguales)
- $H_a: p_1 < p_2\quad$ (hipótesis alternativa que afirma que la nueva es mejor que la existente)
La región de rechazo viene dada por
$Z < -z_\alpha \quad$ (si se rechaza $H_0$ y aceptar $H_a$ )
donde $z_\alpha$ se obtiene a partir de una distribución normal estándar que corresponde a un nivel de significación, $\alpha$ . Por ejemplo $z_{0.5} = 1.645$ para un nivel de significación del 5%. Esto significa que si la relación $Z < -1.645$ es cierta, entonces podríamos decir con un nivel de confianza del 95% ( $1-\alpha$ ) que el clasificador 2 es más preciso que el clasificador 1.
Referencias:
- R. Johnson y J. Freund, Miller and Freund's Probability and Statistics for Engineers, 8th Ed. Prentice Hall International, 2011. (Fuente primaria)
- Prueba de hipótesis-Resumen de la fórmula concisa . (Tomado de [1])