En las pruebas de hipótesis, hay que decidir entre dos distribuciones de probabilidad P1(x) y P2(x) en un conjunto finito X tras observar n muestras i.i.d. x1,...,xn extraída de la distribución desconocida. Sea An⊆Xn denota la región de aceptación elegida para P1 . Las probabilidades de error de tipo I y II pueden expresarse así
αn=Pn1(Acn) βn=Pn2(An)
(Cover & Thomas, Cap. 11 es una excelente referencia para las definiciones y hechos mencionados en este post).
Supongamos que hemos elegido las regiones de aceptación An 's ( n≥1 ), de modo que ambas probabilidades de error se aproximan a cero a medida que aumenta el número de observaciones: αn→0 y βn→0 como n→∞ . El Lemma de Stein nos dice que la tasa máxima de deacreación de ambas probabilidades de error viene determinada, hasta el primer orden del exponente, por la distancia KL entre las distribuciones dadas. Más concretamente
−1nlogαn→D(P2||P1) −1nlogβn→D(P1||P2)
Consideremos ahora la versión bayesiana del problema de comprobación de hipótesis. En este caso, P1 y P2 se dan probabilidades a priori π1 y π2 respectivamente, y la probabilidad de error se obtiene ponderando αn y βn :
en=π1αn+π2βn.
En este caso, el exponente óptimo para en viene dada por la distancia de Chernoff entre las distribuciones dadas:
−1nlogen→C(P1,P2).
Pregunta ¿Qué hay de erróneo en el siguiente razonamiento? (Descargo de responsabilidad: soy no tratando de ser totalmente formal/detallado aquí).
Según (3), la tasa de disminución de en es la tasa mínima de deacrease de αn y βn :
lim .
Desde e_n\rightarrow 0 hay que tener los dos \alpha_n\rightarrow 0 y \beta_n\rightarrow 0 como n\rightarrow \infty . Así, por las consideraciones anteriores sobre el Lemma de Stein, y (1) y (2), se obtendría
\lim -\frac 1 n \log e_n = \min\{D(P_1||P_2), \,\,D(P_2||P_1)\}
que es muy diferente de C(P_1,P_2) .
EDITAR : Ahora me doy cuenta de que (1) y (2) no pueden cumplirse simultáneamente, para las mismas regiones A_n 's, por lo que este debe ser el error en el razonamiento.
Lo que se puede deducir mediante un razonamiento similar es justo, creo yo,
C(P_1,P_2)\leq \min\{D(P_1||P_2), \,\,D(P_2||P_1)\}.