Estoy bastante enamorado de los cocientes de probabilidad como medio de cuantificar las pruebas relativas en los esfuerzos científicos. Sin embargo, en la práctica me parece que el cociente de probabilidades en bruto puede llegar a ser excesivamente grande, por lo que he optado por transformarlo en logaritmo, lo que tiene la agradable ventaja de representar las pruebas a favor/en contra del denominador de forma simétrica (es decir, el valor absoluto del cociente de probabilidades logarítmico representa la fuerza de las pruebas y el signo indica qué modelo, el numerador o el denominador, es el modelo apoyado). Ahora bien, ¿qué base de logaritmo elegir? La mayoría de las métricas de probabilidad utilizan log-base-e, pero me parece una base poco intuitiva. Durante un tiempo utilicé log-base-10, que aparentemente fue apodado el " prohibir " de Alan Turing y tiene la agradable propiedad de que uno puede discernir fácilmente los órdenes de magnitud relativos de las pruebas. Hace poco se me ocurrió que también podría ser útil emplear log-base-2, en cuyo caso pensé que podría ser apropiado utilizar el término "bit" para referirse a los valores resultantes. Por ejemplo, un cociente de probabilidad bruto de 16 se transformaría en 4 bits de evidencia para el denominador en relación con el numerador. Sin embargo, me pregunto si este uso del término "bit" viola su sentido convencional de teoría de la información. ¿Alguna idea?
Pero la aproximación a la divergencia KL es aproximada, ¿no? Sólo es buena hasta un factor de escala constante. Así que si el logaritmo de la razón de verosimilitud es 2, eso sólo te dice que hay una diferencia de $2x$ bits, donde $x$ es desconocido. Por lo tanto, no dice nada en esencia. Además, la aproximación asume un tamaño de muestra infinito, y para tamaños de muestra finitos, la divergencia KL no debería depender del tamaño de la muestra, pero la probabilidad logarítmica sí. No veo cómo puede funcionar lo que dices.
0 votos
Si ya estás bien con la prohibición, entonces también deberías estar bien con el bit. (es decir, no hace falta la justificación completa que he dado a continuación). Pasar de ban a bits es sólo un cambio de unidades, log base 2 en lugar de base 10. (Del mismo modo, ve con "nats" si te gusta la base e).