Para recuperar la entropía, hay que considerar una secuencia de tirar los dados, y preguntar cuántas preguntas por rollo que necesitas en una estrategia óptima, en el límite de que el número de tiradas va al infinito. Nótese que cada pregunta puede cubrir todas las tiradas, por ejemplo para dos tiradas, podrías preguntar en algún momento: "¿Los resultados están en $\{16,21,22,23\}$ ?” (donde el primer dígito denota el primer lanzamiento, y el segundo dígito denota el segundo lanzamiento).
Soy demasiado perezoso para hacerlo por 36 posibilidades, por lo tanto aquí un ejemplo más simple: Considere un dado para el cual cada tirada da sólo uno de tres resultados con igual probabilidad. Entonces la entropía es aproximadamente $1.58496$ .
Para un lanzamiento, la estrategia óptima es simplemente preguntarse "¿fue $1$ ?" seguido de "¿fue $2$ ?", que en promedio da $5/3 = 1.66$ preguntas.
Para dos lanzamientos, una estrategia óptima sería preguntar primero "¿fue uno de $\{11,12,13,21\}$ ?” (donde el primer dígito da el resultado del primer lanzamiento, y el segundo dígito el resultado del segundo lanzamiento). Si la respuesta es "sí", entonces use dos preguntas para señalar uno de los cuatro resultados. De lo contrario, pregunte "¿fue el primer lanzamiento un $2$ ?", si es así, entonces fue uno de $22$ o $23$ y una pregunta es suficiente para determinar eso. En el caso restante sabes que el primer lanzamiento fue $3$ y no saber nada del segundo, así que empleas la estrategia de uno a uno para determinar el segundo lanzamiento.
Esta estrategia necesita en promedio $29/9=3.2222$ preguntas, o $1.61111$ preguntas por lanzamiento. Lo cual ya es mucho mejor, y de hecho sólo $1.65\,\%$ peor que el valor dado por la entropía.
Nótese que el número promedio de preguntas de la estrategia óptima de lanzamiento único puede diferir dramáticamente de la entropía. Para ello, considere el lanzamiento de una moneda sesgada. La entropía de esto puede hacerse arbitrariamente baja haciendo que la moneda esté suficientemente sesgada. Pero obviamente no hay manera de que puedas obtener el resultado del lanzamiento de una moneda con menos de una pregunta.
8 votos
Toma la entropía de base 6, y $H_{6}(X)=1$ , que es la misma que la profundidad máxima de su árbol de decisión de 6 elementos que decide su resultado. La discrepancia viene de la base del registro. usted está tratando de codificar 6 resultados diferentes en base 2, por lo que va a tener que utilizar cadenas de bits de longitud al menos 3. Hay claramente algunos residuos aquí, ya que hay $2^3 =8$ codificaciones" únicas en 3 bits, pero sólo hay que codificar 6 elementos. En general, el límite de entropía se hace más estricto a medida que crece el número de elementos a codificar, como ya se mencionó en la primera respuesta.