La capacidad del canal se define como la tasa máxima alcanzable y es igual al máximo sobre las distribuciones de entrada de la información mutua entre la salida y la entrada, es decir.
$C=\max_{P} I(X;Y)$
Asimismo, la tasa de información se define como
$R=\frac{\log( M)}{n}$
donde $M$ es el número de mensajes y $n$ es la longitud del bloque.
Esta es mi pregunta: Si tenemos $M$ mensajes y $n$ como la longitud del bloque, necesitaríamos $\log_2(M)$ bits para representar el $M$ mensajes. Sin embargo, para evitar el error de canal, podemos añadir redundancia y transmitir los mensajes en $n$ bits para $n>\log_2 (M)$ lo que resulta en $R\leq 1$ . En consecuencia, $C\leq 1$ .
¿Hay alguna otra forma de codificar (no necesariamente añadiendo redundancia) de manera que la capacidad sea mayor que $1$ ?
Es decir, con esta definición de tasa, siempre pienso que es menor que 1, pero desde el punto de vista de la información mutua, no veo la razón de que sea menor que 1. ¿Puede alguien aclararlo?