¿Personalización?
Si se desea una caracterización que tenga sabor a análisis duro, se podrían caracterizar las medidas ergódicas como aquellas medidas en las que la distribución de subpalabras en una palabra mayor (digamos de longitud $N$ ) no depende mucho de la elección de la palabra de longitud $N$ si se ignoran algunas palabras excepcionales de longitud $N$ (donde la probabilidad de la excepción llega a cero). El enunciado preciso de esta caracterización aparece, por ejemplo, en el artículo titulado La entropía es la única invariante finitamente observable.
Me pregunto si hay un teorema que te da alguna clase de medidas parametrizadas por descripciones finitas de ellas y luego dice que no hay algoritmo para determinar la ergodicidad para esta clase.
En cuanto a la intuición, si tienes una medida que se describe fácilmente y sobre la que es fácil razonar, entonces si no se te ocurre ninguna manera de extraer alguna información de un $\mu$ secuencia binaria típica de la muestra de una manera shift-invariante, entonces la medida va a ser ergódica.
Ejemplos
Un ejemplo sencillo (quizá demasiado sencillo) es la medida invariante que se obtendría concatenando 00 u 11 infinitas veces de forma aleatoria e independiente (cada una con probabilidad 1/2), y aplicando después el mapa de desplazamiento una o cero veces, cada una con probabilidad 1/2. Este ejemplo no es muy interesante y puede parecer una salida fácil. La razón por la que esto no es Markov (de cualquier paso) es porque el soporte de esta medida no es un SFT (subshift de tipo finito).
Un ejemplo más interesante sería una medida en la que las distancias entre ocurrencias de 1 son independientes. Es como un proceso de renovación, pero discreto e invariante bajo el mapa de desplazamiento. Sea $(p_i)_{i = 1}^{\infty}$ sea una sucesión de números no negativos cuya suma sea 1 y también tal que $\sum_i i p_i < \infty$ entonces se puede construir una medida invariante de este tipo $\mu$ donde $\mu([10^{i-1}1] | [1]) = p_i$ para todos $i$ y $\mu([1]) = \sum_i i p_i > 0$ . Para construir esta medida, primero se construye la condicional $\mu_{[1]}$ (una medida definida en el cilindro $[1] \subset \{0, 1\}^{\mathbb N}$ ) que corresponde al proceso de renovación en tiempo discreto que tiene $(p_i)_{i = 1}^{\infty}$ como su distribución de tiempos de retención. Este $\mu_{[1]}$ no es invariante bajo el mapa de desplazamiento, pero es invariante bajo su primer mapa de retorno, por lo que se puede utilizar la construcción de rascacielos de Kakutani para construir $\mu$ definido en $\{0,1\}^{\mathbb N}$ . Esta medida es ergódica porque su restricción a $[1]$ es ergódico con respecto al primer mapa de retorno. Entonces se puede elegir $(p_i)_{i = 1}^{\infty}$ de forma que garantice $\mu$ no siendo Markov. Por ejemplo, se puede hacer que su soporte sea el turno par (es decir $p_i > 0$ sólo si $i$ es par).
Otra clase interesante de medidas: las medidas correspondientes a las cadenas de Markov ocultas. Se trata de medidas que son factores de las medidas de Markov.
Clase más general: medidas del formalismo termodinámico, pero ahí las cosas se ponen muy técnicas.