Sí, es posible. El problema XOR es un ejemplo sencillo para este caso. El conjunto de datos es $$C_1=(0,1),(1,0), C_2=(1,1),(0,0)$$ donde $C_i$ es la clase $i$ . En la raíz, la distribución de clases es $1/2-1/2$ . Cualquier división (p. ej. $x\lessgtr 0.5$ , $y\lessgtr0.5$ ...) dará lugar a la misma distribución de clases, por lo que la ganancia de información es 0 o el índice gini no disminuirá. Pero, en el siguiente paso, clasificaremos perfectamente las muestras.
Por lo tanto, una implementación del árbol de decisión con estricto condición de mejora en un nivel no será capaz de aprender este conjunto de datos.