Mientras realizaba algunos EDA, decidí utilizar un diagrama de cajas para ilustrar la diferencia entre dos niveles de un factor.
El camino ggplot El diagrama de caja era satisfactorio, aunque ligeramente simplista (primer diagrama, abajo). Mientras investigaba las características de los gráficos de caja, empecé a experimentar con muescas.
Tengo entendido que las muescas muestran el IC en torno a la mediana y que si las muescas de dos cajas no se solapan hay "pruebas sólidas" -con un nivel de confianza del 95%- de que las medianas difieren.
En mi caso (segundo gráfico), las muescas no se solapan de forma significativa. Pero, ¿por qué la parte inferior del recuadro de la derecha adopta esa extraña forma?
El trazado de los mismos datos en un gráfico de violín no indicó nada inusual sobre la densidad de probabilidad del violín correspondiente.