Estoy intentando trazar un gráfico para mostrar el efecto de mi variable significativa sobre mi variable dependiente, pero los datos son binarios (presencia/ausencia) para ambas. ¿Podría alguien sugerir la mejor manera de mostrar los datos en un gráfico que sea fácil de entender para el lector? ¿Con una guía de cómo hacerlo?
Respuesta
¿Demasiados anuncios?La visualización de datos categóricos puede suponer un reto y no está tan desarrollada como la visualización de datos continuos o mixtos categóricos/continuos. Por desgracia, los nombres de las visualizaciones pertinentes no son tan conocidos, lo que dificulta la búsqueda de ayuda.
En este caso, es probable que necesite un gráfico de mosaico (también conocido como gráfico Marimekko), que le permite trazar variables categóricas tanto en el lado x y y ejes (y tener niveles jerárquicos de cada uno).
A continuación se muestra un ejemplo clásico que muestra la supervivencia (gris claro) frente a la no supervivencia (gris oscuro) en función tanto del sexo (hombre frente a mujer) como de la clase (1ª, 2ª, 3ª o tripulación) de las personas del Titanic. (Tomado de la página de Wikipedia sobre parcelas de mosaico. ) El panel de la izquierda muestra los datos reales, mientras que el de la derecha muestra las frecuencias que cabría esperar si el resultado de supervivencia fuera independiente de las demás variables: