11 votos

¿Cuál es la mejor manera de visualizar los efectos de las categorías y su prevalencia en la regresión logística?

Necesito presentar información sobre los principales predictores de los votos de un candidato utilizando los datos de una encuesta de opinión pública. He realizado una regresión logística utilizando todas las variables que me interesan, pero no encuentro una buena forma de presentar esta información.

A mi cliente no le importa sólo el tamaño del efecto, sino la interacción entre el tamaño del efecto y el tamaño de la población con dicho atributo.

¿Cómo puedo tratar eso en un gráfico? ¿Alguna sugerencia?

He aquí un ejemplo:

El $\beta$ de la variable SEXO (Hombre=1) cuando la variable dependiente es Votar/Votar en una candidatura es de 2,3, que es un número grande después de haber sido exponenciado y tratado como odds ratio o probabilidad. Sin embargo, en la sociedad en la que se realizó esta encuesta sólo había un 30% de hombres. Por lo tanto, aunque los hombres apoyaron bastante a este candidato, sus cifras son insignificantes para un candidato que intenta ganar unas elecciones mayoritarias.

10voto

Sean Hanley Puntos 2428

Estoy de acuerdo con @PeterFlom en que el ejemplo es impar, pero dejando eso de lado, observo que la variable explicativa es categórica. Si eso es consistente, simplifica mucho esto. Yo usaría parcelas de mosaico para presentar estos efectos. Un gráfico de mosaico muestra las proporciones condicionales verticalmente, pero la anchura de cada categoría se escala en relación con su proporción marginal (es decir, incondicional) en la muestra.

He aquí un ejemplo con los datos de la catástrofe del Titanic, creado con R:

data(Titanic)

sex.table   = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
#          Sex
# Survived  Male Female
#      No  0.788  0.268
#      Yes 0.212  0.732
round(prop.table(t(class.table), margin=2), digits=3)
#           Class
# Survived   1st   2nd   3rd  Crew
#      No  0.375 0.586 0.748 0.760
#      Yes 0.625 0.414 0.252 0.240

windows(height=3, width=6)
  par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
  mosaicplot(sex.table,   main="")
  mosaicplot(class.table, main="")

enter image description here

A la izquierda, vemos que las mujeres tenían muchas más probabilidades de sobrevivir, pero los hombres representaban quizás un 80% de las personas a bordo. Por tanto, aumentar el porcentaje de supervivientes masculinos habría supuesto salvar muchas más vidas que incluso un aumento mayor del porcentaje de supervivientes femeninos. Esto es algo análogo a su ejemplo. Hay otro ejemplo a la derecha en el que la tripulación y el personal de a bordo constituían la mayor proporción de personas, pero tenían la menor probabilidad de sobrevivir. (Por si sirve de algo, esto no es un análisis completo de estos datos, porque la clase y el sexo tampoco eran independientes en el Titanic, pero es suficiente para ilustrar las ideas de esta pregunta).

5voto

Zizzencs Puntos 1358

Tengo un poco de curiosidad por saber qué sociedad tenía sólo un 10% de hombres... pero...

Una cosa que podría hacer es trazar los cocientes de probabilidades y etiquetar cada uno con el tamaño de la muestra.

Si quiere que ambas variables se representen gráficamente, puede hacer un gráfico de burbujas, en el que la posición de cada burbuja en el eje y coincida con el tamaño de la razón de momios y el área de la burbuja sea proporcional al tamaño de la muestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X