2 votos

¿Es posible extrapolar un porcentaje a partir de unos coeficientes de regresión logística dados?

Si he hecho una regresión logística (binomial). ¿Es posible entonces, a partir de los coeficientes, calcular un porcentaje de cuánto afecta cada una de las variables a la variable dependiente?

Digamos que tenemos por ejemplo var1: 0,635, var2: 0,245, var3: 1,243. Si sabemos que la variable dependiente Y en los datos es 1 en el 0,64 de las veces. ¿Podemos entonces utilizar esto para calcular algo largo las líneas de:

¿La variable 1 tiene un efecto del 25% sobre Y, la variable 2 del 15% y la variable 3 del 60%?

1voto

mat_geek Puntos 1367

Parece que estás haciendo una pregunta básica sobre si se puede o no calcular un análogo de R cuadrado de la regresión lineal a la regresión logística o quizás más generalmente al modelo lineal generalizado. La base para que esto sea posible con los modelos lineales es que la suma total de cuadrados puede separarse en dos sumas de cuadrados no superpuestas (suma de cuadrados del modelo y suma de cuadrados del error). Pero en el caso de los modelos lineales generalizados, el cuadrado R no sirve como medida de la bondad del ajuste de un modelo. El análogo es la desviación, que puede utilizarse para medir el efecto de las variables en el modelo observando el cambio en la desviación cuando se añade la variable al modelo.

1voto

Eero Puntos 1612

Hay que recordar que los coeficientes dependen de la escala de la variable. Considere una regresión logística en la que x1 es la altura (de una persona) en pulgadas, ¿qué ocurre si se cambia a altura en metros o altura en milímetros? El coeficiente cambia (y lo que significa un aumento de 1 unidad cambia), pero el efecto global de la variable no cambiará (a menos que haya cambios importantes debido al redondeo).

He tenido regresiones en las que el coeficiente de la variable más importante era cercano a 0 (una vez incluso se imprimió como 0,000 debido al redondeo), esto se debe a que la variable es algo así como la dosis de un fármaco en miligramos y las diferencias están en 100s o 1,000s de miligramos, por lo que un aumento de un miligramo no es muy significativo (para esos a menudo recodifico la variable para que un aumento de 1 unidad sea más significativo).

A veces la gente estandariza todas las variables predictoras para que un aumento de 1 unidad sea un aumento de 1 sd. Esto puede hacer que los coeficientes sean más comparables, pero a veces la variable estandarizada pierde significado.

También hay que tener en cuenta la relación entre las posibles variables predictoras.

0voto

Rog Puntos 200

Parece que está buscando algo como el riesgo relativo o las primeras diferencias. Si es así, calcule la probabilidad predicha de observar un 1 con todo excepto su variable de interés fijada en su media o mediana y su tratamiento en un valor bajo (o alto), dando algo como esto

RR_rs = Pr(Y1 =r,Y2 =s|x1) / Pr(Y1 =r,Y2 =s|x)

O las primeras diferencias

FD_rs =Pr(Y1 =r,Y2 =s|x1)Pr(Y1 =r,Y2 =s|x).

Supongo que buscar algún tipo de criterio de información podría conseguir en parte lo que quieres también.

0voto

APAD1 Puntos 106

Si se tiene en cuenta la desviación estándar de un coeficiente (para que los diferentes tipos de escala estén estandarizados), diría que el peso de la importancia de una variable viene dado por:

$$ \frac{|\beta_j|\cdot \sigma_j}{\sum_{i=1}^{m}|\beta_i|\cdot \sigma_i} $$

P.D.: Siento llegar 10 años tarde, con esta sugerencia

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X