3 votos

Introducción de valores medios/proporciones en una regresión logística con interacción continua-discreta

Tengo una regresión logística (en SAS, como referencia) con predictores continuos y categóricos (con codificación de referencia), y un término de interacción entre uno de cada tipo (supongamos por ahora que la variable categórica en cuestión tiene tres niveles de respuesta, con codificación de referencia a $c_1$ y $c_2$ ):

$logit(p) = a + (continuous terms) + (categorical terms) + b_1 (c_1 x) + b_2 (c_2 x)$

donde $b_1$ y $b_2$ son los coeficientes estimados de mi código. A partir de esto, obviamente, puedo obtener una expresión para la probabilidad $p$ de mi resultado. Quiero estimar la p media introduciendo las medias de los términos continuos y las proporciones de los términos categóricos. ¿Pero qué hago con los términos de interacción? ¿Debo establecer $(c_i x) = mean(x)$ ? ¿O lo pongo en $proportion(c_i)mean(x)$ ?

4voto

icelava Puntos 548

La media general prevista (véase la respuesta de onestop) puede no ser tan informativa; al fin y al cabo, se está ajustando un modelo para comprender las desviaciones sistemáticas del mismo.

Puede predecir su p para cualquier ajuste de sus predictores. Dado que está interesado en los efectos de los predictores, tendría sentido observar lo que ocurre cuando su x continua toma valores en el primer, segundo y tercer cuartil de los valores de su muestra, mientras que el predictor categórico varía sobre las categorías que tiene.

Por otra parte, parece que tienes más de una variable continua y más de una categórica, en cuyo caso una enumeración como la que propuse en el párrafo anterior se vuelve ininteligible. Es mejor mirar y reportar p para las configuraciones de los predictores "interesantes" o "relevantes".

3voto

Berek Bryan Puntos 349

Independientemente del término de interacción, este procedimiento no va a estimar la p media, porque el logit es una función no lineal por lo que la media del logit no es la misma que el logit de la media. Si quiere calcular la proporción esperada de resultados positivos en una muestra, la forma más fácil es calcular la p predicha para cada individuo y promediarla.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X