Tengo un conjunto de datos y he utilizado la regresión logística binaria para encontrar los parámetros significativos, así como el coeficiente de los parámetros. Hice el análisis en dos etapas. Primero, en la primera etapa alrededor de la mitad de las variables dependientes eran 1 y el resto 0. Segundo, Para la otra etapa, el resto de las variables dependientes fueron 1 y las variables que en la etapa anterior fueron 1 ahora son 0. El resultado de este análisis son los mismos parámetros significativos para ambas etapas y los coeficientes también son los mismos valores pero opuestos, es decir uno de ellos es negativo y el otro positivo. ¿Cuál es la razón o explicación para que esto ocurra? ¿He seguido una dirección equivocada para mi análisis de regresión? Utilicé SPSS y R-Studio para hacer el análisis y ambos obtuvieron resultados similares.
Respuesta
¿Demasiados anuncios?Básicamente, al intercambiar las etiquetas 1 y 0 de la variable dependiente de la Etapa 1 durante la Etapa 2, se ajustaron los siguientes modelos de regresión logística binaria:
Etapa 1: log(p/(1-p)) = función lineal de sus predictores
Etapa 2: log((1-p)/p) = función lineal de sus predictores
donde p denota la probabilidad de que su variable dependiente en la Etapa 1 tome el valor 1 y 1-p denota la probabilidad de que tome el valor 1.
Como se puede demostrar algebraicamente que log((1-p)/p) = - log(p/(1-p)), los coeficientes de los dos modelos serán idénticos en valor absoluto pero tendrán signos opuestos.
No está claro por qué quiere pasar a la fase 2: la fase 1 ya proporciona toda la información que necesita.