37 votos

Interpretación de las predicciones simples a odds-ratios en regresión logística

Soy un poco nuevo en el uso de la regresión logística, y un poco confundido por una discrepancia entre mis interpretaciones de los siguientes valores que pensé que sería el mismo:

  • exponentiated los valores beta
  • predice la probabilidad de que el resultado utilizando los valores beta.

Esta es una versión simplificada del modelo que yo estoy usando, donde la desnutrición y seguro tanto en código binario, y la riqueza es continua:

Under.Nutrition ~ insurance + wealth

Mi (real) modelo devuelve un exponentiated beta valor de .8 para el seguro, que yo interpretaría como:

"La probabilidad de estar desnutridos para un asegurado individual es .8 veces la probabilidad de ser desnutridos para un seguro médico individual."

Sin embargo, al calcular la diferencia en las probabilidades de los individuos, poniendo en valores de 0 y 1 en el seguro de la variable y el valor de la media de la riqueza, la diferencia en la desnutrición es sólo .04. Que se calcula como sigue:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

Yo realmente apreciaría si alguien podría explicar por qué estos valores son diferentes, y qué mejor interpretación (en particular para el segundo valor) podría ser.


Aclaración Ediciones
Como yo lo entiendo, la probabilidad de ser desnutrido para una persona sin seguro (donde B1 corresponde a los seguros) es:

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

Mientras que la Probabilidad de ser desnutrido para una persona asegurada es:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

Las probabilidades de que están subnutridas para una persona sin seguro en comparación con una persona asegurada es:

exp(B1)

Es allí una manera de traducir entre estos valores (matemáticamente)? Todavía estoy un poco confundido por esta ecuación (donde probablemente debería ser un valor diferente en el lado derecho):

Prob(Ins) - Prob(Unins) != exp(B)

En términos sencillos, la pregunta es ¿por qué no asegurar que un individuo cambie su probabilidad de ser desnutrido tanto como el odds ratio indica que hace? En mis datos, Prob(Ins) - Prob(Unins) = .04, donde el exponentiated beta valor .8 (entonces, ¿por qué la diferencia de que no .2?)

61voto

Sean Hanley Puntos 2428

Parece evidente para mí que $$ \exp(\beta_0 + \beta_1x) \neq\frac{\exp(\beta_0 + \beta_1x)}{1+\exp(\beta_0 + \beta_1x)} $$ a menos $\exp(\beta_0 + \beta_1x)=0$. Por lo tanto, estoy menos clara acerca de lo que la confusión podría ser. Lo que puedo decir es que el lado izquierdo (LI) de la (no) el signo igual es el de probabilidades de ser desnutridos, mientras que el lado derecho es la probabilidad de que están subnutridas. Cuando se examinó en su propio, $\exp(\beta_1)$, es el odds ratio, que es el factor multiplicativo que le permite pasar de las probabilidades($x$) de las probabilidades($x+1$).

Déjeme saber si usted necesita información adicional / información diferente.

Actualización:
Creo que esto es más una cuestión de estar familiarizado con las probabilidades y las probabilidades, y cómo se relacionan el uno con el otro. Nada de eso es muy intuitivo, usted necesita para sentarse y trabajar con él por un tiempo y aprender a pensar en esos términos; no viene naturalmente a nadie.

El problema es que los números absolutos son muy difíciles de interpretar por su cuenta. Digamos que me estaba contando acerca de un tiempo cuando yo tenía una moneda y me preguntaba si era justo. Así que se volcó a algunos y tiene 6 cabezas. ¿Qué significa eso? Es el 6 de mucho, un poco, a la derecha? Es muy difícil de decir. Para lidiar con este problema que queremos dar a los números un poco de contexto. En un caso como este hay dos opciones obvias para proporcionar el necesario contexto: me podría dar el número total de lanzamientos, o me podría dar el número de colas. En cualquier caso, dispone de la información adecuada para dar sentido a 6 cabezas, y se podría calcular el valor de las otras si el que te dijo que no era la persona que usted prefiere. La probabilidad es el número de cabezas dividido por el número total de eventos. Las probabilidades es la relación entre el número de cabezas para el número de no-jefes (intuitivamente, se quiere decir que el número de colas, que funciona en este caso, pero no se si hay más de 2 posibilidades). Con las probabilidades, es posible dar dos números, por ejemplo, de 4 a 5. Esto significa que en el largo plazo va a pasar algo 4 veces por cada 5 veces no sucede. Cuando las probabilidades están presentados de esta manera, se llaman "Las Vegas odds". Sin embargo, en las estadísticas, por lo general, se dividen a través de y decir que las probabilidades son .8 en su lugar (es decir, 4/5 = .8) para efectos de la normalización. También puede convertir entre el odds y probabilidades: $$ \text{probabilidad}=\frac{\text{probabilidades}}{1+\text{probabilidades}} ~~~~~~~~~~~~~~~~ \texto{probabilidades}=\frac{\text{probabilidad}}{1-\text{probabilidad}} $$ (Con estas fórmulas puede ser difícil reconocer que las probabilidades es el lado izquierdo en la parte superior, y la probabilidad es la RHS, pero recuerda que el no es igual signo en el medio.) Una odds ratio es sólo las probabilidades de que algo dividido por la probabilidad de algo más; en el contexto de la regresión logística, cada una de las $\exp(\beta)$ es la proporción de las probabilidades para los sucesivos valores de la covariable cuando todo lo demás se mantiene igual.

Lo que es importante para reconocer a partir de todas estas ecuaciones es que las probabilidades odds y odds ratios no se equiparan en cualquier manera sencilla, simplemente porque la probabilidad sube por .04 mucho ¿ no implica que las probabilidades o odds ratio debería ser algo como .04! Por otra parte, las probabilidades rango de $[0, 1]$, mientras que ln odds (la salida de la raw de regresión logística ecuación) puede variar desde $(-\infty, +\infty)$, y odds y odds ratio puede variar de $(0, +\infty)$. Esta última parte es de vital importancia: Debido a la limitada gama de probabilidades, probabilidades son no-lineales, pero ln odds puede ser lineal. Que es, como (por ejemplo) wealth sube por los constantes incrementos, la probabilidad de desnutrición va a aumentar en cantidades variables, pero la ln odds aumentará en una cantidad constante y las probabilidades de que se incrementará en una constante multiplicativa factor. Para cualquier conjunto dado de valores en el modelo de regresión logística, puede haber algún punto donde $$ \exp(\beta_0 + \beta_1x)-\exp(\beta_0 + \beta_1x') =\frac{\exp(\beta_0 + \beta_1x)}{1+\exp(\beta_0 + \beta_1x)}-\frac{\exp(\beta_0 + \beta_1x')}{1+\exp(\beta_0 + \beta_1x')} $$ para algunos, por $x$$x'$, pero va a ser desigual en todas las demás.

(Aunque fue escrito en el contexto de una pregunta, mi respuesta aquí contiene una gran cantidad de información acerca de regresión logística que puede ser útil para usted en la comprensión de LR y cuestiones relacionadas con el más completo.)

-1voto

Niksr Puntos 59

Odds ratio OR=Exp(b) se traduce en la Probabilidad de A = SQRT(O)/(SQRT(U)+1), donde la Probabilidad es la probabilidad de Un Evento y O es la relación de que suceda Un evento/no ocurra Un evento (o expuestos/no expuestos por el seguro como en la pregunta anterior). Me tomó bastante tiempo para resolver; no estoy seguro de por qué es que no bien conocida fórmula.

Hay un ejemplo. Supongamos que hay 10 personas que ingresaron a la universidad; 7 de ellos son hombres. Así, por cada hombre es un 70% de probabilidad de ser admitido. Las probabilidades de ser admitido para los hombres son 7/3=2.33 y no para ser admitido 3/7=0.43. Odds ratio (or) es de 2,33/0.43=5.44 que significa que para los hombres 5.44 veces más probabilidades de ser admitido lugar para las mujeres. Vamos a encontrar la probabilidad de ser admitido por el hombre a partir de: P=SQRT(5.44)/(SQRT(5.44)+1)=0.7

Actualización Esto es cierto sólo si el número de hombres o mujeres que ingresan son de igual número de aspirantes. En otras palabras, no es la O. No podemos encontrar la probabilidad de la ganancia (o pérdida) depende del factor sin saber obtener información adicional.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X