8 votos

Cada log-lineal de la modelo tiene un perfecto equivalente de regresión logística?

Estoy tratando de adaptarse a una log-lineal de un modelo con un gran número de variables a partir de datos de la encuesta. Hay algunas razones por las que podría ser preferible ajuste de regresiones logísticas para que los datos en su lugar. Varias autoridades sugieren que estos son equivalentes. Sin embargo, tengo algunas razones para dudar de esto.

  1. Log-lineal de los modelos de tratar todas las variables de forma equivalente, mientras que la regresión logística requiere que una variable se identifica como la variable de respuesta.
  2. En el de mínimos cuadrados contexto, no es generalmente el caso de que Y = a+bX + ε frente a X = c+dY + ε el parámetro d es aproximadamente igual a 1/b. Esto es debido a que la primera ecuación minimiza el error vertical, mientras que el segundo minimiza horizontal de error. Estos serán iguales sólo si los errores son simétricas alrededor de la estimación de la línea. Así que estoy preocupado de que esto podría ser cierto de la regresión logística también. (2) en realidad es sólo una forma específica de (1), i. e. una posible asimetría en la regresión formato de la elección de una determinada variable de respuesta.

  3. Si todas las variables en el log-lineal de la modelo están involucrados en uno o más términos de interacción, no veo cómo una regresión logística puede ser equivalente. ¿Cómo se podía expresar las interacciones en las que la variable de respuesta está involucrado en el contexto de una regresión logística?

En respuesta al proyecto de Ley de Huber, estoy usando el término log-lineal de la modelo en mucho más sentido restringido de Wikipedia. Me estoy refiriendo a los modelos de categórica ordinal o de recuento de datos, organizados en tablas, donde los coeficientes son el recuento total de la tabla, el marginal cuenta para cada factor, dividido por el total de la tabla de conteo (que actúa como proxy para las probabilidades), y varios términos de interacción. Este es el sentido utilizado en Agresti, "Análisis de Datos Categóricos", entre otros.

4voto

Stef van Buuren Puntos 1130

La respuesta es 'no'. El modelo loglineal es más general que el modelo de regresión logística. Ver Fienberg, 1980, Análisis Cross-Clasificados de Datos Categóricos, sección 6.2 sobre cómo especificar un modelo loglineal por lo que corresponde a la regresión logística.

En realidad, lo contrario también es cierto: Si todas las variables son categóricas, a continuación, cada modelo de regresión logística corresponde a algún modelo loglineal.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X