4 votos

¿Cuáles son las implicaciones de un modelo de ajuste perfecto?

Realizo una regresión logística con un conjunto de datos relativamente pequeño (N=65), utilizando 12 parámetros (11 variables, una constante, sin interacciones), lo que da como resultado un modelo perfectamente ajustado (en SPSS). Tengo algunas preguntas al respecto:

  1. ¿Es correcto decir que el modelo está saturado, o sólo es así si hay menos puntos de datos que parámetros?
  2. ¿Hay alguna diferencia entre un modelo saturado y un modelo sobreparametrizado?
  3. ¿Qué debo hacer, si es que hay que hacer algo, con el hecho de que este modelo no resulte en un ajuste perfecto? Realizo esta prueba como una comprobación de robustez, las iteraciones del modelo que dejan fuera algunos de los parámetros corroboran los resultados principales. No necesariamente Necesito estimaciones de los coeficientes de este modelo, porque me interesan sobre todo los signos y los obtuve de una prueba anterior (la misma regresión, pero con variables definidas de forma diferente).

Gracias de antemano.

5voto

Craig Walker Puntos 13478

Dos posibilidades:

  1. Has dado con el modelo perfecto para tu proceso de generación de datos. Ya puedes irte a casa y dar por resuelto el problema.
  2. Has sobredimensionado tus datos.

Para diferenciarlas, necesitarás más datos de la misma DGP. Yo diría que (1) es extremadamente improbable, e incluso sin saber que su modelo tenía un ajuste perfecto, (2) sería probable sólo por saber que has hecho una regresión logística con 12 variables en 65 puntos de datos. No me gustan las reglas generales, pero creo que hay una que dice que deberías tener al menos 30 puntos de datos por variable (así que inténtalo con 2-3 variables, no con 12). Sin embargo, mucho de esto depende del contexto.

5voto

Zizzencs Puntos 1358

Con N = 65 no debería tener ciertamente 11 variables independientes. Incluso si la muestra está perfectamente dividida (32 y 33), la regla general indicaría que no hay más de 3 variables independientes.

¿Qué debe hacer? No deberías informar de estos resultados tal cual. Debería ejecutar modelos más sencillos, a menos que pueda obtener más datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X