5 votos

¿Peligros de tratar los residuos como variable latente?

Tengo datos sobre variables ( $y, x_1, x_2$ ), un modelo lineal con la siguiente forma:

$$ y = \beta_0 + \beta_1x_1 + \beta_2x_2 $$

y una suposición teórica de que los residuos representan una variable latente $x_3$ :

$$ \hat{y} - y = x_3 $$

¿Cuáles son los peligros típicos de esta suposición teórica?

0 votos

¿Son X e Y dependientes del tiempo? ¿Vas a utilizar técnicas de series temporales para modelar x3? Lo pregunto porque estoy considerando un supuesto similar para un problema de modelización con datos basados en el tiempo.

0 votos

Por el contrario, trate de imaginar lo que podría suceder sin esa suposición

1voto

Earlz Puntos 19355

He visto que los residuos se consideran con una prioridad en el modelo. Bueno, en cierto modo. En un documento de un colega En este sentido, demuestran que el uso de hipótesis de agrupación bayesiana sobre B-splines explica muy bien la agrupación perceptiva de los esqueletos. Pero hay una trampa. Los esqueletos se ajustan con costillas de una longitud determinada. Este es un parámetro necesario en las b-splines. La anchura es sensible a la escala del objeto: lo grande o pequeño que es. Por lo tanto, la anchura tiene una previa gaussiana sobre ella. Sin embargo, creo que marginan tales hiperparámetros.

También hay otro colega que postula un efecto de "regresión a la media" en la memoria humana. En las tareas de memoria, el valor recordado de un acontecimiento episódico (un valor de color, la altura de una persona, etc.) tiene mayores residuos cuando el valor se aleja del valor prototípico de esa categoría (el prototipo del azul, o la altura de los hombres). Por tanto, ¡toda la teoría gira en torno a los residuos!

Creo que el peligro de predecir los residuos es no considerar todas las hipótesis alternativas. Por ejemplo, tal vez los residuos sean un error de medición, un sesgo de observación o algún otro caso que dé lugar a desviaciones de una tendencia central. Si planea seguir este camino, me aseguraría de modelar todas las posibles hipótesis alternativas y de utilizar alguna forma de comparación de modelos, quizás el AIC.

0 votos

Gracias por sus opiniones y enlaces. Para usted, los peligros son: el error de medición de las IVs y la DV alejada de la verdadera. ¿Qué pasa con los efectos de confusión de otras variables latentes con los efectos de $x_3$ ? El estudio de la memoria suena interesante, aunque me pregunto si es comparable como suena $X$ puede ser heterocedástica y los errores definitivamente sesgados a la media ($cov(\epsilon,X) \ne 0)? AIC suena bien pero no maneja la confusión latente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X