Estoy asistiendo a un análisis de datos de la clase y algunos de mis arraigadas ideas están siendo sacudido. Es decir, la idea de que el error (epsilon), así como cualquier otro tipo de variación, se aplica sólo (eso creía yo) a un grupo (una muestra o conjunto de la población). Ahora, nos enseñan que uno de los supuestos de la regresión es que la varianza es "el mismo para todos los individuos". Esto es de alguna manera impactante para mí. Siempre he pensado que era la varianza en Y a través de todos los valores de X que se supone que es constante.
Tuve una charla con el profe, que me dijo que cuando hacemos una regresión, asumimos nuestro modelo para ser verdad. Y creo que esa es la parte difícil. Para mí, el término de error (epsilon) siempre significaba algo así como "lo que los elementos no conocemos y que pueden afectar nuestra variable de resultado, además de algunos errores de medición". En la forma en que la clase se enseña, no hay tal cosa como "otras cosas"; nuestro modelo se supone que es verdadera y completa. Esto significa que toda la variación residual tiene que ser pensado como un producto de errores de medición (por lo tanto, la medición de un individuo de 20 veces de esperarse que produzca la misma varianza como la medición de 20 individuos de una vez).
Me siento algo mal en algún lugar, me gustaría tener alguna opinión de los expertos en esto... hay un cierto margen para la interpretación de cuál es el término de error es, conceptualmente hablando?