Estoy leyendo Replanteamiento de Estadística (Sección 4.3).
Al hablar sobre el yo.yo.d. supuesto utilizado para construir un modelo de regresión lineal - sin saber si la distribución de los valores están correlacionados, el autor dice:
Un momento de reflexión nos dice que esto no es siempre cierto, en un sentido físico. Si la medición de la misma distancia de forma repetida, o el estudio de una población de alturas, es difícil argumentar que cada medición es independiente de los demás. Por ejemplo, a las alturas en las familias se correlaciona porque de alelos compartidos a través de la reciente ascendencia compartida.
El yo.yo.d. asunción no tiene que parecer torpe, sin embargo, como siempre que se recuerde que la probabilidad está en el interior del golem [el modelo], no fuera en el mundo. El yo.yo.d. asunción es acerca de cómo el golem representa su incertidumbre. Es de carácter epistemológico de la asunción. [...] El punto no es decir que la epistemología supera a la realidad, sino que en la ignorancia de este tipo de correlaciones el más conservador de distribución a utilizar es yo.yo.d. [...]
Aún más, hay muchos tipos de correlación, que hacen poco o nada para la forma general de una distribución, pero sólo afectan a la secuencia exacta en la que aparecen los valores. Por ejemplo, los pares de hermanas tienen una alta correlación alturas. Pero la distribución global de las mujeres de altura sigue siendo casi perfectamente normal. En tales casos, yo.yo.d. sigue siendo perfectamente útil, a pesar de ignorar las correlaciones.
¿Por qué se yo.yo.d. el sector más conservador del supuesto de distribución? Porque no introducir supuestos adicionales en el modelo?