Hay una razón intuitiva para los efectos aleatorios a ser encogido hacia su valor esperado en el modelo mixto lineal general?
Respuestas
¿Demasiados anuncios?hablando en general, la mayoría de los "efectos aleatorios" se producen en situaciones donde hay también un "efecto fijo" o alguna otra parte de la modelo. El modelo mixto lineal general se parece a esto:
$$y_i=x_i^T\beta+z_i^Tu+\epsilon_i$$
Donde $\beta$ es el de "efectos fijos" y $u$ es el de "efectos aleatorios". Claramente, la distinción sólo puede estar en el nivel conceptual, o en el método de estimación de $u$$\beta$. Por si defino un nuevo "efecto fijo" $\tilde{x}_i=(x_i^T,z_i^T)^T$ $\tilde{\beta}=(\beta^T,u^T)^T$ entonces tengo un ordinario de regresión lineal:
$$y_i=\tilde{x}_i^T\tilde{\beta}+\epsilon_i$$
Esto es a menudo un verdadero problema práctico cuando se trata de montar los modelos mixtos cuando el subyacente de los objetivos conceptuales no son claras. Creo que el hecho de que los efectos aleatorios $u$ son encogido hacia cero, y que los efectos fijos $\beta$ no proporciona un poco de ayuda aquí. Esto significa que tienden a favorecer el modelo con sólo $\beta$ incluido (es decir,$u=0$) cuando las estimaciones de $u$ tiene poca precisión en el OLS formulación, y tienden a favorecer la plena OLS formulación cuando las estimaciones $u$ tiene una alta precisión.
No de su respuesta a la pregunta de sí mismo? Si un valor se espera que, a continuación, una técnica que aporta valores más cerca de que sería lo mejor.
Una simple respuesta viene de la ley de los grandes números. Digamos que los sujetos son sus efectos aleatorios. Si ejecuta los sujetos a través de D en 200 ensayos y sujeto E en 20 ensayos de la media medido el rendimiento crees que es la más representativa de mu? La ley de los grandes números podría predecir que los sujetos E del rendimiento será más probable que se desvíe por una mayor cantidad de mu que cualquiera de la a a la D. Se puede o no, y ninguno de los sujetos podrían desviarse, pero sería mucho más justificado para reducir el tamaño del sujeto E, a efecto hacia el sujeto de la a hasta la D, de la otra manera alrededor. Para los efectos aleatorios que son más grandes y tienen menor N tienden a ser los que se aprietan más.
A partir de esta descripción también viene el por qué de los efectos fijos son los que no se reducen. Es porque están fijos,sólo hay uno en el modelo. Usted no tiene ninguna referencia a encogerse hacia ella. Usted podría utilizar una pendiente de 0 como referencia, pero eso no es lo que los efectos aleatorios son encogido hacia. Están hacia una estimación general como mu. El efecto fijo que usted tiene de su modelo es que la estimación.
Yo creo que puede ser útil a su intuición para pensar en un modelo mixto como un jerárquicos o multinivel modelo. Al menos para mí, tiene más sentido cuando pienso en la anidación y cómo el modelo de trabajo dentro y a través de las categorías de una manera jerárquica.
EDIT: Macro, me había dejado esto un poco de composición abierta porque no me ayude a ver de forma más intuitiva, pero no estoy seguro de que es correcta. Pero para expandirla en posiblemente incorrecta direcciones...
Yo lo veo como efectos fijos promedio a través de categorías y de efectos aleatorios, distinguiendo entre las categorías. En cierto sentido, los efectos aleatorios son "grupos" que comparten ciertas características, y más grande y más racimos compactos tendrá una mayor influencia sobre el promedio en el nivel superior.
Con OLS haciendo el montaje (en fases, creo), más grande y más compacto de efectos aleatorios "clusters" así le tire el ajuste más fuertemente hacia sí mismos, mientras que los más pequeños o más difundida de "grupos" se tire el ajuste menos. O tal vez el ajuste comienza más cerca de la más grande y más compacto "clusters" desde el más alto nivel de la media está más cerca de comenzar con
Siento no poder ser más claro, e incluso puede estar equivocado. Tiene sentido para mí, de manera intuitiva, pero como yo trato de escribir no estoy seguro de si es un top-down o bottom-up cosa, o algo diferente. Es una cuestión de nivel inferior "clusters" se ajusta tirando hacia sí con más fuerza, o de tener una mayor influencia en el nivel superior promedio y, en consecuencia, "acabar" más cerca del nivel más alto promedio -- o ninguno?
En cualquier caso, creo que esto explica por qué más pequeños, más difusas categorías de variables aleatorias será tirado más hacia la media que el más grande, el más compacto de categorías.