Básicamente, lo que creo que es la diferencia más clara si se modela un factor como aleatorio, es que se supone que los efectos se extraen de una distribución normal común.
Por ejemplo, si tiene algún tipo de modelo relativo a las calificaciones y desea tener en cuenta los datos de los estudiantes procedentes de diferentes escuelas y modeliza la escuela como un factor aleatorio, esto significa que asume que las medias por escuela se distribuyen normalmente. Esto significa que se están modelando dos fuentes de variación: la variabilidad dentro de la escuela de las calificaciones de los estudiantes y la variabilidad entre escuelas.
Esto da lugar a algo llamado agrupación parcial . Consideremos dos extremos:
- La escuela no tiene ningún efecto (la variabilidad entre escuelas es cero). En este caso, un modelo lineal que no tenga en cuenta la escuela sería óptimo.
- La variabilidad de los centros es mayor que la de los alumnos. Entonces, básicamente, hay que trabajar a nivel de centro en lugar de a nivel de alumnos (menos muestras). Este es básicamente el modelo en el que se tiene en cuenta la escuela utilizando efectos fijos. Esto puede ser problemático si tiene pocas muestras por escuela.
Al estimar la variabilidad en ambos niveles, el modelo mixto logra un compromiso inteligente entre estos dos enfoques. Especialmente si el número de alumnos por centro no es muy elevado, esto significa que los efectos de los centros individuales estimados por el modelo 2 se reducirán con respecto a la media global del modelo 1.
Esto se debe a que los modelos dicen que si se tiene una escuela con dos estudiantes incluidos que es mejor de lo que es "normal" para la población de escuelas, entonces es probable que parte de este efecto se explique porque la escuela ha tenido suerte en la elección de los dos estudiantes considerados. No lo hace a ciegas, sino en función de la estimación de la variabilidad dentro de la escuela. Esto también significa que los niveles de efecto con menos muestras se inclinan más hacia la media general que las escuelas grandes.
Lo importante es que necesitas intercambiabilidad en los niveles del factor aleatorio. Eso significa en este caso que las escuelas son (desde tu conocimiento) intercambiables y no sabes nada que las haga distintas (aparte de algún tipo de ID). Si dispone de información adicional, puede incluirla como factor adicional; basta con que las escuelas sean intercambiables a condición de que se tenga en cuenta el resto de la información.
Por ejemplo, tendría sentido suponer que los adultos de 30 años que viven en Nueva York son canjeables en función del sexo. Si dispone de más información (edad, etnia, educación), también tendría sentido incluirla.
Por otra parte, si se tiene un estudio con un grupo de control y tres grupos de enfermedades muy diferentes, no tiene sentido modelar el grupo como aleatorio, ya que las enfermedades específicas no son intercambiables. Sin embargo, a muchas personas les gusta tanto el efecto de contracción que seguirían defendiendo un modelo de efectos aleatorios, pero esa es otra historia.
Me he dado cuenta de que no he entrado demasiado en las matemáticas, pero básicamente la diferencia es que el modelo de efectos aleatorios estimaba un error distribuido normalmente tanto en el nivel de las escuelas como en el nivel de los estudiantes, mientras que el modelo de efectos fijos tiene el error sólo en el nivel de los estudiantes. Esto significa especialmente que cada escuela tiene su propio nivel que no está conectado a los otros niveles por una distribución común. Esto también significa que el modelo fijo no permite extrapolar a un estudiante o escuela no incluidos en los datos originales, mientras que el modelo de efectos aleatorios sí lo permite, con una variabilidad que es la suma de la variabilidad a nivel de estudiante y a nivel de escuela. Si está interesado específicamente en la probabilidad, podríamos incluirla.
1 votos
Pues bien, los efectos fijos afectan a la media de una distribución conjunta y los efectos aleatorios afectan a la varianza y a la estructura de asociación. ¿Qué quiere decir exactamente con "diferencia matemática"? ¿Está preguntando cómo cambia la probabilidad? ¿Puede ser más específico?
1 votos
De posible interés: ¿Cuál es la diferencia entre los modelos de efectos aleatorios, fijos y marginales?
1 votos
También relacionado: ¿Cuál es la diferencia entre los modelos de efectos fijos, aleatorios y mixtos?
1 votos
La pregunta no parece distinguir el trasfondo del que parte. La terminología de la Economía de Datos de Panel es diferente de la de otras ciencias sociales que utilizan Modelos Multinivel. La pregunta requiere más aclaraciones. De lo contrario, resultará engañosa para quienes lleguen aquí desde uno u otro ámbito sin saber que existe una definición alternativa en un campo relacionado.