¿Puede alguien explicar la diferencia entre variables observadas y variables inobservadas (preferiblemente en inglés sencillo)?
Respuestas
¿Demasiados anuncios?Las variables observadas son aquellas para las que se dispone de mediciones en el conjunto de datos, mientras que las variables no observadas (o latentes) son aquellas para las que no se dispone de mediciones.
Cuando el análisis revela correlaciones entre variables observadas, es posible buscar variables no observadas que expliquen la correlación, sobre todo en los casos en que se duda de que exista una relación causal directa entre ellas. Por poner un ejemplo rebuscado, supongamos que su conjunto de datos incluye las variables "consumo de helados" y "uso del aire acondicionado", que están fuertemente correlacionadas. Podrías sospechar que hay una variable no observada (la temperatura), que actúa como causa común, impulsando la correlación.
A veces, la variable no observada lo es porque no se puede medir directamente. (Tal vez la variable sea de naturaleza más teórica, o tal vez la variable sea en principio directamente medible, pero sería difícil/caro medirla en la práctica). Por ejemplo, no podemos medir la inteligencia directamente, así que utilizamos medidas indirectas, como el rendimiento en los tests de inteligencia, como sustituto.
¿Investiga en economía? Normalmente, las características inobservables son las que capta el término de error y sesgan tus estimaciones, por ejemplo por heteroscedasticidad. Te pondré un ejemplo.
Cuando se lleva a cabo una prueba de correspondencia en el mercado laboral para estudiar la discriminación étnica en la contratación, envía falsas solicitudes de empleo emparejadas. Una de las solicitudes se refiere al solicitante "rojo", mientras que la otra se refiere al solicitante "verde" (donde "verde" y "rojo" son dos grupos étnicos cualesquiera). La etnia es la única característica observable que difiere entre los dos falsos solicitantes; sin embargo, en las solicitudes hay muchas otras características que son iguales (bueno, en realidad son equivalentes, no realmente iguales) para los dos solicitantes, como por ejemplo: nivel de estudios alcanzado, edad, experiencia laboral, etc... Todas estas características son observables (desde el punto de vista del experimentador y desde el del empleador) porque figuran en el CV, mientras que la etnia puede entenderse a partir del nombre de los solicitantes.
Otras características que no figuran en el CV no son, por tanto, observables ni por los empresarios ni por los experimentadores. Estas características son las denominadas "características inobservables". Estas características inobservables afectarán a la estimación de la discriminación en la contratación a través de la heteroscedasticidad (=varianza diferente de los residuos, para los dos grupos comparados). Para más información sobre este punto, véase este artículo y este artículo .
Un problema similar se plantea pruebas de auditoría en el que, en lugar de enviar candidatos ficticios por escrito, el experimentador envía a dos actores a presentarse en persona a una entrevista de trabajo. Los dos actores coinciden en todas las características excepto en el grupo étnico. Sin embargo, habrá características diferentes entre los dos solicitantes que no hayan sido observadas por el experimentador, pero que sí serán observadas por el empresario, también en este caso hablamos de características inobservables. Por ejemplo, un candidato tiene una voz más agradable, o el candidato apesta un poco durante el día de la entrevista o no se peinó bien, etc... aunque estos ejemplos puedan parecer una tontería, estas diferentes características inobservables podrían llegar a determinar una diferencia sistemática en las decisiones de contratación de los dos falsos candidatos y, por tanto, sesgar los resultados.