5 votos

¿Cargar la relación de los datos entre Y y X?

Antecedentes:

Actualmente soy la topografía de una serie de artículos relacionados con el tema de la expansión urbana. Una de las cosas que me he encontrado varias veces en la literatura (cosa que parece molestar a mi), es un tanto extraña relación entre los datos que se han utilizado para crear el dependiente y las variables independientes.

La relación:

Imagina que:

  • La variable dependiente (y) = el tamaño de la ciudad central de la población.

  • Una variable de control (x) = el tamaño de la población metropolitana.

  • ... y que el tamaño de la población metropolitana es una suma de la parte central de la población de la ciudad y las afueras de la población (es decir, x = y + (x - y)).

Pregunta:

¿La anteriormente citada relación no inducir algún tipo de sesgo, dado que los obtenidos de la covarianza está parcialmente basado en el tamaño de y, que en última instancia hace que x endógena y)?

Descargo de responsabilidad:

Lo siento si la pregunta es demasiado simple, no podía encontrar un post con una pregunta similar, ni ningún libro de texto ejemplos.

3voto

Judioo Puntos 625

Empecemos por definir los dos subconjuntos separados;

  • la población metropolitana, $X_m$
  • la no-metro de la población, $X_s$
  • el total de la población, a continuación, $Y = X_m + X_s$

Y entonces, ¿cómo interpretar la covarianza de $Cov(Y,X_m)$? Bien, usted puede reemplazar a $Y$ con sus componentes, por lo que luego ha $Cov(X_m + X_s,X_m)$. Esto puede ser reescrita como:

$$Cov(X_m + X_s,X_m) = Cov(X_s,X_m) + Var(X_m)$$

Así que pensando engañosa ejemplos, la covarianza entre el metro y no de metro de las poblaciones puede ser cero, pero la covarianza entre la población total y el metro de la población sería positivo porque $Var(X_m)$ es positivo. También si lo que ocurre es que la covarianza entre el metro y no de metro de la población es negativo (por ejemplo, compiten por la población) $Cov(Y,X_m)$ podría ser cercana a cero, especialmente si usted artificialmente seleccionar una muestra que tiene poca variación en $X_m$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X