11 votos

¿Por qué el uso de datos de corte transversal para inferir / predecir los cambios longitudinales de una Cosa Mala?

Estoy buscando un papel que espero existe, pero no sé si lo hace. Podría ser un conjunto de estudios de caso, y / o un argumento de la teoría de la probabilidad, acerca de por qué el uso de datos de corte transversal para inferir / predecir los cambios longitudinales puede ser una Cosa Mala (es decir, no es necesariamente así, pero puede ser).

He visto el error de hecho en un par de maneras: inferencias que se hiciera porque la gente más rica en gran Bretaña viajar más, a continuación, a medida que la sociedad se enriquece, el conjunto de la población va a viajar más. Que la inferencia resultó no ser cierto para un periodo de tiempo prolongado (más de una década. Y un patrón similar con el uso de la electricidad doméstica: datos de corte transversal implica grandes aumenta con la renta, que no se manifiestan a lo largo del tiempo.

Hay varias cosas, incluyendo la cohorte de efectos y limitaciones de la oferta.

Sería muy útil disponer de una referencia única que compila estudios de caso; y / o utiliza la teoría de la probabilidad para ilustrar por qué es que el uso de datos de corte transversal para inferir / predecir los cambios longitudinales puede ser muy engañosa.

Hace un papel de existir, y si es así, ¿qué es?

2voto

Hirek Puntos 301

Parte de la respuesta a su propia pregunta pidiendo "longitudinal" de los cambios. La sección transversal de datos son llamados por tomar una instantánea en el tiempo, literalmente, de una sección transversal en rodajas de un tiempo de evolución de la sociedad con sus múltiples relaciones. Por lo tanto, la mejor inferencia que puede hacerlo es bajo el supuesto de que sea lo que sea que usted está estudiando es invariante en el tiempo, o al menos ha llegado a la conclusión de su evolución.

Por el otro, los datos que se están buscando son los datos longitudinales o de panel de datos para los Economistas.

Una buena referencia que explica la mayoría de los métodos, pero también pone de relieve dos ejemplos destacados de la Economía está aquí. Ejemplo 2.1 cuenta de la compañía de las tasas de inversión.

La sección 3 es un poco más teórico, pero lleva una gran cantidad de información: un modelo de datos de panel pueden ser \begin{eqnarray} y_{i,t} = \alpha y_{i,t-1} + x_{i,t} \gamma + \eta_{i} + v_{i,t}. \end{eqnarray}

Ahora, este tipo de modelo puede capturar el estado de dependencia, que es (junto a la heterogeneidad no observada) una explicación común de por qué las personas se comportan de manera diferente. Por lo tanto, si usted sólo observar a la gente que viaja en un punto dado en el tiempo, su $\alpha$ no identificados, lo que significa que no son conscientes de lo mucho que en su viaje de ayer ha influido en su decisión de viajar de nuevo.

Ahora, cierra la dependencia del tiempo por un momento, pero tenga en cuenta que esta ecuación probablemente podría haber sido el verdadero modelo.

En una sección transversal en el modelo, que dejaría el subíndice $t$ totalmente debido a que sólo se tienen datos en un periodo. Por lo tanto, usted también no tiene ninguna posibilidad de contabilidad para el hecho de que cada individuo en el conjunto de datos puede tener tan diferentes que se $\eta_{i}'s$, que el sesgo de su regresiones hacia arriba por lo general, al menos cuando el verdadero modelo es dinámico. Esta es probablemente la razón de la sobreestimación debido a un inadvertido efecto individual (puede ser común, también), que no ha de medir, pero lo que se refleja en su sección transversal del estudio.

Ahora, entrar en el panel de datos de nuevo. Lo que podemos hacer es restar la media a lo largo del tiempo de cada variable, dado que la media de $\eta_i$ es constante en el tiempo, sería eliminar este término. Esta transformación (otras son posibles) le permite centrarse sólo en la dinámica (y de hecho te iba a perder cualquier invariante en el tiempo regresores).

Ahora, esta es la principal diferencia entre la sección transversal y datos de panel. El hecho de que usted puede eliminar el tiempo-invariante efecto porque tienen la variación del tiempo permite eliminar ciertos sesgos que la sección transversal de la estimación no permite detectar. Por lo tanto, antes de contemplar un cambio de política, tales como un aumento del impuesto sobre el viaje porque esperas que la gente viaje y desea obtener más ingresos para el gobierno, es más útil que la han visto el fenómeno en un par de años, así que usted puede estar seguro de que usted no es capturar la heterogeneidad no observada en la muestra que se interpreta como una propensión a viajar.

Para la estimación de estos modelos, lo mejor es ir a través de la referencia. Pero ten cuidado: los diferentes supuestos sobre el comportamiento de la gente hará diferentes estimaciones de los procedimientos admisible o no.

Espero que esto ayude!

1voto

avansledright Puntos 93

Suena muy parecido a la definición de un no-ergodic proceso (medidas a través de las realizaciones de no ser igual a las medidas a lo largo del tiempo). Lamentablemente, muy pocos interesantes fenómenos del mundo real que son ergodic. Supongo que esto podría ser un caso para una escala más fina de muestreo y la inferencia, donde ciertas simplificaciones podría llevarse a cabo. Estoy pensando para ejemplos de pequeños en el tiempo o en escalas espaciales, donde caótico comportamiento no se observa de manera predictores pueden ser linealizados. Pero estoy divagando aquí.. Me temo que no puedo ayudarte con la literatura específica sobre el tema. Lo siento :/ Pero la pregunta interesante, no obstante,

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X