4 votos

Las mejores prácticas cuando se combinan las olas de una encuesta que no es del panel

Esto es más de una gestión de datos de la pregunta.

Cuando la fusión de varias oleadas de una encuesta en la que se hacían las mismas preguntas en varios años, pero cada vez de una nueva muestra -- caso de que los datos de una pregunta se combinan en la misma variable o variables independientes?

Desde cada una de las ondas se administró a una muestra nueva, la única (por persona) identificador sería nueva para cada ciclo y no hay riesgo de que el análisis de las respuestas de múltiples olas como si se tratase de un conjunto de datos de panel. Pero podría usar una sola variable (digamos p1, en lugar de separar w1_q1 w2_q1 w3_q1) ser confuso o útil?

4voto

Judioo Puntos 625

Esta es una distinción entre lo que se llama a veces de gran formato y formato largo para datos de panel. Con más frecuencia en gran formato de la matriz de datos es representada como;

Unit_ID Q1_Wave1 Q1_Wave2 etc..
1       1   2
2       2   1

Mientras que en el formato largo típicamente representa los datos como;

Unit_ID Wave#   Q1
1       1   1
1       2   2
2       1   2
2       2   1

En la final, dentro de lo razonable (sistema de gestión de datos (paquete estadístico o base de datos) permitirá la transformación entre los dos, en relativamente pocos pasos.

En el caso de que usted tiene las mismas unidades para todas las ondas de gran formato es defendible (aunque cada uno tiene sus ventajas, en particular, las aplicaciones). En su caso particular, sin embargo, usted no tiene las mismas unidades para todas las ondas. Así que al final de su amplia base de datos de formato sería parecido a este (donde yo lo uso . a representar a falta de datos);

Unit_ID Q1_Wave1 Q1_Wave2 etc..
1       1        .
2       .        1

Esto es problemático, ya que es probable que desee para hacer las comparaciones de las respuestas entre las olas, pero debido a que los datos no coincide con la mayoría de los programas de la gota de los casos listwise para muchos tipos diferentes de tablas o comparaciones. Es decir, si un caso es la falta de cualquiera de los valores de una fila, se quitarán. Por definición de la naturaleza de la encuesta, cada fila tendrá los valores que faltan.

Por lo tanto sugiero que el largo formato es el más apropiado, y para las mesas o las comparaciones que uno se tiene que usar una instrucción en el programa que hace las comparaciones por las olas. Por eso sugiero que utilicen el formato;

Unit_ID Wave#   Q1
1       1   1
2       2   1

Que no artificialmente insertar los datos que faltan por definición. A pesar de una menor distinción, es difícil pensar en situaciones donde es el ancho de una mejor elección en el tipo de diseño de panel con diferentes unidades en cada ola (pero entre cada uno no es por lo general una tarea ardua, por lo que si es necesario puede pasar de largo a ancho).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X