4 votos

Cómo combinar datos de 5 encuestas de la misma población que abarcan 10 años

Tengo los resultados de las 5 encuestas cada 2 años de diferencia y supongamos que no los sujetos son seleccionados en más de una encuesta.

El método de muestreo utilizado en estos estudios son parciales y tengo los pesos de muestreo calculado(con respecto a la población) para cada punto de datos en cada estudio.

La pregunta es, ¿cómo iba yo a ser capaz de combinar los 5 conjuntos de datos y tener los pesos a calcular para obtener un gran conjunto de datos para el análisis de esta población?

También, ¿qué debo hacer si los sujetos aparecen en más de una encuesta?

Actualizaciones/Mayor Elaboración:

gracias @user30523, aquí hay más información que podría ser útil:

Supongamos que deseo averiguar la distribución estimada de altura entre la población el uso de estos 5 conjuntos de datos.

En algunos de los datos, las personas más jóvenes son representados debido a la ubicación donde la encuesta se llevó a cabo. Supongamos que los pesos se calculan con respecto a su edad.

Por ejemplo. suponiendo que el 2% de la población de 15 años de edad, y la ubicación de la encuesta es en un centro comercial donde los jóvenes de 15 años representaron el 5% de todos los compradores, el muestreo de peso por un sujeto de 15 años de edad en que la encuesta se calcula de 0.02 / 0.05 = 0.4. Para simplificar, cada persona en el centro comercial tiene igual probabilidad de ser encuestados y que todos los participantes hayan cumplido cuando se le preguntó.

Teniendo en cuenta que 5 de las encuestas se llevó a cabo en 5 centros comerciales diferentes y cada uno tiene su conjunto de los pesos calculados de la misma manera, ¿cómo podría entonces ser capaz de combinar todos los 5 conjuntos de datos y volver a calcular las ponderaciones de muestreo?

P. S: soy nuevo en el tema de los pesos de muestreo para qué me corrija si he cometido errores en la forma en que se han calculado los pesos.

2voto

Alistair Puntos 41

Creo que si cada conjunto de datos ya está ponderado para su satisfacción, entonces usted tiene un par de opciones diferentes. Cuál es el más adecuado puede variar dependiendo de tus objetivos y que los detalles de tu existentes de recopilación de datos y de ponderación.

  • (#1) de la Unión de todos los conjuntos de datos, junto con sus pre-calculada en pesos, y eso es todo.

Esta sería la elección correcta si cada conjunto de datos se inclina hacia una adecuada recuento total y no sobre-estado de la importancia de cualquier registro individual en relación con otro conjunto de datos. Si un conjunto de datos ponderados para reflejar el Total de la Población de estados unidos, y otro conjunto de datos fue ponderado en lugar de a su propio recuento total de los encuestados, a continuación, esta no sería la elección correcta.

  • (#2) Calcular un peso para cada conjunto de datos para multiplicar por cada registro existente de peso

Esta sería la elección correcta si cada uno de los conjuntos de datos tienen la misma importancia, independientemente de su tamaño. Ejemplo de abajo...

  • (#3) de la Unión de todos los datos sin procesar y re-calcular los pesos en el nuevo conjunto de datos completo

Esta sería la elección correcta si las razones para la no-respuesta son similares a través de diferentes encuestas - los resultados en el más simple de los datos para trabajar con, y es el menos probable para producir extrema pesos.

Ejemplo #2: cada conjunto de datos se pondera de igual importancia, con este "conjunto de datos de peso" que se multiplica por cualquier peso ya ha sido calculado dentro del conjunto de datos.

> Survey 1: 100 people   weight:  2
> Survey 2: 200 people   weight:  1
> Survey 3: 300 people   weight:  2/3
> Survey 4: 150 people   weight:  4/3
> Survey 5: 250 people   weight:  4/5

0voto

user163 Puntos 48

Es difícil responder a su pregunta, sin datos de ejemplo o de cómo se calculan los pesos.

Tratando de descifrar su pregunta, parece que la cosa más sencilla de hacerlo sería la de unirse a los conjuntos de datos mediante el comando join de la plyr paquete en R.

Una vez que usted tiene un gran conjunto de datos, se puede recalcular los pesos.

Como mucho, como si los sujetos que aparecen en más de una encuesta, depende de qué tipo de análisis que se está haciendo, el plan de muestreo, y cómo muchos de los temas que se repita. Necesito más información antes de que pueda hacer una sugerencia sobre qué hacer.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X