5 votos

¿Es posible a las observaciones de peso encuesta a más de una distribución?

Tengo una encuesta de una muestra de una población cuya distribución de determinadas características no son idénticas a las distribuciones de la población en general. Por ejemplo, la edad de mi encuestados pueden estar sesgados a la baja, o de los ingresos en mi ejemplo puede ser demasiado alta en comparación con la población (o a mi teóricos de la distribución de la población, si la actual distribución de la población es desconocido).

Sé que es posible calcular un coeficiente de ponderación que puede ajustar la distribución de la muestra para que coincida con la distribución de la población en una dimensión, pero es posible ajustar de dos dimensiones (por ejemplo, la edad y los ingresos)? Si es así, ¿no sería una situación en la que no hay ninguna solución (no hay un único coeficiente que va a ajustar la distribución de las muestras para la distribución de la población en ambas dimensiones?)

3voto

Chris Marasti-Georg Puntos 17023

La respuesta a la pregunta, el horquillado, por el momento, si es una buena idea, es que sí, hay maneras de hacer esto. Si usted tiene información sobre la distribución conjunta de la población por encima de todas las variables de interés (por ejemplo, a partir de un censo), puede "poststratify" para que la distribución conjunta, en el caso de variables discretas, o el uso de "calibración" para obtener más general combinaciones de discretas y variables continuas. Si usted tiene solamente la información sobre la distribución marginal y está dispuesto a creer que una suposición de independencia en las dimensiones no introducir demasiada sesgo, entonces usted puede "rastrillo" a los márgenes. Usted puede combinar la post-estratificación, la calibración, y rastrillar para asistir a la arbitraria de las combinaciones de información a la población. El uso de un paquete de software para hacerlo, aunque (por ejemplo, la "encuesta" paquete en R o de la svy conjunto de comandos de Stata), debido a que los cálculos puede ser complicado. Accesibles para la introducción a estos conceptos con ejemplos desarrollados en R y Stata, respectivamente, consulte las siguientes dos referencias:

Lee y Forthofer. El Análisis Complejo De Datos De La Encuesta. La salvia.

Lumley. Encuestas complejas: Una Guía para el Análisis de Uso de R. Wiley.

Ahora, @Mohit preguntó por qué se quiere hacer esto. De hecho, usted debe pensar acerca de ello. Intuitivamente, parecería que están reduciendo el sesgo en la estimación de los parámetros de la población de la muestra. Pero hay casos en los que dicha ponderación puede exacerbar los prejuicios; la búsqueda de la "no ignorables" missingness o de selección de la muestra de los problemas.

1voto

bounav Puntos 1201

Acabo de pedir una aclaración : ¿por qué quieres hacer esto? Como yo lo entiendo, para hacer esto correctamente, usted necesita tener algo de hormigón de referencia a través de la cual usted es cuantificar el sesgo.

La cosa más importante es cuán apropiado es el punto de referencia elegido? (Estamos estandarizar el mal de la base?)

Incluso si tenemos el punto de referencia correcto, es cierto que el punto de referencia es exactamente cierto? (El problema de la coincidencia de cada variable de referencia)

Si usted me pregunta, continúe con el ejemplo, y cuantificar por separado para cada variable el aparente sesgo de la muestra para el "punto de referencia" de la población. Yo supongo que esto sería más informativo y precisa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X