3 votos

Ponderaciones de la encuesta a varios niveles

Estoy trabajando con algunos datos de una encuesta de viajes de los hogares, y tengo una pregunta sobre la mejor manera de utilizar las ponderaciones de la encuesta que se proporcionan. La estructura consiste en que se toman muestras de los hogares y se pide a todos los individuos del hogar que completen un diario de viaje durante un día. Cada individuo registra todos los viajes durante ese periodo de 24 horas. El contratista de los datos suministra tres ponderaciones con el conjunto de datos: una ponderación del hogar, una ponderación de la persona y una ponderación del viaje.

Ahora, me gustaría fusionar los archivos de hogares, personas y viajes para realizar algunos análisis. Mi confusión proviene del hecho de que quiero incluir variables de cada uno de estos niveles en mi modelo principal. Por ejemplo, digamos que quiero conocer la asociación entre el tipo de vehículo utilizado para un viaje determinado y la distancia recorrida en ese viaje, al tiempo que añado la edad de la persona y los ingresos totales del hogar como covariables, además de la interacción entre la edad y el vehículo utilizado. Por tanto, se incluyen variables de los tres niveles. Sin ponderaciones, este es claramente un modelo de 3 niveles y podría ejecutarlo como un modelo multinivel, pero ya que hay ponderaciones, ¿cómo debería estructurarse? ¿Lo ejecuto como un modelo de un nivel utilizando la ponderación del viaje (ya que es el nivel más bajo de análisis)? ¿O tiene que estructurarse como un modelo multinivel incluyendo también las ponderaciones de la encuesta en cada nivel? En un principio había pensado en esto último, pero luego leí que no hay ningún método disponible para ejecutar modelos ponderados de tres niveles con una variable dependiente categórica, que es la que utilizaré en mis análisis (final del primer párrafo, Mplus User's Guide v7, pág. 252).

2voto

Tim Puntos 24

Las ponderaciones sólo deben utilizarse cuando se trata de generar estimaciones de población a partir de los datos de la encuesta. Si está interesado en realizar modelos de comportamiento, como parece ser el caso, sólo tiene que utilizar los datos brutos sin las ponderaciones. Mientras tenga una sección transversal razonable de encuestados en la muestra que cubra las respuestas conductuales de interés, y sólo esté estimando un único coeficiente en cada variable, los modelos deberían funcionar bien.

0voto

l1feh4ck3r Puntos 81

I piense en Creo que lo que se quiere es simplemente agregar o desagregar a los niveles sobre los que se hacen declaraciones en última instancia (y utilizar únicamente las ponderaciones para ese nivel específico). esto es ciertamente lo que se hace en la mayoría de las encuestas a nivel de hogar realizadas por el gobierno federal de los Estados Unidos cuando los resultados se tabulan, resumen o regresan a nivel de persona.

el script de replicación en esta lengua r encuesta nacional de viajes en los hogares La página de instrucciones paso a paso incluye algunas estimaciones en los diferentes niveles y coincide con las publicaciones oficiales de la ornl.

0voto

StasK Puntos 19497

Hay que pensar claramente en el población que está analizando. En una encuesta típica sobre viajes intervienen varias poblaciones:

  1. Hogares (y familias, aunque son técnicamente diferentes): grupos de personas que suelen convivir bajo el mismo techo y que comparten ingresos, gastos, toma de decisiones y, a veces, vehículos.
  2. Individuos, anidados dentro de los hogares.
  3. Días de viaje, que pueden definirse para los hogares (todos los viajes que realizan todos los miembros de un HH en un día determinado) o en los individuos (todos los viajes que realiza un individuo en un día determinado).
  4. Vehículos, anidados dentro de los hogares.
  5. Viajes no vinculados: un segmento individual con un solo modo de transporte.
  6. Viajes vinculados: un viaje con un propósito específico realizado por un individuo o un grupo de individuos. Un ejemplo podría ser

Conduje hasta la estación de metro, aparqué el coche, caminé hasta la estación de tren, cogí el tren, tomé el autobús y caminé dos manzanas desde el autobús hasta el trabajo.

Se trata de seis viajes no enlazados en cuatro modos.

Un ejemplo complicado podría ser

Mi esposa, nuestro hijo y yo salimos de nuestra casa con una bicicleta en el estante. Dejamos a la niña en el colegio, mi mujer la acompañó durante dos manzanas desde donde pudimos parar. Luego dejé a mi mujer en su gimnasio y ella descargó la bici para volver a casa. Luego conduje hasta la estación de metro donde aparqué el coche y cogí el tren para ir al trabajo. Mi mujer volvió a casa con la bici después de su entrenamiento en el gimnasio.

Se trata de dos vehículos, tres personas y unos ocho viajes sin conexión.

  1. También puede haber interés en las calles o manzanas como unidades de análisis. Si no se muestrean explícitamente, es probable que deban tratarse como dominios o subpoblaciones en el análisis.

Cada una de estas poblaciones puede requerir ponderaciones separadas. Normalmente, en un HHTS, se enumerará el hogar y se pedirá a todos que enumeren todos los viajes de un día determinado, por lo que los factores de ponderación adicionales que van del HH (población 1) a los individuos (población 2) y sus viajes (poblaciones 5 y 6) serían 1.

Francamente, no veo especial necesidad de recurrir a los modelos multinivel a la Mplus. En primer lugar, ninguna de las variables que tiene sería normal, ni siquiera remotamente (du-uh). En segundo lugar, la ponderación en múltiples niveles en los modelos mixtos tiene su propio conjunto de peligros ( Pfeffermann et. al. 1998 ). Hay demasiadas piezas en movimiento que amenazan con arruinar tu análisis. Yo simplemente ejecutaría esto como una regresión o un modelo GLM con las ponderaciones adecuado para la población de interés y corrigiendo los errores estándar para la agrupación dentro de la HH (o cualquier etapa de selección anterior a la HH).

En una nota algo relacionada, escribí sobre la ponderación conjunta de las características del hogar y de la persona aquí .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X