8 votos

Diseño de la encuesta chi cuadrado

¿Alguien conoce un método para comparar dos variables con una prueba de chi cuadrado si las variables proceden de encuestas diferentes con diferentes svydesign() ¿Declaraciones? Quiero comprobar una diferencia en la distribución de una variable en dos olas de una encuesta, pero la svychisq() se limita a un objeto de diseño.

¿Es legítimo apilar las dos variables en una nueva data.frame crear un nuevo svydesign con los pesos colectivos y luego ejecutar la prueba?

3voto

StasK Puntos 19497

Si va por el camino de apilar los conjuntos de datos juntos, entonces debería definir superestratos correspondientes a los dos conjuntos de datos/ondas, de modo que svydesign() sabe que son independientes. Así, su nuevo svydesign tendrá estratos = cruce de año y estrato, las UMP de los diseños originales y las ponderaciones de los diseños originales.

Como sugería en el comentario, en la literatura se han propuesto otras formas de combinar estimaciones y pruebas. Wu (2004) utiliza la verosimilitud empírica basada en variables comunes entre los dos conjuntos de datos.

Para las variables continuas, lo ideal sería utilizar la prueba de Kolmogorov-Smirnov con datos "planos", pero no sé si sus extensiones funcionan para los datos de encuestas; lo dudo. Así que puede que tenga que convertir sus variables continuas en ordinales en digamos $[\log_2(n)]$ grupos de percentiles o intervalos de igual anchura del intervalo de la variable (donde la función anterior del tamaño de la muestra es un número de intervalos comúnmente utilizado para un histograma), y aplicar el método Rao-Scott $\chi^2$ a ellos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X