Hola compañeros StackExchange los usuarios,
Preámbulo: he sido encargado de la realización de un análisis de conglomerados (o, posiblemente, una latente el análisis de clase, como estoy meditando) para encontrar que no se solapan los grupos como sujetos que se presentan con similar psico-social de los rasgos, como se mide en el conjunto de datos. Hay un a priori de la hipótesis sobre el número de grupos y sus características, pero el análisis es ser exploratoria, en lugar de confirmación, sin embargo. El conjunto de datos contiene varios miles de temas, y alrededor de dos docenas de variables de interés. Tan lejos, tan bueno.
Sin embargo, hay un inconveniente: la encuesta trata de un complejo de múltiples etapas diseño estratificado, que evidentemente viola el SRS de la asunción y sus derivados tradicionales de los errores estándar. Este tipo de diseños a menudo requieren de arranque para proporcionar validez de las inferencias. Observación de pesos han sido proporcionados por los arquitectos de la encuesta.
Mi pregunta: dado que las estadísticas son exploratorio y no confirmatoria, y que no formales de deducciones de cualquier tipo que se producen en este paciente-centrado en el análisis (no incluso la precisión de las estimaciones, tales como los intervalos de confianza), el complejo diseño de la encuesta se omite en la buena fe?
La única advertencia puede ser uno de validez externa; ciertos grupos demográficos se han muestreado. Pero el uso de la observación de pesos al calcular la distancia/matrices de covarianza debe dar cuenta de esto, ¿no?
Muchas gracias,
Brenden