1 votos

EFA sobre datos de cuestionario intrínsecamente sesgados

Tengo un conjunto de datos muy amplio en el que se presentaron a los participantes viñetas cortas que contenían escenarios que provocaban miedo. Los participantes valoraron temeroso encontraron estas viñetas en una escala Likert del 1 al 7. El objetivo de estos datos era realizar un AFE para examinar qué variables latentes impulsan la respuesta a estas viñetas.

Tengo respuestas válidas de N = 467 participantes en 142 de estas viñetas, y una docena de viñetas neutras que se incluyeron sólo para asegurarme de que la gente respondiera con sensatez. Cuando someto los datos a un análisis factorial con rotación oblicua, obtengo factores interpretables (es decir, que encajan con algunas predicciones teóricas).

Lo que me preocupa, sin embargo, es que los datos están intrínsecamente muy sesgados positivamente. Esto se debe a que las viñetas individuales están diseñadas para provocar miedo. Esto significa que habrá muchas más respuestas por encima de la mediana de la escala que por debajo. (Las viñetas de control son básicamente el reflejo de las de miedo, que es lo que cabría suponer, y aparecen como un factor muy distinto). La idea general es que la respuesta diferirá de una viñeta a otra en función de los desencadenantes del miedo dentro de las diferentes viñetas.

Hace mucho tiempo que no hago análisis factorial, pero tengo entendido que es una extensión de la correlación/regresión y, por lo tanto, la normalidad es un supuesto clave. Las pruebas formales de normalidad univariante salen como cabría esperar, con cada viñeta muy razonablemente sesgada, y el MVN para R indica que los datos no superan las pruebas de normalidad multivariante.

Traté de tomar el Tabachnick y Fidell recomendado de transformar los datos, pero no parece funcionar.

¿Algún otro enfoque para limpiar los datos que merezca la pena probar? ¿Me convendría recurrir a algo distinto del análisis factorial?

1voto

Zizzencs Puntos 1358

Creo que la cuestión aquí es que las variables ni siquiera son continuas: son ordinales. Mucha gente haría un análisis factorial de los datos brutos de todos modos, pero ha habido algunas investigaciones sobre mejores enfoques.

Un buen documento es Joreskog y Moustaki (2006) y documentos citados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X