Supongamos que tengo algunos ítems de autoinforme medidos en una escala Likert de 5 puntos (de Totalmente en desacuerdo a Totalmente de acuerdo) y otros ítems medidos en una escala Likert de 4 puntos (Nunca, Rara vez, A veces, A menudo). ¿Puede alguien indicarme la bibliografía (o consejos prácticos) para combinar estos elementos en una escala compuesta? Supongamos, por el bien del argumento, que tenemos alguna evidencia empírica de que los ítems deben combinarse.
Algunas ideas:
1. Suma de las puntuaciones brutas
Pro: Fácil
Contra: Las respuestas máximas en la escala de 5 puntos (originalmente de 4) aumentan la puntuación total de la escala más que las respuestas máximas en la escala de 4 puntos (originalmente de 3).
2. Reescalar y sumar
Coloca todos los elementos en una escala de 0 a 1 y súmalos. Así, los ítems de 4 puntos (0,1,2,3) se multiplicarían por (4/3)/4 y los ítems de 5 puntos (0,1,2,3,4) se multiplicarían por 1/4, lo que daría lugar a valores posibles de (0,,33,,66,1) y (0,,25,,50,,75,1), respectivamente. De este modo, las respuestas máximas en la escala de 5 puntos (originalmente 4) no aumentarían la puntuación total de la escala más que las respuestas máximas en la escala de 4 puntos (originalmente 3).
Pro: Los artículos tendrían la misma ponderación. (podría ser un contra, dependiendo de su perspectiva).
Inconveniente: ¿Ignora las diferencias de variabilidad entre los artículos en las diferentes métricas?
3. Normalizar y sumar
Un enfoque relacionado sería estandarizar todos los ítems (puntuación z) y luego sumarlos.
Pro: Aborda las diferencias de variabilidad entre los artículos en diferentes métricas
Inconveniente: la puntuación total de la escala es menos interpretable y específica de la muestra. Esto último hace que sea difícil de comparar como una medida para ser utilizada en otros entornos/otras muestras.
4. PCA u otra reducción de datos
4a. EFA para obtener las cargas factoriales. Multiplique los ítems escalados por las cargas factoriales.
4b. PCA para obtener la puntuación del primer componente principal.
Pro: Artículos ponderados por influencia.
Contra: Lo mismo que el nº 2. Las puntuaciones derivadas del EPT podrían variar mucho en función de las opciones de rotación/extracción. Algunos no lo aconsejarían con datos ordinales.
En general: me gusta el número 2 porque parece más fácil comparar los resultados entre diferentes muestras. ¿Qué opina? ¿Ideas alternativas o preocupaciones sobre las ideas presentadas?