9 votos

¿Asesoría/literatura sobre la combinación de ítems con diferentes escalas de respuesta en escalas compuestas?

Supongamos que tengo algunos ítems de autoinforme medidos en una escala Likert de 5 puntos (de Totalmente en desacuerdo a Totalmente de acuerdo) y otros ítems medidos en una escala Likert de 4 puntos (Nunca, Rara vez, A veces, A menudo). ¿Puede alguien indicarme la bibliografía (o consejos prácticos) para combinar estos elementos en una escala compuesta? Supongamos, por el bien del argumento, que tenemos alguna evidencia empírica de que los ítems deben combinarse.

Algunas ideas:

1. Suma de las puntuaciones brutas

Pro: Fácil

Contra: Las respuestas máximas en la escala de 5 puntos (originalmente de 4) aumentan la puntuación total de la escala más que las respuestas máximas en la escala de 4 puntos (originalmente de 3).

2. Reescalar y sumar

Coloca todos los elementos en una escala de 0 a 1 y súmalos. Así, los ítems de 4 puntos (0,1,2,3) se multiplicarían por (4/3)/4 y los ítems de 5 puntos (0,1,2,3,4) se multiplicarían por 1/4, lo que daría lugar a valores posibles de (0,,33,,66,1) y (0,,25,,50,,75,1), respectivamente. De este modo, las respuestas máximas en la escala de 5 puntos (originalmente 4) no aumentarían la puntuación total de la escala más que las respuestas máximas en la escala de 4 puntos (originalmente 3).

Pro: Los artículos tendrían la misma ponderación. (podría ser un contra, dependiendo de su perspectiva).

Inconveniente: ¿Ignora las diferencias de variabilidad entre los artículos en las diferentes métricas?

3. Normalizar y sumar

Un enfoque relacionado sería estandarizar todos los ítems (puntuación z) y luego sumarlos.

Pro: Aborda las diferencias de variabilidad entre los artículos en diferentes métricas

Inconveniente: la puntuación total de la escala es menos interpretable y específica de la muestra. Esto último hace que sea difícil de comparar como una medida para ser utilizada en otros entornos/otras muestras.

4. PCA u otra reducción de datos

4a. EFA para obtener las cargas factoriales. Multiplique los ítems escalados por las cargas factoriales.

4b. PCA para obtener la puntuación del primer componente principal.

Pro: Artículos ponderados por influencia.

Contra: Lo mismo que el nº 2. Las puntuaciones derivadas del EPT podrían variar mucho en función de las opciones de rotación/extracción. Algunos no lo aconsejarían con datos ordinales.


En general: me gusta el número 2 porque parece más fácil comparar los resultados entre diferentes muestras. ¿Qué opina? ¿Ideas alternativas o preocupaciones sobre las ideas presentadas?

5voto

Zendmailer Puntos 138

Esta es una gran pregunta.

Creo que en la construcción de escalas hay un delicado equilibrio entre la interpretabilidad y las consideraciones psicométricas. En concreto, la suma o la media de una escala es mucho más fácil de entender que la suma o la media de los ítems estandarizados o reescalados.

Sin embargo, puede haber una razón psicométrica algo sutil para volver a escalar los ítems antes de crear su escala compuesta (es decir, tomar una suma o un promedio). Si los ítems tienen desviaciones estándar radicalmente diferentes, la fiabilidad de la escala compuesta disminuirá simplemente por estas diferentes desviaciones estándar .

Una forma de entenderlo intuitivamente es darse cuenta de que, como usted señala, a los ítems con desviaciones estándar muy variadas se les asignan pesos diferentes en el compuesto. Por lo tanto, el error de medición en el ítem con la mayor desviación estándar tenderá a dominar la escala compuesta. En efecto, tener desviaciones típicas muy diferentes reduce el mismo beneficio que se intenta obtener al promediar múltiples ítems (es decir, normalmente, promediar múltiples ítems reduce el impacto del error de medición de cualquiera de los ítems componentes).

A continuación he creado una demostración de los efectos de un único elemento dominante en algunos datos simulados. Aquí creo cinco ítems correlacionados y encuentro la fiabilidad (medida con el alfa de Cronbach) de la escala resultante.

require(psych)

# Create data
set.seed(13105)
item1 <- round(rnorm(100, sd = 3), digits = 0)
item2 <- round(item1 + rnorm(100, sd = 1), digits = 0)
item3 <- round(item1 + rnorm(100, sd = 1), digits = 0)
item4 <- round(item1 + rnorm(100, sd = 1), digits = 0)
item5 <- round(item1 + rnorm(100, sd = 1), digits = 0)

d <- data.frame(item1, item2, item3, item4, item5)

# Cronbach's alpha
alpha(d)

Reliability analysis   
Call: alpha(x = d)

  raw_alpha std.alpha G6(smc) average_r  mean  sd
       0.97      0.97    0.97      0.87 -0.14 2.5

Reliability if an item is dropped:
      raw_alpha std.alpha G6(smc) average_r
item1      0.96      0.96    0.94      0.84
item2      0.97      0.97    0.96      0.88
item3      0.97      0.97    0.96      0.89
item4      0.97      0.97    0.96      0.88
item5      0.96      0.97    0.96      0.87

 Item statistics 
        n    r r.cor r.drop  mean  sd
item1 100 0.98  0.99   0.97 -0.10 2.5
item2 100 0.94  0.92   0.90 -0.27 2.8
item3 100 0.93  0.91   0.89 -0.09 2.7
item4 100 0.94  0.92   0.91 -0.19 2.6
item5 100 0.94  0.93   0.91 -0.06 2.7

Y aquí cambio la desviación estándar de item2 multiplicando el artículo por $5$ . Obsérvese el drástico descenso del alfa de Cronbach debido a este procedimiento. Obsérvese también que multiplicar un ítem por una constante positiva no afecta en lo más mínimo a la matriz de correlación construida con estos cinco ítems. Lo único que he hecho al multiplicar item2 por $5$ es que he cambiado la escala en la que item2 se mide, y sin embargo, el cambio de esta escala afecta en gran medida a la fiabilidad del compuesto.

# Re-scale item 2 to have a much larger standard deviation than the other items
d$item2 <- d$item2 * 5

# Cronbach's alpha
alpha(d)

Reliability analysis   
Call: alpha(x = d)

  raw_alpha std.alpha G6(smc) average_r  mean  sd
       0.74      0.97    0.97      0.87 -0.36 4.7

Reliability if an item is dropped:
      raw_alpha std.alpha G6(smc) average_r
item1      0.68      0.96    0.94      0.84
item2      0.97      0.97    0.96      0.88
item3      0.69      0.97    0.96      0.89
item4      0.68      0.97    0.96      0.88
item5      0.68      0.97    0.96      0.87

  Item statistics 
        n    r r.cor r.drop  mean   sd
item1 100 0.98  0.99   0.96 -0.10  2.5
item2 100 0.94  0.92   0.90 -1.35 13.9
item3 100 0.93  0.91   0.86 -0.09  2.7
item4 100 0.94  0.92   0.89 -0.19  2.6
item5 100 0.94  0.93   0.90 -0.06  2.7

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X