Soy nuevo en R y quiero evaluar la validez de algunas escalas usando R. ¿Hay algún paquete que pueda usar para probar la validez convergente y discriminante en R?
Respuesta
¿Demasiados anuncios?Los más utilizados enfoque correlacional se llama escalado de rasgos múltiples (MTS). La idea que subyace al MTS es que se supone que los ítems que pertenecen a la misma dimensión están más correlacionados entre sí, así como con su propia escala, y que sus correlaciones con los ítems de otras dimensiones deben ser nulas o, al menos, de menor magnitud. En general, consideramos que una correlación de 0,3 (o 0,4) o superior es indicativa de una correlación "significativa" para dos ítems pertenecientes a la misma subescala. Escalar el éxito es la proporción de ítems que tienen una mayor correlación con su propia dimensión que con cualquier otra dimensión, y los valores más altos indican una buena validez convergente. Básicamente, calculamos las correlaciones entre ítems dentro de cada escala y entre escalas; es decir, para cada subescala, la puntuación de cada ítem está correlacionada con todos los demás ítems de la misma subescala (validez convergente) y de otras escalas (validez divergente). Este método está disponible en el psy como mtmm()
El programa ofrece resultados numéricos y gráficos cuando se solicitan. Algunos autores han sugerido que se examinen las pruebas de correlación de una cola, con una corrección adecuada para las comparaciones múltiples (la mayoría de las veces, un enfoque conservador como el método de Bonferroni). Éxito de la escala con las pruebas de significación se refiere al número de correlaciones significativas (es decir, sólo se cuentan como errores de escala las pruebas de correlación no significativas de una cola).
Por último, se suele informar de la media índice de homogeneidad (correlaciones entre ítems dentro de la escala) y un indicador de consistencia interna como el alfa de Cronbach. La terminología anterior procede de Fayers y Machin (2007). La página web psy::mtmm()
no realiza pruebas de significación, pero no es realmente difícil de codificar.
A continuación se muestra un ejemplo de tabla resumen para las medidas de validez convergente y divergente:
(Viene del SF-36 cuestionario que se utiliza para medir la calidad de vida relacionada con la salud. Tabla 5.2, p. 119, en (1).
Notarás que he llamado a este método MTS aunque viene acompañado de Multimétodo Multitrait (MTMM) (2) que se ha discutido en una cuestión relacionada, ¿Cómo calcular la correlación entre/dentro de grupos de variables? No es de extrañar, ya que esto último no es más que una generalización de MTS aplicada a múltiples instrumentos: En el MTMM no sólo nos centramos en la forma en que un determinado instrumento mide uno o varios rasgos, sino que lo comparamos con otros instrumentos conocidos, también llamados métodos. Existen varias formulaciones de modelos de MTMM, como el modelo de unicidad correlacionada (3), el modelo CFA para MTMM (4,5), el modelo de producto directo (6) y el modelo de puntuación verdadera (TS) (7). Las representaciones geométricas de los modelos CFA se analizan en (8). Como puede verse, estos enfoques no se basan en un simple análisis de correlación, sino que permiten postular un verdadero modelo de medición (véanse los siguientes párrafos sobre el análisis factorial), aunque ha sido objeto de algunas críticas, por ejemplo (9-11).
Otra idea es calcular la correlación entre las puntuaciones de los ítems y de las subescalas (por ejemplo, la correlación bioserial o poliserial), para cada subescala (esto puede hacerse también con otras subescalas). Las correlaciones elevadas son indicativas de un buen poder discriminatorio y, en conjunto, apoyarán la idea de que los ítems que pertenecen a la misma subescala están correlacionados entre sí y con la puntuación total (como se refleja en el alfa de Cronbach, la carga en el análisis factorial o el parámetro de discriminación en un modelo de respuesta al ítem).
Otro enfoque se basa en métodos de análisis factorial, ya sea exploratorio o confirmatorio análisis de factores (CFA). En el marco del AFC, la matriz de patrones (correlaciones entre los ítems y el factor, o cargas) del modelo de medición hipotetizado se especifica de antemano, mientras que en el análisis factorial exploratorio las cargas, comunalidades y unicidades se estiman a partir de los datos sin imponer restricciones. Dos puntos críticos que vale la pena recordar son que (a) si se utiliza la misma muestra para extraer los factores (y construir reglas de puntuación para cada subescala) y evaluar la bondad del ajuste de un modelo factorial, entonces la generalizabilidad de los resultados del AFC será obviamente limitada, y (b) si el modelo no se ajusta a los datos, nada nos dice cuál podría ser el modelo correcto (incluso si se utilizan los llamados índices de modificación para refinar el modelo inicial, porque en este caso es fácil caer en la trampa del fisgoneo de datos). En R, hay tres paquetes que podrían utilizarse: sem , lavaan , OpenMx . Los tres paquetes ofrecen numerosos ejemplos de aplicaciones de CFA.
Las siguientes son pautas aproximadas para evaluar el ajuste del modelo: un ajuste comparativo (CFI) y un índice de Tucker-Lewis (TLI) superiores a 0,90 indican un ajuste adecuado del modelo, siendo preferibles valores cercanos a 0,95; un residuo cuadrático medio estandarizado (SRMR) inferior a 0,10 (resp. 0,08) y un error cuadrático medio de aproximación (RMSEA) inferior a 0,08 (resp. 0,06) indican un ajuste aceptable (resp. bueno) del modelo (12).
Como nota al margen, recomendaría echar un vistazo a la psico paquete también. Presenta muchos métodos útiles para la psicometría (análisis de ítems y de fiabilidad, métodos relacionados con los factores). William Revelle tiene un libro en curso sobre psicometría aplicada con R .
Referencias
- Fayers, P. M. y Machin, D. (2007). Calidad de vida: La evaluación, el análisis y la interpretación de los resultados comunicados por los pacientes . Wiley.
- Campbell, D.T. y Fiske, D.W. (1959). Validación convergente y discriminante mediante la matriz multirasgo-multimétodo. Boletín Psicológico , 56, 81-105.
- Marsh, H.W. (1989). Análisis factorial confirmatorio de datos multirasgo-multimétodo: Muchos problemas y pocas soluciones . Medición psicológica aplicada , 13, 335-361.
- Althauser, R.P., Heberlein, T.A., y Scott, R.A. (1971). Una evaluación causal de la validez: La matriz multirasgo-multimétodo aumentada. En Blalock, H.M. (editor), Modelos causales en las ciencias sociales , pp. 151-169. Chicago: Aldine.
- Andrews, F.M. (1984). Validez de constructo y componentes de error de las medidas de encuesta: un enfoque de modelización estructural . Boletín de Opinión Pública , 48, 409-442.
- Browne, M.W. (1984). La descomposición de las matrices multirasgo-multimétodo . Revista Británica de Psicología Matemática y Estadística , 37, 1-21.
- Saris, W.E y Andrews, F.M. (1991). Evaluation of measurement instruments using a structural modeling approach. En Biemer, P.P., Groves, R.M., Lyberg, L.E., Mathiowetz, N.A., y Sudman, S. (editores), Errores de medición en las encuestas , pp. 575-597. Nueva York: Wiley.
- Hox, J.J. y Bechger, T. (1995). Comparación y combinación de diferentes enfoques de la matriz Multitrait-Multimethod . En Hox, J.J., Mellenbergh, G.J., y Swanborn, P.G. (editores), Teoría de las facetas: Análisis y diseño , pp. 135-144. Zeist, Países Bajos: SETOS.
- Brannick, M.T y Spector, P.E. (1990). Problemas de estimación en el modelo de bloques diagonales de la matriz multirasgo-multimétodo . Medición psicológica aplicada , 14(4), 325-339.
- Putka, D.J., Lance, C.E., Le, H., y McCloy, R.A. (2011). Nota de advertencia sobre la modelización de datos multirrasgo-multiraterial procedentes de diseños de medición mal estructurados . Métodos de investigación organizativa , 14(3), 503-529.
- Cote, J.A. (1995), ¿Qué problemas de estimación se producen al analizar los datos del MTMM? En Kardes, F.R. y Sujan, M. (editores), Avances en la investigación de los consumidores Volumen 22 , pp. 345-353. Provo, UT: Asociación para la Investigación del Consumidor.
- Hu, L. T. y Bentler, P. M. (1999). Criterios de corte para los índices de ajuste en el análisis de la estructura de covarianza: Criterios convencionales frente a nuevas alternativas . Modelización de ecuaciones estructurales , 6, 1-55.