8 votos

¿Cómo probar las diferencias entre las medianas de múltiples ítems de Likert?

En un estudio mediante un cuestionario, pedimos a los encuestados que expresaran su actitud respecto a cómo los diferentes factores climáticos del invierno, como la nieve o el carácter resbaladizo, podrían afectar a su elección de ir al trabajo a pie o en bicicleta. La muestra estaba compuesta por 500 personas y las respuestas se dieron en forma de 5 escalas que iban de muy negativas a muy positivas (escala ordinal).

Si quiero comparar las respuestas a diferentes preguntas, supongo que la mediana es una herramienta adecuada ya que los datos son ordinales. Sé que para comparar las medias hay diferentes pruebas estadísticas para mostrar si la probabilidad de diferencia es significativa (prueba t o prueba no paramétrica..). Pero estoy un poco confundido si puedo utilizar estas pruebas en el tipo de datos que he explicado aquí.

  • ¿Existe un test estadístico para comparar las medianas?
  • ¿O debo transferir los datos a la escala de intervalos si es apropiado?

4voto

Eric Davis Puntos 1542

Considero que la media es un indicador mucho más útil de la tendencia central de los ítems de Likert que la mediana. He ampliado mi argumento aquí en una pregunta sobre si se debe utilizar la media o la mediana para los ítems likert .

Un recuento de algunas de estas razones:

  • La media es más informativa; la mediana es demasiado bruta para los ítems Likert. Por ejemplo, la mediana de 1 1 3 3 3 es lo mismo que 3 3 3 5 5 (es decir, 3) pero la media refleja la diferencia.
  • Los ítems de Likert suelen estar redactados de forma que la suposición de igual distancia entre categorías es un punto de partida útil.
  • Aunque las respuestas individuales sean discretas, la medición a nivel de grupo se aproxima a la continuidad (con 500 personas y una escala de 5 puntos, el valor de su media podría adquirir 500 * 4 + 1 = 2001 valores diferentes)
  • No se discute que el porcentaje es un resumen útil en las preguntas del tipo "sí" (por ejemplo, la votación). Esto es sólo la media cuando las respuestas han sido codificadas 0 and 1 . Tratar una escala likert de 5 puntos como 1 2 3 4 5 me parece casi tan natural.
  • Otras escalas plausibles de los ítems de Likert probablemente no cambiarán sustancialmente las inferencias sobre si existen diferencias entre las medias (pero puede comprobarlo).

Si está convencido de que la media es la medida apropiada de la tendencia central, entonces querrá estructurar sus pruebas de hipótesis de forma que comprueben las diferencias entre las medias. Una prueba t de muestras emparejadas permitiría una comparación de medias por pares, pero habría problemas en cuanto a la precisión de los valores p dada la distribución discreta y no normal del error. Sin embargo, adoptar un enfoque no paramétrico no es una solución, porque cambia la hipótesis.

Esperaría que la prueba t de muestras emparejadas fuera bastante robusta al menos para las típicas medias de los ítems Likert que evitan cualquier extremo de la escala, pero no tengo ningún estudio de simulación a mano.

3voto

ER17 Puntos 1

En general, estoy de acuerdo con los argumentos de Jeromy de que la media es una estadística razonable para las escalas Likert. Lo que podría hablar a favor de la mediana, es que la mediana es una medida mucho más robusta de la ubicación, ya que protege contra los valores atípicos (tiene el mayor punto de ruptura del 50%). Sin embargo, como las escalas Likert son escalas acotadas, la posibilidad de que haya valores atípicos extremos es muy baja (sólo si los datos son extremadamente asimétricos). Además, la mediana suele recortar demasiado los datos, por lo que podría considerar el uso de medias recortadas en su lugar. Normalmente se recomienda un 20% de recorte [1].

Si desea calcular una prueba emparejada de la diferencia de medianas, recomendaría comparar las medias utilizando un método bootstrap de percentiles (este es el único método para comparar medianas que funciona bien en el caso de valores empatados, véase Wilcox, 2005 [1]).

En el WRS para R, hay una función llamada trimpb2 que hace este cálculo para dos muestras independientes (también se puede calcular un valor p para las medias de trimmend con esa función). En su caso, sin embargo, necesita comparar grupos dependientes. En este caso, también puede hacer un método bootstrap de percentiles ajustados al sesgo [2].

Sin embargo, hay que tener en cuenta que la diferencia de las medianas de las distribuciones marginales no es lo mismo como mirar la mediana de las puntuaciones de las diferencias. La primera responde a la pregunta "¿En qué se diferencia la respuesta típica del primer grupo de la del segundo?" y la realiza la función WRS rmmcppb . La segunda responde a la pregunta "¿Cuál es la puntuación de diferencia típica?" y la realiza la función WRS rmmcppbd .

[1] Wilcox, R. R. (2005). Introduction to robust estimation and hypothesis testing. San Diego: Academic Press.

[2] Wilcox, R. R. (2006). Comparaciones por pares de grupos dependientes basadas en las medianas. Computational Statistics & Data Analysis, 50, 2933-2941. doi:10.1016/j.csda.2005.04.017

0voto

Eero Puntos 1612

Una opción para comparar las medianas es pruebas de permutación . Sin embargo, si está comparando las respuestas a 2 preguntas que fueron rellenadas por el mismo conjunto de personas (datos emparejados), entonces también podría querer ver Prueba de McNemar y sus variaciones.

Por ejemplo, la idea de la prueba de McNemar (y sus extensiones) es observar una matriz con los recuentos de cuántos encuestados eligieron las combinaciones, de modo que un individuo contribuiría al recuento en la celda cuya columna está determinada por su respuesta a la pregunta 1 y la fila está determinada por su respuesta a la pregunta 2 (los comandos de tabla o tabla cruzada crean la matriz). El patrón de esta matriz será probablemente más informativo que una simple media o mediana. La diagonal representa a las personas que respondieron lo mismo a las 2 preguntas, el triángulo superior son los que respondieron más alto en la 1ª pregunta que en la 2ª, y el triángulo inferior la diferencia. La distancia a la diagonal indica la diferencia entre las dos respuestas. Las variaciones de la prueba de McNemar se fijan en si los recuentos de los 2 triángulos son diferentes, o si la matriz es simétrica. Para tener en cuenta la naturaleza ordinal (frente a la nominal) de los datos, se tiene en cuenta la distancia desde la diagonal.

El simple hecho de observar los patrones de la tabla puede ser suficiente para sus propósitos, pero si necesita una prueba formal, entonces puede optar por las pruebas sugeridas, o hacer algún tipo de prueba de permutación (exactamente cómo depende de lo que esté buscando o tratando de mostrar).

3 votos

La prueba de McNemar es para datos nominales. Para datos ordinales, como en este caso, la gente suele elegir el Prueba de rango con signo de Wilcoxon o prueba de signos (pero la potencia de este último tiende a ser baja).

0 votos

El problema de la pregunta de Saeed es que exigían la comparación de las medianas de relacionado , no independientes, distribuciones. Prueba t de muestras pareadas, podemos decir, compara los medios porque su numerador -la media de las diferencias por caso- es el mismo valor que la diferencia entre las dos medias. Pero para la mediana, la mediana de las diferencias por caso no es el mismo valor que la diferencia entre las dos medianas. Por lo tanto, dudo que exista una prueba que pueda llamarse exactamente "prueba de medianas para muestras pareadas".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X