70 votos

¿Cuáles son buenas estadísticas básicas a utilizar para datos ordinales?

Tengo algunos datos ordinales obtenidos de preguntas de encuestas. En mi caso son respuestas en estilo Likert (Totalmente en Desacuerdo-En Desacuerdo-Neutral-De Acuerdo-Totalmente de Acuerdo). En mis datos están codificados como 1-5.

No creo que las medias signifiquen mucho aquí, ¿entonces qué estadísticas de resumen básicas se consideran útiles?

4 votos

Las opciones comunes incluyen - medianas, modas, proporciones o proporciones acumulativas en cada grupo

36voto

Eric Davis Puntos 1542

Voy a argumentar desde una perspectiva aplicada que la media suele ser la mejor opción para resumir la tendencia central de un ítem Likert. Específicamente, estoy pensando en contextos como encuestas de satisfacción de estudiantes, escalas de investigación de mercado, encuestas de opinión de empleados, ítems de pruebas de personalidad y muchos otros ítems de encuestas de ciencias sociales.

En tales contextos, los consumidores de la investigación a menudo quieren respuestas a preguntas como:

  • ¿Qué afirmaciones tienen más o menos acuerdo en comparación con otras?
  • ¿Qué grupos estuvieron más o menos de acuerdo con una afirmación determinada?
  • ¿Con el tiempo, ha aumentado o disminuido el acuerdo?

Para estos propósitos, la media tiene varios beneficios:

1. La media es fácil de calcular:

  • Es fácil ver la relación entre los datos brutos y la media.
  • Pragmáticamente es fácil de calcular. Por lo tanto, la media se puede incorporar fácilmente en los sistemas de informes.
  • También facilita la comparabilidad en diferentes contextos y configuraciones.

2. La media es relativamente bien entendida e intuitiva:

  • La media se usa a menudo para informar sobre la tendencia central de los ítems Likert. Por lo tanto, es más probable que los consumidores de la investigación comprendan la media (y por lo tanto confíen en ella y actúen en consecuencia).
  • Algunos investigadores prefieren la opción, en opinión, aún más intuitiva de informar el porcentaje de la muestra que responde 4 o 5. Es decir, tiene la interpretación relativamente intuitiva de "porcentaje de acuerdo". En esencia, esta es solo una forma alternativa de la media, con una codificación de 0, 0, 0, 1, 1.
  • Además, con el tiempo, los consumidores de la investigación construyen marcos de referencia. Por ejemplo, al comparar tu desempeño docente de año en año, o entre materias, desarrollas un sentido matizado de lo que indica una media de 3.7, 3.9, o 4.1.

3. La media es un solo número:

  • Un solo número es particularmente valioso cuando quieres hacer afirmaciones como "los estudiantes estaban más satisfechos con la Materia X que con la Materia Y".
  • También encuentro, empíricamente, que un solo número es en realidad la información principal de interés en un ítem Likert. La desviación estándar tiende a relacionarse con el grado en que la media se acerca a la puntuación central (por ejemplo, 3.0). Por supuesto, empíricamente, esto puede no aplicarse en tu contexto. Por ejemplo, leí en algún lugar que cuando las calificaciones de You Tube tenían el sistema de estrellas, había un gran número de calificaciones muy bajas o muy altas. Por esta razón, es importante inspeccionar las frecuencias de las categorías.

4. No hace mucha diferencia

  • Aunque no lo he probado formalmente, hipotetizaría que para comparar las clasificaciones de tendencia central entre ítems, o grupos de participantes, o con el tiempo, cualquier elección razonable de escala para generar la media produciría conclusiones similares.

29voto

Dori Puntos 1325

Una tabla de frecuencias es un buen lugar para comenzar. Puedes hacer el recuento y la frecuencia relativa para cada nivel. Además, el recuento total y el número de valores faltantes pueden ser útiles.

También puedes usar una tabla de contingencia para comparar dos variables a la vez. Puedes mostrarlo usando un gráfico de mosaico también.

29voto

DavLink Puntos 101

Para resúmenes básicos, estoy de acuerdo en que es aceptable reportar tablas de frecuencia y alguna indicación sobre la tendencia central. Para inferencias, un artículo reciente publicado en PARE discutió la prueba t vs. MWW-test, Five-Point Likert Items: t test versus Mann-Whitney-Wilcoxon.

Para un tratamiento más elaborado, recomendaría leer la revisión de Agresti sobre variables categóricas ordinales:

Liu, Y y Agresti, A (2005). El análisis de datos categóricos ordinales: Un resumen y una encuesta de desarrollos recientes. Sociedad de Estadística e Investigación Operativa Test, 14(1), 1-73.

Se extiende en gran medida más allá de las estadísticas habituales, como el modelo basado en umbrales (por ejemplo, la razón de odds proporcional), y vale la pena leerlo en lugar del libro CDA de Agresti.

A continuación muestro una imagen de tres formas diferentes de tratar un ítem Likert; de arriba abajo, la vista "de frecuencia" (nominal), la vista "numérica" y la vista "probabilística" (un Modelo de Crédito Parcial):

texto alternativo

Los datos provienen de los datos Science en el paquete ltm, donde el ítem en cuestión es la tecnología ("La nueva tecnología no depende de la investigación básica en ciencias", con respuesta de "totalmente en desacuerdo" a "totalmente de acuerdo", en una escala de cuatro puntos)

14voto

jdelator Puntos 1336

La práctica convencional es utilizar las estadísticas no paramétricas suma de rangos y rango medio para describir datos ordinales.

Así es como funcionan:

Suma de Rangos

  • asignar un rango a cada miembro en cada grupo;

  • por ejemplo, supongamos que estás observando los goles de cada jugador en dos equipos de fútbol opuestos, entonces clasifica a cada miembro de ambos equipos de primero a último;

  • calcular la suma de rangos sumando los rangos por grupo;

  • la magnitud de la suma de rangos te indica qué tan juntos están los rangos para cada grupo

Rango Medio

R/M es una estadística más sofisticada que R/S porque compensa tamaños desiguales en los grupos que estás comparando. Por lo tanto, además de los pasos anteriores, divides cada suma por el número de miembros en el grupo.

Una vez que tengas estas dos estadísticas, puedes, por ejemplo, realizar un z-test en la suma de rangos para ver si la diferencia entre los dos grupos es estadísticamente significativa (creo que esto se conoce como la prueba de suma de rangos de Wilcoxon, que es intercambiable, es decir, funcionalmente equivalente a la prueba U de Mann-Whitney).

Funciones de R para estas estadísticas (las que conozco, de todas maneras):

wilcox.test en la instalación estándar de R

meanranks en el Paquete cranks

3voto

Zizzencs Puntos 1358

Basado en el resumen este artículo puede ser útil para comparar varias variables que son de escala Likert. Compara dos tipos de pruebas de comparación múltiple no paramétricas: una basada en rangos y otra basada en un test de Chacko. Incluye simulaciones.

0 votos

En la actualidad, esto casi parece un comentario, @PeterFlom. Aunque la biblioteca digital ACM probablemente sea menos susceptible a la descomposición de enlaces, ¿te importaría decir algo sobre el artículo, quizás un resumen de la información útil que proporciona?

2 votos

Hola @gung, no estaba seguro de dónde colocar el comentario en este hilo largo. Añadí la cita aquí ya que la pregunta publicada hoy estaba cerrada, y este artículo me parece útil (y aborda problemas que no he visto en otro lugar)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X