12 votos

La visualización de los Datos Ordinales - medias, Medianas, y la Media de los Rangos

Gracias de antemano por cualquier ayuda. Tengo algunos datos ordinal que no está normalmente distribuida, así que me decidí a hacer no paramétrico de la prueba con el test de Mann-Whitney. Estoy mirando las diferencias entre los grupos de siete puntos -, los resultados son 0, 1, 2, o 3 para cada sujeto. Estoy teniendo un tiempo difícil averiguar cómo mostrar mis datos!

Si me presentan los datos de uso de los camellones (e IQR de las medianas), no está claro en todos donde las diferencias son debido a que la mayor parte de las medianas otoño ya sea 0 o 1. Así que a pesar de la U de Mann-Whitney muestra diferencias significativas, la tabla sólo se ve interesante.

Yo también podría presentar los datos de uso de los medios. Hay algunos artículos científicos por ahí que dicen que usted puede hacer uso de los medios con los datos ordinales, pero que no se puede hacer el mismo tipo de suposiciones acerca de las diferencias entre las puntuaciones (por ejemplo, la diferencia entre el 0 y el 1 no es la misma que entre el 1 y el 2). El uso de los medios sería un poco controvertido, aunque los números en la tabla de contar la historia bien cuando usarlos.

Una tercera opción es el uso de la media de los rangos que SPSS me da en la salida de la u de Mann-Whitney. La media de los rangos son lo que se comparó entre los grupos, así que tal vez debería utilizar? El único problema que tengo con esto es que la media de los rangos en realidad no significa nada en lo que respecta a los datos reales (por ejemplo, yo puedo ver que los sujetos están más cerca de un 3 mientras que los controles están más cerca de un 1 utilizando la media de los rangos.)

Y una última opción fue la realización de un análisis de chi-cuadrado la comparación de casos y controles después de dividir las puntuaciones en dos grupos (0 y 1 para bajo y 2 y 3 de alto). Sin embargo, cuando hice esto, las diferencias no fueron tan pronunciadas (probablemente por un número de razones).

Algún consejo sobre qué hacer y cómo presentar mis datos es muy apreciado!

9voto

dan90266 Puntos 609

Esta es una excelente pregunta. Como se encontró, de cuantiles no funcionan cuando hay muchos lazos en los datos, debido a que son demasiado discontinuo como estimadores. A menudo me encuentro significa trabajar mejor, si se puede asumir que el espaciado entre las categorías son al menos "la mitad significativo". Superación de las probabilidades siempre son válidos. En el caso de estos sería estimado por la proporción de observaciones $\geq 1, \geq 2, =3$. La media de los rangos son útiles cuando se comparan los grupos, pero no veo como mucha utilidad para una sola variable.

La corrección de la media para resumir las variables ordinales rara vez puede provenir de los propios datos. Es subjetivo.

En lugar de utilizar la media de los rangos que me gustaría utilizar una adecuada correlación por rangos de medida o la concordancia de probabilidad (una simple traducción lineal de la de Wilcoxon-Mann-Whitney estadística; es el rango medio de observaciones en uno de los dos grupos divididos por una constante) entre dos variables (por ejemplo, un archivo binario de la agrupación y en una escala ordinal). Opciones para los coeficientes de correlación incluyen Somers' $D_{xy}$ (lo cual es consistente con el de la concordancia de la probabilidad y penaliza por los lazos de la variable ordinal) y Goodman-Kruskal $\gamma$ que no penalice para las relaciones en cualquiera de las $x$ o $y$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X