6 votos

Comparar los órdenes de clasificación de los miembros de la población a través de diferentes variables

Tengo algunos datos que describen unidades residenciales para personas con problemas de aprendizaje, variables como lo bonito que es el mobiliario, el nivel de sintomatología psiquiátrica en la unidad, lo contento que está el personal, cosas así.

Quiero comprobar si estamos midiendo las cosas correctas, por ejemplo, si las unidades con personal más feliz tienen un ambiente más agradable, si las unidades con mobiliario bonito tienen personal feliz, ese tipo de cosas.

El problema es que sólo tengo datos para 8 unidades (promedios dentro de cada una, por ejemplo, 10 empleados dan sus respuestas sobre lo felices que son, esta es la media de la unidad), así que no puedo usar realmente la regresión lineal para ver si las cosas que hemos medido se afectan entre sí. He dibujado algunos gráficos de dispersión para todos los datos y, en general, diría que parece haber una relación lineal en el sentido que yo esperaría. Pero como digo con 8 unidades no va a generar ninguna estadística.

Tuve la brillante idea de ordenar cada unidad en todas las variables, y luego comparar los órdenes de rango de alguna manera. Si estamos midiendo las cosas correctas, los rangos deberían ser similares, así:

Unit 1 (ranks across all variables): 1,1,1,1,1,1,1,1,1
Unit 2: 2,2,2,2,2,2,2,2,2

etc.

mientras que si me equivoco, y las variables no son importantes entre sí, conseguiré esto:

Unit 1: 1,2,3,4,5,6,7,8
Unit 2: 8,7,6,5,4,3,2,1
Unit 3: 4,5,6,7,8,1,2,3

etc.

Esto es lo que me pasa:

Unit1    7    5  5.0    5    3    4    5    3
Unit2    6    2  4.0    6    5    3    2    5
Unit3    3    7  7.5    1    4    1    1    1
Unit4    4    4  3.0    7    6    7    7    8
Unit5    5    3  1.0    4    2    5    6    7
Unit6    2    6  6.0    8    8    8    8    6
Unit7    1    8  7.5    3    7    6    4    4
Unit8    8    1  2.0    2    1    2    3    2

A mí me parece muy bien, excepto la primera columna.

¿Alguna opinión al respecto? ¿Es una estadística adecuada de la que no he oído hablar? ¿O hay algo razonablemente sólido que pueda hacer con estos resultados?

Perdón por lo extenso de la pregunta, ¡muchas gracias de antemano!

6voto

ashwnacharya Puntos 3144

No sé hasta qué punto es útil el siguiente enfoque, pero se podría conceptualizar la situación de forma ligeramente diferente: imagine que las diferentes variables son calificadores que simplemente ordenan las unidades de "mejor" a "peor". Se espera que el orden de clasificación sea similar entre los "calificadores". Esto parece ser una aplicación del coeficiente de concordancia de Kendall $W$ de acuerdo entre evaluadores. En R

> rtr1    <- c(1, 6, 3, 2, 5, 4)  # rank order from "rater" 1
> rtr2    <- c(1, 5, 6, 2, 4, 3)  # "rater" 2
> rtr3    <- c(2, 3, 6, 5, 4, 1)  # "rater" 3
> ratings <- cbind(rtr1, rtr2, rtr3)
> library(irr)      # for kendall()
> kendall(ratings)
 Kendall's coefficient of concordance W
 Subjects = 6 
   Raters = 3 
        W = 0.568 

 Chisq(5) = 8.52 
  p-value = 0.130

Edición: Esto es equivalente a la prueba de Friedman para muestras dependientes:

> rtrAll <- c(rtr1, rtr2, rtr3)
> nBl    <- 3    # number of blocks / raters
> P      <- 6    # number of dependent samples / units
> IV     <- factor(rep(1:P, nBl))         # factor sample / unit
> blocks <- factor(rep(1:nBl, each=P))    # factor blocks / raters
> friedman.test(rtrAll, IV, blocks)
        Friedman rank sum test
data:  rtrAll, IV and blocks 
Friedman chi-squared = 8.5238, df = 5, p-value = 0.1296

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X