Tengo algunos datos que describen unidades residenciales para personas con problemas de aprendizaje, variables como lo bonito que es el mobiliario, el nivel de sintomatología psiquiátrica en la unidad, lo contento que está el personal, cosas así.
Quiero comprobar si estamos midiendo las cosas correctas, por ejemplo, si las unidades con personal más feliz tienen un ambiente más agradable, si las unidades con mobiliario bonito tienen personal feliz, ese tipo de cosas.
El problema es que sólo tengo datos para 8 unidades (promedios dentro de cada una, por ejemplo, 10 empleados dan sus respuestas sobre lo felices que son, esta es la media de la unidad), así que no puedo usar realmente la regresión lineal para ver si las cosas que hemos medido se afectan entre sí. He dibujado algunos gráficos de dispersión para todos los datos y, en general, diría que parece haber una relación lineal en el sentido que yo esperaría. Pero como digo con 8 unidades no va a generar ninguna estadística.
Tuve la brillante idea de ordenar cada unidad en todas las variables, y luego comparar los órdenes de rango de alguna manera. Si estamos midiendo las cosas correctas, los rangos deberían ser similares, así:
Unit 1 (ranks across all variables): 1,1,1,1,1,1,1,1,1
Unit 2: 2,2,2,2,2,2,2,2,2
etc.
mientras que si me equivoco, y las variables no son importantes entre sí, conseguiré esto:
Unit 1: 1,2,3,4,5,6,7,8
Unit 2: 8,7,6,5,4,3,2,1
Unit 3: 4,5,6,7,8,1,2,3
etc.
Esto es lo que me pasa:
Unit1 7 5 5.0 5 3 4 5 3
Unit2 6 2 4.0 6 5 3 2 5
Unit3 3 7 7.5 1 4 1 1 1
Unit4 4 4 3.0 7 6 7 7 8
Unit5 5 3 1.0 4 2 5 6 7
Unit6 2 6 6.0 8 8 8 8 6
Unit7 1 8 7.5 3 7 6 4 4
Unit8 8 1 2.0 2 1 2 3 2
A mí me parece muy bien, excepto la primera columna.
¿Alguna opinión al respecto? ¿Es una estadística adecuada de la que no he oído hablar? ¿O hay algo razonablemente sólido que pueda hacer con estos resultados?
Perdón por lo extenso de la pregunta, ¡muchas gracias de antemano!