8 votos

Nivel de medición de las puntuaciones percentiles

Este me molesta desde hace tiempo, y se produjo una gran disputa en torno a él. En psicología (así como en otras ciencias sociales), nos enfrentamos a diferentes formas de tratar los números :-) es decir los niveles de medición . También es práctica común en psicología estandarizar algún cuestionario, y de ahí transformar los datos en puntuaciones percentiles (para evaluar la posición de un encuestado dentro de la muestra representativa).

Resumiendo, si tienes una variable que contiene los datos expresados en puntuaciones percentiles, ¿cómo debes tratarla? ¿Como una variable ordinal, de intervalo o incluso de razón?

No es ratio, porque no hay 0 real (0 th percentil no implica ausencia de propiedad medida, sino el valor más pequeño de la variable). Defiendo la opinión de que las puntuaciones percentiles son ordinales, ya que P 70 - P 50 no es igual a P 50 - P 30 mientras que el otro lado dice que es intervalo.

Por favor señores, corten el cordón. ¿Ordinal o intervalo?

0 votos

Por cierto, P70 - P50 representa el porcentaje de personas que se encuentran entre el percentil 70 y el percentil 50, y ese porcentaje es 20. Evidentemente, es lo mismo que P50 -P30. A la hora de evaluar si las diferencias son iguales no creo que haya que fijarse en las puntuaciones subyacentes.

0 votos

Y lo mismo ocurre con el cálculo de los coeficientes de correlación, supongo.

0 votos

Sí, eso sería correcto. De hecho, la correlación sería la relación, ya que 0 significa que no hay correlación y tal conclusión es invariante de la escala. Por cierto, sospecho que los percentiles también se clasificarían como relación, ya que el punto 0 es invariante de la escala, pero en realidad no importa. La mayoría de las aplicaciones estadísticas requieren medidas a nivel de intervalo, no necesariamente de razón.

15voto

jldugger Puntos 7490

John Tukey argumentó con fuerza y contundencia a favor de una proporción tipo de medición en su libro sobre EDA . Algo que hace que las proporciones sean especiales y diferentes de la taxonomía clásica "nominal, ordinal, intervalo, razón" es que con frecuencia gozan de una simetría evidente: Una proporción puede considerarse como la media de una variable indicadora binaria (0/1). Porque no debería suponer ninguna diferencia significativa recodificar el indicador, el análisis de los datos debería permanecer esencialmente inalterado al volver a expresar la proporción como su complemento. En concreto, la recodificación $0\to 1$ et $1\to0$ cambia la proporción original $p$ a $1-p$ . Por ejemplo, no debería haber ninguna diferencia entre hablar del 60% de personas que votan "sí" o del 40% que votan "no" en un referéndum; los dos números 0,6 y 0,4 representan exactamente lo mismo. Así, las estadísticas, pruebas, decisiones, resúmenes, etc., deberían dar los mismos resultados ( mutatis mutandis ) independientemente de la forma de expresión utilizada.

En consecuencia, Tukey utilizó reexpresiones de proporciones, y análisis basados en esas reexpresiones, que son (casi) invariantes bajo la conversión $p\longleftrightarrow 1-p$ . Son de la forma $f(p) \pm f(1-p)$ para diversas funciones $f$ . (El signo menos suele ser mejor porque sigue distinguiendo entre $p$ et $1-p$ : sólo sus signos difieren cuando se reexpresan). Cuando se escalan de modo que el cambio diferencial cerca de $p=1/2$ es igual a $1$ A estos valores los denominó "plegados". Entre ellos se encuentra el logaritmo plegado ("flog"), proporcional a $\log(p) - \log(1-p)$ = $\log(p/(1-p)$ = $\text{logit}(p)$ y la raíz doblada ("froot"), proporcional a $\sqrt{p} - \sqrt{1-p}$ .

Una exposición matemática de este tema es menos convincente que ver las estadísticas en acción, por lo que recomiendo leer el capítulo 17 de EDA y estudiar los ejemplos que contiene.

En resumen, sugiero que la propia pregunta es demasiado restrictiva y que hay que abrirse a posibilidades que van más allá de las sugeridas por la taxonomía clásica de variables.


Addendum: Por qué "Intervalo" y "Ratio" no son respuestas del todo correctas

Stevens creó la tiponimia nominal-ordinal-intervalo-ratio en un convincente artículo publicado en 1946 en Ciencia (Nueva Serie, Vol. 103, nº 2684, pp 677-680). El fundamento de las distinciones es explícito invariancia de las "operaciones empíricas básicas" bajo acciones de grupo. Su Tabla 1 describe así la relación entre la escala y el grupo:

$$\begin{array}{ll} \text{Scale}&\text{Mathematical Group Structure} \\ \hline\text{Nominal}&\text{Permutation Group } x^\prime = f(x);\ f(x) \text{ means any one-to-one substitution} \\ \text{Ordinal}&\text{Isotonic Group } x^\prime = f(x);\ f(x) \text{ means any monotonic increasing function} \\ \text{Interval}&\text{General Linear Group } x^\prime = ax + b \\ \text{Ratio}&\text{Similarity Group } x^\prime = ax \end{array}$$

(Esta es una cita directa, con algunas columnas no mostradas).

Esto debe leerse con cierta latitud, porque siempre tenemos la opción de elegir un modelo que no sea exactamente correcto. (Por ejemplo, una distribución Normal como modelo de variación puede ser extremadamente útil y bastante precisa incluso cuando se aplica, por ejemplo, a la altura de las personas, que nunca puede ser negativa aunque todas las distribuciones Normales asignen algunos probabilidad a valores negativos). Así, por ejemplo, los datos de proporciones extremadamente pequeñas podrían considerarse de relación porque el límite superior de $1$ es prácticamente irrelevante. Los datos de proporciones muy próximas que no se aproximan a ninguno de los límites $0$ o $1$ podría considerarse de intervalo tipo. Limitar el alcance de las preguntas a cualquiera de estos casos especiales justificaría (parcialmente) algunas de las otras respuestas de este hilo que insisten en que las proporciones están en una escala de intervalo o de razón. Sin embargo, cuando las proporciones de un conjunto de datos pueden ser a la vez grandes (mayores que $1/2$ ) y pequeños (menos de $1/2$ ) y algunos de ellos se acercan a $1$ o $0$ es evidente que no se pueden aplicar ni el grupo lineal general ni el grupo de similitud, porque no preservan el intervalo $[0,1]$ . Por este motivo, la clasificación de Stevens es incompleta y, por lo general, no puede aplicarse a las proporciones.

5voto

Antecedentes para entender mi respuesta

La propiedad crítica que distingue entre escala ordinal y de intervalo es si podemos tomar relación de diferencias . Si bien no se puede tomar razón de medidas directas para ninguna de las dos escalas la razón de diferencias es significativa para intervalo pero no ordinal (Ver: http://en.wikipedia.org/wiki/Level_of_measurement#Interval_scale ).

La temperatura es el ejemplo clásico de escala de intervalo. Considere lo siguiente:

80 f = 26,67 c

40 f = 4,44 c y

20 f = -6,67 c

Las diferencias entre el primero y el segundo es:

40 f y 22.23 c

La diferencia entre el segundo y el tercero es:

20 f y 11.11 c

Obsérvese que la relación es la misma independientemente de la escala en la que midamos la temperatura.

Un ejemplo clásico de datos ordinales son los rangos. Si tres equipos, A, B y C, ocupan los puestos 1º, 2º y 4º, respectivamente, una afirmación como ésta no tiene sentido: "La diferencia de fuerza del equipo A con respecto al equipo B es la mitad de la diferencia de fuerza del equipo B con respecto al equipo C".

Respuesta a su pregunta

¿Es significativa la relación entre las diferencias de los percentiles? En otras palabras, ¿es la relación de diferencias en percentiles invariante respecto a la escala subyacente? Consideremos, por ejemplo: (P 70 -P 50 ) / (P 50 -P 30 )?

Supongamos que estos percentiles se basan en una puntuación subyacente entre 0-100 y calculamos la relación anterior. Evidentemente, obtendríamos la misma relación de diferencias de percentiles con una transformación lineal arbitraria de la puntuación (por ejemplo, multiplicar todas las puntuaciones por 10 para que el intervalo esté entre 0-1000 y calcular los percentiles).

Por lo tanto, mi respuesta: Intervalo

1voto

ESRogs Puntos 1381

Continuo (intervalo); se trata de un método de cómo convertir datos ordinales en algo que pueda tener alguna distribución que tenga sentido.

0 votos

De hecho, hemos sugerido algo parecido en este tema; buscaré el enlace.

0 votos

Y creo que tu criterio de "intervalidad" sólo es válido para una distribución uniforme.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X