John Tukey argumentó con fuerza y contundencia a favor de una proporción tipo de medición en su libro sobre EDA . Algo que hace que las proporciones sean especiales y diferentes de la taxonomía clásica "nominal, ordinal, intervalo, razón" es que con frecuencia gozan de una simetría evidente: Una proporción puede considerarse como la media de una variable indicadora binaria (0/1). Porque no debería suponer ninguna diferencia significativa recodificar el indicador, el análisis de los datos debería permanecer esencialmente inalterado al volver a expresar la proporción como su complemento. En concreto, la recodificación $0\to 1$ et $1\to0$ cambia la proporción original $p$ a $1-p$ . Por ejemplo, no debería haber ninguna diferencia entre hablar del 60% de personas que votan "sí" o del 40% que votan "no" en un referéndum; los dos números 0,6 y 0,4 representan exactamente lo mismo. Así, las estadísticas, pruebas, decisiones, resúmenes, etc., deberían dar los mismos resultados ( mutatis mutandis ) independientemente de la forma de expresión utilizada.
En consecuencia, Tukey utilizó reexpresiones de proporciones, y análisis basados en esas reexpresiones, que son (casi) invariantes bajo la conversión $p\longleftrightarrow 1-p$ . Son de la forma $f(p) \pm f(1-p)$ para diversas funciones $f$ . (El signo menos suele ser mejor porque sigue distinguiendo entre $p$ et $1-p$ : sólo sus signos difieren cuando se reexpresan). Cuando se escalan de modo que el cambio diferencial cerca de $p=1/2$ es igual a $1$ A estos valores los denominó "plegados". Entre ellos se encuentra el logaritmo plegado ("flog"), proporcional a $\log(p) - \log(1-p)$ = $\log(p/(1-p)$ = $\text{logit}(p)$ y la raíz doblada ("froot"), proporcional a $\sqrt{p} - \sqrt{1-p}$ .
Una exposición matemática de este tema es menos convincente que ver las estadísticas en acción, por lo que recomiendo leer el capítulo 17 de EDA y estudiar los ejemplos que contiene.
En resumen, sugiero que la propia pregunta es demasiado restrictiva y que hay que abrirse a posibilidades que van más allá de las sugeridas por la taxonomía clásica de variables.
Addendum: Por qué "Intervalo" y "Ratio" no son respuestas del todo correctas
Stevens creó la tiponimia nominal-ordinal-intervalo-ratio en un convincente artículo publicado en 1946 en Ciencia (Nueva Serie, Vol. 103, nº 2684, pp 677-680). El fundamento de las distinciones es explícito invariancia de las "operaciones empíricas básicas" bajo acciones de grupo. Su Tabla 1 describe así la relación entre la escala y el grupo:
$$\begin{array}{ll} \text{Scale}&\text{Mathematical Group Structure} \\ \hline\text{Nominal}&\text{Permutation Group } x^\prime = f(x);\ f(x) \text{ means any one-to-one substitution} \\ \text{Ordinal}&\text{Isotonic Group } x^\prime = f(x);\ f(x) \text{ means any monotonic increasing function} \\ \text{Interval}&\text{General Linear Group } x^\prime = ax + b \\ \text{Ratio}&\text{Similarity Group } x^\prime = ax \end{array}$$
(Esta es una cita directa, con algunas columnas no mostradas).
Esto debe leerse con cierta latitud, porque siempre tenemos la opción de elegir un modelo que no sea exactamente correcto. (Por ejemplo, una distribución Normal como modelo de variación puede ser extremadamente útil y bastante precisa incluso cuando se aplica, por ejemplo, a la altura de las personas, que nunca puede ser negativa aunque todas las distribuciones Normales asignen algunos probabilidad a valores negativos). Así, por ejemplo, los datos de proporciones extremadamente pequeñas podrían considerarse de relación porque el límite superior de $1$ es prácticamente irrelevante. Los datos de proporciones muy próximas que no se aproximan a ninguno de los límites $0$ o $1$ podría considerarse de intervalo tipo. Limitar el alcance de las preguntas a cualquiera de estos casos especiales justificaría (parcialmente) algunas de las otras respuestas de este hilo que insisten en que las proporciones están en una escala de intervalo o de razón. Sin embargo, cuando las proporciones de un conjunto de datos pueden ser a la vez grandes (mayores que $1/2$ ) y pequeños (menos de $1/2$ ) y algunos de ellos se acercan a $1$ o $0$ es evidente que no se pueden aplicar ni el grupo lineal general ni el grupo de similitud, porque no preservan el intervalo $[0,1]$ . Por este motivo, la clasificación de Stevens es incompleta y, por lo general, no puede aplicarse a las proporciones.
0 votos
Por cierto, P70 - P50 representa el porcentaje de personas que se encuentran entre el percentil 70 y el percentil 50, y ese porcentaje es 20. Evidentemente, es lo mismo que P50 -P30. A la hora de evaluar si las diferencias son iguales no creo que haya que fijarse en las puntuaciones subyacentes.
0 votos
Y lo mismo ocurre con el cálculo de los coeficientes de correlación, supongo.
0 votos
Sí, eso sería correcto. De hecho, la correlación sería la relación, ya que 0 significa que no hay correlación y tal conclusión es invariante de la escala. Por cierto, sospecho que los percentiles también se clasificarían como relación, ya que el punto 0 es invariante de la escala, pero en realidad no importa. La mayoría de las aplicaciones estadísticas requieren medidas a nivel de intervalo, no necesariamente de razón.