1 votos

Medir la dispersión de un conjunto de valores reside en un rango

Quiero saber cuál es el mejor método para calcular (medir) la dispersión estadística de un conjunto de valores reside entre un rango.

Escenario :

Mi objetivo es construir un índice. Tengo dos métodos que generan valores de índice (códigos de índice) y quiero averiguar qué método crea el mejor. Un índice se considera mejor, si sus valores se distribuyen uniformemente o más a través del espacio de índice.

ej: let $I_1=\{20, 40, 60, 80, 100\}$ y $I_2=\{54, 55, 56, 57, 59\}$ sean dos índices. Entonces $I_1$ es mejor que $I_2$ porque se ha extendido más por el espacio del índice (de 0 a 100).

El espacio de índices tiene un límite superior ( $H$ ) y un límite inferior ( $L$ ). Todos los valores de índice se encuentran entre estos límites ( $L \le i_j \le H$ ).

Así que quiero una medida estadística que pueda utilizar para identificar correctamente el índice "más disperso".

Gracias de antemano.

1voto

Puesto que conoce la parte superior ( $H$ ) e inferior ( $L$ ) de su rango de índices, la distribución de índices "ideal" sería discreta-uniforme en $[L,H]$ .

Por desgracia, la desviación típica, la asimetría o la curtosis sólo caracterizarán parcialmente lo que busca. De hecho, he tenido que lidiar con el mismo problema que tú (el de encontrar una distribución lo más "uniforme" posible).

He desarrollado la siguiente medida de "uniformidad", que me ha resultado útil. Pruébela y vea si se ajusta a sus necesidades. Se calcula como sigue:

  1. Crear la FDA empírica continua derecha de los índices $I_i$ (ten en cuenta que será una función escalonada tenlo en cuenta cuando hable más adelante).
  2. Calcular la distancia euclidiana ( $d=\sqrt{a^2+b^2}$ ) entre la parte superior de un salto y la parte superior del salto siguiente (es decir, la parte superior de un paso es el más a la izquierda de la ECDF para un valor dado de la ECDF), llame a este $\delta(k_i,k_{i+1})$ . Sea $\delta(I_i)=p_0+\sum\limits_{j \in \{1...|I_i|-1\}} \delta(k_j,k_{j+1})$ donde $p_0$ es la probabilidad asignada al punto más a la izquierda de la distribución.
  3. La distancia equivalente para una distribución perfectamente uniforme sería $U(L,H)=\frac{1}{H-L+1}+(H-L)\sqrt{1+(H-L+1)^{-2}}$ ya que es la distancia de una línea diagonal desde la parte superior de la ECDF a $L$ a la parte superior de la ECDF en $H$
  4. Calcule el índice de uniformidad como $\Upsilon(I_i) = \frac{U[L,H]}{\delta(I_i)}$

De geometría simple, $0\leq \Upsilon(I_i) \leq 1$ . Puede ordenar sus distribuciones desde el valor más bajo de $\Upsilon(I_i)$ (menos uniforme) a la más alta $\Upsilon(I_i)$ (la mayoría incluso).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X