2 votos

Comprobación de una hipótesis de ley de potencias a partir de la distribución promediada

En el siguiente documento se ofrece una forma de comprobar la existencia de una ley de potencias en la distribución: http://arxiv.org/abs/0706.1062

La esencia de todo el procedimiento es la siguiente:

  1. Sea $\textbf{X}$ sea el conjunto o vector de observaciones de variable discreta o continua y queramos comprobar si estos elementos proceden de la distribución power-law $k^{-\alpha}$ .
  2. El procedimiento más básico (y el peor) sería hallar (con un binning adecuado) la distribución de números de $\textbf{X}$ y trazarlo en escala log-log. Si los puntos del gráfico parecen estar presentes aproximadamente en una línea recta, entonces la distribución es una ley de potencia. Entonces se puede ajustar visualmente la línea recta a la parte aproximadamente recta del gráfico y averiguar el índice $\alpha$ .
  3. Una forma mejor es utilizar una función de distribución acumulativa o un binning logarítmico y, de nuevo, ajustar visualmente una línea recta.
  4. Por último, se puede utilizar uno de los anteriores y luego utilizar digamos "ajuste por mínimos cuadrados" para encontrar el exponente $\alpha$ .
  5. Sin embargo, todos estos métodos suponen que la distribución subyacente es efectivamente una ley de potencias. Esto puede no ser siempre cierto. Una forma mejor que se describe en el artículo mencionado es la siguiente: Utilizando un método de máxima verosimilitud, primero se encuentra un punto mínimo $k_{min}$ por encima de la cual se mantiene la ley de potencia y el índice correspondiente $\alpha$ . A continuación, generamos un gran número de muestras sintéticas distribuidas según la ley de potencia utilizando este valor de $\alpha$ y comparar sus fluctuaciones con las de los datos reales. Si la fracción de conjuntos de datos sintéticos con más fluctuación que los datos originales es grande ( $>0.1$ ), normalmente se considera un indicativo de una ley de potencia.

Todo este proceso, sin embargo, utiliza un vector real de observaciones $\textbf{X}$ y no la distribución generada utilizando valores de $\textbf{X}$ .

Consideremos ahora la siguiente situación: Tengo una simulación de un proceso aleatorio y me gustaría comprobar la existencia de ley de potencia en dicho proceso. Sin embargo, si este proceso se pudiera simular, no lo simularía una vez, sino que diría $1000$ veces y promediar todas las distribuciones resultantes para ver la forma real de la distribución subyacente.

Hasta ahora, todo bien. Pero ahora esto invita al diablo. Al promediar las distribuciones, simplemente hemos desechado vectores individuales $\textbf{X}$ y no se pueden promediar ya que cada permutación de un vector $\textbf{X}$ contiene la misma información. Por lo tanto, el método descrito anteriormente no se puede utilizar, ya que utiliza $\textbf{X}$ para establecer una ley de potencia.

Una forma de resolver el problema sería la siguiente: Después de hallar la distribución media $p(k)$ construya un vector ficticio $\textbf{X}_d$ que contiene valores $k$ y el número de valores sería proporcional a $p(k)$ . Por lo general, elegiremos el número entero más próximo a $nP(k)$ donde $n$ es el tamaño de la muestra.

Un problema obvio de este enfoque es que cuando los valores de $p(k)$ son muy pequeños, no está muy claro cuántos valores de $k$ debe incluirse en $\textbf{X}_d$ ( $0$ o $1$ ). Ambas opciones parecen dar un sesgo sobre la distribución subyacente real.

¿Cómo se puede resolver este problema sin grandes esfuerzos computacionales?

1voto

Compeek Puntos 111

No entiendo muy bien el problema. ¿Su simulación produce muestras aleatorias o una distribución? ¿Cómo se promedian las distribuciones?

Si su simulación produce muestras aleatorias a partir de una distribución fija, parece que podría colocar las muestras de todas sus 1000 ejecuciones en un vector largo y probar ese vector utilizando el método descrito anteriormente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X