7 votos

Ranking distribuidos al azar variables basado en decreasingness

Para una investigación que estoy llevando a cabo, se han topado con el siguiente problema, que debo resolver en varias ocasiones:

Mis datos se compone de secuencias de observaciones $\{O_1,O_2,\ldots,O_n\}$, cada una con una diferente distribución normal de error. Las secuencias son de longitud variable, que van desde los 5 a 44 las observaciones.

Necesito un sistema de clasificación que expresa lo mucho que la secuencia de observaciones es decreciente.


He aquí lo que he encontrado hasta ahora:

Ya que todo está normalmente distribuida, es fácil de calcular, $P(O_1 > \cdots > O_n )$ o $\prod_{i=1}^{n-1}P(O_i > O_{i+1})$ a través de Monte Carlo. Así que mi primer ingenua manera de enfrentarse a este problema es tratar de estos dos puntuaciones.

Hay problemas con este enfoque. En mis datos, las observaciones pueden corresponder a una exponencial decreciente de la cantidad, o sigue una ley de potencia. En estos asintóticamente convergente de los casos, para un gran $n$ estos resultados podrían ser muy bajo. Lo que es más, una secuencia corta con amplia barras de error fácilmente podría conseguir una mayor puntuación.

Así que un buen sistema de clasificación debe castigar a corto, ambigua y secuencias de perdonar largo, asintóticamente secuencias convergentes.

Pensando en el caso ambiguo, se puede demostrar que si todos los de la observación i.yo.d, entonces, independientemente de la distribución:

  • $\displaystyle P(O_1 > O_2 > \cdots > O_n) = \frac{1}{n!}$ y
  • $\displaystyle\prod_{i=1}^{n-1}P(O_i > O_{i+1}) = \frac{1}{2^{n-1}}$

A partir de estas observaciones, me he inspirado para llegar a la siguiente clasificación:

  • $P(O_1 > \cdots > O_n ) \times {n!}$
  • $\displaystyle\prod_{i=1}^{n-1}P(O_i > O_{i+1}) \times 2^{n-1}$

No puedo decir nada acerca de las propiedades estadísticas de estas clasificaciones, ya que son de mi propia invención y no puedo encontrar ningún papel en este problema. Además, todavía tengo que implementar nada, ya que sólo he encontrado con este problema muy recientemente. Voy a actualizar a esta pregunta con mi evolución.

De entrada y críticas son bienvenidos! Gracias a todos por adelantado!

5voto

matt Puntos 11

En lugar de la aproximación de una muy pequeña probabilidad, a continuación, reescalado por algo enorme (como $44! \approx 2.7 \times 10^54$) que sería mejor para computar el valor entero de estadísticas, tales como el recuento de los valores de $i$, de modo que $O_i \gt O_{i+1}$. Este será un uso más eficiente de cualquier MonteCarlo, que se ejecuta a realizar.

Una idea que se ha estudiado mucho por los matemáticos es el número de inversiones, los pares de $i \lt j$ donde $O_i \gt O_j$. De una manera uniforme permutación aleatoria, el número de inversiones es una suma de independiente uniforme discreta distribuciones

$$ \sum_{i=1}^n U[\lbrace 0, 1, ..., i-1 \rbrace] $$

y como $n \to \infty$ este es asintóticamente normal con una media de ${n \choose 2}/2$ y la desviación estándar $\sqrt{(2n^3 + 3n^2-5n)/72} = n^{3/2}/6 + O(n).$

No sé de una forma cerrada expresión para el número de permutaciones de $n$ con exactamente, por lo menos $i$ inversiones, pero hay recursiones que son lo suficientemente rápidos como para mucho más grande $n$ que usted está utilizando. Deje $I(n,i)$ el número de permutaciones de $n$ con exactamente $i$ de las inversiones. Entonces

$$ I(n,i) = \sum_{j=0}^{i-1} I(n-1,i-j)$$

por el condicionamiento en el último uniforme variable aleatoria arriba.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X