12 votos

Determinar si un pesado de cola distribuida proceso ha mejorado significativamente

Observo los tiempos de procesamiento de un proceso antes y después de un cambio en el fin de averiguar, si el proceso ha mejorado por el cambio. El proceso ha mejorado, si el tiempo de procesamiento se reduce. El tiempo de procesamiento de la distribución de la grasa de cola, por lo que comparar sobre la base del promedio no es sensato. En lugar de eso me gustaría saber si la probabilidad de observar un menor tiempo de procesamiento después de que el cambio es significativamente superior al 50%.

Deje $X$ ser la variable aleatoria para el tiempo de procesamiento después de que el cambio y $Y$ el de antes. Si $P(X < Y)$, que es significativamente superior $0.5$, entonces yo diría que el proceso ha mejorado.

Ahora he a $n$ observaciones $x_i$ $X$ $m$ observaciones $y_j$$Y$. La observó probabilidad de $P(X < Y)$$\hat p = \frac{1}{n m} \sum_i \sum_j 1_{x_i < y_j}$.

¿Qué puedo decir acerca de $P(X < Y)$ habida cuenta de las observaciones $x_i$$y_j$?

12voto

bheklilr Puntos 113

Su estimación $\hat{p}$ es igual a la u de Mann-Whitney $U$ estadística, y es por lo tanto equivalente a la de Wilcoxon rank-sum estadística $W$ (también conocido como el de Wilcoxon-Mann-Whitney estadística): $W = U + {n(n+1)\over{2}}$ donde $n$ es el tamaño de la muestra de $y$ (suponiendo que no hay lazos.) Por lo tanto, puede utilizar las tablas / software de la prueba de Wilcoxon y transformar de nuevo a $U$ para obtener un intervalo de confianza o un $p$-valor.

Deje $m$ ser el tamaño de la muestra de $x$, $N$ = $m+n$. Entonces, asintóticamente,

$W^* = \frac{W-\frac{m(N+1)}{2}}{\sqrt{\frac{mn(N+1)}{12}}} \sim \text{N}(0,1)$

Fuente: Hollander y Wolfe, Estadística no Paramétrica Métodos, aproximadamente p. 117, pero probablemente la mayoría de los test no paramétrico de las estadísticas de los libros de llegar.

0voto

mat_geek Puntos 1367

Considerar los pares de diferencia $X_i-Y_i$, $P(X_i-Y_i<0) = p$ a continuación, $I\{X_i-Y_i<0\}$ $i=1,2,..,n$ son iid variables aleatorias de Bernoulli. Por lo que el número de $X$ $X_i < Y_i$ es binomial $n$ $p=P(X_i-Y_i<0)$. A continuación, $X/n$ es una estimación insesgada de la probabilidad y los intervalos de confianza y pruebas de hipótesis se puede hacer con base en el binomio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X