2 votos

¿Cómo estimar los tiempos de respuesta probables a partir de muestras anteriores?

Soy un gestor informático que se ocupa de los retrasos de varios departamentos en un proceso de compra. En una fase determinada tenemos 25 traspasos y, por tanto, 25 tiempos de respuesta. Tantos tiempos variables (y sin SLA) crean una gran incertidumbre sobre la fecha final, que se refleja en el riesgo informático y de ciberseguridad. He recopilado las marcas de tiempo de estos traspasos de 5 compras anteriores para modelar la fecha prevista en la que una compra llegará a la fase final (es decir, el contrato firmado). Quiero conocer las estimaciones optimista, media y pesimista. Para ello, he calculado los siguientes estadísticos Mínimo > Media menos desviación típica > Media > Media más desviación típica > Máximo

Entonces encontré un problema. Vamos a calcular para la siguiente muestra (los valores son días): 0.2, 1.0, 0.3, 0.0, 0.1

Lo conseguimos:

  • Mínimo: 0.0
  • Media menos desviación típica: -0,1
  • Media: 0.3
  • Media más desviación estándar: 0.7
  • Máximo: 1.0

Ese -0,1 fue inesperado (para mí). Esperaba algún valor entre el mínimo (0,0) y la media (0,3) que pudiera indicarme cuál es la respuesta rápida, basándome en valores históricos. Me di cuenta de que estaba suponiendo una distribución normal, que no es el caso.

Así que he intentado utilizar los percentiles 25 y 75, en lugar de las desviaciones típicas. Y entonces me encontré con otro problema. Vamos a calcular para la siguiente muestra: 2.0, 2.0, 2.0, 2.0, 3.0

Es decir: normalmente tarda 2 días, pero en una ocasión tardó 3. Algo entre [2,3] debería describir la realidad. Pero mi métrica se convierte:

  • Mínimo: 2.0
  • 25 perc.: 2,0
  • Media: 2,2
  • Porcentaje 75: 2,0
  • Máximo: 3.0

Tengo un percentil 75 (2,0) inferior a la media (2,2). Estadísticamente computa bien, pero no puedo usar el percentil 75 para modelar un caso peor que la media. Estoy calculando algo mal. Esperaba que un percentil pudiera ser un valor no presente en la muestra, como si tuviera valores continuos... alguna interpolación.

Así pues, mi mente está en interpolar alguna distribución normal, pero mis escasos conocimientos de estadística no me llevan a una solución. ¿Pueden ayudarme a modelar esto?

Utilizo Excel. Alguna solución factible en excel sería genial.

1voto

manku Puntos 111

No da mucha información sobre estos tiempos de espera, así que esta respuesta debe considerarse altamente especulativa.

A menudo, los tiempos de espera se modelan como exponenciales. Su pequeña muestra $0.2, 1.0, 0.3, 0.0, 0.1$ tiene un valor atípico elevado $1.0$ lo que puede sugerir una distribución sesgada a la derecha. Una muestra de tamaño cinco es difícilmente suficiente para especular de forma fiable sobre la distribución de los tiempos de espera.

Si $\bar X$ es la media de una población exponencial de tamaño $n,$ uno tiene $\frac{\bar X}{\mu} \sim \mathsf{Gamma}(\mathrm{shape}=n,\mathrm{rate}=n).$ Esta relación puede "pivotarse" para obtener un IC del 95% para $\mu$ de la forma $\left(\frac{\bar X}{U}, \frac{\bar X}{L}\right),$ donde $L$ y $U$ área de corte 0,025 de las colas inferior y superior de $\mathsf{Gamma}(n,n),$ respectivamente.

Así que si tienes $n = 20$ observaciones exponenciales con $\bar X = 0.35,$ entonces un IC del 95% para $\mu$ es $(0.24, 0.57).$ [Cálculos en R.]

0.35/qgamma(c(.975,.025),20,20)
[1] 0.2359218 0.5729946

En el peor de los casos, la media es tan grande como $\mu = 0.57,$ se podría especular que el 99% de las veces el tiempo de espera sería inferior a $2.624.$

qexp(.99, 1/0.57)  # mean 0.57 implies rate 1/0.57
[1] 2.624947

Por supuesto, esto se basa en sólo 20 observaciones, la suposición que los tiempos de espera futuros imitarán a los pasados, y la suposición de que los tiempos de espera son exponenciales.

Por el contrario, si se dispone de una cantidad considerable de datos sobre los tiempos de espera anteriores pertinentes, entonces más información y menos suposiciones. En Puede utilizar el percentil 99 de esos datos para una predicción "pesimista" del próximo tiempo de espera, como se muestra a continuación. pesimista" del próximo tiempo de espera, como se muestra a continuación.

set.seed(2021)
y = rexp(1000, 1/0.35)  # fictitious exponential data
                          for illustration
summary(y)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0002822 0.0990812 0.2418578 0.3520501 0.4953001 2.3407786 

quantile(y, .99)
     99% 
1.535914 

Basándome en mis datos ficticios, sólo diez veces en 1000 situaciones de este tipo el tiempo de espera fue superior a $1.536$ y el tiempo de espera nunca fue mayor que $2.35.$

sum(y > 1.536)
[1] 10

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X