Soy un gestor informático que se ocupa de los retrasos de varios departamentos en un proceso de compra. En una fase determinada tenemos 25 traspasos y, por tanto, 25 tiempos de respuesta. Tantos tiempos variables (y sin SLA) crean una gran incertidumbre sobre la fecha final, que se refleja en el riesgo informático y de ciberseguridad. He recopilado las marcas de tiempo de estos traspasos de 5 compras anteriores para modelar la fecha prevista en la que una compra llegará a la fase final (es decir, el contrato firmado). Quiero conocer las estimaciones optimista, media y pesimista. Para ello, he calculado los siguientes estadísticos Mínimo > Media menos desviación típica > Media > Media más desviación típica > Máximo
Entonces encontré un problema. Vamos a calcular para la siguiente muestra (los valores son días): 0.2, 1.0, 0.3, 0.0, 0.1
Lo conseguimos:
- Mínimo: 0.0
- Media menos desviación típica: -0,1
- Media: 0.3
- Media más desviación estándar: 0.7
- Máximo: 1.0
Ese -0,1 fue inesperado (para mí). Esperaba algún valor entre el mínimo (0,0) y la media (0,3) que pudiera indicarme cuál es la respuesta rápida, basándome en valores históricos. Me di cuenta de que estaba suponiendo una distribución normal, que no es el caso.
Así que he intentado utilizar los percentiles 25 y 75, en lugar de las desviaciones típicas. Y entonces me encontré con otro problema. Vamos a calcular para la siguiente muestra: 2.0, 2.0, 2.0, 2.0, 3.0
Es decir: normalmente tarda 2 días, pero en una ocasión tardó 3. Algo entre [2,3] debería describir la realidad. Pero mi métrica se convierte:
- Mínimo: 2.0
- 25 perc.: 2,0
- Media: 2,2
- Porcentaje 75: 2,0
- Máximo: 3.0
Tengo un percentil 75 (2,0) inferior a la media (2,2). Estadísticamente computa bien, pero no puedo usar el percentil 75 para modelar un caso peor que la media. Estoy calculando algo mal. Esperaba que un percentil pudiera ser un valor no presente en la muestra, como si tuviera valores continuos... alguna interpolación.
Así pues, mi mente está en interpolar alguna distribución normal, pero mis escasos conocimientos de estadística no me llevan a una solución. ¿Pueden ayudarme a modelar esto?
Utilizo Excel. Alguna solución factible en excel sería genial.