2 votos

Aplicar la mediana en funcionamiento para las mediciones diarias no equidistantes, con varias mediciones potenciales de KPI por día

Supongamos que tengo mediciones diarias de un KPI con posibles lagunas (es decir, algunos días no hay mediciones) y a veces varias mediciones al día. ¿Cómo se aplicaría la mediana en funcionamiento (véase por ejemplo aquí ) en esta situación? La intención es mostrar una tendencia del KPI del proceso subyacente. ¿Hay que promediar los valores de los días con varias mediciones (por ejemplo, utilizando la mediana)?

He utilizado gráficos de control de procesos estadísticos (SPCC) y he aplicado transformaciones box-cox, pero no estoy seguro de que se infrinja el supuesto de normalidad subyacente.

He leído en algún sitio que se puede utilizar el bootstrapping (mensual) y luego aplicar los SPCC. Estoy bastante seguro de que podría programar esto, pero me falta la "confianza estadística" para juzgar si vale la pena.

Gracias.

2voto

Hugo Delgado Puntos 1

Supongamos que la mediana en funcionamiento se pretende que sea la mediana de 7 valores, observados a mediodía todos los días de la semana pasada. Con observaciones irregulares, una alternativa es tomar la mediana de 168 valores en todas las horas de la semana pasada. La cuestión es entonces cómo completar los valores en las numerosas horas no observadas.

Dependiendo del KPI y del procedimiento de medición, puede rellenar el valor de una hora no medida con:

  • la última medición antes de la hora no medida
  • la primera medición después de la hora no medida
  • una interpolación lineal entre las dos mediciones anteriores
  • cualquiera de las anteriores ajustadas a la hora del día, por ejemplo, añadiendo la diferencia prevista entre las temperaturas del mediodía y las de la noche a cualquier observación de temperatura nocturna
  • un valor de algún modelo horario ajustado a los datos observados

Si realmente se obtienen los datos una vez al día, a mediodía, como se pretende, los cuatro primeros procedimientos darán el mismo valor que se habría obtenido de la mediana de las siete mediciones diarias.

Nada de esto se refiere a los SPCC, las transformaciones o una suposición de normalidad, pero puede ser suficiente para una demostración transparente de las tendencias.

2voto

Nick Cox Puntos 22819

Es difícil calibrar cómo funcionaría cualquier método sin ver siquiera los datos de la muestra, pero las posibilidades incluyen

  • resumir los últimos tantos valores, mediante una mediana, o media, o más generalmente una media recortada

(en este caso, considere la posibilidad de ponderar a la baja según el tiempo transcurrido)

  • Resumiendo cada día, ídem, y dejando sólo los días en blanco sin mediciones.

Hagas lo que hagas, es esencial graficar los datos y los resultados. (Está bien si eso es obvio).

No hay ninguna suposición de normalidad subyacente al suavizado descriptivo o exploratorio, aunque una distribución condicional sesgada afectará a las medias más que a las medianas. Las medias recortadas parecen un poco atípicas en este territorio, pero permiten un compromiso sintonizable entre la media y la mediana.

Box-Cox lo considero personalmente sobrevalorado, aunque no por sus autores originales (no hay relación): en la mayoría de los casos, hay dos posibilidades principales, dejar los datos como vienen y trabajar en una escala logarítmica.

Es difícil saber cómo hay que pensar en los valores atípicos: en un contexto empresarial, los valores muy altos o muy bajos podrían informarle sobre acontecimientos pasados que conoce y que no forman parte de su toma de decisiones, o podrían ser detalles importantes que no debería descartar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X