El Control Estadístico de Procesos (CEP) puede utilizarse para determinar si un proceso está "en control estadístico". Una herramienta habitual del CEP es el "gráfico de control de medias", que consiste básicamente en una serie temporal de medias muestrales obtenidas del proceso que se pretende analizar.
Una regla general presentada por John Oakland en su libro Control estadístico de procesos es la siguiente. Cito:
Una tendencia es una sucesión de puntos en el gráfico que van al alza o a la baja, y puede indicar cambios graduales, como el desgaste de las herramientas. Las reglas relativas a la detección de carreras y tendencias se basan en encontrar una serie de siete puntos en una tendencia ascendente o descendente (figura 6.5), o en una carrera por encima o por debajo del valor medio (figura 6.6). Éstas se tratan como señales de descontrol. La razón de elegir siete está relacionada con el riesgo de encontrar un punto por encima de la media, pero [dentro de 2 σ ] siendo ca=0,475. La probabilidad de encontrar siete puntos en dicha serie será (0,475)7 = ca. 0,005. Esto indica cómo una racha o tendencia de siete tiene aproximadamente la misma probabilidad de ocurrir que un punto [3 σ lejos de la media] (pág. 111, 7e)
Los autores motivan aquí la discusión con el uso de una distribución normal, por lo que es lógico que todos los cálculos se realicen con la normal. Los autores incluyen la siguiente figura como ilustración de una "tendencia"
El fundamento de esta definición de "tendencia" es confuso. Oakland señala correctamente que
Φ(2)−Φ(0)≈0.47
Sin embargo, la probabilidad de observar tal secuencia de observaciones no es 7*0,46>1, ni tampoco 0.46)7 . La probabilidad de observar una tendencia depende de la secuencia de valores observados.
Suponiendo que los puntos son independientes, entonces la probabilidad de observar una tendencia x1>x2>⋯>x7 , donde xi son iid, sería la probabilidad que encuentro x2<x1 multiplicado por la probabilidad de que x3<x2 y así sucesivamente. Más compacto,
6∏i=1Φ(xi)
Este producto depende claramente de lo "empinada" que sea esta tendencia.
import numpy as np
from scipy.stats import norm
#Not so steep
trend = np.linspace(2,1,7)
np.prod(norm.cdf(trend))
>>>0.6094690320800531
#Very steep
trend = np.linspace(2,-2,6)
np.prod(norm.cdf(trend))
>>>0.0005112910660916415
¿Podría alguien más familiarizado con el SCP justificarme por qué una tendencia de 7 puntos, independientemente de dónde se observen esos puntos, señala un proceso fuera de control? Y lo que es más importante, ¿por qué los profesionales del CPS se refieren a estas tendencias como "estadísticamente significativas"?