7 votos

Comprender los gráficos de control estadístico

Los gráficos de control están de moda en mi empresa estos días. Nuestros "analistas de datos" (las comillas son a propósito) están poniendo límites de control en casi todos los gráficos que producen. El otro día estuvimos mirando algunos gráficos de llamadas a nuestro centro de atención telefónica durante el último año. Tenemos mediciones del número de llamadas de cada semana que se trazan en un gráfico de líneas. Recientemente, los analistas que preparan estos gráficos han empezado a poner líneas en los gráficos indicando "límites de control".

La pregunta que tengo es sobre cómo están calculando dónde deben estar estos límites de control. Cuando pregunté cómo determinaban los límites, esta es la respuesta que obtuve:

Primero buscamos una sección del gráfico en la que los puntos parezcan algo estables (es decir, con poca varianza) y luego calculamos la media de esos puntos. A continuación, calculamos el error estándar de esos puntos y trazamos los límites de control a +/- 3 errores estándar de la media que hemos calculado.

¿Es correcto calcular la media de esta manera? Parece que deberíamos utilizar TODOS los puntos para calcular la media en lugar de desechar todo lo que "parece" que varía demasiado.

¿Tiene siquiera sentido poner límites de control a una medida como ésta (el número de llamadas que entran en un centro de llamadas)? Mientras las mediciones estén dentro de los límites de control, consideramos que la semana es normal. Si la medición del volumen de llamadas de una semana está fuera de estos límites de control, se considera significativa y justifica un análisis más profundo. Hay algo que me parece artificial en todo esto.

12voto

jldugger Puntos 7490

El objetivo de un gráfico de control es identificar, lo más rápidamente posible, cuando algo solucionable va mal. Para que funcione bien, debe no identificar los cambios aleatorios o incontrolables como "fuera de control".

Los problemas con el procedimiento descrito son múltiples. Entre ellas se encuentran

  • La sección "estable" del gráfico no es típica. Por definición, es menos variable de lo habitual. Al subestimar la variabilidad de la situación en control, hará que el gráfico identifique incorrectamente muchos cambios como fuera de control.

  • Utilizar los errores estándar es simplemente un error. Un error estándar estima la variabilidad muestral del media tasa de llamadas semanal, no la variabilidad de las tasas de llamadas en sí.

  • Fijar los límites en $\pm 3$ desviaciones estándar puede ser eficaz o no. Se basa en una regla general aplicable para normalmente datos distribuidos que no están correlacionados en serie. Las tasas de llamadas no se distribuirán normalmente a menos que sean moderadamente grandes (alrededor de 100+ por semana, aproximadamente). Pueden o no estar correlacionados en serie.

  • El procedimiento supone que el proceso subyacente tiene una tasa invariable en el tiempo. Pero usted no está fabricando widgets; está respondiendo a un mercado que, con suerte, está (a) aumentando de tamaño y (b) disminuyendo su tasa de interés de compra con el tiempo. Las tendencias temporales son esperada. Tarde o temprano, cualquier tendencia hará que los datos parezcan sistemáticamente fuera de control.

  • Las personas tienden a pasar por ciclos anuales de actividad que se corresponden con las estaciones, el calendario académico, las vacaciones, etc. Estos ciclos actúan como tendencias para provocar eventos predecibles (pero sin sentido) fuera de control.

Un conjunto de datos simulados ilustra estos principios y problemas.

Control chart

El procedimiento de simulación crea una serie realista de datos que son en el control: en relación con un patrón subyacente predecible, incluye no excursiones fuera de control a las que se puede asignar una causa. Este gráfico es un resultado típico de la simulación.

Estos datos se han extraído de las distribuciones de Poisson, un modelo razonable para las tasas de llamadas. Empiezan con una base de 100 por semana, con una tendencia lineal ascendente de 13 por semana al año. A esta tendencia se superpone un ciclo anual sinusoidal con una amplitud de ocho llamadas por semana (trazado por la curva gris discontinua). Se trata de una tendencia modesta y una estacionalidad relativamente pequeña, creo.

Los puntos rojos (alrededor de las semanas 12 - 37) se identificaron como el período de 26 semanas de menor desviación estándar encontrado durante el primer año y medio de este gráfico de dos años. Las líneas finas rojas y azules se fijan en $\pm 3$ errores estándar en torno a la media de este período. (Las líneas gruesas doradas y verdes se fijan en $\pm 3$ desviaciones estándar alrededor de la media.

(Uno no suele proyectar líneas de control hacia atrás en el tiempo, pero lo he hecho aquí como referencia visual. Por lo general, no tiene sentido aplicar los controles de forma retroactiva: su objetivo es identificar futuro cambios).

Obsérvese cómo la tendencia secular y las variaciones estacionales llevan al sistema a condiciones aparentemente fuera de control entre las semanas 40-65 (un máximo anual) y después de la semana 85 (un máximo anual más la tendencia acumulada de más de un año). Cualquiera que intente utilizarlo como gráfico de control estaría buscando erróneamente causas inexistentes la mayor parte del tiempo. En la práctica, este sistema sería odiado y pronto ignorado por todos. (He visto empresas en las que todas las puertas de las oficinas y todas las paredes de los pasillos estaban cubiertas de gráficos de control que nadie se molestaba en leer, porque todos sabían que era mejor).

La forma correcta de proceder empieza por plantear las preguntas básicas, como por ejemplo, ¿cómo se mide la calidad? ¿Qué influencia puede tener sobre ella? ¿Cómo, a pesar de sus esfuerzos, es probable que estas medidas fluctúen? ¿Qué le dirían las fluctuaciones extremas (cuáles podrían ser sus causas controlables)? A continuación, debe realizar un análisis estadístico de los datos anteriores. ¿Cuál es su distribución? ¿Están correlacionados temporalmente? ¿Existen tendencias? ¿Componentes estacionales? ¿Existen pruebas de excursiones pasadas que puedan indicar situaciones fuera de control?

Una vez hecho todo esto, puede ser posible crear un gráfico de control eficaz (u otro sistema de seguimiento estadístico). La bibliografía es amplia, por lo que si esta empresa se toma en serio el uso de métodos cuantitativos para mejorar la calidad, hay mucha información sobre cómo hacerlo. Pero ignorar estos principios estadísticos (ya sea por falta de tiempo o de conocimientos) prácticamente garantiza el fracaso del esfuerzo.

6voto

Eero Puntos 1612

La idea general de los gráficos de control es distinguir entre la variación por causa común y la variación por causa especial. La idea es que el proceso es bastante estable y genera datos a partir de una distribución determinada (aunque la Poisson tiene más sentido para el número de llamadas que la normal). Una gran ventaja de los gráficos de control es que limitan la reacción exagerada a la variación natural, a la vez que permiten descubrir cuándo ha cambiado el proceso.

Elegir un conjunto de observaciones porque tienen una pequeña variación casi garantizaría que los límites son demasiado estrechos y, por tanto, aumentarían las reacciones inadecuadas a la variación normal. Utilizar todos los datos tiene mucho más sentido, y utilizar un gráfico C de Poisson podría ser mejor que un gráfico de barras x. Pero, también parece que un centro de llamadas esperaría diferencias debido a las vacaciones o la temporada (dependiendo de lo que se está apoyando), por lo que los supuestos subyacentes pueden incluso no ser apropiados aquí.

Parece que hacen algo porque pueden y no porque responden a una pregunta significativa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X