Estoy trabajando en un determinar por qué ciertos empleados a causa de errores en una empresa en proceso y por qué otros no. Tengo la información de los empleados, la información acerca de los errores que han hecho y los equipos que los empleados se encuentran en el.
Todos los empleados en todos los equipos han provocado errores en un momento u otro. Lo que quiero saber es si hay ciertas características acerca de ciertos empleados que les lleva a realizar determinados tipos o número de errores. El tamaño de la muestra es de unos pocos miles durante un periodo de seis meses.
¿Ustedes qué piensan que es el mejor enfoque, es decir, método de la agrupación general de minería de datos método?