2 votos

Reglas de asociación por el algoritmo Apriori - ¿Cómo leerlas?

Vamos a considerar la minería de reglas de asociación para el análisis de la cesta en una gasolinera.

Es obvio que la mayoría de las personas compran gasolina, algunas de ellas algo adicional.

Las siguientes implicaciones son válidas:

  • 'sandwich' $\to$ 'petrol'
  • 'coke' $\to$ 'petrol'
  • 'chocolate' $\to$ 'petrol'
  • 'newspaper' $\to$ 'petrol'
  • $\dots$

Puramente lógicamente, la proposición SI alguien compra coca-cola en la gasolinera ENTONCES es probable que también compre gasolina.

Obviamente, esto no es muy útil. ¿Estás al tanto de algún enfoque sistemático sobre cómo lidiar con situaciones como esta?

2voto

Alex Wong Puntos 11

Usted tiene razón en su interpretación de que $\{coke\} \Rightarrow \{petrol\}$ representa la proposición, o regla de asociación, que:

SI alguien compra coke en la estación de servicio ENTONCES es probable que compre también petrol.

Para entender un poco más esta regla y ubicarla en contexto en términos de utilidad, hay algunos conceptos que podría observar. Deje que $D$ sea el conjunto de datos, $X$ e $Y$ sean conjuntos de elementos y $\{X\} \Rightarrow \{Y\}$ una regla de asociación.

Soporte [1], $supp(X)$, es una medida de qué tan frecuentemente aparece el conjunto de elementos $X$ en el conjunto de datos como antecedente/lado izquierdo.

$supp(X) = \frac{|\{d \in D ; X \in d\}|}{|D|}$

Confianza [1], $conf(\{X\} \Rightarrow \{Y\})$, es una medida de qué tan frecuentemente la regla de asociación $\{X\} \Rightarrow \{Y\}$ es verdadera en el conjunto de datos.

$conf(\{X\} \Rightarrow \{Y\}) = \frac{supp(X \bigcup Y)}{supp(X)}$

Elevación [1], $lift(\{X\} \Rightarrow \{Y\})$, es una comparación del soporte observado con lo que se esperaría si $X$ e $Y$ fueran independientes.

$lift(\{X\} \Rightarrow \{Y\}) = \frac{supp(X \bigcup Y)}{supp(X) \times supp(Y)}$

También existen otras medidas de "interesantez" de una regla de asociación tales como toda-confianza, cobertura, entropía, interés, apalancamiento, etc. [2, 3].

Fuentes

[1] Conceptos Útiles, Reglas de Asociación, Wikipedia

[2] Tan, Pang-Ning; Kumar, Vipin; y Srivastava, Jaideep; Seleccionar la medida objetiva correcta para análisis de asociación, Sistemas de Información, 29(4):293-313, 2004 DOI:10.1016/S0306-4379(03)00072-3

[3] Michael Hahsler (2015). Una Comparación Probabilística de las Medidas de Interés Comúnmente Utilizadas para Reglas de Asociación. Enlace

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X