2 votos

Cálculo de la probabilidad en los conjuntos

Estaba leyendo sobre el cálculo del apoyo y la confianza en relación con la "minería de reglas asociadas" y encontré las siguientes definiciones:

Una regla de asociación se define como: $A \rightarrow B$ donde $A\subset T$ , $B\subset T$ y $A \cap B = \emptyset$ .

Apoyo: $c(A \rightarrow B) = P(A \cup B) $ . En otras palabras, el apoyo debe ser la relación de las transacciones que contiene tanto $\{A\}$ y $\{B\}$ dividido por el número total de transacciones en la base de datos.

Por ejemplo, considere las siguientes transacciones almacenadas en la base de datos:

\begin{array}{|c|c|} \hline {\bf ID} & {\bf Transaction} \\ \hline 1 & \{Beer, Dipper, Milk\} \\ \hline 2 & \{Beer, Milk\} \\ \hline 3 & \{Beer, Potato Chips\} \\ \hline 4 & \{Dipper, Cheese, Butter \} \\ \hline \end{array}

Así que, basándome en las definiciones y la descripción anteriores, quiero calcular el apoyo a $c(\{Beer\} \rightarrow \{Milk\})$ . Por lo tanto, tengo que calcular el $P(\{Beer\} \cup \{Milk\})$ (la probabilidad de que una transacción determinada contenga cerveza o leche). Lo que me resulta confuso es que, dado que $\{Beer\}$ y $\{Milk\}$ son conjuntos, ¿debo calcular la unión construyendo el $\{Beer, Milk\}$ y luego calcular la probabilidad de $P(\{Beer, Milk\})$ ?

Caso 1) Si no damos prioridad a la operación de unión antes de calcular la probabilidad: $P(\{Beer\} \cup \{Milk\}) = P(\{Beer\} ) + P(\{Milk\}) - P(\{Beer\} \cap \{Milk\}) $

$P(\{Beer\} \cup \{Milk\}) = \frac{3}{4} + \frac{2}{4} - \frac{2}{4} = \frac{3}{4} = 0.75$

Caso 2) Pero si suponemos que los conjuntos no son eventos, y tenemos que calcular la unión de dos conjuntos y luego calcular la probabilidad:

$P(\{Beer\} \cup \{Milk\}) = P(\{Beer, Milk\}) = \frac{2}{4} = 0.5$

Mi pregunta) Para mí, el caso 1 es matemáticamente correcto con la información proporcionada, pero el caso 2 es la respuesta correcta. ¿Cuál es matemáticamente correcto en términos de escritura? ¿Es válido decir $P(\{Beer\} \cup \{Milk\})$ = P({Cerveza, Leche}) ya que son conjuntos y no variables?

0voto

Fahmy Aziz Puntos 23

La primera respuesta es la fórmula PIE para la cerveza o la leche, pero la pregunta pide cerveza y leche.

La segunda respuesta es correcta - si lo piensas, escogiendo una transacción al azar, 2 de las 4 transacciones tienen cerveza y leche, por lo que la probabilidad es $\frac24$ .

En cuanto a su anotación, $P(\{\text{Beer, Milk}\}=P(\{Beer\}\cap\{Milk\})$ y no $P(\{Beer\}\cup\{Milk\})$ (la diferencia es la dirección a la que apunta la tapa).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X