1 votos

Suma de dos probabilidades

Supongamos que tengo dos artículos de texto (artículo 'a' => x palabras, artículo 'b' => y palabras)

i encontrar el número total de palabras en "a" = x el número total de apariciones de la palabra "el" en el artículo = x1

probabilidad de la palabra 'el' en el artículo 'a' => x1/x (he almacenado esto como decimal, así que no tengo x1 y x exactos en una etapa posterior)

ahora quiero fusionar (¿añadir?) la probabilidad de la misma palabra 'el' en el artículo 'b', que es y1/y

cómo debo hacerlo, supongo que simplemente añadiendo estará mal.

en una etapa posterior obtendré más artículos 'c', 'd'... y quiero mantener las actualizaciones de probabilidad, ¿cómo debo hacerlo?

Gracias.

3voto

Gudmundur Orn Puntos 853

Si entiendo bien lo que estás haciendo, entonces quieres como caso final (número total de ocurrencias de "el") / (número total de palabras). Así que en este caso, usted tomará

$$\dfrac{x_1 + y_1}{x + y}$$

Ahora bien, si no grabaste $x, y, x_1, y_1$ por separado, entonces supongo que tendrás que volver a contarlas. O, al menos, tendrás que saber la proporción de palabras de un artículo con respecto al número de palabras del otro.

3voto

DiGi Puntos 1925

Debe llevar la cuenta del tamaño total de los artículos que ha procesado hasta la fecha. Supongamos que $p$ es la probabilidad de que una palabra elegida al azar en los artículos procesados hasta el momento sea "el", y que esos artículos contengan en conjunto $n$ palabras. Ahora se obtiene un nuevo artículo con $k$ casos de "el" en $m$ palabras. A continuación, deberá actualizar $p$ a $\frac{pn+k}{n+m}$ y $n$ a $n+m$ para preparar el tratamiento del siguiente artículo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X