4 votos

La minería de texto de la máquina de registros para encontrar la correlación entre los errores en la R

Me he con que me de 50 MB de datos a partir de una máquina que consta de los registros de eventos tales como el estado del dispositivo, de advertencia y de error. Deseo realizar minería de texto en el mismo para encontrar la correlación entre los errores de decir, un error podría desencadenar otro en el futuro y tomar una prescriptivo de la acción. He utilizado la agrupación jerárquica en R para generar un dendrograma, pero el resultado no podía rendimiento esperado de conocimiento. Por lo tanto, he planificado realizar el Algoritmo Apriori en el mismo. Mis consultas son:

  1. Es la Agrupación Jerárquica sugerido para encontrar correlaciones?
  2. Es Apriori un buen algoritmo de tal situación y por qué? O, ¿hay algún otro método para solucionar este problema?

Los registros que he se parece a esto :

enter image description here

1voto

Alex Puntos 2961

Apriori es uno de los algoritmos para resolver Asociación de la regla de aprendizaje de la una.k.una. Frecuentes De Modelos De Minería De Datos.

El problema es definido con conjuntos de elementos en las transacciones. Dentro de una sola transacción, hay una serie de elementos A que veces nos dicen que con un segundo conjunto de elementos B. Primero un mínimo de apoyo es dado por el usuario y se define como la frecuencia de las A B ocurren en el mismo "transacción" sobre todas las transacciones, es decir,support=P(AB). A continuación, el usuario define un mínimo de confianza , el cual es definido confidence=P(B|A)=support(AB)support(A).

En este caso, considere la posibilidad de agrupar los eventos de los registros durante un período de tiempo en una sola transacción. Definir el soporte mínimo y el mínimo de confianza, a continuación, Apriori, encontrarán los conjuntos de eventos satisfacer los mínimos.

Esto vuelve muchos conjuntos de elementos y por lo general una segunda métrica se calcula para determinar el mejor de estos. Levante es el más común en el caso de estos, sino también considerar estos otros de la asociación de métricas

0voto

Hamed Momeni Puntos 434

Creo que usted debe ir para el Algoritmo Apriori

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X