Me he con que me de 50 MB de datos a partir de una máquina que consta de los registros de eventos tales como el estado del dispositivo, de advertencia y de error. Deseo realizar minería de texto en el mismo para encontrar la correlación entre los errores de decir, un error podría desencadenar otro en el futuro y tomar una prescriptivo de la acción. He utilizado la agrupación jerárquica en R para generar un dendrograma, pero el resultado no podía rendimiento esperado de conocimiento. Por lo tanto, he planificado realizar el Algoritmo Apriori en el mismo. Mis consultas son:
- Es la Agrupación Jerárquica sugerido para encontrar correlaciones?
- Es Apriori un buen algoritmo de tal situación y por qué? O, ¿hay algún otro método para solucionar este problema?
Los registros que he se parece a esto :