Dispongo de una base de datos de 78706 incidentes de residentes en centros de atención a la tercera edad (5 años de datos). Quiero aprender e implementar una herramienta que permita analizar estos datos utilizando los siguientes atributos:
- Residente
- Fecha/hora
- Ubicación
- Resultado
- Lesión
Quiero poder obtener de mi sistema las siguientes hipótesis, que se transmitirán a los especialistas para que investiguen, tomen decisiones y actúen:
Ejemplos de resultados:
- La mayoría de los incidentes en el centro A con los residentes X, Y y Z
- Las caídas se producen en el ala norte entre las 2 y las 5 de la madrugada
- Los desgarros de la piel se producen durante la ducha en la instalación B
- La mayoría de los incidentes en un centro C están relacionados con la reubicación
Mi pregunta es no qué paquete de software puede ayudarme pero qué tipo de análisis estadístico resuelve este problema: regresión, cluster, etc.
¿Puede recomendar algún libros prácticos ¿también para un arranque?