¿Hay alguna razón en particular por la que elegirás la estimación de la densidad del núcleo en lugar de la estimación paramétrica? Estaba aprendiendo a ajustar la distribución a mis datos. Esta pregunta me llegó.
El tamaño de mis datos es relativamente grande, con 7500 puntos de datos. Reclamaciones automáticas. Mi objetivo es ajustarlo a una distribución (no paramétrica o paramétrica). Y luego usarlo para simular datos de auto-reclamaciones, y calcular el VaR o TVaR.
Utilicé el registro para transformar los datos y hacerlos relativamente normales. Ajusté muchas distribuciones incluyendo la normal, lognormal, gamma, t, etc... Utilicé AIC y logaritmo para identificar el mejor ajuste. Pero ninguno de estos ajustes pasó la prueba de KS (valor p extremadamente pequeño, con e-10).
Por eso pregunté en qué situación debería cambiar a KDE.