Tengo algunos datos que me desea estimar la distribución marginal de. Yo no tengo una idea real de lo que paramétrico de la distribución sería adecuado, por lo que fue en la planificación de la colocación de una no-paramétrico (probablemente kernel) estimación de la densidad de los datos.
Sin embargo, hay dos complicaciones
1) Los datos que tiene un umbral en el $0$
2) Los datos son en su mayoría agrupados en torno a cero, es probablemente justo decir que es una mezcla de dos distribuciones, siendo casi un delta en $0$, y el otro es estrictamente positivo de distribución con una larga cola.
Sé de algunos métodos para lidiar con el 1), pero el simple métodos que he utilizado (reflexión kernels) conducir a resultados insatisfactorios cerca de cero. Realmente no sé qué hacer acerca de 2).
¿Cuál es el estado de la técnica para este tipo de problema? Tal vez un R-paquete que implementa algo que se pueda probar?
Feliz de dar un ejemplo de los datos, pero no estoy seguro de que la mejor manera de hacer esto. Déjame saber y puedo editar la pregunta.
EDIT: he probado el logspline idea - con y sin quitar los ceros (de hecho, me quitan todos los valores muy cercanos a cero, $<0.05$). Para bien de interés, el resultado sin la eliminación de los ceros es:
Y con los ceros eliminados:
Parece que con los ceros eliminado, una distribución exponencial podría encajar bastante bien.