6 votos

Estado del arte: estimación no paramétrica de la densidad con un límite y datos agrupados cerca de cero

Tengo algunos datos que me desea estimar la distribución marginal de. Yo no tengo una idea real de lo que paramétrico de la distribución sería adecuado, por lo que fue en la planificación de la colocación de una no-paramétrico (probablemente kernel) estimación de la densidad de los datos.

Sin embargo, hay dos complicaciones

1) Los datos que tiene un umbral en el $0$

2) Los datos son en su mayoría agrupados en torno a cero, es probablemente justo decir que es una mezcla de dos distribuciones, siendo casi un delta en $0$, y el otro es estrictamente positivo de distribución con una larga cola.

Sé de algunos métodos para lidiar con el 1), pero el simple métodos que he utilizado (reflexión kernels) conducir a resultados insatisfactorios cerca de cero. Realmente no sé qué hacer acerca de 2).

¿Cuál es el estado de la técnica para este tipo de problema? Tal vez un R-paquete que implementa algo que se pueda probar?

Feliz de dar un ejemplo de los datos, pero no estoy seguro de que la mejor manera de hacer esto. Déjame saber y puedo editar la pregunta.

EDIT: he probado el logspline idea - con y sin quitar los ceros (de hecho, me quitan todos los valores muy cercanos a cero, $<0.05$). Para bien de interés, el resultado sin la eliminación de los ceros es:

enter image description here

Y con los ceros eliminados:

enter image description here

Parece que con los ceros eliminado, una distribución exponencial podría encajar bastante bien.

3voto

Patrick Puntos 183

Si conoce la gama de sus datos, puede utilizar la inversa de la transformación probit. En un par de de ejemplos, el ajuste se veía muy satisfactorio visualmente. Este enfoque se explica en más detalle en un claro papel[1]. Creo que hay debe ser una R de implementación, pero no lo pude encontrar (tal vez usted puede contactar con el autor).

El enfoque también puede ser adaptado para el caso donde su variable aleatoria se distribuye en $[0,+\infty)$

[1] G. Geenens, transformación Probit para la estimación de densidad de kernel en la unidad de intervalo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X