Quiero calcular un ancho de banda mejor para mi estimador de densidad de núcleo, que es un Epanechnikov. Utilizo la fórmula de Silverman que implica la desviación estándar de la muestra, el tamaño de la muestra y una constante, pero estoy consiguiendo una curva muy lisa en la mayoría de los casos y preferiría si fuera más equilibrada. Gracias por cualquier ayuda que pueda darme.
Respuestas
¿Demasiados anuncios?Para descaradamente citar el programa Stata entrada manual para kdensity
:
La anchura óptima es el ancho que se minimice la media integrado de cuadrados de error si los datos fueron Gaussiano y un núcleo Gaussiano fueron utilizados, por lo que no es óptimo en cualquier sentido global. De hecho, para multimodal y muy sesgada densidades, este ancho es generalmente demasiado amplia y oversmooths la densidad (Silverman, 1992).
Silverman, B. W. 1992. Estimación de densidad de Estadística y Análisis de Datos. London: Chapman & Hall. ISBN 9780412246203
La fórmula de Stata dar para el óptimo del ancho de banda $h$ es:
$$h = \frac{0.9m}{n^{1/5}} \quad \mbox{with } m = \min\left(\sqrt{\operatorname{Var}(X)},\frac{\operatorname{IQR}(X)}{1.349}\right),$$
donde $n$ es el número de observaciones en $X$, $\operatorname{Var}(X)$ es su variación y $\operatorname{IQR}(X)$ su rango intercuartil.
Me hicieron una pregunta similar hace un par de meses. Rob Hyndman proporciona una excelente respuesta en el que se recomienda Sheather-Jones método.
Una adición punto. En R, para la density
función, configure el ancho de banda de forma explícita a través de la bw
argumento. Sin embargo, a menudo me encuentro que el adjust
argumento es más útil. El adjust
argumento escalas el valor del ancho de banda. Por lo adjust=2
significa el doble del ancho de banda.