4 votos

Extraña aparición de la estimación de densidad tipo Cauchy

Tengo algunos hallazgos preliminares que son un poco extraños.

Tengo un par de conjuntos de datos relacionados que son pequeños (~150) muestras de números enteros positivos y que parecen bastante extraños. Como son pequeños, no me tomo en serio sus histogramas, así que he realizado Estimación de la densidad del núcleo gaussiano en ambos. (Aunque no he sido tan cuidadoso con la selección del ancho de banda, al menos lo he tenido en cuenta y dudo que sea un problema importante en el contexto actual, pero podría estar equivocado).

Lo extraño es esto: en ambos casos, obtengo un ajuste notablemente bueno a una distribución de Cauchy (lo he hecho a mano, sin cosas de MLE en este caso*, pero he corroborado los ajustes mirando gráficos normales y log-log) que está centrado en un número positivo (es decir, el KDE básicamente se parece a este ). Pero como he dicho, las muestras son (y deben ser) enteras positivas, por lo que el soporte de la distribución es el mismo. Por otro lado, la distribución de Cauchy se ajusta muy bien a la región positiva.

Lo único que puedo imaginar que produzca algo así, además de un error por mi parte, es que estas muestras puedan admitir algún tipo de interpretación de sumas de IIDRVs y eso lleve a la aparente cauchicidad debida a el CLT generalizado .

¿Qué puede causar esto? Las explicaciones de los errores son especialmente bienvenidas. Sin embargo, tenga en cuenta mis dudas sobre el ancho de banda del kernel sea un problema.

*Sin embargo, he probado los ajustes MLE a algunas otras distribuciones comunes (por ejemplo, gamma) y estos son terribles, especialmente en comparación.

2voto

Did Puntos 1

Una forma sencilla de producir distribuciones de cola pesada es considerar distribuciones (de cola fina) con un parámetro aleatorio. Supongamos, por ejemplo, que $N$ tiene un distribución geométrica con el parámetro $A$ y que $A$ tiene un Distribución Beta Es decir, $$ \mathrm P(A\in dx)=\frac1{\mathrm B(a,b)}x^{a-1}(1-x)^{b-1}\cdot[0\leqslant x\leqslant 1]\cdot\mathrm dx, $$ y, para cada entero no negativo $n$ , $$ \mathrm P(N\geqslant n\mid A)=A^n. $$ Entonces, $$ \mathrm P(N\geqslant n)=\frac1{\mathrm B(a,b)}\int\limits_0^1x^{n+a-1}(1-x)^{b-1}\mathrm dx=\frac{\mathrm B(a+n,b)}{\mathrm B(a,b)}=\frac{\Gamma(a+b)\Gamma(a+n)}{\Gamma(a)\Gamma(a+b+n)}, $$ por lo que $\mathrm P(N\geqslant n)$ equivale a un múltiplo de $n^{-b}$ cuando $n\to\infty$ .

Para obtener una cola equivalente a $n^{-1}$ como en un (discreto) Distribución de Cauchy , elija $b=1$ Es decir, $$ \mathrm P(A\in dx)=ax^{a-1}\cdot[0\leqslant x\leqslant 1]\cdot\mathrm dx, $$ En otras palabras, suponga que $A=U^{1/a}$ donde $U$ se distribuye uniformemente en $(0,1)$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X