2 votos

Si las estimaciones de estimación cuantílica paramétrica $p$ calculando la MLE, entonces cómo obtener la no paramétrica $p$ ?

Para la estimación cuantílica no paramétrica o paramétrica.

Si las estimaciones de estimación cuantílica paramétrica $p$ calculando la MLE, entonces cómo obtener la no paramétrica $p$ ?

Relacionado:

https://mathoverflow.net/questions/48223/parametric-vs-non-parametric-estimation-of-quantiles

Pero no entiendo cómo hacer una estimación cuantílica no paramétrica, ni cómo es $p$ estimado en ese caso. ¿Hay que seguir utilizando la FCD inversa?

1voto

BruceET Puntos 7117

Suponga que tiene una muestra de tamaño $n = 1000$ de una distribución normal desconocida. Queremos estimar el percentil 65 de la distribución desconocida. Yo sólo casualmente tengo uno en mi ordenador ahora, en un vector $\mathbf{x}.$

Como usted dice, hay dos enfoques posibles. Uno es tomar el percentil 65 de la muestra. El resultado es 105,45, que obtengo utilizando el software estadístico R.

quantile(x, .65)
##      65% 
## 105.4531 

El segundo enfoque consiste en estimar la media $\mu$ y la desviación estándar $\sigma$ de la población normal, utilizando la media y la desviación estándar de la muestra desviación estándar de la muestra. Obtengo $\hat \mu = \bar X = 100.40$ y $\hat \sigma = S = 14.74.$

mean(x);  sd(x)
## 100.4008
## 14.74482

Pero el percentil 65 de $\mathsf{Norm}(100.50, 14.745)$ es de 105,98.

qnorm(.65, 100.40, 14.475)
## 105.9775

La pregunta que se plantea ahora es: ¿cuál se acerca más a la respuesta correcta? La primera estimación (no paramétrica) 105,45 o la segunda estimación (paramétrica) 105,98. En una situación de la vida real nunca lo sabríamos con seguridad, pero podríamos esperar la estimación paramétrica basada en las MLEs $\hat \mu$ y $\hat \sigma$ sería mejor.

Pero en este caso, nosotros puede lo sé con seguridad porque he simulado mi muestra de 1000 de $\mathsf{Norm}(100, 15),$ que tiene un percentil 65 de 105,78. Así que la estimación paramétrica está un poco más cerca.

 qnorm(.65, 100, 15)
 ## 105.7798

Los datos fueron simulados por el siguiente código R. Como establecí una semilla, usted puede replicar el experimento con precisión en R.

set.seed(2017); x = round(rnorm(1000, 100, 15), 3)

Adenda por pregunta en el comentario: Aquí hay una breve demostración de quantile en el contexto actual.

quantile(x, .65)
##      65% 
## 105.4531 
sx = sort(x);  sx[650];  sx[651]
## 105.423
## 105.509

Nota: La superioridad del estimador paramétrico en el ejemplo anterior no es un resultado accidental de una sola vez. En una simulación de 100.000 muestras de tamaño $n=200,$ la media de los estimadores paramétricos fue de 105,77 con un error cuadrático medio de 1,22; la media de los estimadores no paramétricos fue de 105,74 con un error cuadrático medio de 1,85.

0voto

SecStone Puntos 13

Sólo miran los cuantiles de la muestra. Si piensas en las "observaciones" en lugar de ser una colección de valores, piensa en ellas como una aproximación discreta a la verdadera distribución. Es decir, si tienes un conjunto de observaciones $\{x_n\}_{n=1}^N$ se puede construir la fdc empírica como una mezcla de masas puntuales centradas en estos lugares:

$$\hat{P}[X] = \sum_{n=1}^N \frac 1 N \delta_{x_n}$$

Para los pequeños $N$ esto no es muy efectivo, y por eso es útil incorporar algunas suposiciones paramétricas (como hacen en ese enlace), pero si tienes toneladas de datos $\hat{P}$ puede caracterizar la verdadera distribución muy bien; es análogo a los bayesianos que utilizan Monte Carlo para caracterizar su posterior en lugar de obtener explícitamente una expresión para ella.

Resulta que la FCD empírica tiene un montón de propiedades útiles, como, por ejemplo, consistencia en los momentos, consistencia en los cuantiles, etc. Si quieres obtener una aproximación a $P[a \leq X \leq b]$ entonces $\hat{P}[a \leq X \leq b]$ es una estimación muy buena con muestras de gran tamaño.

Para estimar específicamente los cuantiles, sólo tienes que buscar puntos en tu soporte en los que la proporción de observaciones en un lado o en otro coincida con tu objetivo. Por ejemplo, digamos que tienes 1000 observaciones y quieres estimar el cuantil de 0,25. Entonces encontraría el primer punto en su soporte tal que el 25% de los valores muestreados están por debajo de ese punto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X