32 votos

La estimación de los parámetros de la distribución t de Student

¿Cuáles son la máxima probabilidad de los estimadores para los parámetros de la distribución t de Student? ¿Existen en la forma cerrada? Una rápida búsqueda en Google no me da ningún resultado.

Hoy en día estoy interesado en el caso univariante, pero probablemente voy a tener que ampliar el modelo para múltiples dimensiones.

EDIT: de hecho, estoy principalmente interesado en la ubicación y la escala de los parámetros. Por ahora puedo asumir que los grados de libertad parámetro es fijo, y posiblemente el uso de algunos esquema numérico para encontrar el valor óptimo más tarde.

30voto

patfla Puntos 1

La forma cerrada no existe para T, pero de una manera muy intuitiva y estable enfoque es mediante el algoritmo EM. Ahora, porque el estudiante es una escala de la mezcla de las normales, usted puede escribir su modelo como

$$y_i=\mu+e_i$$

donde$e_i|\sigma,w_i \sim N(0,\sigma^2w_i^{-1})$$w_i\sim Ga(\frac{\nu}{2}, \frac{\nu}{2})$. Esto significa que condicionalmente en $w_i$ el mle son simplemente el promedio ponderado de la media y la desviación estándar. Esta es la "M"paso

$$\hat{\mu}=\frac{\sum_iw_iy_i}{ \sum_iw_i}$$ $$\hat{\sigma}^2= \frac{\sum_iw_i(y_i-\hat{\mu})^2}{n}$$

Ahora, la "E" paso reemplaza $w_i$ con sus expectativas dado todos los datos. Esta es dada como:

$$\hat{w}_i=\frac{(\nu+1) \sigma^2 }{\nu \sigma^2 +(y_i-\mu)^2}$$

así que simplemente repetir los dos pasos anteriores, la sustitución de la "mano derecha" de cada ecuación con las actuales estimaciones de los parámetros.

Esta muy fácilmente muestra la robustez de las propiedades de la distribución t como observaciones con grandes residuos recibir menos peso en el cálculo de la ubicación de $\mu$, y la limitada influencia en el cálculo de $\sigma^2$. Por "limitado influencia" me refiero a que la contribución a la estimación de $\sigma^2$ a partir de la i-ésima observación no puede superar un determinado umbral (esto es $(\nu+1)\sigma^2_{old}$ en el algoritmo EM). También se $\nu$ es una "solidez"de los parámetros en que el aumento (disminución) $\nu$ se traducirá en más (menos) uniforme de pesos y, por tanto, más (menos) sensibilidad a los valores atípicos.

Una cosa a tener en cuenta es que el registro de la probabilidad de la función puede tener más de un punto fijo, por lo que el algoritmo EM pueden converger a un modo local en lugar de un modo global. El local modos es probable que se encuentren cuando el parámetro de localización se inicia demasiado cerca de un valor atípico. Así que a partir de la mediana es una buena manera de evitar esto.

7voto

mitchshih Puntos 1

El siguiente trabajo aborda exactamente el problema que has publicado.

Liu C. y Rubin D. B. 1995. "Estimación ML de la t de distribución con EM y sus extensiones, ECM y ECME." Statistica Sinica 5:19-39.

Proporciona un general multivariante distribución t de la estimación de parámetros, con o sin el conocimiento del grado de libertad. El procedimiento se puede encontrar en la Sección 4, y es muy similar a la probabilityislogic para 1-dimensión.

4voto

Lucozade Puntos 299

Yo la duda que existe en la forma cerrada: si escribe uno de los factores de riesgo como $$\frac{\Gamma(\frac{\nu+1}{2})} {\sqrt{\nu\pi}\,\Gamma(\frac{\nu}{2})} \left(1+\frac{t^2}{\nu} \right)^{-\frac{\nu+1}{2}} = \frac{\Gamma(\frac{\nu+1}{2})} {\sqrt{\nu\pi}\,\Gamma(\frac{\nu}{2})} \exp \left \{ \left [ \ln \left(1+\frac{t^2}{\nu} \right) \right ] \left [ {-\frac{\nu+1}{2}} \right ]\right \}$$ and take the ln of that, you will get a nonlinear equation in $\nu$. Even if you manage to get a solution, then depending on the number of factors (terms) $n$, the MLE equation is going to depend on this $n$ in a nontrivial way. All that dramatically simplifies, of course, when $\nu \rightarrow \infty$, cuando la energía se acerca a una exponencial (Gaussiano PDF).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X