Tengo los datos de que se cree que es de Rayleigh distribuido (de acuerdo con algunos trabajos académicos). Sin embargo, al graficar el histograma de probabilidad normalizada de abajo) se ve como una distribución de Rayleigh con un desplazamiento. Hay una forma de "normalizar" una variable aleatoria, de modo que puede caber un Rayleigh parámetro? Estoy pensando en cuando nos tomamos Normal de la RV y restar la media y dividir por la varianza para hacerla estándar (cero significa que, la unidad de la varianza). Si eso no suena como una cosa correcta a hacer, es que hay una distribución similar a la que tiene un parámetro de este tipo de cambio?
Respuesta
¿Demasiados anuncios?Una cosa importante a tener en cuenta es que los datos no parecen ser coherentes con haber sido extraída de una de Rayleigh de la población -- la cola derecha es considerablemente demasiado pesado.
Sin embargo, voy a seguir como si el pasado-Rayleigh fueron un modelo adecuado.
Si el desplazamiento es desconocido, se puede estimar como un parámetro.
La densidad para un parámetro de Rayleigh es:
$\qquad f(x;\sigma )={\frac {x}{\sigma ^{2}}}e^{-x^{2}/(2\sigma ^{2})},\quad x\geq 0,$
Si se introduce un cambio de $\mu$ se convierte en:
$\qquad f(x;\mu,\sigma )={\frac {x-\mu}{\sigma ^{2}}}e^{-(x-\mu)^{2}/(2\sigma ^{2})},\quad x\geq \mu .$
[NOTA: Aquí $\mu$ es el límite inferior de la variable aleatoria, no la media.]
Dey et al, 2014 [1] discutir la estimación en dos parámetros de Rayleigh caso. (Sin embargo, usted debe tomar nota de que en la parametrización de ahí, el segundo parámetro, $\lambda$, no es la escala - aunque ellos dicen que es - en realidad, $\sigma$ (o algo proporcional a ella) es un parámetro de escala, donde $\lambda=(2\sigma^2)^{-1}$.)
Ellos proporcionan un simple iterativo estimador para la MLE del cambio de parámetro, $\mu$: $\require{enclose}$ $${\mu}^{[j+1]}=\enclose{horizontalstrike}{2\sum_{i=1}^n(x_i-\mu^{[j]})^2\times \sum_{i=1}^n(x_i-\mu^{[j]})\times \sum_{i=1}^n(x_i-\mu^{[j]})^{-1}}$$
[Edit: parece Que esta fórmula (que se encuentra tanto en el trabajo y versiones publicadas!) no puede ser correcta, ya que es en el cuadrado de las unidades de$x$. Claramente un cambio de ubicación/parámetro tiene que ser en unidades de$x$.
Por el momento (hasta que yo a ver si me pueden derivar correctamente a mí), probablemente la mejor cosa a hacer es optimizar el perfil de registro de la probabilidad de $\mu$ en la ecuación 7 uso de un univariante optimizer:
$\qquad g(\mu) = \sum_{i=1}^n\ln\left[\frac{(x_i-\mu)}{\sum_{i=1}^n(x_i-\mu)^2}\right]$
- una comprobación rápida de la álgebra parece sugerir que esta fórmula es correcta hasta una constante aditiva. Ejecución de una docena de ejemplos al azar generados Rayleigh de datos - tanto en los pequeños (n=10) y moderadamente muestras grandes (n=1000) - sugiere que simplemente optimizar el perfil de registro de probabilidad directamente parece que funciona bastante bien. He utilizado el Brent del método, pero cualquier número razonable de la optimización de los métodos de trabajo de manera adecuada.]
A continuación, $\hat{\mu}$ es el valor de ${\mu}$ en la última iteración obtenida en la convergencia, ${\mu}^{[T]}$, dicen.
Estas iteraciones se podría iniciar (${\mu}^{[0]}$) en el método de los momentos estimador de $\mu, \tilde{\mu}=\bar{x}-k s$ donde $\bar{x}$ $s$ es la media muestral y la desviación estándar, respectivamente, y $k = \frac{\Gamma(\frac32)}{\sqrt{1-\Gamma(\frac32)^2}}=\sqrt{\frac{\pi}{4-\pi}}\approx 1.913$, o en algunos adecuadamente pequeña distancia por debajo de la menor observación (por ejemplo, ${\mu}^{[0]}=x_{(1)}-\frac{c}{\sqrt{n}}$ $c$ cerca de $0.3$ debería funcionar razonablemente bien como un punto de inicio). Tenga en cuenta que el método de los momentos estimador puede a veces superar los más pequeños de la observación (y deben ser evitadas/modificado en ese caso).
Si los datos son luego cambió por $\hat{\mu}$, $x^{(0)}_i=x_i-\hat{\mu}$, el parámetro de escala puede ser estimada a partir de la vuelta desplazado a la datos de la manera habitual para una distribución de Rayleigh. Los errores estándar y los intervalos de confianza de seguir en la misma forma.
Curiosamente, (pero no del todo sorprendente para un cambio de parámetros de una variable aleatoria delimitada por debajo de ella), el cambio de parámetro no tiene la "costumbre" asymptotics para la Emv, en que la varianza no es proporcional a $\frac{1}{n}$.
(El papel da asintótico de los intervalos de confianza para los parámetros - pero, de nuevo, tenga en cuenta que no hacen uso de la misma parametrización para el parámetro principal. El mismo trabajo se analizan otros estimadores, pero desde la Emv son bastante simples, me gustaría sugerir que se pegue con ellos)
[1]: Dey, S., T. Dey, y D. Kundu (2014),
Dos Parámetros de Distribución de Rayleigh: Diferentes Métodos de Estimación,
Revista americana de Matemáticas y Ciencias de la Administración, Vol. 33, Nş 1, p55-74
(documento de trabajo de aquí)