Yo siempre uso de la media geométrica para calcular una lognormal mediana. Sin embargo, en el mundial de la industria, a veces usando el ejemplo de la mediana da mejores resultados. La pregunta entonces es, hay un intervalo de corte/punto de partida desde el que la muestra de la mediana puede ser utilizado de forma segura como un estimador de la mediana de la población?
Asimismo, la muestra de la media geométrica es el MLE para la mediana, pero no imparcial. Un estimador imparcial sería $\hat{\beta}_{\mbox{CGM0}}=\exp(\hat{\mu}-\sigma^2/2N)$ si $\sigma$ es conocido. En la práctica, una visión sesgada corregido estimador $\hat{\beta}_{\mbox{CGM}}$ (ver abajo) es utilizado desde la $\sigma$ es siempre desconocido. Hay documentos que decir que esta corrección de sesgo geomean estimador es mejor porque de menor MSE y unbiasedness. Sin embargo, en la realidad, cuando sólo tenemos un tamaño de muestra de 4 a 6, puedo argumentar que la corrección del sesgo de no tiene sentido ya
- Unbiasedness significa que el estimador se centra en el verdadero parámetro de población, ni bajo ni sobre-estimar el parámetro. Para la distribución sesgada positivamente, el centro es la mediana no la media.
- Invariantes de la transformación es propiedad importante en mi área actual(transformación entre DT50 y la tasa de degradación k, k=log(2)/DT50). Obtendrá diferentes resultados en función de los datos originales y los datos transformados.
- Para el tamaño limitado de la muestra, la media de unbiasedness es potencialmente engañoso. El sesgo no es error, un estimador imparcial puede dar mayor error. A partir de un Bayesiano punto de vista, los datos conocidos y fijos, el MLE maximiza la probabilidad de observar los datos, mientras que el sesgo de corrección se basa en unos parámetros fijos.
La muestra de la media geométrica estimador es MLE, la mediana de la imparcial, invariantes a transformaciones. Creo que debe ser preferida a la corrección de sesgo geomean estimador. Estoy en lo cierto?
Assumming $X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2)$
$\beta = \exp(\mu)$
$\hat{\beta}_{\mbox{GM}}= \exp(\hat{\mu})= \exp{(\sum\frac{\log(X_i)}{N})} \sim \mbox{LN}(\mu,\sigma^2/N)$
$\hat{\beta}_{\mbox{SM}}= \mbox{median}(X_1,X_2,...,X_N) $
$\hat{\beta}_{\mbox{CGM}}= \exp(\hat{\mu}-\hat\sigma^2/2N)$
donde, $\mu$ $\sigma$ son el registro y registro-sd, $\hat\mu$ $\hat\sigma$ son de la Emv para$\mu$$\sigma$.
Una pregunta relacionada: para la varianza de la muestra la mediana, no es una fórmula aproximada $\frac{1}{4Nf(m)^2}$; lo que es bastante grande el tamaño de la muestra el uso de esta fórmula?