Definición
Supongamos que $X \sim D(\mu, \sigma)$ , donde $D$ es una distribución 1D (que se genera a partir de $\mathbb{R}$ ) con media $\mu$ y stddev $\sigma$ . Si tomo una muestra $X$ (la variable aleatoria) $M\times N$ veces, recibiendo una matriz $A$ (con $M$ filas y $N$ columnas), y luego generar
-
un vector $V_\mu$ de $A$ reduciendo cada fila de $A$ a un solo valor calculando el media de esa fila, y
-
un vector $V_\sigma$ de $A$ reduciendo cada fila de $A$ a un solo valor calculando el desviación estándar sesgada de esa fila del media --> número único de $V_\sigma = \sqrt{\frac{1}{N}\sum_{i=0}^{N}(x_i - \overline{x})^2}$ ,
¿Cómo puedo estimar correctamente el $\mu$ y $\sigma$ de $V_\mu$ y $V_\sigma$ ? Está claro que la estimación de $\mu$ es sólo el media de $V_\mu$ Pero, ¿cómo puedo manejar el $\sigma$ ?
Sigma
He intentado experimentar, decidiendo que, para empezar, vamos a suponer que $D = \mathcal{N}$ y $X \sim \mathcal{N}(\mu=3, \sigma=5)$ . He generado $A$ , calculado imparcialidad $\sigma(A)$ y luego se redujo $A$ a $V_\sigma$ , a partir de la cual he calculado el media . Este es el resultado:
Obviamente, el resultado está sesgado, la estimación es inferior a la verdadera $\sigma$ la mayoría de las veces. Si en lugar de ello multiplico cada miembro de $V_\sigma$ por $\frac{N}{N-1}$ antes de calcular la media de $V_\sigma$ me sale:
que sobrepasa el verdadero $\sigma$ más a menudo que no, así que estoy realmente perdido aquí. También he probado a multiplicar $V_\sigma$ por $\frac{MN}{MN-1}$ en su lugar, pero esto da como resultado
que es ligeramente mejor que el original, pero sigue siendo muy tendencioso.
EDITAR : Gracias a Ryan por señalarme mi error, claro, se me olvidó hacer la raíz cuadrada del factor de corrección. Aún así, no tenía ni idea de que el $c_4$ También hay que tener en cuenta el factor de la seguridad. Multiplicando la media de $V_\sigma$ por $\sqrt{\frac{N}{N-1}}$ y también por $1/c_4(M)$ que he obtenido:
que es insesgada, pero con una distribución más uniforme (con una desviación estándar mayor).
Mu
La estimación media es buena, como se esperaba:
Pregunta
Después de todo lo que he mostrado, lo que me pregunto es lo siguiente:
-
Dado $D = \mathcal{N}$ ¿Qué son estas distribuciones que observo? Parecen normales, pero ¿no lo son? EDITAR Ahora sé que la distribución para media estimación, si restamos el verdadero $\mu$ es un $t$ distribución con $N-1$ grados de libertad.
-
RESUELTO POR COMPLETO Dado $D = \mathcal{N}$ ¿Cómo puedo corregir el $\sigma$ estimación de $V_\sigma$ ? EDITAR : contestado por Ryan, ver Sigma sección.
-
Dado $D = \mathcal{N}$ Después de corregir el $\sigma$ estimación, ¿está bien afirmar que $D$ es probablemente $\mathcal{N}(\mu, \sigma)$ ? Ciertamente, cuanto más grande $M$ y $N$ conseguir, más seguro puedo estar al afirmar tal hecho, ¿verdad? ¿Cuál es el procedimiento estadístico adecuado que debo ejecutar después de obtener mi estimación de $\mu$ y $\sigma$ ? Por ejemplo, según mi experimento, puedo ver que el $\mu$ estimación cae en $[2, 4]$ aproximadamente el 95% de las veces. EDITAR : Ahora sé que si genero el intervalo como $\overline{x} \pm 1.96 \cdot \sigma \cdot \sqrt{N}$ el intervalo contendrá $\mu$ El 95% de las veces. Pero ¿qué pasa con $\sigma$ ? Y cuando finalmente me decida por algunas estimaciones de intervalo de $\mu$ y $\sigma$ ¿Puede algo sobre $P(X > c), X \sim \mathcal{N}(...)$ ¿se dice?
-
¿Puede resolverse este problema para el $D$ es decir, obtener $V_\mu$ y $V_\sigma$ de un grupo de muestras ( $M\times N$ para ser específicos) y concluir algo sobre la verdadera $\mu$ y $\sigma$ ?