Problema
¿Alguien puede ayudar a explicar el concepto de inferencia tal como lo explican Bradeley Efron y Trevor Hastie en su libro "Computer Age Statistical Inference"? En el Capítulo 2, comenzando en la página 13, introducen la estimación de las propiedades $\theta$ de una distribución desconocida $F$. Tienen una explicación que me deja confundido. Ellos escriben:
La estimación de $\hat{\theta}$ se calcula a partir de $\bf x$ según algún algoritmo desconocido, digamos, $\hat{\theta}=t(\bf x)$ donde $t(x)$ en nuestro ejemplo es la función promedio $\bar x = \sum\frac{x_i}{n}$. $\hat{\theta}$ es la realización de $\hat{\Theta} = t(\bf X)$. La salida de $t(\cdot)$ aplicado a una muestra teórica $\bf X$ de $F$.
Más adelante dicen que todo el punto del párrafo que acabo de compartir era dar la definición de inferencia. Es decir, la precisión del estimador observado $\hat{\theta} = t(\bf x)$ es la precisión probabilística de $\hat{\Theta} = t(\bf X)$ como un estimador de $\theta.
Como ejemplos, ellos proporcionan lo siguiente:
- $\mu = E_F\{\hat{\Theta}\}$ como la esperanza
- sesgo como $bias = \mu - \theta$
- varianza como $var = E_F\{(\hat{\Theta} - \mu)^2\}$.
¿Eh? ¿Qué están tratando de comunicar aquí? Déjame volver a lo básico. Entiendo que $\bf x$ es datos observados de manera que $\bf x $ $= (x_1, x_2, .., x_n) $. Entiendo que definen $\bf X$ $=(X_1, X_2, ..., X_n)$ indican $n$ extracciones independientes de una distribución de probabilidad $F$. Sin embargo, estoy completamente confundido sobre qué están haciendo $\hat{\Theta}$ y $\bf X$ aquí para ayudar a nuestra definición de inferencia. ¿Inferencia de qué?
Preguntas
Tengo las siguientes preguntas a partir de la lectura anterior:
- ¿Es posible explicar esta definición usando un ejemplo/distribución de la vida real, como la distribución normal?
- ¿Cuál es la diferencia conceptual entre $\hat{\theta}$ and $\hat{\Theta}$?
- ¿Qué significa $t(\cdot)$?
Creo que lo anterior captura mi confusión con la definición dada anteriormente. Estoy estudiando por mi cuenta y creo que este resumen general dado por los autores es hermoso, pero una explicación más aplicada que abstracta me iría bien aquí. Por lo tanto, las preguntas anteriores son críticas y espero que una persona amable y bien versada en estadística pueda explicarme esto.