La forma en que pienso en las estadísticas auxiliares es: un conjunto de datos tiene numerosas fuentes de aleatoriedad. Un estadístico suficiente lleva toda la información que puedo extraer en los datos sobre esta aleatoriedad. Una estadística suficiente mínima es la estadística suficiente "más pequeña". Digamos ahora que ésta tiene la forma $S = (T,C)$ .
Ahora resulta que sólo me interesan algunos aspectos de la aleatoriedad ( $T$ ) en los datos, y prefiero condicionar las partes no interesantes (tratar $C$ como realmente se fijó a $c$ ). Esto tiene sentido cuando $C$ depende sólo de parámetros que no me interesan, y es especialmente útil cuando $T|C$ tiene una distribución simple.
Por ejemplo, realizo una regresión lineal. Me interesa saber cómo afecta alguna covariable al resultado, y asumo que $Y_i \sim N(\alpha + \beta x_i, \sigma^2)$ para $1 \leq i \leq m$ . Lo que me importa es $\alpha, \beta$ y $\sigma^2$ . Pero también hay otras fuentes de aleatoriedad: $x$ es probablemente la realización de una variable aleatoria $X$ (sin interés). El tamaño de la muestra es probablemente también aleatorio (si no está fijado de antemano), y $m$ es una realización de una variable aleatoria $M$ (sin interés). Cuando realizo mi regresión lineal, condiciono estos aspectos de los datos. Una de las razones es que no me interesa realmente $X$ y $M$ per se. La segunda razón es que sería muy complicado escribir una probabilidad para todas las fuentes de azar $(Y_i, X_i, M)$ , $1\leq i\leq M$ al mismo tiempo.
Si hay una estadística mínima suficiente $S=(T, C)$ y $C$ describe exclusivamente $X$ y $M$ entonces preferiría condicionar en $C=c$ que es lo mismo que tratar $X_i = x_i$ y $M = m$ como fijo.
1 votos
¿Puede aclarar lo que quiere decir con "(sin resolver)"? Además, ¿puede incluir referencias de dónde está tratando de aprender las estadísticas auxiliares?
0 votos
"Sin resolver" en el sentido de que no tengo que resolver la distribución marginal de T2, si por ejemplo hay T1 y T2, y ver que es independiente del parámetro. Hasta ahora, he estado usando los apuntes de mi clase, que sólo incluye la definición habitual que se puede encontrar en internet de que T=(T1,T2) es suficiente para un parámetro, donde T1 es condicionalmente suficiente y T2 es auxiliar. También he leído la sección de Casella sobre la ancilaridad. Sólo estoy tratando de encontrar una manera de explicarlo a otras personas en términos de laicos sin utilizar términos estadísticos técnicos.