5 votos

¿Puede alguien explicar el concepto de estadísticas auxiliares en términos sencillos?

Me cuesta mucho intentar relacionarlo o entenderlo de la forma más sencilla (sin resolver).

"Sin resolver" en el sentido de que no tengo que resolver la distribución marginal de T2, si por ejemplo hay T1 y T2, y ver que es independiente del parámetro. Sólo estoy tratando de encontrar una manera de explicarlo a otras personas en términos de laicos sin utilizar términos estadísticos técnicos

1 votos

¿Puede aclarar lo que quiere decir con "(sin resolver)"? Además, ¿puede incluir referencias de dónde está tratando de aprender las estadísticas auxiliares?

0 votos

"Sin resolver" en el sentido de que no tengo que resolver la distribución marginal de T2, si por ejemplo hay T1 y T2, y ver que es independiente del parámetro. Hasta ahora, he estado usando los apuntes de mi clase, que sólo incluye la definición habitual que se puede encontrar en internet de que T=(T1,T2) es suficiente para un parámetro, donde T1 es condicionalmente suficiente y T2 es auxiliar. También he leído la sección de Casella sobre la ancilaridad. Sólo estoy tratando de encontrar una manera de explicarlo a otras personas en términos de laicos sin utilizar términos estadísticos técnicos.

5voto

jennyfofenny Puntos 1951

La forma en que pienso en las estadísticas auxiliares es: un conjunto de datos tiene numerosas fuentes de aleatoriedad. Un estadístico suficiente lleva toda la información que puedo extraer en los datos sobre esta aleatoriedad. Una estadística suficiente mínima es la estadística suficiente "más pequeña". Digamos ahora que ésta tiene la forma $S = (T,C)$ .

Ahora resulta que sólo me interesan algunos aspectos de la aleatoriedad ( $T$ ) en los datos, y prefiero condicionar las partes no interesantes (tratar $C$ como realmente se fijó a $c$ ). Esto tiene sentido cuando $C$ depende sólo de parámetros que no me interesan, y es especialmente útil cuando $T|C$ tiene una distribución simple.

Por ejemplo, realizo una regresión lineal. Me interesa saber cómo afecta alguna covariable al resultado, y asumo que $Y_i \sim N(\alpha + \beta x_i, \sigma^2)$ para $1 \leq i \leq m$ . Lo que me importa es $\alpha, \beta$ y $\sigma^2$ . Pero también hay otras fuentes de aleatoriedad: $x$ es probablemente la realización de una variable aleatoria $X$ (sin interés). El tamaño de la muestra es probablemente también aleatorio (si no está fijado de antemano), y $m$ es una realización de una variable aleatoria $M$ (sin interés). Cuando realizo mi regresión lineal, condiciono estos aspectos de los datos. Una de las razones es que no me interesa realmente $X$ y $M$ per se. La segunda razón es que sería muy complicado escribir una probabilidad para todas las fuentes de azar $(Y_i, X_i, M)$ , $1\leq i\leq M$ al mismo tiempo.

Si hay una estadística mínima suficiente $S=(T, C)$ y $C$ describe exclusivamente $X$ y $M$ entonces preferiría condicionar en $C=c$ que es lo mismo que tratar $X_i = x_i$ y $M = m$ como fijo.

1 votos

(+1) Relato muy claro. Error tipográfico en la última frase: "Ife es un mínimo". Tal vez se deba añadir alguna discusión sobre las consecuencias de condicionar a $C$ para la relevancia de las propiedades hipotéticas a largo plazo de los estimadores &c.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X