15 votos

¿Ejemplos de una estadística que no es independiente de la distribución de la muestra?

Esta es la definición de la estadística en la wikipedia

Más formalmente, la teoría estadística define la estadística como una función de una muestra donde la función es independiente de la muestra de la distribución; es decir, la función puede ser declarada antes de la realización de los datos. El término estadística se utiliza tanto para la función y el valor de la función en una muestra dada.

Creo entender que la mayoría de esta definición, sin embargo, la parte donde la función es independiente de la muestra de la distribución no he sido capaz de resolver.

Mi comprensión de la estadística hasta el momento

Una muestra es un conjunto de realizaciones de un cierto número de independientes, idénticamente distribuidas (iid) de variables aleatorias con distribución F (10 realizaciones de un rollo de 20 caras de la feria de dados, 100 realizaciones de 5 rollos de 6 caras de la feria de los dados al azar en el sorteo de 100 personas de una población).

Una función, cuyo dominio es ese conjunto, y cuyo rango es el de los números reales (o tal vez puede producir otras cosas, como un vector u otro objeto matemático...) sería considerada una estadística.

Cuando pienso en ejemplos, la media, la mediana, la varianza de todos los sentido en este contexto. Ellos son una función en el conjunto de realizaciones (mediciones de la presión arterial a partir de una muestra aleatoria). También puedo ver cómo un modelo de regresión lineal podría ser considerado un dato de $y_{i} = \alpha + \beta \cdot x_{i}$ - esto no es sólo una función de un conjunto de realizaciones?

Donde estoy confundido

Suponiendo que mi comprensión de arriba es correcto, no he sido capaz de entender cuando una función puede no ser independiente de la muestra de la distribución. He estado tratando de pensar en un ejemplo para hacer sentido de ella, pero no hubo suerte. Cualquier visión sería muy apreciada!

47voto

Aaron Puntos 36

Esa definición es un poco torpe forma de estado. Una "estadística" es cualquier función de los valores observables. Todo lo que la definición significa es que un estadístico es una función sólo de los valores observables, no una función de la distribución o de cualquiera de sus parámetros. Por ejemplo, si $X_1, X_2, ..., X_n \sim \text{N}(\mu, 1)$ , a continuación, una estadística podría ser cualquier función de $T(X_1,...,X_n)$ mientras que una función $H(X_1,....,X_n, \mu)$ no sería una estadística, ya que depende de $\mu$. Aquí están algunos ejemplos:

$$\begin{equation} \begin{aligned} \text{Statistic} & & & & & \bar{X}_n = \frac{1}{n} \sum_{i=1}^n X_i, \\[12pt] \text{Statistic} & & & & & S_n^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X}_n)^2, \\[12pt] \text{Not a statistic} & & & & & D_n = \bar{X}_n - \mu, \\[12pt] \text{Not a statistic} & & & & & p_i = \text{N}(x_i | \mu, 1), \\[12pt] \text{Not a statistic} & & & & & Q = 10 \mu. \\[12pt] \end{aligned} \end{equation}$$

Cada dato es una función sólo de los valores observables, y no de su distribución o de sus parámetros. Así que no hay ejemplos de una estadística que es una función de la distribución o de sus parámetros (en cualquier tipo de función no sería una estadística). Sin embargo, es importante tener en cuenta que la distribución de un estadístico (en oposición a la estadística en sí misma) por lo general dependerá de la distribución subyacente de los valores. (Esto es cierto para todas las estadísticas de otros de auxiliares de estadísticas.)


¿Qué acerca de una función donde los parámetros son conocidos? En los comentarios de abajo, Alecos pide una excelente pregunta de seguimiento. ¿Qué acerca de una función que utiliza un fijo de la hipótesis de valor del parámetro? Por ejemplo, ¿qué acerca de la estadística $\sqrt{n} (\bar{x} - \mu)$ donde $\mu = \mu_0$ es igual a un conocido de la hipótesis de valor de $\mu_0 \in \mathbb{R}$. Aquí la función es de hecho una estadística, tanto tiempo como se ha definido adecuadamente el dominio restringido. Así que la función $H_0: \mathbb{R}^n \rightarrow \mathbb{R}$ con $H_0(x_1,...,x_n) = \sqrt{n} (\bar{x} - \mu_0)$ sería una estadística, pero la función de $H: \mathbb{R}^{n+1} \rightarrow \mathbb{R}$ con $H(x_1,...,x_n, \mu) = \sqrt{n} (\bar{x} - \mu)$ podría no ser una estadística.

4voto

jgradim Puntos 1143

Lo interpreto como diciendo que debe decidir antes de ver los datos qué estadística va a calcular. Entonces, por ejemplo, si va a eliminar los valores atípicos, debe decidir antes de ver los datos qué constituye un "valor atípico". Si decide después de ver los datos, entonces su función depende de los datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X