6 votos

Estandarización de una variable normal estándar

¿Si estandarizar una variable aleatoria normal estándar, va a ser normal todavía estándar? ¿Es decir, si $X\sim N(0,1)$, entonces puede hacer $$X^*=\frac{x-\bar x}{sd(x)}$$ ? and will $X^*\sim N(0,1)$?

En R código:

x <- rnorm(5)
scale(x)

Me parece que estoy normalizando un estándar normal, suena doble estandarización. También no sé si mantendrá la distribución normal estándar.

10voto

AdamSane Puntos 1825

Si $X_i$ son iid Normal(0,1), a continuación una muestra de que no tienen la media de la muestra 0 o desviación estándar de la muestra 1 sólo debido a la variación aleatoria.

Ahora consideremos lo que sucede cuando hacemos $Z=\frac{X-\overline{X}}{s_X}$

Mientras nos hacemos ahora tienen muestra de media 0 y desviación estándar de la muestra 1, lo que no tiene es $Z$ están normalmente distribuidos.

En pequeño a moderado tamaño de la muestra, se tiene a corto colas, y considerablemente más pequeños de la curtosis de una normal estándar, Hecho a partir de la simulación para las muestras de tamaño n=10 se ve bastante similar a una escala beta(4,4) (que se ha reducido a mentir en (-3,3) ):

enter image description here

(El eje x es una muestra aleatoria de B(4,4) escala a (-3,3). Por supuesto, esto no significa que la distribución de la forma es una versión beta(4,4).)

Los valores de res se genera de la siguiente manera:

res=replicate(100000,scale(rnorm(10)))

Para muestras de tamaño 5, el resultado parece más bien una escala de beta(3/2,3/2).

Además, los valores en cada una de las muestras no son independientes, ya que suma a 0 y sus plazas suma a $n-1$

7voto

Jeff Bauer Puntos 236

Tenemos que

$$X_i^* = \frac{X_i}{s} - \frac{\bar X}{s}$$

La varianza de la muestra a partir de una muestra normal sigue una distribución exacta,

$$(n-1)s^2/\sigma^2\sim\chi^2_{n-1} \implies s^2 \sim \frac{1}{n-1}\chi^2_{n-1} \implies s \sim \frac{1}{\sqrt{n-1}}\chi_{n-1}$$

es decir, $s$ sigue a la raíz cuadrada de un chi-cuadrado dividida por sus grados de libertad.

Pero incluso si esto significa que $\frac{X_i}{s}$ es la proporción de una normal estándar sobre la raíz cuadrada de un chi-cuadrado dividida por sus grados de libertad, el numerador es no independiente del denominador, por lo que no podemos decir que la relación sigue a un Estudiante de la $t$-distribución (y personalmente no conozco su distribución).

En cuanto al segundo término, se sabe que la media de la muestra y la varianza de la muestra variables aleatorias son independientes si y sólo si la muestra se compone de independientes normales, que es el caso aquí.

Además, la media de la muestra sigue un cero significa que la distribución normal con varianza aquí $1/n$, lo $\sqrt{n}\bar X$ sigue una normal estándar.

Así que tenemos que $$\frac{\sqrt {n} \bar X}{s} \sim de t \implica \frac{\bar X}{s} \sim \frac{1}{\sqrt {n}} $$

es decir, el segundo término de $X_i^*$ sigue una escala del estudiante $t$-distribución

Así, en todos los

$$X^*_i = \frac{Z_i}{\sqrt{\chi^2_{n-1}/(n-1)}} - \frac{1}{\sqrt {n}}t$$

donde he utilizado el símbolo $Z$ para denotar una variable aleatoria siguiendo una normal estándar. El primer término no es un Estudiante de la $t$, y por otra parte, no es independiente del segundo término. Poner juntos no se ve mucho de normal o de un Estudiante de la distribución.

5voto

AlaskaRon Puntos 51

Las variables normales estándar originales tienen verdadero significa 0 (e (x) = 0) y son independientes. Tomando un conjunto de ellos y dividiéndolos por su desviación estándar, estandarizarlos, pero el resultado, irónicamente, no es normal estándar. Son dependientes (porque comparten el denominador) y tienen t-distribuciones. Así que si quieres normal estándar, sólo seguir con rnorm(5).

0voto

Igal Tabachnik Puntos 15160

Intuitiva prueba por contraejemplo

Ya hay algunas respuestas generales que cubren la pregunta, pero personalmente creo que el siguiente razonamiento más fáciles de seguir.

Supongamos que el tamaño de la muestra es 1.

Su definición de la $X^*$ es de la siguiente manera

$$X^*=\frac{x-\bar x}{sd(x)}$$

Debido a que el tamaño de la muestra es 1, tenemos $\bar x = x$, lo que para cualquier $x$ la expresión se reduce a

$$X^*=\frac{\bar x-\bar x}{sd(x)} =\frac{0}{0}$$

Como $X^*$ está claro que no es una distribución normal para el tamaño de la muestra 1, se puede definitivamente no tiene una distribución normal estándar en general.

0voto

Deep North Puntos 1260

Acabo de hacer algunos experimentos. Parece ser después escala otra vez, estás más cerca de obtener algunos datos con $\mu=0$ y $\sigma=1$.

set.seed(123)
x <- rnorm(1000,0,1)
mean(x)
sd(x)
y<-scale(x)
mean(y)
sd(y)

Resultados:

> mean(x)
[1] 0.01612787

> sd(x)
[1] 0.991695


> y<-scale(x)

> mean(y)
[1] -8.235085e-18

> sd(y)
[1] 1

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X