21 votos

¿Por qué se utilizan siempre distribuciones con media 0 y desviación típica 1?

Soy autodidacta en estadística, pero muchos de los materiales que he leído apuntan a un conjunto de datos con media 0 y desviación típica 1.

Si ese es el caso entonces:

  1. ¿Por qué la media 0 y la DE 1 son buenas propiedades?

  2. ¿Por qué una variable aleatoria extraída de esta muestra es igual a 0,5? La probabilidad de extraer 0,001 es la misma que 0,5, así que debería ser una distribución plana...

  3. Cuando se habla de Z Scores, ¿a qué se refieren realmente?

15voto

PhilPursglove Puntos 257

Para empezar, estamos hablando de la distribución normal estándar, una distribución normal con una media de 0 y una desviación estándar de 1. La abreviatura de una variable que se distribuye como una distribución normal estándar es Z.

He aquí mis respuestas a sus preguntas.

(1) Creo que hay dos razones clave por las que las distribuciones normales estándar son atractivas. En primer lugar, cualquier variable con distribución normal puede convertirse o transformarse en normal estándar restando su media de cada observación antes de dividir cada observación por la desviación típica. Esto se denomina transformación Z o creación de puntuaciones Z. Esto resulta muy útil, sobre todo en la época anterior a los ordenadores.

Si quisieras averiguar la probabilidad de algún suceso a partir de una variable que se distribuye normalmente con una media de 65,6 y una desviación típica de 10,2, ¿no sería un auténtico suplicio sin un ordenador? Digamos que esta variable es la altura en pulgadas de las mujeres estadounidenses. Y digamos que estamos interesados en averiguar la probabilidad de que una mujer extraída al azar de la población sea muy alta, digamos que mida más de 75 pulgadas. Es un poco complicado averiguarlo con un ordenador, ya que tendría que llevar conmigo una tabla para cada posible distribución normal. Sin embargo, si lo transformo en una puntuación Z, puedo utilizar la tabla para averiguar la probabilidad: $$ \begin{aligned} \frac{(x_i - \bar x)}{\sigma_x} &= Z \\ \frac{(75 - 65.6)}{10.2} &= 0.9215 \end{aligned} $$ Utilizando la tabla Z encuentro que la probabilidad acumulada P(z < Z) - 0,8212 y por tanto la probabilidad de encontrar una mujer tan alta o más de 75 pulgadas es del 17,88%. Podemos hacerlo con tout variable distribuida normalmente, por lo que esta distribución normal estándar es muy útil.

La segunda razón por la que se utiliza con frecuencia la distribución normal estándar se debe a la interpretación que proporciona en términos de puntuaciones Z. Cada "observación" de una variable transformada en Z es el número de desviaciones estándar de la media de la observación original sin transformar. Esto resulta especialmente útil para pruebas estandarizadas en las que el rendimiento bruto o absoluto es menos importante que el rendimiento relativo.

(2) No te entiendo. Creo que estás confundido con lo que entendemos por función de distribución acumulativa. Observa que el valor esperado de una distribución normal estándar es 0, y este valor corresponde al valor de .5 en la función de distribución acumulativa asociada.

(3) Las puntuaciones Z son las "observaciones" o datos individuales de una variable que se ha transformado en Z. Volvamos a mi ejemplo de la variable altura de las mujeres estadounidenses en pulgadas. Una observación concreta puede ser una mujer alta de 75 pulgadas. La puntuación Z para esto es el resultado de la transformación Z de la variable como hicimos anteriormente: $$ \begin{aligned} \frac{(x_i - \bar x)}{\sigma_x} &= Z \\ \frac{(75 - 65.6)}{10.2} &= 0.9215 \end{aligned} $$ La puntuación Z en este caso es 0,9215. La interpretación de la puntuación Z es que esta mujer en concreto es 0,9215 desviaciones estándar más alta que la estatura media. Una persona con una estatura de 55,4 pulgadas tendría una puntuación Z de 1 y estaría 1 desviación estándar por debajo de la estatura media.

11voto

  1. Al principio, la respuesta más útil probablemente sea que la media de 0 y la sd de 1 son matemáticamente convenientes. Si puedes calcular las probabilidades de una distribución con una media de 0 y una desviación típica de 1, puedes calcularlas para cualquier distribución similar de puntuaciones con una ecuación muy sencilla.

  2. No entiendo esta pregunta. La media de 0 y la desviación típica de 1 suele aplicarse a la distribución normal estándar, a menudo llamada curva de campana. El valor más probable es la media y disminuye a medida que nos alejamos. Si la distribución es realmente plana, no hay ningún valor más probable que otro. Tu pregunta está mal formulada. ¿Tal vez estabas buscando preguntas sobre lanzar monedas? Busca la distribución binomial y el teorema central del límite.

  3. ¿"Quiero decir aquí"? ¿Dónde? La respuesta sencilla para las puntuaciones z es que son sus puntuaciones escaladas como si su media fuera 0 y su desviación estándar fuera 1. Otra forma de verlo es que toma una puntuación individual como el número de desviaciones estándar que tiene esa puntuación respecto a la media. La ecuación calcula la (puntuación - media) / desviación típica. Las razones para hacer esto son muy variadas, pero una de ellas es que en los cursos introductorios de estadística hay tablas de probabilidades para diferentes puntuaciones z (véase la respuesta 1).

Si hubieras buscado primero puntuación z, aunque fuera en la wikipedia, habrías obtenido respuestas bastante buenas.

2voto

adhg Puntos 158

Como Graham y John te han dado excelentes explicaciones, me limitaré a responder a tu última pregunta:

Cuando se habla de Z Scores, ¿a qué se refieren realmente?

La mejor manera de responder es pensar en esta pregunta: Las notas de la clase CS 101 se distribuyen normalmente con $\mu$ = 80 y $\sigma$ = 5. ¿Cuál es la puntuación z para el grado 65?

Entonces: (65-80)/5=-3

Se puede decir que la puntuación z para el grado 65 es -3 o lo que es lo mismo, 3 desviaciones estándar a la izquierda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X