28 votos

Transformar los datos a la media y desviación estándar deseadas

Estoy buscando un método para transformar mi conjunto de datos de su media y desviación estándar actuales a una media y desviación estándar objetivo. Básicamente, quiero reducir/ampliar la dispersión y escalar todos los números a una media.

No funciona hacer dos transformaciones lineales por separado, una para la desviación estándar y otra para la media. ¿Qué método debo utilizar?

4 votos

Si $Y = aX + b$ entonces $E(Y) = a E(X) + b$ y $Var(Y) = a^2 Var(X)$ . ¿Ayuda esto?

0 votos

@ocram, creo que es una respuesta (y buena)...

0 votos

@PeterEllis: ¡Gracias! Lo convertiré en una respuesta entonces :-)

47voto

Alan Puntos 7273

Supongamos que empiezas $\{x_i\}$ con la media $m_1$ y una desviación estándar no nula $s_1$ y se quiere llegar a un conjunto similar con media $m_2$ y la desviación estándar $s_2$ .

Entonces, multiplicando todos sus valores por $\frac{s_2}{s_1}$ dará un conjunto con media $m_1 \times \frac{s_2}{s_1}$ y la desviación estándar $s_2$ .

Ahora añadiendo $m_2 - m_1 \times \frac{s_2}{s_1}$ dará un conjunto con media $m_2$ y la desviación estándar $s_2$ .

Así que un nuevo conjunto $\{y_i\}$ con $$y_i= m_2+ (x_i- m_1) \times \frac{s_2}{s_1} $$ tiene media $m_2$ y la desviación estándar $s_2$ .

Se obtendría el mismo resultado con los tres pasos: trasladar la media a $0$ , escalar a la desviación estándar deseada; traducir a la media deseada.

9voto

Dave Puntos 76

Consideremos el cálculo de la puntuación z de los datos $x_i$ con la media $\bar{x}$ y la desviación estándar $s_x$ .

$$z_i = \dfrac{x_i-\bar{x}}{s_x}$$

Esto significa que, dados unos datos $(x_i)$ podemos transformar a datos con una media de $0$ y la desviación estándar de $1$ .

Reordenando, obtenemos:

$$x_i = z_i s_x+ \bar{x}$$

Esto nos devuelve los datos originales con la media original $\bar{x}$ y la desviación estándar $s_x$ . Pero podríamos haber ido a los datos $y_i$ con cualquier media $\bar{y}$ y la desviación estándar $s_y$ .

$$y_i = z_i s_y +\bar{y}$$

Ahora combina las dos transformaciones, primero para $z_i$ y luego a $y_i$ .

$$y_i = \dfrac{x_i-\bar{x}}{s_x}s_y + \bar{y}$$

Esto es lo mismo que lo que publicó Henry, pero creo que es útil ver que llegamos allí yendo primero a datos estandarizados y luego transformando a datos con los valores de media y desviación estándar que deseamos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X