¿Qué es una desviación estándar, cómo se calcula y cuál es su utilidad en estadística?
Respuestas
¿Demasiados anuncios?La desviación estándar es la raíz cuadrada del segundo momento central de una distribución. Un momento central es la diferencia esperada del valor esperado de la distribución. Un primer momento central suele ser 0, por lo que definimos un segundo momento central como el valor esperado de la distancia al cuadrado de una variable aleatoria con respecto a su valor esperado.
Para ponerlo en una escala más acorde con las observaciones originales, tomamos la raíz cuadrada de ese segundo momento central y lo llamamos desviación estándar.
La desviación estándar es una propiedad de una población. Mide el grado de "dispersión" media de esa población. ¿Están todas las observaciones agrupadas en torno a la media o están muy dispersas?
Para estimar la desviación típica de una población, solemos calcular la desviación típica de una "muestra" de esa población. Para ello, se toman observaciones de esa población, se calcula la media de esas observaciones y, a continuación, se calcula la raíz cuadrada de la desviación media al cuadrado de esa "media muestral".
Para obtener un estimador insesgado de la varianza, no se calcula la desviación cuadrática media de la media de la muestra, sino que se divide por (N-1), donde N es el número de observaciones de la muestra. Tenga en cuenta que esta "desviación estándar de la muestra" no es un estimador insesgado de la desviación estándar, pero el cuadrado de la "desviación estándar de la muestra" es un estimador insesgado de la varianza de la población.
Si la información que se necesita es la distribución de los datos en torno a la media, la desviación estándar resulta muy útil.
La suma de la diferencia de cada valor con respecto a la media es cero (obviamente, ya que los valores están repartidos uniformemente alrededor de la media), por lo que elevamos al cuadrado cada diferencia para convertir los valores negativos en positivos, los sumamos en toda la población y sacamos su raíz cuadrada. Este valor se divide por el número de muestras (o el tamaño de la población). Así se obtiene la desviación estándar.
La mejor manera que tengo de entender la desviación estándar es pensar en un peluquero. (Para que este ejemplo funcione, es necesario recopilar datos de una peluquera y promediar su velocidad de corte de pelo).
El peluquero tarda una media de 30 minutos en cortar el pelo de una persona.
Supongamos que usted hace el cálculo (la mayoría de los paquetes de software lo hacen por usted) y encuentra que la desviación estándar es de 5 minutos. Esto significa lo siguiente:
- la peluquera corta el pelo al 68% de sus clientes en 25 minutos y 35 minutos
- la peluquera corta el pelo al 96% de sus clientes en 20 y 40 minutos
¿Cómo lo sé? Tienes que fijarte en la curva normal, en la que el 68% cae dentro de una desviación estándar y el 96% cae dentro de dos desviaciones estándar de la media (en este caso, 30 minutos). Así que suma o resta la desviación estándar de la media.
Si se desea coherencia, como en este caso, cuanto menor sea la desviación estándar, mejor. En este caso, el peluquero pasa un máximo de unos 40 minutos con cualquier cliente. Hay que cortar el pelo con rapidez para que la peluquería tenga éxito.
- Ver respuestas anteriores
- Ver más respuestas