2 votos

Suponiendo una distribución normal: ¿cuál es la sd para una media dada?

Supongamos que, según una estadística nacional, en Alemania la gente tiene un $mean$ de $10,000$ euros en su cuenta bancaria y a eso lo llamamos su "patrimonio". Desgraciadamente, sólo el $mean$ pero no la desviación típica ( $sd$ ). Suponiendo que los activos se distribuyen normalmente, ¿es posible decir cuál es el $sd$ ¿es? Tenga en cuenta que en este ejemplo los valores negativos son posibles y significaría que alguien tiene deudas (tal vez hay una palabra más correcta que activos para lo que quiero decir, pero no lo sé).

Mis pensamientos hasta ahora :

Una distribución normal estándar tiene una media de $0$ y una sd de $1$ . Ahora podemos pensar en la distribución de los activos como una distribución normal estándar que ha sido desplazada por $+10,000$ . La distribución resultante tiene $mean$ de $10,000$ y un $sd$ de $1$ y se distribuye normalmente. El problema con esta idea es que cada puede considerarse como una distribución normal desplazada, por lo que siempre supondremos un $sd$ de $1$ . De este modo, no se tiene en cuenta la escala de la variable. Por ejemplo, para un $mean$ de $10,000$ € la $sd$ sería $1$ y para un $mean$ de $1,000,000$ centavos el $sd$ sería $1$ También. Esto no me parece correcto.

Editar :

  1. Debido a la respuesta que quiero explicar con más detalle por qué estaba pensando que sería posible decirle a la sd. Llamamos distribución normal sólo a las distribuciones que tienen determinadas formas, es decir, la distribución debe tener una curtosis de 3 y una asimetría de 0 (ambas aproximadamente). La sd también refleja la forma de una distribución, de ahí que pensara que una distribución no puede ser normal con cualquier sd (¿o no?). Esto me llevó a la idea de que debe haber alguna sd que la distribución debe tener si se supone que es una distribución normal. ¿Cuál es el error en mi razonamiento?

  2. He cambiado el ejemplo porque la variable del primer ejemplo no puede ser normal, por lo tanto, la pregunta no tendría mucho sentido (como señala Glen_b).

15voto

icelava Puntos 548

La media y la desviación típica de una distribución normal no están relacionadas de ninguna manera. Las distribuciones normales pueden tener cualquier valor real como media y cualquier valor positivo como desviación típica.

De ello se deduce que si sólo conocemos la media, no podemos decir nada en absoluto sobre la desviación típica.

Por ejemplo, cualquiera de los cuatro histogramas siguientes del consumo simulado de carne de 100.000 alemanes es coherente con una media de 132. Sólo tienen desviaciones típicas diferentes, que me he sacado de la chistera.

meat consumption

Ahora bien, podemos estar bastante seguros de que la DE no es 50, porque eso implicaría una cantidad apreciable de personas con negativo consumo de carne. Suponiendo una distribución normal. Pero incluso una muy pequeña SD de 1 no completamente descartar un consumo negativo, porque la densidad de toda distribución normal se extiende a los números negativos.

Si no le hubiera dicho a R que usara el mismo eje horizontal en las cuatro gráficas (usando el parámetro breaks), entonces los ejes se escalarían a cada conjunto de datos simulado por separado, y las cuatro gráficas se verían como la típica forma de campana. Vea los gráficos de densidad para los mismos datos:

all normal

Código R:

sds <- c(1,10,20,50)
set.seed(1)
meat_consumption <- sapply(sds,function(sd)rnorm(1e5,132,sd))

par(mfrow=c(2,2))
for ( ii in seq_along(sds) ) {
    hist(meat_consumption[,ii],,xlab="",main=paste("SD:",sds[ii]),
        breaks=seq(floor(min(meat_consumption)),ceiling(max(meat_consumption))))
}

# Density plots
for ( ii in seq_along(sds) ) {
  plot(density(meat_consumption[,ii]),,xlab="",main=paste("SD:",sds[ii]))
}

8voto

AdamSane Puntos 1825

Consumo de carne no puede se distribuya exactamente normal a cualquier desviación estándar; lo sabemos con certeza --

  1. es sencillamente imposible consumir cantidades negativas de carne, pero toda distribución normal asigna una probabilidad positiva a los números negativos.

    Si en vez de eso decimos que es aproximadamente normal, entonces hay límites a lo grande que puede hacer que la desviación estándar antes de que no puede ser muy cerca de lo normal, pero no podemos decir lo grande que es sin decir primero lo que consideramos que no lo suficientemente cerca como para ser contado como aproximadamente normal.

    Para satisfacer a la mayoría de la gente para fines típicos, necesitaría que la media estuviera al menos a varias desviaciones estándar de 0.

  2. Sin embargo es posible consumir no carne, y cualquier distribución del consumo de carne entre la población de muchos países (alemanes o no) incluirá al menos una pequeña proporción de personas que no consumen ninguna. Según una encuesta reciente El 10% de los alemanes son vegetarianos y el 1,1% veganos [1], por lo que, si estas cifras son exactas, una novena parte de la población no consume carne, una proporción considerable. Cualquier fracción distinta de cero con un consumo exactamente nulo significa que no puede ser exactamente normal, y 1/9 no es pequeña.

    En particular, un pico de 1/9 en el consumo 0 ridiculiza incluso una afirmación de normalidad aproximada.

Dejando a un lado los problemas del ejemplo (que imponía una restricción de positividad); si no hay otras restricciones o requisitos aparte de la media, la desviación típica puede ser cualquier cosa; no está restringida.

[1]: O'Riordan, Tim; Stoll-Kleemann, Susanne (31 de agosto de 2015). "Los retos de cambiar el comportamiento alimentario hacia un consumo más sostenible". Environment: Ciencia y Política para el Desarrollo Sostenible. 57 (5): 4-13.

4voto

Rickyfox Puntos 197

Sin tener en cuenta otras fuentes de datos, no hay forma de estimar la desviación típica de una muestra sin la muestra real .
La línea de pensamiento que esbozas simplemente asume que la desviación estándar es 1, pero no hay forma de verificar o refutar eso sin datos.

0voto

Lewis Puntos 10

Me gustaría rebatir un comentario de otra respuesta en el sentido de que

La media y la desviación típica de una distribución normal no son vinculadas de ninguna manera.

Podrían serlo, en el sentido de que podría ser razonable que $p\left(\sigma\mid\mu\right) \neq p\left(\sigma\right)$ . Para el problema que nos ocupa, el conocimiento de la media quizá nos dé alguna información sobre magnitudes plausibles de la desviación típica.

Imagina que no estás familiarizado con la moneda. Por ejemplo, consideremos el mismo problema esta vez en Corea del Sur. ¿Cuál es la desviación típica del ahorro? El problema es que quizá no tengas ni idea de la escala correspondiente. ¿Cuánto es mucho en won surcoreano? ¿Cuánto es poco? Bueno, si te digo que la media de ahorro es de 10 millones de wones, creo que ya tienes una idea de las magnitudes plausibles de la desviación. He elegido Corea del Sur porque sé que la escala relevante es mayor de lo que cabría esperar.

Obviamente, la información sobre $\mu$ rara vez es suficiente para determinar de forma unívoca $\sigma$ a menos que tenga información muy específica sobre la relación entre ambos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X