Discusión de la nueva pregunta:
Por ejemplo, si quiero estudiar el tamaño del cuerpo humano y encuentro que el tamaño del cuerpo humano adulto tiene una desviación estándar de 2 cm, probablemente inferiría que el tamaño del cuerpo humano adulto es muy uniforme
Depende de con qué lo comparemos. ¿Cuál es el estándar de comparación que lo hace muy uniforme? Si lo comparas con la variabilidad de las longitudes de los cerrojos para un tipo concreto de cerrojo, eso podría ser enormemente variable.
mientras que una desviación estándar de 2 cm en el tamaño de los ratones significaría que los ratones difieren sorprendentemente en su tamaño corporal.
Por comparación con lo mismo en tu ejemplo de humanos más uniformes, ciertamente; cuando se trata de longitudes de cosas, que sólo pueden ser positivas, probablemente tenga más sentido comparar el coeficiente de variación (como señalo en mi respuesta original), que es lo mismo que comparar la sd con la media que sugieres aquí.
Obviamente, el significado de la desviación estándar es su relación con la media,
No, no siempre. En el caso de tallas de las cosas o importes de cosas (por ejemplo, el tonelaje de carbón, el volumen de dinero), eso suele tener sentido, pero en otros contextos no tiene sentido comparar con la media.
Incluso así, no son necesariamente comparables de una cosa a otra. No hay una norma aplicable a todas las cosas sobre lo variable que es algo antes de serlo.
y una desviación estándar en torno a una décima parte de la media no es destacable (por ejemplo, para el CI: DE = 0,15 * M).
¿Qué cosas estamos comparando aquí? ¿Las longitudes con los coeficientes de inteligencia? ¿Por qué tiene sentido comparar un conjunto de cosas con otro? Nótese que la elección de media 100 y sd 15 para un tipo de test de CI es totalmente arbitraria. No tienen unidades. Podría haber sido fácilmente media 0 sd 1 o media 0,5 y sd 0,1.
Pero, ¿qué se considera "pequeño" y qué "grande", cuando se trata de la relación entre la desviación estándar y la media?
Ya se ha cubierto en mi respuesta original, pero más elocuentemente cubierto en el comentario de whuber - no hay una norma, y hay no puede ser.
Algunos de mis puntos sobre Cohen siguen aplicándose a este caso (la sd relativa a la media está al menos libre de unidades); pero incluso con algo como, por ejemplo, la d de Cohen, un estándar adecuado en un contexto no es necesariamente adecuado en otro.
Respuestas a una versión anterior
Siempre calculamos y comunicamos las medias y las desviaciones estándar.
Bueno, tal vez muchas veces; no sé si siempre hazlo. Hay casos en los que no es tan relevante.
Pero, ¿qué significa realmente el tamaño de la varianza?
La desviación estándar es una especie de distancia media* de la media. La varianza es el cuadrado de la desviación estándar. La desviación estándar se mide en las mismas unidades que los datos; la varianza está en unidades al cuadrado.
*(RMS -- https://en.wikipedia.org/wiki/Root_mean_square )
Le dicen algo sobre lo "dispersos" que están los datos (o la distribución, en el caso de que esté calculando la sd o la varianza de una distribución).
Por ejemplo, supongamos que observamos qué asiento ocupa la gente en una sala vacía. Si observamos que la mayoría de la gente se sienta cerca de la ventana con poca variación,
No se trata exactamente de registrar "qué asiento", sino de registrar "la distancia a la ventana". (Saber que "la mayoría se sienta cerca de la ventanilla" no te dice necesariamente nada sobre la media ni sobre la variación respecto a la media. Lo que le dice es que la mediana distancia de la ventana debe ser pequeña).
podemos suponer que esto significa que la gente generalmente prefiere sentarse cerca de la ventana y que obtener una vista o suficiente luz es el principal factor de motivación para elegir un asiento.
Que la mediana sea pequeña no lo dice por sí mismo. Se puede deducir de otras consideraciones, pero puede haber todo tipo de razones para ello que no podemos discernir de ninguna manera a partir de los datos.
Si, por otro lado, observamos que, aunque la mayor proporción se sienta cerca de la ventana, hay una gran variación con otros asientos ocupados también con frecuencia (por ejemplo, muchos se sientan cerca de la puerta, otros se sientan cerca del dispensador de agua o de los periódicos), podríamos suponer que, aunque muchas personas prefieren sentarse cerca de la ventana, parece que hay más factores que la luz o la vista que influyen en la elección de los asientos y en las diferentes preferencias de las personas.
De nuevo, estás aportando información ajena a los datos; puede que se aplique o puede que no. Por lo que sabemos, la luz es mejor lejos de la ventana, porque el día está nublado o las persianas están cerradas.
¿A qué valores podemos decir que el comportamiento que hemos observado es muy variado (a diferentes personas les gusta sentarse en diferentes lugares)?
Lo que hace que una desviación estándar sea grande o pequeña no viene determinado por una norma externa, sino por consideraciones sobre el tema, y hasta cierto punto por lo que se hace con los datos, e incluso por factores personales.
Sin embargo, con las medidas positivas, como las distancias, a veces es relevante considerar la desviación estándar en relación con la media (el coeficiente de variación); sigue siendo arbitrario, pero las distribuciones con coeficientes de variación mucho menores que 1 (desviación estándar mucho menor que la media) son "diferentes" en algún sentido que aquellas en las que es mucho mayor que 1 (desviación estándar mucho mayor que la media, que a menudo tenderá a ser fuertemente sesgada a la derecha).
¿Y cuándo podemos deducir que el comportamiento es mayoritariamente uniforme (a todo el mundo le gusta sentarse en la ventana)
Hay que tener cuidado con el uso de la palabra "uniforme" en ese sentido, ya que es fácil que se malinterprete su significado (por ejemplo, si digo que la gente está "uniformemente sentada en la sala", eso significa casi lo contrario de lo que quiere decir). De forma más general, cuando se habla de estadística, se suele evitar el uso de términos de la jerga en su sentido corriente.
¿y la escasa variación que muestran nuestros datos es en su mayor parte resultado de efectos aleatorios o variables de confusión (suciedad en una silla, que el sol se haya movido y haya más sombra en la parte de atrás, etc.)?
No, de nuevo, estás aportando información externa a la cantidad estadística que estás discutiendo. La varianza no te dice nada de eso.
¿Existen directrices para evaluar la magnitud de la varianza en los datos, similares a las directrices de Cohen para interpretar el tamaño del efecto (una correlación de 0,5 es grande, 0,3 es moderada y 0,1 es pequeña)?
En general, no.
-
La discusión de Cohen[1] sobre los tamaños del efecto es más matizada y situacional de lo que indicas; da una tabla de 8 valores diferentes de pequeño medio y grande dependiendo de qué tipo de cosa se esté discutiendo. Esos números que das se aplican a las diferencias de medias independientes (Cohen's d ).
-
Los tamaños del efecto de Cohen están escalados para ser cantidades sin unidad. La desviación estándar y la varianza no lo son: si se cambian las unidades, ambas cambiarán.
-
Los tamaños del efecto de Cohen están pensados para aplicarse en un ámbito de aplicación concreto (e incluso en ese caso considero que centrarse demasiado en esos estándares de lo que es pequeño, mediano y grande es algo arbitrario y algo más prescriptivo de lo que me gustaría). Son más o menos razonables para su área de aplicación prevista, pero pueden ser totalmente inadecuados en otras áreas (la física de alta energía, por ejemplo, requiere con frecuencia efectos que cubren muchos errores estándar, pero los equivalentes de Cohens tamaños de los efectos puede ser muchos órdenes de magnitud más de lo que se puede conseguir).
Por ejemplo, si el 90% (o sólo el 30%) de las observaciones se sitúan a una desviación estándar de la media, ¿se trata de algo poco común o completamente anodino?
Ah, fíjate ahora que has dejado de discutir el tamaño de la desviación estándar / varianza, y has empezado a discutir la proporción de observaciones dentro de una desviación estándar de la media, un concepto totalmente diferente. Muy A grandes rasgos, esto está más relacionado con los picos de la distribución.
Por ejemplo, sin cambiar la varianza en absoluto, puedo cambiar la proporción de una población dentro de 1 sd de la media con bastante facilidad. Si la población tiene un $t_3$ aproximadamente el 94% se encuentra dentro de 1 sd de la media, si tiene una distribución uniforme, aproximadamente el 58% se encuentra dentro de 1 sd de la media; y con una beta( $\frac18,\frac18$ ), es alrededor del 29%; esto puede ocurrir con todos ellos teniendo las mismas desviaciones estándar, o con cualquiera de ellos siendo más grande o más pequeño sin cambiar esos porcentajes -- no está realmente relacionado con la dispersión en absoluto, porque usted definió el intervalo en términos de desviación estándar.
[1]: Cohen J. (1992),
"Una cartilla de poder,"
Psychol Bull. , 112 (1), Jul: 155-9.