Processing math: 100%

16 votos

¿Cómo evalúo la desviación estándar?

He recogido respuestas de 85 personas sobre su capacidad para llevar a cabo ciertas tareas.

Las respuestas están en una escala Likert de cinco puntos:

5 = Muy bien, 4 = Bien, 3 = Promedio, 2 = Pobre, 1 = muy pobre,

La puntuación media es de 2,8 y la desviación estándar es de 0,54.

Entiendo lo que significan la media y la desviación estándar.

Mi pregunta es: ¿qué tan buena (o mala) es esta desviación estándar?

En otras palabras, ¿existen directrices que puedan ayudar en la evaluación de la desviación estándar.

0 votos

¿Qué significaría que la SD fuera buena o mala aquí?

7 votos

Es bastante difícil obtener una DE tan pequeña con datos como estos: para una media de 2,8, la DE tiene que ser al menos 0.2×0.8=0.4 . (Incluso si 2,8 representa un valor redondeado, la DE debe seguir siendo superior a 0,357.) Una DE de 0,54 implica que no más de dos personas podrían haber respondido con un 5 (con 21 2 y 62 3) y no más de seis podrían haber respondido con un 1 (con 5 2 y 74 3). Esto sugiere que la pregunta puede proporcionar excepcionalmente poca información porque la escala no discrimina eficazmente.

0 votos

@whuber ¡excelentes datos forsensics! Pero también podría imaginar que o bien hizo un promedio de diferentes preguntas o hizo algo mal en sus cálculos. Parece difícil imaginar que la gente realmente respondiera de manera tan uniforme, especialmente cuando se habla de sus supuestas habilidades.

19voto

Zizzencs Puntos 1358

Las desviaciones estándar no son "buenas" o "malas". Son indicadores de la dispersión de los datos. A veces, en las escalas de valoración, queremos una gran dispersión porque indica que nuestras preguntas/valoraciones cubren el rango del grupo que estamos valorando. Otras veces, queremos una sd pequeña porque queremos que todos sean "altos".

Por ejemplo, si se evaluaran las habilidades matemáticas de los estudiantes en un curso de cálculo, se podría obtener una sd muy pequeña haciéndoles preguntas de aritmética elemental como 3+2 . Pero supongamos que se hace una prueba de nivel más seria para el cálculo (es decir, los estudiantes que aprueban pasan a Cálculo I, los que no lo hacen toman primero cursos de nivel inferior). Se podría esperar una sd más baja (y una media más alta) entre los estudiantes de primer año en el MIT que en South Podunk State, dada la misma prueba.

Así que. ¿Cuál es el objetivo de su prueba? ¿Quiénes forman parte de la muestra?

3 votos

(+1) Sólo para añadir un poco a la observación "Las desviaciones estándar no son 'buenas' o 'malas'": tener un predictor con una gran desviación estándar puede ser "bueno" porque, en la regresión, está inversamente relacionado con el error estándar de una estimación del coeficiente de regresión. Por otro lado, si lo que te preocupa es la precisión de una medida, una desviación estándar grande es "mala". Supongo que el interés del autor se acerca más a lo primero, pero no está claro.

11voto

Sascha Puntos 306

Respuesta corta, está bien y es un poco más bajo de lo que podría haber esperado de los datos de la encuesta. Pero probablemente la historia de su empresa se sitúe más en la media o en el 2% superior.

Para las escalas discretas de la investigación en ciencias sociales, en la práctica la desviación estándar es una función directa de la media. En concreto, he comprobado, mediante el análisis empírico de muchos estudios de este tipo, que la desviación típica real en las encuestas sobre escalas de 5 puntos es del 40%-60% de la variación máxima posible (por desgracia, no está documentada aquí).

En el nivel más sencillo, considerar los extremos, imaginar que la media fuera 5,0. La desviación típica debe ser cero, ya que la única manera de que la media sea 5 es que todos respondan 5. A la inversa, si la media fuera 1,0 entonces el error estándar debe ser también 0. Por tanto, la desviación típica está definida con precisión dada la media.

Ahora bien, entre medias hay más zonas grises. Imaginemos que la gente puede responder 5,0 o 1,0, pero nada en el medio. Entonces la desviación estándar es una función precisa de la media:

stdev = sqrt ( (5-media)*(media-1))

La desviación estándar máxima de las respuestas en cualquier escala acotada es la mitad del ancho de la escala. En este caso es sqrt((5-3)(3-1)) = sqrt(2*2)=2.

Ahora, por supuesto, la gente puede responder a valores intermedios. A partir de los metaestudios de los datos de las encuestas en nuestra empresa, descubro que la desviación estándar de las escalas numéricas en la práctica es del 40% al 60% del máximo. En concreto,

  • 40% para escalas de puntos del 100%,
  • 50% para las escalas de 10 puntos y
  • 60% para las escalas de 5 puntos y
  • 100% para escalas binarias

Así que para su conjunto de datos, yo esperaría una desviación estándar del 60% x 2,0 = 1,2. Usted obtuvo 0,54, que es aproximadamente la mitad de lo que habría esperado si los resultados fueran calificaciones autoexplicadas. ¿Las calificaciones de las habilidades son resultados de baterías de pruebas más complicadas que son promedios y, por lo tanto, tendrían una varianza menor?

Sin embargo, la verdadera historia es que probablemente la capacidad sea tan baja o tan alta en relación con otras tareas. Informa de las medias o los porcentajes de las dos casillas más altas entre las habilidades y centra tu análisis en eso.

-2voto

Mun Puntos 6844

Si los datos se distribuyen normalmente, se puede ver cómo se localiza la población.

  • El 68% de las personas se encuentra dentro de una desviación estándar de la media ( 2.26 - 3.34 ):

enter image description here

  • El 95% de las personas se encuentra dentro de las 2 desviaciones estándar de la media ( 1.72 - 3.88 ):

enter image description here

Te dice lo "repartidos" que están tus números.

2 votos

Esta respuesta no ha sido votada porque es incorrecta: utiliza una regla general aproximada (como si fuera exacta) en un caso en el que es inaplicable. La respuesta sería verdadera si se sustituye por las conclusiones de la desigualdad de Chebyshev (que establece que al menos el 75% de los observaciones se sitúan dentro de dos DE de la observación media; es decir, al menos el 75% de las respuestas son 2 ó 3), pero esto no proporcionará mucha información.

0 votos

Además, sólo es cierto para poblaciones con una distribución realmente normal. A partir de ahí, puedes calcular los números de forma arbitraria y exacta evaluando la integral sobre la distribución normal dentro de los límites dados por la sd alrededor de la media. Realmente no es útil aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X