6 votos

¿Cuando es el error estándar de la media increíblemente grande para un rango de datos, cuando sabemos el tamaño de muestra?

Mientras que la lectura de un artículo (publicado y revisado por pares, se hace referencia a continuación) investigar las proporciones de los diferentes tipos de tejidos en el cerebro humano, me encontré con una tabla de presentación de datos en los diferentes subgrupos en el estudio. Los datos se presentan como +/- SE (que supongo será el error estándar, aunque no podía ver lo especificado en el texto) y el rango.

Un ejemplo es la edad de uno de los subgrupos: n= 23 edad media = 66 SE = 2.9 el rango de edad de 60-69

Esto me desconcertó. Si la SE es de 2.9, a continuación, dado el tamaño de la muestra, de 23 de la SD de la edad debe ser:

SD = sqrt(23) * 2.9 = 13.9

Esto podría conducir a una desviación estándar que es bastante más grande que el rango especificado para la edad, que no debería ser posible.

Soy un principiante en el mundo de las estadísticas, así que mi pregunta es simplemente si a partir de esto es posible concluir que uno o varios de los valores debe ser incorrecta, o si me falta algo que hacer este dato a tener sentido.

Gracias!

Referencia: Guttmann CR, Jolesz FA, Kikinis R, et al. Cambios en la sustancia blanca con el envejecimiento normal. Neurología 1998;50:972-978.

5voto

AdamSane Puntos 1825

Estoy buscando en el papel ahora (las cifras están en la final).

Puede haber perdido algo, pero hasta ahora no veo nada en el papel que los estados que la 2.9 pretende ser un error estándar (no puedo encontrar "SÍ" o "error estándar" en el papel, por ejemplo).

Edit: Mattias señala en los comentarios de que (a diferencia de la versión html que he enlazado), en la versión pdf definitivamente dice 'SÍ', que invalida lo que sigue. Esto significa que el artículo se ha equivocado.

Usted puede han deducido que es un error estándar de la forma en que la información es presentada en la Tabla.1, donde por ejemplo la media de Edad para el grupo de edad de 60-69 es dado como 66.0$\pm$ 2.9.

Sin embargo, no es inusual para $\pm$ a ser utilizado de diferentes maneras, como para indicar la desviación estándar, o algún múltiplo del error estándar (lo que nos deja para siempre requieren ser explicadas si vamos a saber con certeza lo que significa).


La delimitación de la desviación estándar y el error estándar de la media

En cualquier caso, es una buena pregunta, y la investigación de la información en los papeles es importante.

El mayor valor posible para una desviación estándar de población de un almacén de variable continua en $[a,b]$$(b-a)/2$; esto ocurre cuando la mitad de las observaciones están en el límite inferior y medio en el límite superior.

Así, por ejemplo, si sabíamos que el grupo de edad es $60-69$ (suponiendo que las edades se registra sólo en años completos), la mayor desviación estándar posible es $4.5$, y el mayor error estándar de la media sería de $4.5/\sqrt{n}$.

enter image description here

Por supuesto, si la varianza de la muestra se basa en un $n-1$ denominador, entonces la desviación estándar puede ligeramente superior a la mitad del rango (en un lugar fácilmente computable manera).

La regla de oro - la desviación estándar no debe ser más de la mitad de la gama - es una pena recordar, como largo como para muestras pequeñas que tenemos en mente es realmente $s_n$ que posee.

Sin embargo, podemos enlazar más. Primera nota de que $n$ era extraño en la tabla en cuestión, de modo que en realidad no podemos colocar la mitad en cada extremo, y es posible calcular la (ligeramente más pequeño) desviación estándar que permitiría. Aún más importante, se nos dice que la media, y que pueden tener un mayor impacto, reduciendo al máximo la desviación estándar de aproximadamente 4.15 ($s_n$) o 4.24 ($s_{n-1}$).

Tenga en cuenta que si la edad habían sido distribuidos de manera uniforme, habría dado sobre el derecho de la desviación estándar:

enter image description here

(No es uniforme, podemos decir que debido a que la media es mayor que el valor central, pero nos da una idea de el tipo de propagación que tiene).

La "sd < $\frac{1}{2}$ intervalo de la" regla de oro sigue siendo probablemente el más útil para recordar, a menos que usted está haciendo muy detallada investigación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X