15 votos

Confusión sobre cuándo utilizar $z$ -estadística vs. $t$ -estadística

Me refería a este vídeo para calcular el intervalo de confianza . Sin embargo, tengo una confusión. Este tipo está usando $z$ -estadística para el cálculo. Sin embargo, creo que debería haber sido un $t$ -estadística. No se nos da la verdadera desviación estándar de la población. Estamos utilizando la desviación estándar de la muestra para estimar la verdadera.

Entonces, ¿por qué tomó la distribución normal para el intervalo de confianza en lugar de $t$ ?

0 votos

Sólo como referencia, trabajando el problema expuesto en el video con un t estadística que se obtendría: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145 .

23voto

Eero Puntos 1612

Cuando hice mi primer curso de estadística (después de los dinosaurios, pero cuando los ordenadores reales todavía ocupaban una sala entera) nos enseñaron a utilizar la tabla z si había más de 30 grados de libertad, en parte porque la tabla t del libro sólo llegaba hasta 30 grados de libertad y si miras la tabla t verás que en algún punto alrededor de los 28 grados de libertad obtienes los mismos resultados que la tabla z hasta 2 dígitos significativos (y al hacer todo eso a mano tendíamos a redondear más a menudo). Quizá el presentador siga siendo de esa escuela.

Es cierto que si se utiliza la desviación estándar de la muestra para una prueba sobre la media, se debería utilizar la distribución t independientemente del tamaño (lo que es mucho más fácil de hacer hoy en día) y sólo utilizar la z (normal estándar) cuando se conoce la desviación estándar de la población, pero a efectos prácticos no se suele ver una diferencia significativa si el tamaño de la muestra es grande.

2 votos

Gran anécdota :)

2 votos

Un desafortunado efecto secundario del hecho de que a veces esté bien utilizar intervalos z es que algunos textos introductorios presentan intervalos z en lugar de intervalos t. Hay muchas áreas de la ciencia en las que las muestras son habitualmente lo suficientemente pequeñas como para que los intervalos z sean totalmente inapropiados. Se lo digo a mis alumnos todos los años, con instrucciones explícitas, pero aún así un número considerable de ellos utiliza los intervalos z :-(

10voto

nexneo Puntos 531

Tienes razón, debería ser una distribución t. Pero como el tamaño de la muestra es de 36 (es decir, > 20), una distribución z también sería apropiada. Recuerde que, a medida que aumenta el tamaño de la muestra, la forma de la distribución t se asemeja más a la de la distribución z.

4voto

Me cuesta entender si Khan ha simplificado demasiado las cosas en el vídeo o si simplemente está equivocado. Tendría que decir lo segundo, pero el problema no está en el z o t pregunta. Llama a lo que calcula un intervalo de confianza y luego dice que tiene un 92% de confianza en que la media de la población cae dentro del rango dado. Eso no es algo que se concluya de un intervalo de confianza... por desgracia.

Entonces vuelvo a la t contra. z pregunta y empezar a preguntarse si cometió un error allí. Pienso que tal vez no, porque afirma que si la muestra es más pequeña hay que hacer una corrección. Así que las otras respuestas son probablemente correctas en eso. Sólo está utilizando z porque ya lo ha introducido y está bastante cerca con el n de 36. No pienso revisar todos los vídeos pero me imagino que introducirá el t distribución más tarde, espero que la próxima.

Es realmente lamentable que Khan Academy se equivoque en tantas áreas de las estadísticas... pero tal vez sólo me siento así porque sólo me señalan los vídeos con problemas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X