30 votos

Cómo realizar el test t de Student de tener solamente el tamaño de la muestra, la media muestral y la media de la población se conocen?

Estudiante $t$-prueba requiere de la muestra desviación estándar de $s$. Sin embargo, ¿cómo puedo calcular para $s$ cuando sólo el tamaño de la muestra y la media muestral se conocen?

Por ejemplo, si el tamaño de la muestra es de $49$ y media muestral es de $112$, a continuación, voy a intentar crear una lista de $49$ idénticas muestras con valores de $112$ cada uno. Como era de esperar, la desviación estándar de la muestra es de $0$. Esto creará una división por cero problema en el $t$ prueba.

DATOS ADICIONALES:
El ingreso promedio de ACME Norte de los trabajadores de la Fábrica es de $\$200$. Se ha informado de que una muestra aleatoria de $49$ los trabajadores en ACME Sur de la Fábrica tuvo un ingreso anual de $\$112$. Es esta diferencia estadísticamente significativa?

Estoy en lo correcto en decir que la media de población es de $\$200$?

37voto

jldugger Puntos 7490

Esto puede sorprender a muchos, pero para resolver este problema no necesariamente se debe estimar s. De hecho, usted no necesita saber nada acerca de la propagación de los datos (a pesar de que sería útil, por supuesto). Por ejemplo, en la Pared, Boen, y Tweedie en un artículo de 2001 se describe cómo encontrar un número finito de intervalo de confianza para la media de cualquier distribución unimodal basado en un único empate.

En el presente caso, tenemos algunos para ver la media de la muestra de 112 como dibujar a partir de una distribución aproximadamente normal (es decir, la distribución de muestreo de la media de una muestra aleatoria simple de 49 sueldos). Estamos suponiendo implícitamente que hay un número bastante grande de los trabajadores de la fábrica y que su salario de distribución no es tan sesgada o multimodal como para hacer que el teorema del límite central inoperable. A continuación, un conservador IC del 90% para la media se extiende hacia arriba para

$$112 + 5.84\ |112|,$$

claramente que cubre la verdadera media de 200. (Ver Wall et al fórmula 3.) Dada la limitada información disponible y de las suposiciones hechas aquí, por lo tanto, podemos concluir que 112 diferencia "significativa" de los de 200.

Referencia: "Un verdadero Intervalo de Confianza para la Media Con Muestras de Tamaño de Uno y Dos". La American Estadístico, Mayo De 2001, Vol. 55, Nº 2: pp 102-105. (pdf)

14voto

palmsey Puntos 3799

Este no parece ser un poco artificial pregunta. 49 es una cuadrada exacta de 7. El valor de una distribución t con 48 ministerio de hacienda para una prueba de dos caras de p<0.05 está muy cerca de 2 (2.01).

Rechazamos la hipótesis nula de igualdad de medios si |sample_mean - popn_mean| > 2*StdError, es decir, 200-112 > 2*SE para SE < 44, es decir, SD < 7*44 = 308.

Sería imposible conseguir una distribución normal con una media de 112 con una desviación estándar de 308 (o más) sin que la negativa de los salarios.

Dado que los salarios son acotados a continuación, son propensos a ser sesgado, por lo que suponiendo una log-normal de distribución, sería más apropiado, pero se requiere todavía altamente variable de los salarios para evitar una p<0,05 en un t-test.

4voto

Akira Puntos 1061

Supongamos que hay 999 trabajadores en ACME norte de la fábrica realizando cada uno un salario de 112, y 1 CEO de decisiones 88112. La media de la población es que el sueldo es $\mu = 0.999 * 112 + 0.001 * 88112 = 200.$ La probabilidad de sacar el CEO de una muestra de 49 personas en la fábrica es de $49 / 1000 < 0.05$ (esta es la de la distribución hipergeométrica), por lo tanto, con un 95% de confianza, su población la media de la muestra será de 112. De hecho, mediante el ajuste de la relación de los trabajadores/CEOs, y el sueldo del CEO, se puede hacer arbitrariamente raro que una muestra de 49 empleados se elaborará un CEO, mientras que la fijación de la población en 200, y la media de la muestra en la 112. Por lo tanto, sin hacer algunas suposiciones acerca de la distribución subyacente, usted no puede dibujar cualquier inferencia sobre la media de población.

3voto

Supongo que usted se refiere a una muestra de prueba de la t de. Su objetivo es comparar la media de la muestra con un hipotético de la media. Se calcula entonces (suponiendo que su población es de Gauss) un valor de P que responde a esta pregunta: Si la media de la población es realmente fue el hipotético valor, lo difícil sería obtener una muestra cuya media es la medida de ese valor (o más) de lo observado? Por supuesto, la respuesta a esa pregunta depende del tamaño de la muestra. Pero también depende de la variabilidad. Si los datos tienen una enorme cantidad de dispersión, que son consistentes con una amplia gama de la población. Si los datos son realmente ajustados, que son consistentes con un rango menor de la población.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X