Antecedentes: estoy dando una presentación a los compañeros en el trabajo en la prueba de hipótesis, y de entender la mayoría de lo bien, pero hay un aspecto que me voy a atar a mi mismo, en nudos tratando de entender así como explicar a los demás.
Esto es lo que creo que sé (por favor, corrija si mal!)
- Estadísticas de la que sería normal si la varianza era conocido, seguir una $t$-distribución, si la varianza es desconocida
- CLT: La distribución de muestreo de la media muestral es aproximadamente normal suficientemente grande $n$ ( $30$ , podría ser de hasta el $300$ altamente distribuciones sesgadas)
- El $t$-distribución puede ser considerado Normal para los grados de libertad $> 30$
Utilice el $z$-prueba si:
- La población normal y varianza conocida (para cualquier tamaño de la muestra)
- La población normal, con varianza desconocida y $n>30$ (debido a la CLT)
- Población binomial, $np>10$, $nq>10$
Utilice el $t$-prueba si:
- La población normal, con varianza desconocida y $n<30$
- Ningún conocimiento acerca de la población o la varianza y la $n<30$, pero los datos de muestra se ve normal / pasa las pruebas etc por lo que la población puede suponer normal
Así que yo me quedo con:
- Para las muestras de $>30$ $<\approx 300$ (?), ningún conocimiento acerca de la población y de la varianza conocido / desconocido.
Así que mis preguntas son:
En ¿qué tamaño de muestra se puede asumir (donde ningún conocimiento acerca de la distribución de la población o la varianza) que la distribución de muestreo de la media normal (es decir, CLT ha pateado en) cuando la distribución de muestreo se ve que no es normal? Sé que algunas distribuciones necesidad de $n>300$, pero algunos de los recursos parecen decir el uso de la $z$-prueba siempre que $n>30$...
Para los casos que no estoy seguro acerca de, supongo yo que mirar los datos para la normalidad. Ahora, si los datos de la muestra no parece normal ¿puedo usar el $z$-prueba (ya que asume la población normal, y desde $n>30$)?
¿Qué acerca de los datos de la muestra de casos no estoy seguro acerca de la no parecen normales? Hay circunstancias donde usted todavía uso un $t$-prueba o $z$-prueba o siempre la ves para transformar / utilizar pruebas no paramétricas? Sé que, debido a la CLT, en algún valor de $n$ la distribución de muestreo de la media se aproxima a la normalidad, pero los datos de la muestra no me dicen lo que el valor de $n$; los datos de la muestra podría no ser normal, mientras que la media muestral sigue una normal / $t$. Hay casos en los que sería la transformación de / utilizando una prueba no paramétrica, cuando en realidad la distribución de muestreo de la media era normal / $t$ pero no podía decirle?