Supongamos que he dibujado una muestra de una distribución de Cauchy. ¿Es posible hacerlo t-test de un estudiante de media distinta de cero? Si no es así, ¿por qué dejaría?
Respuestas
¿Demasiados anuncios?No, tendría que romper la hipótesis de la prueba. Test t de Student se aplican a la normalidad muestras distribuidas. De lo contrario, el t-estadísticas de $ t = \frac{\overline{x} - \mu_0}{s / \sqrt{n}}$ no puede seguir a un Estudiante de derecho (no es una distribución normal, dividido por una $\chi²$ de la distribución, que es el argumento original detrás de la prueba de la t).
En la parte superior de que, Cauchy ley no tienen una expectativa (de hecho, la muestra significa seguir una ley de Cauchy). Cualquier conclusión a partir de la evaluación de decir es falso, ya que una nueva observación puede cambiar el valor estimado por órdenes de magnitud. La siguiente imagen presenta valores consecutivos de una media evaluados en la primera $n$ elementos de Cauchy ensayos, como $n$ crece más y más
n<-1000
plot(cumsum(rcauchy(n))/seq(1,n),type='l')
Sin embargo, aún hay esperanza, como la de Cauchy de la ley tienen una mediana, que corresponden a la posición del parámetro (si esto es lo que están tratando de estimar).
Mientras que un one-sample t-test aplicado a los datos de pensamiento que se pueden extraer de una distribución de Cauchy no prueba un cambio en la media (desde el Cauchy no tiene uno) podría ser utilizado para la prueba de un cambio en la ubicación.
Así que vamos a examinar lo que sucede cuando usted:
En muestras pequeñas no lo hace mal; el nivel de significación es menor de lo que debería ser (por ejemplo, si lleva a cabo un 5% de prueba para n=10, el tipo real de la tasa de error es inferior al 3%), pero si usted empuje hacia arriba de la tensión nominal nivel de significación para obtener el real nivel de significación en la región de la derecha, la potencia de una prueba una cola no es terrible en n=10 (y mejor por debajo de ella) en comparación con otros comunes de una sola muestra de las pruebas (hay algunos mejores pruebas aún):
El problema viene de que la curva de potencia para la prueba t-test apenas cambios con el aumento de la $n$, mientras que para las otras pruebas de mejora (eficiencia relativa mejora a medida que n aumenta; si cuádruple tamaño de la muestra se obtiene una potencia similar a un giro alrededor de la mitad). La prueba de t de la curva de potencia no cambia mucho porque la distribución de la media muestral de una de Cauchy es el mismo que para una sola observación; lo que el cambio no se podría ser debido a cambios en el denominador o el cambio de dependencia entre el numerador y el denominador. Así que a n=100, la prueba de t de la curva de potencia es casi en el mismo lugar, pero las otras dos pruebas tienen mucho más pronunciada de energía curvas.
Usted puede robustify t-pruebas en una variedad de más o menos sofisticadas formas, y su rendimiento en el Cauchy tiende a ser bastante buena. Incluso algo tan simple mente como el recorte (por ejemplo, alrededor del 20%-40% de cada extremo, y de nuevo, con un ajuste de su valor nominal nivel de significación para estar más cerca el comportamiento deseado) puede conducir a una mejora sustancial; algunos autores sugieren Winsorizing para la desviación estándar en lugar de recortar, aunque luego la distribución de la estadística t parece estar más afectado y necesita ajustar niveles nominales de más. La cosa agradable sobre un puro recorte se puede simplemente dejar fuera a algunos puntos de datos y llamar a un t-test de rutina (siempre y cuando usted sabe lo que el ajuste al nivel nominal que hacer para lograr los resultados deseados, el nivel de significación).
Estrictamente hablando, usted quiere ajustar los grados de libertad (no sólo n-1-t donde t es el número recortadas), pero por encima de tamaños de muestra pequeños, no se debería hacer todo lo que haya mucha diferencia.
En física se llama Breit-Wigner de distribución. Los físicos buscar en la ubicación del pico y la anchura a mitad de altura, en lugar de la media y la varianza.
Usted no puede hacer la prueba t en esta cosa. La razón es que se trata de una distribución estable. En términos prácticos, esto significa que si usted mira la media de la muestra, su distribución va a ser Breit-Wigner (de Cauchy). El CLT no funciona en estas distribuciones.