6 votos

Valores críticos de la prueba de Anderson-Darling

He encontrado valores críticos para la prueba de Anderson Darling para una distribución normal a niveles de significación del 1%, 2,5%, 5%, 10% y 15% en varias fuentes, incluida la wikipedia:

http://en.wikipedia.org/wiki/Anderson%E2%80%93Darling_test

Me gustaría disponer de un valor crítico para un nivel de significación del 0,1% (en el "caso 4", sin conocer la media ni la varianza). No he podido encontrarlo buscando en la web, y no estoy seguro de cómo debo calcularlo. ¿Puede alguien ayudarme?

5voto

Akira Puntos 1061

Utilizando Código de Marsaglia & Marsaglia y una búsqueda de bisección, se puede encontrar que el valor crítico de 0,001 está alrededor de 5,9694. Esto sería para el 'Caso 1' en el artículo de wikipedia citado. No estoy seguro de cómo convertirlo en el 'Caso 4'.

0 votos

Este parece ser un valor asintótico. Una buena simulación para su $n$ ¡muy bien podría ser más preciso!

0 votos

@whuber, efectivamente lo es. Rahman et. al. dan valores de simulación para $n=10,20,\ldots,100$ en la tabla 2 de este documento: math.usm.my/bulletin/pdf/v29n1/v29n1p2.pdf aunque, de nuevo, no aborda las pruebas del "caso 4", sólo del "caso 1".

0 votos

Esos valores de simulación no tienen ni siquiera dos cifras significativas de precisión. Por ejemplo, la línea de $n=10$ en el cuadro 2 debe ser 1,246, 1,624, 1,942, 2,512, 3,108, 3,924, 4,556, 6,044 ( $10^7$ iteraciones). (El último dígito de los valores más altos sigue siendo incierto.) Esto requirió sólo un minuto de tiempo de cálculo; la simulación tarda sólo cinco veces más para $n=1000$ .

5voto

Eero Puntos 1612

Puedes utilizar la simulación (no es una idea nueva, es como Gosset/Student derivó la tabla t original (pero tenemos herramientas más rápidas que él)).

Genere una muestra psuedo aleatoria a partir de una distribución normal (o al menos lo más cercano que el ordenador pueda llegar) del tamaño de la muestra de interés y calcule el Estadístico Anderson Darling para esa muestra. Ahora repita este proceso unos cuantos millones de veces (o tal vez más que unos cuantos, dependiendo de lo preciso que quiera ser). El valor crítico del 0,1% será el percentil del 0,1% o del 99,9%.

Sin embargo, me cuesta imaginar una pregunta útil que pueda ser respondida por una prueba de Anderson-Darling con una significación del 0,1%. ¿Cuál es la pregunta a la que intenta responder?

1 votos

Entiendo su punto de vista - esto es una cosa de impar. Estoy probando la salida de una simulación bajo un gran número de configuraciones posibles, por lo que espero fallos a un nivel de significación del 1%. Pensé en combinar los resultados de cada configuración para obtener un único número AD*. No lo hice porque no me daría ninguna pista sobre qué configuración individual era defectuosa, y porque las configuraciones defectuosas han fallado (hasta ahora) esta prueba de forma espectacular. Veo que utilizando un nivel de significación del 0,1%, admitiré algunos fallos. ¿Quizás tenga que mirar la distribución de los resultados individuales de AD*?

0 votos

Sobre el comentario de Greg (+1): Me pregunto hasta qué punto los valores críticos extremos como el 0,1% se ven afectados por las diferentes medias y/o varianzas de la distribución normal subyacente. Después de todo, Matt menciona que está en el "caso 4".

0 votos

De acuerdo, la comprobación de los resultados de la simulación es uno de los pocos casos en los que la comprobación de las coincidencias de una distribución exacta tiene sentido. Pero en lugar de realizar pruebas con un alpa tan bajo, podría considerar la posibilidad de observar todas sus estadísticas de prueba en algún tipo de gráfico para buscar puntos inusuales (los cúmulos también podrían significar algo diferente).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X