1 votos

Prueba de significación estadística para el problema de la clasificación

Estoy comparando cuatro algoritmos para el problema de la clasificación. Mi configuración actual del experimento es la siguiente

1) He dividido los datos en entrenamiento, validación y prueba

2) Ejecuto los cuatro algoritmos y obtengo los valores de las métricas de rendimiento (nDCG, MAP, Precisión, etc., un total de 5 métricas) para cada algoritmo en los datos de prueba y los almaceno.

3) Realizo el procedimiento anterior (1 y 2) 10 veces, y tengo el resultado para los cuatro algoritmos, para cada algoritmo una tabla de 50 valores (1o iteraciones y 5 métricas de rendimiento).

Ahora, me gustaría hacer la significación estadística de mi algoritmo frente a los otros tres algoritmos. Cuál es la mejor prueba para esto, y cómo hacerlo ?, y si hay un procedimiento readymade en matlab, R, python o octava, puede usted por favor me indican ?

1voto

user1219801 Puntos 50

Prueba de Friedman sería apropiado en este caso. La hipótesis nula de esta prueba es que no hay una diferencia significativa entre esos algoritmos. Si se rechaza la hipótesis nula, habrá que realizar una prueba post-hoc como la de Nemenyi para comprobar si la diferencia de rendimiento de esos algoritmos es estadísticamente significativa o no.

En R, puede realizar la prueba de Friedman utilizando friedman.test . Para la prueba post-hoc, véase PMCMR paquete.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X