Clasificadores de aprendizaje automático big-O o complejidad

Question

Clasificadores de aprendizaje automático big-O o complejidad

Preguntado el 9 de Mayo, 2014: Cuando se hizo la pregunta
637 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Para evaluar el rendimiento de un nuevo algoritmo clasificador, intento comparar la precisión y la complejidad (big-O en entrenamiento y clasificación). En Aprendizaje automático: una revisión Obtengo una lista completa de clasificadores supervisados, también una tabla de precisión entre los algoritmos, y 44 problemas de prueba de Depósito de datos de la UCI . Sin embargo, no puedo encontrar una revisión, documento o sitio web con la gran-O para clasificadores comunes como:

C4.5
RIPPER (Creo que esto podría no ser posible, pero quién sabe)
RNA con retropropagación
Bayesiano ingenuo
K-NN
SVM

Si alguien tiene alguna expresión para estos clasificadores, será muy útil, gracias.

Preguntado el 9 de Mayo, 2014 por Chris B.

2 votos

Quizá le interese el siguiente artículo : thekerneltrip.com/máquina/aprendizaje/ Aviso legal, es mi blog :)

Comentado el 13 de Abril, 2018 por Even Mien

0 votos

¿Le importaría rastrear los lugares a los que apuntaban los enlaces ahora muertos de la pregunta?

Comentado el 19 de Abril, 2018 por RexE

0 votos

@RUser4512 ¡muy buena deliberación en el blog! ¿has considerado añadir también la complejidad del espacio?

Comentado el 19 de Abril, 2018 por RexE

Mostrar 1 comentarios más

Answer 1

1 Respuestas

Answer 2

15voto

Just a lil kid Puntos 97

Sea $N$ = número de ejemplos de entrenamiento, $d$ = dimensionalidad de las características y $c$ = número de clases.

Luego la formación tiene complejidades:

Naive Bayes es $O(Nd)$ todo lo que tiene que hacer es calcular la frecuencia de cada valor de característica $d_i$ para cada clase.
$k$ -NN está en $\mathcal{O}(1)$ (algunos incluso dicen que es inexistente, pero la complejidad espacial de la formación es $\mathcal{O}(Nd)$ ya que hay que almacenar los datos, lo que también lleva tiempo).
La SVM no lineal no aproximada es $O(N^2)$ o $O(N^3)$ dependiendo del núcleo. Puede obtener un $O(N^3)$ hasta $O(N^{2.3})$ con algunos trucos.
La SVM aproximada es $O(NR)$ donde R es el número de iteraciones.

Complejidad de las pruebas:

Naive Bayes está en $\mathcal{O}(cd)$ ya que tiene que recuperar $d$ valores de las características de cada $c$ clases.
$k$ -NN está en $\mathcal{O}(Nd)$ ya que tiene que comparar el punto de prueba con cada punto de datos de su base de datos.

Fuente: "Core Vector Machines: Entrenamiento rápido de SVM en conjuntos de datos muy grandes" - http://machinelearning.wustl.edu/mlpapers/paper_files/TsangKC05.pdf

Lo siento, no sé nada de los demás.

Respondido el 10 de Mayo, 2014 por Just a lil kid (97 Puntos )

6 votos

No es del todo correcto: la complejidad de entrenamiento de kernel SVM está entre $O(n^2)$ y $O(n^3)$ en función de C Véase, por ejemplo Solucionadores de máquinas de vectores soporte de Bottou y Lin (sección 4.2).

Comentado el 10 de Mayo, 2014 por Marc Claesen

0 votos

@MarcClaesen El enlace ya no funciona y no está en wayback machine. Es el mismo artículo: leon.bottou.org/publicaciones/pdf/lin-2006.pdf ?

Comentado el 4 de Febrero, 2019 por conor

Clasificadores de aprendizaje automático big-O o complejidad

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Clasificadores de aprendizaje automático big-O o complejidad

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: