4 votos

¿Cómo se hace exactamente de la máquina de la teoría del aprendizaje/trabajo, ayuda en los problemas prácticos?

Para los últimos 3 meses, he ido a través de una máquina en la teoría de aprendizaje del curso que se centra exclusivamente en la teoría. Se cubrió muchos de los conceptos oscuros, como L1/L2 de regularización, mal acondicionado,dispersión, VC dimensión, el gradiente de la pendiente, la regresión logística, la entropía, la ganancia de información, la distancia Euclídea-y las matemáticas detrás de ella.

Lo más confuso para mí es: ¿Cómo es exactamente la máquina de la teoría del aprendizaje de trabajo en los problemas prácticos? Es que vale la pena conocer todos los detalles técnicos y de matemáticas de las pruebas?

Después de leer la teoría de los materiales y saber cómo el algoritmo se construyen, todavía no sé que cosas como "el uso de un menos complicado algoritmo de primera", "¿qué tipo de algoritmo es más complicado", "¿qué tipo de algoritmo debe ser elegido a la hipótesis o qué tipo de problema es el que se puede aprender", "cómo ofrecer un derecho hyperplane o hacer buenas características para adaptarse al modelo", etc.

1voto

David Puntos 41

La pregunta es demasiado amplia como para que me conteste.

Pero la teoría es siempre importante cuando se vienen para el diseño de los algoritmos. Piense acerca de cómo el popular algoritmos de aprendizaje automático, tales como la Red Neuronal, se necesita saber cuál es el gradiente de / cómo calcular el gradiente, para construir el modelo de datos.

Si su trabajo diario es la descarga de programas y ejecutar en sus datos, sin entender, la teoría puede no ser muy útil. Pero si usted está trabajando en el diseño del algoritmo / la persona a inventar nuevos modelos, la teoría es esencial.

Además, los términos que usted ha mencionado (L1/L2 de regularización, mal acondicionado,dispersión, VC dimensión, el gradiente de la pendiente, la regresión logística, la entropía, la ganancia de información) son muy importantes en la mayoría de los piratas problemas también.

Por ejemplo,

  • L1 regularización dará una más escasa sistema, que puede ahorrar tiempo en la ejecución de la producción. Pero comparar a L2, es más difícil para optimizar, esto significa que necesitamos más tiempo para construir el modelo.

  • enfermo acondicionado / numérico de la estabilidad es también muy importante. Muchos algoritmos se trabajará en la teoría pero no en la práctica porque los ordenadores sólo puede representar a un grande o en pequeño número en cierto grado.

0voto

Srneczek Puntos 108

Esta es una buena pregunta, yo estaba en esta posición yo mismo hace un tiempo y se siente muy desalentador.

Conocer la teoría es muy importante en el uso de la máquina de aprendizaje en la práctica. Sin la teoría de aprendizaje de la máquina sólo se convierte en caja negra puede enviar los datos a obtener una respuesta. Gran si la representación gráfica de un conjunto de sentido x y y de un ejemplo no le importa; pero terrible si usted realmente desea hacer uso de el resultado. Un simple ejemplo de esto sería la regresión de orden superior, de regresión (por ejemplo. aX^2+bX+c) casi siempre te dan un mejor ajuste a los datos. Usted puede probar esto con cualquier programa para la representación de datos y la búsqueda de la línea de mejor ajuste (excel es lo que tengo en mente). Como aumentar el orden del polinomio de su error, o R al cuadrado de los valores de los enfoques 1 (1, ajuste perfecto). Parece una obviedad, whak la orden de hasta el 100 y conseguir su perfecta línea de mejor ajuste. Sin embargo, si has comprendido el camino de la regresión funciona como usted sabe, como el número de cuenta en la regresión (X^2,X^1,X^0) aumenta la necesidad de más datos se ajustan a estas características. Este es especialmente el caso cuando usted está considerando la extrapolación a la interpolación. La comprensión de la forma en que funciona el modelo permite utilizar el tipo correcto de modelo para los datos, y obtener respuestas útiles; respuestas que usted entienda el alcance y las limitaciones de.

Así sabemos por qué la teoría de la materia. Pero fuera de la simple ejemplo acerca de ¿cómo saber cuál es el modelo a utilizar. Es una pregunta difícil.

Una buena regla del pulgar leí hace muchos años en este sitio se desea, al menos, 15 veces el número de puntos de datos como tiene características, este es lidiar con el sobreajuste - pero esto no es siempre posible en mi experiencia.

Otra buena regla es elegir un modelo que se siente como el problema. Tengo un problema con el periódico de datos (subidas y bajadas) tal vez piense acerca de lo que los modelos que usted sabe que puede utilizar una onda seno.

Un duro regla es que no hay que confundir la regresión y clasificación de problemas, sentido de la ronda de 1.5 hasta 2, no tiene sentido para la ronda de Rojo a Azul.

Un modelo con menos características es más simple. Modelos simples tienden a optimizar de manera más rápida.

Esta es la regla más importante: si usted realmente no entiende la forma en que funciona el modelo anote el tipo de resultado que usted espera (y aumenta wrt x^2, casas con más habitaciones se venden por más dinero, etc.) entonces, si su modelo no está de acuerdo ya sea encontrar una muy, muy buena razón por la que su intuición era malo o aceptar que usted no sabe lo que ha sucedido y este modelo no es para usted hasta que usted ha hecho más a la lectura.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X