9 votos

Diferencia entre supervisado de aprendizaje de la máquina y el diseño de experimentos?

Soy un físico experimental de formación y han estándar que se usan métodos estadísticos para analizar los datos, y el diseño de experimentos (DOE) marco de trabajo para desarrollar modelos de sistemas mediante la variación de los insumos y la medición de los resultados.

Recientemente, he estado mirando en el uso de la máquina de aprendizaje y estoy tratando de determinar si hay alguna utilidad/beneficio de más de DOE.

Estoy esperando que alguien de este foro puede validar la forma en que estoy pensando supervisado de aprendizaje de la máquina, o señalar lo que me estoy perdiendo.

Yo, básicamente, ha llegado a la conclusión de que supervisó la máquina de aprendizaje es un método para calcular la función de transferencia de un sistema, teniendo en cuenta los datos de entrenamiento es un conjunto de datos que conecta el conjunto de entradas con lo que la salida de la verdad debe ser.

A pesar de la maquinaria que se encarga de determinar la función de transferencia se basa en el conjunto de entrenamiento, ¿cuál es la diferencia entre el DOE y supervisado de aprendizaje de la máquina en términos de la exactitud o de otra medida de rendimiento de la función de transferencia?

Gracias!!

7voto

Aksakal Puntos 11351

Sustituir "supervisado ML" con "análisis de regresión", y verás que tu pregunta es de difícil respuesta. Dependiendo de cuán estrechamente a definir el análisis de regresión, DOE podría ser parte del término.

Supongamos que usted está planeando utilizar el análisis de regresión para determinar la eficiencia de un determinado herbicida en el campo. Uno de el primer paso sería diseñar el experimento. En este caso, yo diría que DOE es inseparable de su análisis de regresión, es parte de él.

En muchas aplicaciones de ML te dan los datos, y no puede hacer mucho acerca de la planificación de los experimentos, de hecho, no hay ningún experimento. Por ejemplo, en Kaggle competiciones de todo lo que se suele establecer por adelantado, el conjunto de datos de entrenamiento es pre-definido y dado, el conjunto de datos de prueba se dará en la evaluación paso, y no se puede hacer nada acerca de estas cosas. Es por eso que el DOE no se menciona al antiguo testamento en el campo.

Sin embargo, no tiene que ser de esta manera. Supongamos, está la construcción de auto-conducción de coches. Sí, como de costumbre, usted puede emplear todos los conjuntos de datos disponibles para entrenar a su ML componentes de visión, todas las imágenes con las señales de tránsito y situaciones de carretera, muy bien marcados, etc. No DOE involucrados aquí, de verdad. Sin embargo, una vez que estás fuera de la fase inicial, y obtener en las pruebas de campo, las cosas cambian. Todas las típicas preocupaciones de que DOE direcciones se muestran, por ejemplo, usted puede necesitar 10 coches de pruebas o 1.000 para obtener un resultado fiable? Usted necesita 1.000 millas o 1.000.000 de millas en la carretera vacía, antes de intentar la prueba del coche en una calle real? etc.

ML no necesariamente puede llamar DOE lo que hacen para el plan de desarrollo, pero en esencia es DOE. Por lo tanto, la respuesta a tu pregunta está en cómo de manera amplia o reducida definir ML plazo. Es simplemente ajuste la función a los datos utilizando el costo (pérdida)? O es una definición más general de la construcción de la máquina confiable que sustituye a los seres humanos, que incluiría más que ajuste/optimización, pero al menos algunos aspectos de la DOE.

6voto

Rob Gray Puntos 1556

Tu pregunta es difícil de responder, porque no hay ningún "supervisado ML algoritmo". Hay un gran número de diferentes ML de algoritmos que pueden ser optimizados en una supervisado de la moda, cada uno con sus fortalezas y debilidades.

En un nivel muy abstracto, se puede definir el Aprendizaje de Máquina (ML) como una búsqueda a través de algunos de espacio $P$ para una parametrización ($\theta$) de un determinado modelo de $M$ tal que $M(x;\theta)$ da un valor mínimo (aunque no siempre todo el mundo) para la función de costo ($\mathcal{C}$) y de entrada ($x$). Más formalmente:

$$\arg\min_{\theta\in P} \mathcal{C}(M(\theta))$$

Para aprendizaje supervisado, una forma de la función de costo se puede tomar es (dado $y$ como el suelo, la verdad):

$$\mathcal{C}(M(x; \theta)) = ||M(x;\theta) - y||_2$$

Cualquier búsqueda a través de $P$ que minimiza la función de costo se pueden encuadrar en este marco, y por lo tanto usted puede reclamar pérez como un ML algoritmo si se desea. Específicamente, un ML algoritmo se define por: la optimización de la técnica empleada, el modelo utilizado, y su función de costo. Si usted llena los DOE, usted puede comenzar a comparar con el resto de ML algoritmos.

4voto

Indio Puntos 1

Acabo de terminar un curso a nivel de posgrado en el diseño experimental y estoy empezando a aprender el aprendizaje de máquina... apuesto a que hay gente en este sitio web que puede responder a esta mejor que puedo, pero espero que esta respuesta va a hacer.

En sus núcleos, el diseño experimental (ED) y el aprendizaje de máquina (ML) tienen objetivos diferentes. El objetivo principal de la disfunción eréctil es evaluar la influencia de los tratamientos y, si procede, de comparar la influencia de los diferentes tratamientos. El objetivo principal de ML es para dar la exactitud de las predicciones.

Estos diferentes núcleos, así, influir en cómo cada tema es desarrollado:

  • En ED, se hace hincapié en el buen diseño, de manera que la variabilidad de tratamiento de las estimaciones de los parámetros) se reduce, a veces con la necesidad de cumplir con las restricciones presupuestarias. Mi ED profesor dijo una vez algo a la melodía de "los Estadísticos son siempre criticado por exigir una muestra de gran tamaño. Si usted fuera un estadista que trabaja en los misiles, el disparo de un misil es un par de millones de dólares por el desagüe". Diseños factoriales fraccionados, por lo que entiendo, son muy populares debido a las limitaciones presupuestarias. El objetivo principal de la disfunción eréctil es la inferencia estadística de los parámetros de tratamiento.
  • En ML, se hace hincapié en el uso de los algoritmos de predicción y los problemas detrás de ellos (por ejemplo, computacional compexity, software/hardware de los problemas, etc.).

Dada mi experiencia en ambos, no se intenta comparar las dos asignaturas. Es como comparar manzanas con naranjas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X