Tendré que estar en desacuerdo con la mayoría de las respuestas aquí y afirmar que Aprendizaje automático tiene un alcance muy preciso y una clara distinción de las estadísticas. El ML es un subcampo de la informática con una larga historia, que sólo en los últimos años ha encontrado aplicaciones fuera de su dominio. El campo paterno de ML y su dominio de aplicación se encuentra dentro de la Inteligencia Artificial (robótica, software de reconocimiento de patrones, etc.), por lo tanto, no es sólo un "término de moda" como "Big Data" o "Data Science". La estadística, por otro lado, (que viene de la palabra "estado") se desarrolló dentro de las ciencias sociales y económicas como una herramienta para los humanos, no para las máquinas. El ML evolucionó por separado de la estadística y, aunque en algún momento comenzó a basarse en gran medida en los principios estadísticos, no es en absoluto un subcampo de la estadística. El ML y la estadística son campos complementarios, no superpuestos.
Respuesta larga :
Como su nombre indica, los métodos de ML se crearon para el software o las máquinas, mientras que los métodos estadísticos se crearon para los humanos. Tanto el ML como la estadística se ocupan de las predicciones sobre los datos, pero los métodos de ML siguen un enfoque automatizado no paramétrico, mientras que los métodos estadísticos requieren una gran cantidad de trabajo manual de construcción de modelos con un factor explicativo añadido. Esto tiene mucho sentido si se tiene en cuenta que los algoritmos de ML se desarrollaron en la investigación de la IA como un medio de predicción automatizada destinado a integrarse en el software de robótica (por ejemplo, para el reconocimiento de la voz y la cara). Cuando una "máquina" hace una predicción, no le importan las razones que hay detrás. A una máquina no le importa conocer los impulsores/predictores que hay detrás de un modelo que clasifica el correo electrónico como spam o no spam, sólo le importa tener la mejor precisión de predicción. Por eso, prácticamente todos los métodos de ML son cajas negras No es porque no tengan un modelo, es porque el modelo se construye algorítmicamente y no está pensado para que sea visible ni para los humanos ni para las máquinas.
El concepto de "entrenamiento" en el ML se basa en la capacidad de cálculo, mientras que la construcción de modelos estadísticos con métodos de tipo OLS para la estimación de parámetros se basa en los conocimientos de un experto humano. En un escenario de regresión múltiple, depende estrictamente del estadístico utilizar su juicio experto para elegir su modelo y verificar todos los supuestos estadísticos necesarios. El objetivo de un estadístico no es sólo encontrar patrones y utilizarlos para hacer predicciones, sino también comprender sus datos y su problema con mucha más profundidad que el ML.
Por supuesto, en algunas ocasiones el ML y la estadística se solapan, como ocurre con muchas disciplinas. La regresión logística es una de estas ocasiones; originalmente un método estadístico, que se parece tanto al simple Perceptrón (una de las técnicas más fundamentales de ML), que algunos lo consideran un método de ML.