Actualmente estoy en un proyecto en el que básicamente necesito, como todos, entender cómo la salida $y$ está relacionado con la entrada $x$ . La particularidad aquí es que los datos $(y,x)$ se me da una pieza a la vez, por lo que quiero actualizar mi análisis cada vez que reciba un nuevo $(y,x)$ . Creo que esto se denomina procesamiento "en línea", a diferencia del procesamiento "por lotes", en el que se tienen todos los datos necesarios y se realizan los cálculos utilizando todos los datos al mismo tiempo.
Así que he buscado ideas y finalmente he llegado a la conclusión de que el mundo se divide en tres:
-
La primera parte es el terreno de la estadística y la econometría. La gente hace OLS, GLS, variables instrumentales, ARIMA, pruebas, diferencia de diferencias, PCA y demás. Esta tierra está dominada en su mayoría por la linealidad y hace sólo el procesamiento "por lotes".
-
La segunda parte es la isla del aprendizaje automático y otras palabras como inteligencia artificial, aprendizaje supervisado y no supervisado, redes neuronales y SVM. Aquí se realiza tanto el procesamiento "por lotes" como el "en línea".
-
La tercera parte es todo un continente que acabo de descubrir, poblado en su mayoría por ingenieros eléctricos, según parece. Allí, la gente suele añadir la palabra "filtro" a sus herramientas, y han inventado grandes cosas como el algoritmo Widrow-Hoff, Mínimos cuadrados recursivos El Filtro Wiener El Filtro Kalman y probablemente otras cosas que aún no he descubierto. Al parecer, hacen sobre todo la tramitación "en línea", ya que se adapta mejor a sus necesidades.
Así que mi pregunta es, ¿tiene usted una visión global de todo esto? Tengo la impresión de que estas tres partes del mundo no se hablan demasiado entre sí. ¿Me equivoco? ¿Existe una gran teoría unificada para entender cómo $Y$ Se refiere a $X$ ? ¿Conoce algún recurso donde se puedan sentar las bases de esa teoría?
No sé si esta pregunta tiene realmente sentido, pero estoy un poco perdido entre todas esas teorías. Imagino que la respuesta a la pregunta "¿debo usar esto o aquello?" sería "depende de lo que quieras hacer (y de tus datos)". Sin embargo siento que esos tres mundos tratan de responder a la misma pregunta ( $y=f(x)$ ?) y así debería ser posible tener una visión más elevada de todo esto, y comprender en profundidad lo que hace que cada técnica sea particular.