¿Quién utilizó por primera vez "early stopping" para referirse a una forma de regularización que consiste en detener el entrenamiento antes de la convergencia? He intentado buscar por mi cuenta pero no estoy seguro de cómo encontrar la respuesta.
¿Se utilizaba el término en estadística antes de las redes neuronales, por ejemplo?