Ahora el argumento en favor de la MSE.
Considere la posibilidad de una Pérdida o función de Coste debido a la desviación, $L=L(d)$. Queremos que tienen ciertas propiedades razonables para hacer el trabajo que se pretende hacer.
Una de esas propiedades es $L(0) = 0$.
Otra es que el $L(0)$ es un mínimo global. Pero entonces, y si es diferenciable en a $d=0$, tendremos $\partial L(0)/\partial d =0$, pero también se $\partial^2 L(0)/\partial d^2 >0$.
Una tercera condición es la que está en todas partes en aumento en $d$.
Considere ahora su 2º orden expansión de Taylor alrededor de cero (McLaurin):
$$L(d) \approx L(0) + \frac {\partial L(0)}{\partial d} \cdot d + \frac 12 \frac {\partial^2 L(0)}{\partial d^2}\cdot d^2 = \frac 12 \frac {\partial^2 L(0)}{\partial d^2}d^2$$
...ya que los dos primeros términos son cero dadas las propiedades que queremos que la función tiene. También, el último término es positivo, y depende del cuadrado de la desviación, por lo que es simétrica para negativos y positivos de las desviaciones.
Llegamos a la conclusión de:
Si como nuestra función de Pérdida podemos utilizar una función diferenciable en a $d=0$, entonces la desviación de costes (especialmente para las pequeñas desviaciones) puede ser aceptablemente modelada como una función lineal de la desviación cuadrática.
Esta parece una muy general y poderoso argumento en favor de las PYME en todos los casos, pero hay dos sutil y puntos críticos que debilitan:
1) la diferenciabilidad en $d=0$ es exactamente lo que se pierde en la mayoría de los casos donde el mundo real de la situación indica que los costes son asimétricas negativas y positivas desviaciones.
2) Para pasar de "error cuadrado" a la "espera del error cuadrado" debemos considerar la $L(d)$ como una variable aleatoria. Pero entonces, si uno va a utilizar $E[L(d)]$ o de alguna otra "medida de la concentración", se vuelve discutible y abierto a los argumentos, teórica y aplicada.
Aquí es donde la conveniente propiedades del valor esperado entran en juego, siendo un operador lineal en la teoría y se estima que por ejemplo los medios en los trabajos aplicados.