La pregunta se refiere a la maximización de la probabilidad, la cual es una función de un único parámetro $\rho \in [-1,1]$, encontrando sus puntos críticos. Entre ellos se encuentran los ceros de la derivada del logaritmo de la probabilidad. En este caso, el derivado del registro de probabilidad es una función racional de $\rho$: el numerador es un polinomio cúbico y el denominador es un polinomio de cuarto grado (igual a $(1-\rho^2)^2$). Desde cualquier polinomio cúbico puede tener hasta tres raíces reales, ¿cómo podemos estar seguros de que hay un único máximo de la probabilidad?
Bien, no podemos: como Lehmann señala, no pueden ser dos de los máximos locales. Pero no más que eso. La razón es que cuando hay dos (en cualquier lugar entre los números reales, no sólo en el rango de $[-1,1]$), debido a que cualquier polinomio es diferenciable-debe de haber un mínimo local que se extiende entre ellos. Que mínimo local corresponde a un tercio de la raíz, y que todo no puede ser.
Este argumento puede ser apreciado por mirar a los gráficos de algunas de las funciones que muestran en realidad. En ambas figuras, el azul de puntos de la curva de parcelas en el registro de la probabilidad, la roja discontinua de la curva de parcelas de sus derivados, y el oro sólido de la curva es el numerador de la derivada--el polinomio cúbico en la pregunta.
(Esta situación sólo puede surgir cuando ambos $\sum x_i^2$ $\sum y_i^2$ son sensiblemente menos de $n$, que es cada vez más improbable como $n$ crece grande. En esta figura, ambos valores se $0.08 n$.)
Usted puede ver dos de los máximos locales de la sesión likelood, uno cerca de cada extremo. Entre ellos, por lo tanto, debe haber un mínimo local, y es evidente en la parte inferior de la poca de la "U" de la curva cerca de $\rho=0$. Tres ceros de la derivada y su numerador son visibles donde el rojo y el dorado de las curvas de la cruz de la $\rho$ eje: uno de ellos está muy cerca de a $0$, uno es negativo y el otro positivo. (Esta es una situación en la que los datos son tan inconsistentes con el modelo que el método de probabilidad máxima de no hacer un buen trabajo en la estimación de $\rho$, que en este caso es $0.13$.)
La siguiente figura es más realista. El valor de $\rho$ es el mismo pero esta vez $\sum x_i^2 = n = \sum y_i^2$. La derivada tiene exactamente un cero real, y (por tanto) la probabilidad tiene un máximo local en el interior del dominio, $(-1,1)$.
Tenga en cuenta que $\pm 1$ son siempre puntos críticos (la derivada se convierte en ilimitado medida que se aproxima a estos extremos) y deben ser siempre consideradas. Sin embargo, no es difícil mostrar que nunca volverán a ser los máximos locales, a menos que los datos están perfectamente correlacionados o perfectamente anticorrelated.