Publicado en MO ya que no tiene respuesta en MSE
Se sabe que el número de raíces reales de un polinomio aleatorio con coeficientes reales es mucho menor que el número de raíces complejas. Sin pérdida de generalidad, asumamos que los coeficientes son aleatorios uniformemente en $(-1,1)$, porque si no, podemos dividir cada coeficiente por el coeficiente con el mayor valor absoluto para escalar cada coeficiente a $(-1,1)$. Entonces, el número de raíces reales de un polinomio de grado $n$ es asintótico a $\displaystyle \frac{2\log n}{\pi} + o(1)$. Asíntoticamente similares se mantienen para otras distribuciones de los coeficientes, sin embargo, para el resto de esta publicación asumimos que los coeficientes son aleatorios uniformemente en $(-1,1)$. Esto significa que el número de raíces complejas es aproximadamente $\displaystyle n - \frac{2\log n}{\pi}$.
Definición 1: La mayor raíz de un polinomio es la raíz con el módulo más grande. Definición 2: La menor raíz de un polinomio es la raíz con el módulo más pequeño.
El gráfico anterior muestra las raíces de un polinomio de grado $101$; la raíz más grande está en la esquina superior derecha en color verde.
¿Es más probable que la raíz más grande o la más pequeña sea compleja o real? La suposición ingenua es que la raíz más grande o la más pequeña es más probable que sea compleja que real porque hay exponencialmente más raíces complejas que raíces reales, como se ve en la asíntota anterior.
Sin embargo, los datos experimentales muestran que
- La probabilidad de que la raíz más grande sea real es igual a la probabilidad de que la raíz más pequeña sea real y esta probabilidad es mayor que la de que cualquiera de ellas sea compleja.
- Esta probabilidad disminuye a $1/2$ conforme $n \to \infty$ como se muestra en el gráfico anterior (creado usando una simulación de Monte Carlo con $10^5$ pruebas para cada valor de $n$).
- Nota: En lugar de una distribución uniforme, si asumimos que los coeficientes están distribuidos normalmente con una media de $0$ y una desviación estándar de $1$ y escalados a $(-1,1)$, la observación anterior y las probabilidades límite se mantienen.
Es contraintuitivo que a pesar de ser considerablemente menos en número de forma exponencial, las raíces reales tienen más probabilidad de contener tanto las raíces más grandes como las más pequeñas. En este sentido, las raíces más grandes así como las más pequeñas están sesgadas hacia lo real.
Pregunta 1: ¿Cuál es la razón de este sesgo?
Pregunta 2: ¿Se acerca la probabilidad de que la raíz más grande (o la más pequeña) de un polinomio de grado $n$ sea real a $\frac{1}{2}$ conforme $n \to \infty$?
Actualización 2-Mayo-2024: Podemos cuantificar el sesgo observado de la siguiente manera. Sea $P(L|R)$ la probabilidad de que una raíz sea la más grande dado que es real y sea $P(L|C)$ la probabilidad de que una raíz sea la más grande dado que es compleja. De manera similar, sea $P(S|R)$ la probabilidad de que una raíz sea la más pequeña dado que es real y sea $P(S|C)$ la probabilidad de que una raíz sea la más pequeña dado que es compleja. Entonces, los datos experimentales indican que
$$ P(L|R) = P(S|R) \approx \frac{\pi}{4\log n}, $$
$$ P(L|C) = P(S|C) \approx \frac{\pi}{2n\pi - 4\log n}. $$
Relacionado: ¿Cuál es la probabilidad de que el valor absoluto de las raíces de un polinomio de grado $n$ sea mayor que $x$?