Estoy agregando una respuesta separada para la pregunta general que la OP hizo, que resuelve la pregunta en forma negativa para todos $n>2$ (y da una prueba alternativa para $n=3$ a la que di arriba).
Recordemos que la OP definió una secuencia de funciones algebraicas $f_n$ por la regla $f_0(x) = 1$ , $f_1(x) = \sqrt {x+1}$ y $f_{n+1}(x) = \sqrt {x + f_n(x)}$ para todos $n \ge 1$ . Se observó que $f_n$ tiene un antiderivado elemental para $n=0$ , $1$ y $2$ y el problema era determinar si $f_n$ tiene un antiderivado elemental para algunos $n>2$ .
Voy a demostrar que no hay ningún antiderivado elemental de $f_n$ cuando $n>2$ .
Supongamos que $n>2$ (NB: Esto es importante, porque el argumento a continuación no trabajar para $n \le2 $ el lector puede disfrutar encontrando donde se descompone), y dejar $K_n = { \mathbb C} \bigl (x,f_n(x) \bigr )$ ser el campo diferencial elemental generado por $x$ y $f_n(x)$ . Luego $K_n$ es el campo de las funciones meromórficas en la normalización $ \hat C_n$ de la curva algebraica $C_n$ definido por el grado mínimo $y$ -polinomio amónico $P_n(x,y)$ que satisface $P_n \bigl (x,f_n(x) \bigr ) \equiv 0$ . Este grado mínimo es $2^n$ por ejemplo, $P_2(x,y) = (y^2-x)^2-x-1$ y $P_3(x,y) = \bigl ((y^2-x)^2-x \bigr )^2-x-1$ etc.
Desde $P_{n+1}(x,y) = (P_n(x,y)+1)^2-x-1$ para $n \ge 1$ con $P_1(x,y)=y^2-x-1$ se ve, aplicando el Criterio de Eisenstein a $P_n(x,y)$ considerado como un elemento de $D[y]$ con $D$ siendo el dominio integral ${ \mathbb C}[x]$ que $P_n(x,y)$ es irreducible para todos $n \ge 1$ . Por lo tanto, $ \hat C_n$ está conectado.
Será importante en lo que sigue observar que $K_n$ tiene una involución $ \iota $ que arregla $x$ y envía $f_n(x)$ a $-f_n(x)$ Esto es porque $P_n(x,y)$ es un polinomio uniforme en $y$ . El campo fijo de $ \iota $ es ${ \mathbb C} \bigl (x,\,f_n(x)^2 \bigr )$ y el $(-1)$ -espacio propio de $ \iota $ es ${ \mathbb C} \bigl (x,\,f_n(x)^2 \bigr )f_n(x) = K_{n-1}{ \cdot }f_n(x)$ .
Ahora, la curva $C_n \subset \mathbb {CP}^2$ tiene sólo un punto en la línea del infinito, a saber $[1,0,0]$ pero la normalización $ \hat C_n$ tiene $2^{n-1}$ puntos que se encuentran sobre este punto. Pueden ser parametrizados de la siguiente manera: Primero, establecer la convención que $ \sqrt {u}$ significa que la función analítica única en el complejo $u$ -aplano menos su eje negativo y $0$ que satisface $ \sqrt1 = 1$ y $ \bigl ( \sqrt {u} \bigr )^2 = u$ . Deje que $ \epsilon = ( \epsilon_1 , \ldots , \epsilon_ {n-1})$ ser cualquier secuencia con ${ \epsilon_k }^2=1$ y considerar la secuencia de funciones $g^ \epsilon_k (t)$ definido por los criterios $g^ \epsilon_1 (t) = \sqrt {1+t^2}$ y $g^ \epsilon_ {k+1}(t) = \sqrt {1+ \epsilon_ {n-k}t g^ \epsilon_k (t)}$ para $1 \le k < n$ . Elegir, como se puede, un $ \delta_n >0$ suficientemente pequeño para que, cuando $t$ es complejo y satisface $|t|< \delta_n $ todas las funciones $g^ \epsilon_k $ son analíticos cuando $|t|< \delta_n $ . En particular, se encuentra una expansión $$ g^ \epsilon_n (t) = 1+ \tfrac12\epsilon_1\ ,t + \tfrac18 (2 \epsilon_1\epsilon_2 -1)t^2 + O(t^3). $$
Además, es fácil verificar que el disco en $ \mathbb {CP}^2$ definido por $$ [x,y,1] = [1,\ t g^ \epsilon_n (t),\ t^2] \qquad\text {for} \quad |t|< \delta_n $$ es una parametrización no singular de una rama de $C_n$ en un barrio del punto $[1,0,0]$ . En la normalización $ \hat C_n$ esto es entonces una parametrización local de un vecindario de un punto $p_ \epsilon\in \hat C_n$ . Obviamente, esto describe $2^{n-1}$ puntos distintos sobre $ \hat C_n$ .
Cuando $x$ y $f_n$ se consideran funciones meromórficas en $ \hat C_n$ , se deduce que hay una carta de coordenadas locales única $t_ \epsilon :D_ \epsilon\to D(0, \delta_n ) \subset \mathbb {C}$ de un disco abierto $D_ \epsilon\subset \hat C_n$ sobre $p_ \epsilon $ de tal manera que $t_ \epsilon (p_ \epsilon )=0$ y en cuál tiene fórmulas $$ x = \frac1 {{t_ \epsilon }^2} \quad\text {and} \quad f_n(x) = \frac {g^ \epsilon_n (t_ \epsilon )}{t_ \epsilon } = \frac {1+ \tfrac12\epsilon_1\ t_ \epsilon + \tfrac18 (2 \epsilon_1\epsilon_2 -1)\ {t_ \epsilon }^2} {t_ \epsilon } + O({t_ \epsilon }^2). $$ En particular, se deduce que $f_n(x)$ como una función meromórfica en $ \hat C_n$ , tiene un divisor polar igual a la suma de la $p_ \epsilon $ y por lo tanto tiene el grado $2^{n-1}$ . Por supuesto, esto implica que el divisor cero de $f_n(x)$ en $ \hat C_n$ debe ser de grado $2^{n-1}$ también.
Tenga en cuenta que las funciones $g^ \epsilon_k $ satisfacer $g^{- \epsilon }_k(-t) = g^{ \epsilon }_k(t)$ donde $- \epsilon = (- \epsilon_1 , \ldots ,- \epsilon_ {n-1})$ . Esto implica que $ \iota (p_ \epsilon ) = p_{- \epsilon }$ y que $t_ \epsilon\circ\iota = -t_{- \epsilon }$ .
Ahora, el $2^{n-1}$ ceros de $f_n(x)$ en $ \hat C_n$ son distintos, ya que son los ceros del polinomio $q_n(x) = P_n(x,0) = (q_{n-1}+1)^2-x-1$ y el discriminante de $q_n$ siendo el resultado de $q_n$ y $q_n'$ es claramente un entero impar, y por lo tanto no es cero. Por lo tanto, $C_n$ es una doble cubierta ramificada de $C_{n-1}$ se ramificó exactamente donde $f_{n}$ tiene sus ceros. Esto induce una cubierta ramificada $ \pi_n : \hat C_n \to \hat C_{n-1}$ que es exactamente el cociente de $ \hat C_n$ por la involución $ \iota $ (cuyos puntos fijos son donde $f_n$ tiene sus ceros). Desde entonces uno tiene la fórmula de Riemann-Hurwitz $$ \chi ( \hat C_n) = 2 \chi ( \hat C_{n-1}) - B_n = 2 \chi ( \hat C_{n-1}) - 2^{n-1}, $$ y $ \chi ( \hat C_1) = \chi ( \hat C_2) = 2$ La inducción da $ \chi ( \hat C_n) = (3{-}n)2^{n-1}$ así que el género de $ \hat C_n$ es $(n{-}3) 2^{n-2} + 1$ . (Esto no será realmente necesario abajo, pero es interesante.)
Los únicos polos de $x$ y $f_n(x)$ en $ \hat C_n$ son los puntos $p_ \epsilon $ , y el cálculo usando las expansiones anteriores muestra que, en un barrio de $p_ \epsilon $ se tiene una expansión de la forma $$ f_n(x)\, \mathrm {d} x - \mathrm {d} \left (f_n(x) \bigl ( \tfrac12\ x + \tfrac16\ f_n(x)^2 \bigr ) \right ) = \left ( \frac { (1- \epsilon_1\epsilon_2 ) } {4{t_ \epsilon }^2} + O({t_ \epsilon }^{-1}) \right )\ \mathrm {d} t_ \epsilon\ . $$ Así, el diferencial meromórfico $ \eta $ en $ \hat C_n$ definido por el lado izquierdo de esta ecuación tiene, en el peor de los casos, polos dobles en los puntos $p_ \epsilon $ y ningún otro polo.
Ahora, por el Teorema de Liouville, $f_n$ tiene un antiderivado elemental si y sólo si $f_n(x)\ \mathrm {d} x$ y, por lo tanto, la forma $ \eta $ son expresables como combinaciones lineales finitas de diferenciales exactos y diferenciales logarítmicos. Por lo tanto, $f_n(x)$ tiene un antiderivado elemental si y sólo si $ \eta $ es expresable en la forma $$ \eta = \mathrm {d} h + \sum_ {i=1}^m c_i\, \frac { \mathrm {d} g_i}{g_i} $$ para algunos $h,g_1, \cdots g_m \in K_n$ y algunas constantes $c_1, \ldots ,c_m$ . Supongamos que existen. Desde $ \eta $ tiene, en el peor de los casos, polos dobles en el $p_ \epsilon $ y ningún otro polo, se deduce que $h$ debe tener, en el peor de los casos, simples postes en los puntos $p_ \epsilon $ y ningún otro polo; de hecho, $h$ se determina de manera única hasta una constante aditiva porque su expansión a $p_ \epsilon $ en términos de $t_ \epsilon $ debe ser de la forma $$ h = \frac { \epsilon_1\epsilon_2 -1}{4t_ \epsilon } + O(1). $$
Además, porque $ \eta $ es impar con respecto a $ \iota $ se deduce que $h$ (después de añadir una constante adecuada si es necesario) también debe ser impar con respecto a $ \iota $ . Esto implica, en particular, que $h$ se desvanece en cada uno de los ceros de $f_n$ (que, por el argumento anterior, son simples ceros). Esto implica que $h = r\,f_n$ para algunos $r \in K_{n-1}$ que no tiene polos y satisface $r(p_ \epsilon ) = ( \epsilon_1\epsilon_2 -1)/4$ para cada uno $ \epsilon $ . Sin embargo, ya que $r$ no tiene polos y $ \hat C_n$ está conectado, de lo que se deduce que $r$ es constante. Por lo tanto, no puede tomar los dos valores distintos $0$ y $-1/2$ como la ecuación $r(p_ \epsilon ) = ( \epsilon_1\epsilon_2 -1)/4$ implica.
Así, el deseado $h$ no existe, y $f_n$ no puede ser integrado en términos elementales para ninguna $n>2$ .