Una forma común de formalizar polinomios sobre algún anillo $R$ (conmutativo con identidad, y digamos no trivial para evitar algunas patologías) es como secuencias de elementos en $R$ que finalmente son $0$ .
De forma más general, consideremos $R^{\mathbb{N}}$ el conjunto de todas las secuencias en $R$ y $R^{(\mathbb{N})}$ el subconjunto de secuencias que eventualmente $0$ .
Así, en la primera los elementos son $(a_0, a_1, a_2, \dots)$ con $a_i \in R$ y en esta última sólo se tienen aquellas secuencias que a partir de algún momento tienen $a_i = 0$ .
Entonces, definiendo $+$ por coordenadas se obtiene un grupo abeliano finito y se puede definir una operación de multiplicación diciendo $(a_0, a_1, a_2, \dots)(b_0, b_1, b_2, \dots)$ es igual a $(c_0, c_1, c_2, \dots)$ donde $c_i = \sum_{k+j=i}a_ib_j$ . Entonces $R^{\mathbb{N}}$ se convierte en un anillo y $R^{(\mathbb{N})}$ un subring.
Ahora, interpreta $(0,1, 0, \dots)$ como "la variable $X$ " y verás que $R^{(\mathbb{N})}$ con estas operaciones "es" sólo el anillo de polinomios. El otro anillo sería el de las series de potencias formales.
Así, en cierto sentido, un polinomio es sólo su secuencia de coeficientes.
Como has comentado pensar en los polinomios como mapas puede llevar a problemas. Es cierto en toda su generalidad que a cada polinomio se le puede asociar una función $R$ a $R$ Sin embargo, este mapa $R[X] \to R^R$ es en general no inyectiva (nótese que para un anillo finito esta última es finita mientras que la primera no lo es). Y, por tanto, no se puede identificar un polinomio con la función que induce.
Es inyectiva si y sólo si $R$ es un dominio infinito. (Tangencialmente, es suryectiva si y sólo si $R$ es un campo finito).
Así, por ejemplo, para los números reales sí se pueden identificar polinomios con funciones polinómicas. Sin embargo, es útil tener en cuenta que un polinomio no es en sí mismo una función real, pero puede utilizarse para definir una.
En cuanto al punto específico de la demostración del teorema de Wilson, esto se aborda principalmente en el comentario de anon, pero permítanme enmarcarlo de otra manera.
Dado que cada elemento de $\mathbb{Z}_p$ es una raíz del polinomio $X^p - X$ se deduce que $(X-i) \mid X^p - X$ para cada $i \in \mathbb{Z}_p$ [para probar esto haz una división polinómica, y observa que el resto debe ser $0$ ] y por tanto [como los factores son coprimos y estamos en una UFD] $X(X-1) \dots (X- (p-1)) \mid X^p - X$ . Así, para algún polinomio $Q$ tenemos $QX(X-1) \dots (X- (p-1))= X^p - X$ . Sin embargo, teniendo en cuenta el grado vemos que $Q$ es constante y comparando los coeficientes principales vemos que $Q=1$ . Por lo tanto, $X(X-1) \dots (X- (p-1))= X^p - X$ .