La noción de normalidad no tiene nada que ver aquí. Dejemos que $A\in M_n(\mathbb{C})$ s.t. $A$ es diagonalizable.
$\textbf{Poposition}$ . Si $dim(\ker(A))\leq 1$ entonces cada una de sus raíces cuadradas es diagonalizable. En caso contrario, hay una de sus raíces cuadradas que no es diagonalizable.
$\textbf{Proof}$ . Caso 1. Supongamos que $dim(\ker(A))=1$ podemos suponer que $A=diag(0,\lambda _1 I_{p_1},\cdots,\lambda_{n-1} I_{p_{n-1}})$ donde el $(\lambda_i)$ son distintos de cero, distintos y $1+p_1+\cdots+p_{n-1}=n$ . Si $B$ es una raíz cuadrada de $A$ entonces $AB=BA$ y $B$ es de la forma $diag(0,B_1,\cdots,B_{n-1})$ , donde $B_i^2=\lambda_i I_{p_i}$ . Entonces, cada $B_i$ es diagonalizable y $B$ también. Resolvemos el caso $A$ invertible de la misma manera.
Caso 2. Si $dim(\ker(A))=k\geq 2$ entonces $A_{|\ker(A)}=0$ admite una raíz cuadrada de la forma $diag(\begin{pmatrix}0&1\\0&0\end{pmatrix},0_{k-2})$ que no es diagonalizable. Por lo tanto, obtenemos unos $B$ que no es diagonalizable.
Observación. Por supuesto, podemos generalizar el resultado anterior. Sea $f$ sea una función holomorfa y consideremos la ecuación $f(B)=A$ Entonces las soluciones $B$ son diagonalizables si, para cada $\lambda\in spectrum(A)$ la ecuación $f(x)=\lambda$ sólo tiene raíces simples O tiene raíces múltiples pero, en este caso, el valor propio $\lambda$ es simple..