Me gusta saulspatz' respuesta porque es muy práctico. Me gustaría ofrecer otra perspectiva, basada en el hecho de que las transformaciones lineales se caracterizan por sus filas, hasta la elección de las bases en el dominio y codominio. La clave está en esta proposición:
La proposición. Supongamos $T\colon V\to W$ es una transformación lineal con $\dim V = n$ e $\dim W = m$ e $\operatorname{rank} T = r \leqslant m$. Luego están las bases de $v_1,\dots,v_n$ para $V$ e $w_1,\dots,w_m$ para $W$ tal que la matriz de $T$ con respecto a estas bases es
$$
\mathcal M(T,v_1,\dots,v_n,w_1,\dots,w_m) = \begin{pmatrix} I_{r\times r} & 0_{r\times n-r} \\ 0_{m-r\times r} & 0_{m-r\times n-r}\end{pmatrix},
$$
donde $I_{r\times r}$ es el $r\times r$ matriz identidad, y los diversos $0_{\ast\times\ast}$ son cero matrices de las dimensiones correspondientes. Como corolario de la proposición, se puede leer fuera de la matriz por $T$ en estas bases que
\begin{align*}
\operatorname{rank}T &\stackrel{\text{def}}{=} \dim \operatorname{image}T = r, \\
\operatorname{nullity}T &\stackrel{\text{def}}{=} \dim \ker T = n-r,
\end{align*}
y por lo tanto la ganancia de la clasificación de nulidad teorema:
$$
\dim V = n = r + (n-r) = \operatorname{rango}T + \operatorname{nulidad}T.
$$
Para una rápida prueba de la proposición, mantener las cosas como "tosca" como sea posible para la intuición del amor, porque el rango de $T$ es $r$, tomar vectores $v_1,\dots,v_r$ en $V$ tal que $w_1 = T(v_1),\dots,w_r = T(v_r)$ abarcan la imagen de $T$. Extender $v_1,\dots,v_r$ a una $v_1,\dots,v_r,v_{r+1},\dots,v_n$ para $V$ e $w_1,\dots,w_r$ a una $w_1,\dots,w_r,w_{r+1},\dots,w_m$ para $W$. Con respecto a estas bases, podemos determinar rápidamente
$$
\mathcal M(T,v_1,\dots,v_n,w_1,\dots,w_m) = \begin{pmatrix} I_{r\times r} & \ast \\ 0_{m-r\times r} & \ast\end{pmatrix}.
$$
Debido a que el rango de $T$ es $r$, y el primer $r$ columnas de la matriz de $T$ son linealmente independientes, podemos determinar que (posiblemente después de que algunos de fila y columna de las operaciones), los dos $\ast$'s en la anterior matriz de $T$ tiene que ser el cero matrices de dimensiones adecuadas, de ahí la propuesta.