Yo empezaría por hacer un dibujo. Representar el $\mathbb{R}^i$ por "manchas".
Ahora
$$\mathbb{R}^n\overset{T}{\longrightarrow}\mathbb{R}^m\overset{S}\longrightarrow \mathbb{R}^\ell.$$
Ahora bien $\text{im }T\subset\ker S$ entonces todas las cosas que se mapean en $\mathbb{R}^m$ por $T$ están en el núcleo de $S$ y por lo tanto será "asesinado" por $S$ por lo que tenemos $S\circ T=0$ .
Por otro lado, si $S\circ T=0$ la composición de $T$ y $S$ "mata" todo. En particular todo lo que $T$ envía a $\mathbb{R}^m$ también conocido como $\text{im }T$ es "asesinado" por $S$ por lo que está en el núcleo de $S$ .
Esta es la por qué ? Las demás respuestas espero que las contesten con voz amable y técnica. ¿Sabes lo que quiero decir con 'matar'?