Recuerde que $\mathrm{M}_2(\mathbf C)$ no es más que $\mathrm{PGL}_2(\mathbf C)$. Su pregunta es acerca de una prueba de la afirmación de que cualquier subgrupo finito de $\mathrm{PGL}_2(\mathbf C)$ es conjugado a un subgrupo de $\mathrm{PSU}_2(\mathbf C)$. De hecho, esto se cumple de manera más general:
Proposición. Sea $n$ un número natural distinto de cero. Entonces cualquier subgrupo finito de $\mathrm{PGL}_n(\mathbf C)$ es conjugado a un subgrupo de $\mathrm{PSU}_n(\mathbf C).
'
Prueba. Recuerde que $\mathrm{PGL}_n(\mathbf C)$ es el cociente del grupo lineal general $\mathrm{GL}_n(\mathbf C)$ por su subgrupo normal ${\mathbf C}^\star I$ de todos los múltiplos no nulos de la matriz identidad $I$ de $n\times n$. Sea $$ \pi\colon \mathrm{GL}_n(\mathbf C)\rightarrow \mathrm{PGL}_n(\mathbf C) $$ el mapa cociente. Recuerde también que el grupo lineal especial $\mathrm{SL}_n(\mathbf C)$ es el subgrupo de $\mathrm{GL}_n(\mathbf C)$ de todas las matrices con determinante igual a $1$. Dado que cualquier número complejo distinto de cero tiene una raíz $n$-ésima distinta de cero, $\pi$ mapea este subgrupo en $\mathrm{PGL}_n(\mathbf C)$, es decir, $$ \pi(\mathrm{SL}_n(\mathbf C))=\mathrm{PGL}_n(\mathbf C). $$ Sea $$ \rho\colon \mathrm{SL}_n(\mathbf C)\rightarrow \mathrm{PGL}_n(\mathbf C) $$ la restricción de $\pi$ a $\mathrm{SL}_n(\mathbf C)$. Según lo dicho anteriormente, $\rho$ es sobreyectiva. Su núcleo es $$ \ker(\rho)=\ker(\pi)\cap\mathrm{SL}_n(\mathbf C)=\mu_n I, $$ donde $\mu_n$ es el grupo de raíces $n$-ésimas de la unidad en $\mathbf C$. En particular, el núcleo de $\rho$ es finito.
Ahora, sea $G$ un grupo finito en $\mathrm{PGL}_n(\mathbf C)$. Dado que $\rho$ tiene un núcleo finito, la imagen inversa $H=\rho^{-1}(G)$ es un subgrupo finito de $\mathrm{SL}_n(\mathbf C)$. En particular, $H$ es un subgrupo finito de $\mathrm{GL}_n(\mathbf C)$ tal que $\pi(H)=\rho(H)=G$ ya que $\rho$ es sobreyectiva.
Sea $(\cdot|\cdot)$ el producto interno hermitiano estándar en $\mathbf C^n$. Dado que $H$ es un subgrupo finito de $\mathrm{GL}_n(\mathbf C)$, la forma $(\cdot|\cdot)'$ en $\mathbf C^n$ definida por $$ (v|w)'=\sum_{h\in H}(hv|hw) $$ es una forma hermitiana definida positiva en $\mathbf C^n$. Además, es invariante bajo $H$, es decir, para todo $h\in H$ y todo $v,w\in\mathbf C^n$ se tiene $$ (hv|hw)'=(v|w)'. $$ Esto significa que $H$ está contenido en el grupo unitario de la forma hermitiana $(\cdot|\cdot)'$. Dado que cualquier forma hermitiana definida positiva en $\mathbf C^n$ es equivalente a la forma hermitiana estándar, existe un elemento $a\in\mathrm{GL}_n(\mathbf C)$ tal que $$ (av|aw)=(v|w)' $$ para todo $v,w\in\mathbf C^n$. Se sigue que $aHa^{-1}$ está contenido en el grupo unitario ordinario $\mathrm{U}_n(\mathbf C)$. Dado que todos los elementos de $H$ tienen determinante igual a $1$, el conjugado $aHa^{-1}$ de $H$ está contenido en el grupo unitario especial $\mathrm{SU}_n(\mathbf C)$. Se deduce que $$ \pi(a)G\pi(a)^{-1}\subseteq\mathrm{PSU}_n(\mathbf C) $$ ya que $\mathrm{PSU}_n(\mathbf C)=\pi(\mathrm{SU}_n(\mathbf C))$. $\square$
Observación. Note que el argumento anterior se aplica de manera más general a un subgrupo compacto $G$ de $\mathrm{PGL}_n(\mathbf C)$, reemplazando la suma sobre $H$ por una integral adecuada.