La cuestión es que la intensidad luminosa es la intensidad percibida por el ojo humano, y teniendo en cuenta especialmente el hecho de que la misma cantidad de energía será percibida como más brillante o más tenue dependiendo de si la longitud de onda está en un máximo de sensibilidad del ojo o en un mínimo.
Esto hace que la candela sea ligeramente más lavada que las otras seis unidades base del SI, porque necesitas depender de mediciones fisiológicas del ser humano promedio, quien sea que sea, pero el simple hecho es que no puedes medir qué tan brillante se ve una luz para el ojo humano usando solo cronómetros, cintas métricas y pesas: necesitas usar el ojo mismo como dispositivo de medición, o al menos calibrar con uno. La intensidad luminosa es una medida de la respuesta biológica de un sistema específico (si no es de la percepción subjetiva que esta respuesta causa), y a menos que estés dispuesto a definir la unidad de intensidad luminosa en términos de la actividad neuronal en el nervio óptico, realmente necesitas una unidad de medida que sea independiente del triplete mks.
En general, supongamos que tu ojo recibe luz de una fuente con una intensidad radiante de $$I_\mathrm{r.i.}=(I_\mathrm{r.i.})\:\mathrm{W\:sr^{-1}m^{-2}}$$, es decir, cada área unitaria $A$, canalizando un lápiz de radiación de ángulo sólido $\Omega$ recibe $I_\mathrm{r.i.}A\Omega$ julios de energía radiada por segundo. Sin embargo, esto todavía no te dice qué tan brillante se verá la fuente para ti, porque los diferentes receptores son más o menos sensibles a la radiación en diferentes longitudes de onda. No obstante, esta dependencia ha sido estudiada bastante a fondo mediante diversos métodos, lo que ha resultado en una función de luminosidad bastante estándar: es decir, una función $$\bar{y}(\lambda),\text{ también denotada }V(\lambda),$$ que te dice cómo se ven las luces a diferentes longitudes de onda. Por lo tanto, si $\bar{y}(\lambda_1)/\bar{y}(\lambda_2)=2$, entonces una luz en $\lambda_1$ se verá el doble de brillante que una lámpara con la misma intensidad radiante en $\lambda_2$.
Por supuesto, hay alguna variación individual, así como el difícil problema metrológico de medir y estandarizar la función de luminosidad, y controlar el hecho de que diferentes poblaciones pueden tener diferentes respuestas promedio, pero todo eso está en el juego y es, en última instancia, problema de otra persona (es decir, no de un físico). Y si realmente quieres adentrarte profundamente, necesitas controlar el hecho de que la intensidad percibida variará en condiciones de buena iluminación versus baja iluminación, y así sucesivamente. Sin embargo, solo necesitas normalizar una vez para cada conjunto de condiciones; de ahí el valor de las velas estándar.
La candela es esencialmente la unidad de la función de luminosidad estándar. Una fuente de luz de longitud de onda $\lambda$ e intensidad radiante $I_\mathrm{r.i.}$ tendrá una intensidad luminosa (percibida) $$I_\mathrm{l.i.}=\bar{y}(\lambda)I_\mathrm{r.i.},$$ donde ahora la intensidad luminosa $I_\mathrm{l.i.}$ es una bestia completamente diferente a la intensidad radiante, ya que depende de una reacción humana, por lo que se mide en candelas. Por lo tanto, la función de luminosidad tiene unidades de $\mathrm{cd}/(\mathrm{W\:sr^{-1}m^{-2}})$, y el papel de la definición del SI es normalizarla de manera que $$\bar{y}(555\:\mathrm{nm})=\frac{1\:\mathrm{cd}}{\mathrm{W\:sr^{-1}m^{-2}}}.$$ A partir de aquí, uno puede completar el resto de la curva para $\bar{y}(\lambda)$ usando solo mediciones comparativas de intensidad luminosa (percibida), que son mucho más fáciles.
Cuando se mide el "brillo" de una fuente de luz, hay una enorme cantidad de diferentes cantidades de interés, cada una con su propia unidad pero un nombre muy similar a las demás, y dependiendo de detalles exactos como si estás integrando sobre ángulo, superficie, longitud de onda, o cualquier combinación de estos. Es muy fácil, como físico, simplemente rendirse y considerar que "intensidad luminosa" simplemente será una de la lista. De manera similar, es fácil simplemente pasar por alto términos como fotometría y no darse cuenta de que es muy diferente a radiometría.
Esto solo significa, sin embargo, que necesitamos elevar nuestro nivel y comprender que hay una dimensión adicional en juego aquí: la sensación subjetiva de brillo tal como es percibida por el ojo humano como un dispositivo de medición, que necesitamos incluir en pie de igualdad con nuestros relojes, metros y (pronto) balanzas de vatios, si realmente queremos producir mediciones que sean útiles en un mundo habitado por humanos.