Una de las justificaciones de las instrucciones vectoriales es que, en una CPU moderna, lleva más trabajo descodificar una instrucción y realizar todo el trabajo administrativo que la rodea -programación, renombrado de registros, etc.- que ejecutarla realmente, por lo que es fundamentalmente más eficiente realizar varias operaciones aritméticas en una sola instrucción.
¿Puede cuantificarse? En una CPU moderna -me encantaría conocer la cifra de cualquiera de ellas-, ¿cuánta energía se necesita para, digamos, multiplicar un par de números de 64 bits, frente a la cantidad total de energía que se necesita para descodificar, programar y ejecutar una instrucción de multiplicación?