Lo que no entiendo es la matemática para averiguar la caída exacta de voltaje del transistor entre el colector y el emisor.
No necesitas un voltaje exacto. \$0.2V\$ es una estimación razonable para la mayoría de los BJT en saturación. La hoja de datos te dará valores más precisos, bajo una variedad de condiciones de funcionamiento. \$0.2V\$ tampoco es muy significativo para la mayoría de los circuitos, por lo que puedes simplemente ignorarlo. Al ignorarlo, reduces ligeramente la corriente en el LED, lo cual es un error del lado de la precaución, por lo que no necesariamente es algo malo.
También estoy tratando de entender la matemática utilizada para calcular los miliamperios requeridos que tienen que fluir a través de la base del transistor para encenderlo completamente (pero sin desperdiciar electricidad adicional).
Hay una regla empírica para un BJT utilizado como un interruptor de emisor común, como este:
simular este circuito – Esquemático creado usando CircuitLab
cuando quieres llevar el transistor a saturación (como lo haces aquí), haz que la corriente base sea 1/15ava parte de la corriente del colector. Nuevamente, la hoja de datos te dará más detalles, pero muchos de los parámetros (como \$\beta\$ o \$h_{fe}\$) pueden variar en un rango amplio, como función de la temperatura, la corriente de operación y la variación de fabricación de cada dispositivo. La solución es asegurarte de tener suficiente corriente base para asegurar la saturación del transistor en todos los casos.
Entonces:
$$ I_b = \frac{I_c}{15} = \frac{100mA}{15} = 6.7mA $$
La resistencia base tendrá los \$5V\$ del Arduino en ella, menos la caída de \$0.65V\$ del diodo base-emisor en ella, y la corriente se calcula entonces usando la ley de Ohm:
$$ R_b = \frac{V_{R_b}}{I_b} = \frac{5V-0.65V}{6.7mA} = 652\Omega $$
El valor estándar de \$680\Omega\$ es lo suficientemente cercano. La potencia en R1 es:
$$ P_{R1} = \frac{V^2}{R} = \frac{(5V-0.65V)^2}{680\Omega} = 0.028W $$
...así que incluso una resistencia de 1/8W está bien aquí.
O, puedes disponer el transistor como un seguidor de emisor, por lo que la corriente de base va hacia alimentar el LED, y por lo tanto no se "desperdicia":
simular este circuito
Para más detalles, ver ¿Por qué alguien conduciría LEDs con un emisor común?