$$\eqalign{ P\Bigl(\bigcup_{i=1}^n E_i\Bigr) = \sum_{i\le n} P(E_i) - &\sum_{i_1<i_2}\underbrace{ P(E_{i_1}\cap E_{i_2})}_{ {\text {two at a time}}} +\sum_{i_1<i_2<i_3} \underbrace{ P(E_{i_1}\cap E_{i_2}\cap E_{i_3})}_{\text {three at a time}} - \cr &\cdots+ (-1)^{n}\sum_{i_1<i_2<\cdots<i_{n-1} } \underbrace{ P(E_{i_1}\cap\cdots\cap E_{i_{n-1}} )}_{(n-1)\text { at a time}} \cr &\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ + (-1)^{n+1}P(E_1\cap E_2\cap\cdots\cap E_n)} $$
Los subíndices en las sumas anteriores son sólo una forma práctica de escribir, por ejemplo en el término $\sum\limits_{i_1<i_2} P(E_{i_1}\cap E_{i_2}) $ , "tomar la suma de las probabilidades de intersecciones de dos sucesos distintos (las intersecciones tomadas sin tener en cuenta el orden; es decir, en la suma, se tiene sólo uno de, por ejemplo $P(E_1\cap E_2)$ o $P(E_2\cap E_1) \thinspace $ )".
Por supuesto, mi " $n$ " es tu " $2^n-n$ ".
Por tu preocupación al final de tu post, tenga en cuenta la fórmula anterior tiene términos negativos.
En general, si los acontecimientos $\{E_i\}$ son mutuamente excluyentes, entonces $P(\cup E_i )=\sum P(E_i)$ pero si los acontecimientos se solapan $P(\cup E_i )\le\sum P(E_i)$ . Esto se debe a que la parte derecha de la fórmula anterior cuenta algunas probabilidades más de una vez (en concreto, las de la intersección de los solapamientos de $E_i$ ).