Tiene que ver con la diferencia entre condicional y incondicional probabilidad. Una probabilidad condicional es aquella en la que sólo se contemplan situaciones con una determinada información conocida, mientras que la probabilidad incondicional contempla la probabilidad global. Por ejemplo, si eres la segunda persona en sacar, entonces hay dos probabilidades condicionales:
(1) La probabilidad de que saques la paja más corta, dado que la primera persona no lo dibujó.
(2) La probabilidad de que saques la paja más corta, dado que la primera persona hizo dibujarla.
La probabilidad de (2) es claramente cero, ya que si la primera persona sacó la pajita corta, entonces no tiene ninguna posibilidad de hacerlo. En comparación, la probabilidad de (1) es 1/2, ya que después de sacar una paja larga quedan dos pajas y una de ellas es la corta.
Pero entonces, ¿cuál es la probabilidad, en general, de que saques la paja más corta? En otras palabras, ¿cuál es la probabilidad incondicional? Hay una fórmula para ello, que se reduce a tomar cada una de las probabilidades condicionales, multiplicándolas por la probabilidad de que esa condición ocurra y sumándolos. En símbolos, se ve así:
$P(A) = \sum_B P(A|B)P(B)$ donde $P(A|B)$ es la probabilidad de que ocurra el evento A, dado que evento B ocurrido, que luego se multiplica por $P(B)$ la probabilidad de que se produzca el suceso B, sumada sobre todos los posibles sucesos Bs*. En nuestro caso:
Probabilidad de que saques la pajita corta = (Probabilidad de que la saques dado que la primera persona no la sacó)×(Probabilidad de que la primera persona no la saque) + (Probabilidad de que la saques dado que la primera persona la sacó)×(Probabilidad de que la primera persona la saque = 1/2 × 2/3 + 0 × 1/3 = 1/3
Porque la primera persona tenía 1/3 de posibilidades de sacar la paja corta, y 2/3 de posibilidades de sacar una de las largas. Básicamente, el orden de extracción no importa porque esos dos eventos se ponderan de tal manera que todo se anula.
También puedes ver lo que ocurre cuando la tercera persona saca la paja corta, ya que conoces la probabilidad de que la primera persona, o la segunda, saque la paja corta, y deberías ser capaz de calcular las probabilidades condicionales de que la tercera persona saque la paja corta dado que o la primera persona lo dibujó, o la segunda persona lo dibujó, o ninguna de ellas lo dibujó.
Otra forma de verlo es considerar el caso en el que todos sacan una pajita simultáneamente, pero la revelan de una en una. Está claro que si se gana o se pierde se determina en cuanto se coge la pajita, por lo que no se puede influir en las elecciones de los demás, pero funcionalmente funciona exactamente igual que si se saca por turnos.
*Una pequeña aclaración - esos eventos B deben ser exhaustivo lo que significa que todos los resultados posibles deben estar cubiertos por al menos un evento, pero también mutuamente excluyentes , lo que significa que no hay solapamiento entre ambos. Si tiras un dado de seis caras, entonces los eventos de sacar 1, 2, 3, 4 o 5 son mutuamente excluyentes, pero no exhaustivos (porque sacar 6 no está cubierto), pero los eventos de sacar un número par y sacar un número mayor que 4 no son mutuamente excluyentes, porque sacar un 6 cuenta para ambos.