1 votos

Me cuesta explicar el fallo de lógica probabilística que supone extrapolar una tendencia deportiva a corto plazo a un partido completo

Estoy viendo baloncesto con un amigo y los Pistons ganan a los Hawks 42-18 tras el primer cuarto. Mi amigo dice que es tan probable como que los Pistons ganen el partido 168-72. Me parece mal, pero no sé cómo explicarlo. Esto me parece mal, pero no sé cómo explicarlo. Sé que puede tener algo que ver con la baja probabilidad de repetir un acontecimiento raro cuatro veces seguidas, pero una respuesta natural es que, dado que ya han dominado el primer cuarto, ¿no es más probable que puedan hacer lo mismo, o más, en los cuartos siguientes?

¿Por qué no es tan probable ganar un partido por 96 puntos como ganar un cuarto por 24 puntos?

Un ejemplo más extremo: un equipo devuelve el saque inicial para un touchdown y va ganando 7-0 a falta de 14:50 para el final del primer cuarto, y el locutor dice previsiblemente: "¡a este ritmo, ganarán el partido 2520-0! Jajaja!".

La cuestión es, más en general, dónde se produce el fallo en la lógica probabilística cuando las tendencias temporales a corto plazo se extrapolan directamente a un periodo de tiempo más largo. Sé que la varianza probablemente aumenta con el equipo, así que eso podría tener algo que ver, pero eso también parece aumentar la probabilidad de que se produzcan sucesos extremos, especialmente si la trayectoria empieza siendo extrema.

1voto

Loren Pechtel Puntos 2212

Creo que se trata de un simple problema de extrapolación. Las series temporales lo hacen más sutil, pero el problema sigue ahí.

Por ejemplo, si trazo una línea a través de las alturas y los pesos de los hombres, podría predecir que un hombre de 90.000 kg medirá 2.000 metros. El problema es que no existe ningún hombre de 90.000 kg, por lo que inmediatamente vemos lo absurdo de este "modelo" (extrapolación).

Del mismo modo, si trazara una línea a través de los precios de las acciones de Apple hace unos años, podría predecir que dentro de diez años sería multimillonario. El mismo problema -- extrapolación -- pero está disfrazado porque a diez años de mi predicción volonté venir, aunque un hombre de 90.000 kg nunca lo será.

Las series temporales también suelen tener límites, saturaciones, ciclos, correlaciones y retroalimentaciones positivas y negativas, etc.

Y en tu ejemplo deportivo, no es que marcar sea una ley de la naturaleza o que los equipos no puedan cambiar de estrategia. Quizá los Hawks ralenticen el ritmo a propósito, quizá los Pistons hayan jugado tan duro que no puedan mantener ese ritmo. Quizás los equipos tienden a jugar para ganar, no para anotar el máximo número de puntos, y 24 puntos es razonablemente cómodo al final del partido. No se trata de números aleatorios, sino que están relacionados con el rendimiento humano, las motivaciones y las estrategias.

1voto

Martin Robins Puntos 1893

Imagina que lanzas una moneda cara 8 veces seguidas. Cuántas caras esperas que salgan en las próximas 8 tiradas?

  • Si sabes que la moneda es justa, la racha de 8 caras es irrelevante y esperarás 4 caras en los próximos 8 lanzamientos (con el número total de caras siguiendo el distribución binomial con $p = .5$ ) Con la condición de conocer la probabilidad $p$ de lanzar una moneda a cara o cruz, la historia previa es irrelevante.
  • Por otro lado, lanzar 8 caras seguidas puede hacer pensar que la moneda es no justo, que la probabilidad de cabezas $p$ es mayor que $\frac{1}{2}$ . Si cree en probabilidad subjetiva (es decir, estás dispuesto a tratar $p$ como variable aleatoria), actualizaría sus creencias sobre $p$ para la moneda utilizando Regla de Bayes .

Un marco un poco más general

Sea $\Delta s_t = s_t - s_{t-1}$ sea la variación de la puntuación desde el momento $t-1$ al tiempo $t$ . Obseve que la puntuación $s_t$ se puede escribir como:

$$ s_t = \sum_\tau \Delta s_{\tau} $$

Supongamos que cada $\Delta s_t$ se extrae de forma independiente de una distribución $\mathcal{S}$ . Podemos escribir $\Delta s_t = \mu + \epsilon_t$ donde $\{\epsilon_t\}$ es un proceso de ruido blanco .

Como en el ejemplo anterior de lanzar una moneda al aire, lo único que importa para pronosticar la puntuación esperada $\mathrm{E}[s_t \mid \mathcal{F} ]$ es $\mu$ . La historia pasada sólo importa en la medida en que nos ayuda a saber qué $\mu$ es.

Ejemplos:

  • Asumamos que ver a los Pistons machacar a los Hawks en el 1er cuarto no nos dice nada sobre $\mu$ . Si quedan 100 incrementos de tiempo en el juego y entonces pensamos $E[\mu | \mathcal{F}] = .02$ entonces esperaremos que los Piston aumenten su ventaja en 2 puntos.
  • Supongamos que ver a los Pistons dar una paliza a los Hawks nos ha hecho actualizar nuestro pronóstico de $\mu$ de $.02$ a $.2$ . Entonces esperamos que los Pistons aumenten su ventaja en 20 puntos en los siguientes 100 incrementos de tiempo.

Y se complica aún más... (cada incremento de tiempo no tiene por qué ser independiente)

Si eres un observador astuto, probablemente te habrás dado cuenta de que anteriormente supuse que cada incremento de tiempo es condicionalmente independiente (dado $p$ o $\mu$ ). Esto podría violarse fácilmente:

  • Los equipos que van por delante pueden levantar el pie del acelerador.
  • Los equipos que van muy por detrás pueden rendirse por completo, dejar de intentar ganar.
  • Los equipos más rezagados pueden adoptar estrategias de expectativas negativas y de aumento de la varianza.
  • Las condiciones cambiantes (p. ej. lesiones, etc.) pueden hacer que $\mu$ un proceso variable en el tiempo $\mu_t$ .

Todo esto te llevaría a no tratar $\Delta s_t$ como extracciones iid de alguna distribución.

Resumen y conclusiones

Mi intuición básica es que cuando observas que un equipo aumenta el marcador en el primer cuarto, estás observando principalmente ruido aleatorio en lugar de información útil sobre algún parámetro. $\mu$ . Pronosticar que el segundo trimestre será 42-18 después de que el primero fuera 42-18 sería igual de problemático que pronosticar 42-18 caras en los próximos 60 lanzamientos basándose en la observación de 42-18 cara-cola en los primeros 60 lanzamientos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X