En contra de otras respuestas, yo diría que se puede decir algo sobre las capacidades de Bolts dados los datos disponibles. En primer lugar, reduzcamos su pregunta. Preguntas sobre el ser humano más rápido, pero como hay una diferencia en las distribuciones de las velocidades de carrera de los hombres y las mujeres, donde las mejores corredoras parecen ser ligeramente más lentas que los mejores corredores, deberíamos centrarnos en los corredores. Para obtener algunos datos, podemos mirar el mejores rendimientos del año en la carrera 100 de los últimos 45 años . Hay varias cosas que hay que tener en cuenta sobre estos datos:
- Esos son los mejores tiempos de carrera, por lo que no nos hablan de las capacidades de todos los humanos, sino de los mínimo velocidades alcanzadas.
- Suponemos que estos datos reflejan una muestra de los mejores corredores del mundo. Aunque puede ocurrir que haya corredores aún mejores que no hayan participado en los campeonatos, esta suposición parece bastante razonable.
En primer lugar, vamos a discutir cómo pas para analizar estos datos. Podrías notar que si graficamos los tiempos de ejecución contra el tiempo, observaríamos una fuerte relación lineal.
Esto podría llevarle a utilizar una regresión lineal para pronosticar la mejora de los corredores que podríamos observar en los próximos años. Sin embargo, esto sería una muy malo idea, que inevitablemente te llevaría a la conclusión de que en aproximadamente dos mil años los humanos serían capaces de correr 100 metros en cero segundos, ¡y después de eso empezarían a lograr los tiempos de carrera negativos! Esto es obviamente absurdo, ya que podemos imaginar que existe algún tipo de límite biológico y físico de nuestras capacidades, que nos es desconocido.
¿Cómo podría analizar estos datos? En primer lugar, hay que tener en cuenta que se trata de datos sobre valores mínimos, por lo que deberíamos utilizar un modelo adecuado para dichos datos. Esto nos lleva a considerar teoría del valor extremo modelos (véase, por ejemplo, el Introducción a la modelización estadística de los valores extremos libro de Stuart Coles). Se puede suponer que para estos datos distribución de valores extremos generalizada (GEV). Si $Y = \max(X_1,X_2,\dots,X_n)$ donde $X_1,X_2,\dots,X_n$ son variables aleatorias independientes e idénticamente distribuidas, entonces $Y_i$ siguen una distribución GEV. Si está interesado en modelar mínimos, entonces si $Z_1,Z_2,\dots,Z_k$ son muestras de mínimos, entonces $-Z_i$ siguen una distribución GEV para los mínimos. Por lo tanto, podemos ajustar la distribución GEV a los datos de las velocidades de carrera, lo que conduce a un ajuste bastante bueno (véase más abajo).
Si se observa la distribución acumulativa sugerida por el modelo, se notará que el mejor tiempo de carrera de Usain Bolt está en la parte más baja $1\%$ cola de la distribución. Así que si nos atenemos a estos datos, y a este análisis de ejemplo de juguete, llegaríamos a la conclusión de que los tiempos de ejecución mucho más pequeños son improbables (pero obviamente, posibles). El problema obvio de este análisis es que ignora el hecho de que hemos visto mejoras año a año de los mejores tiempos de carrera. Esto nos devuelve al problema descrito en la primera parte de la respuesta, es decir, que asumir un modelo de regresión aquí es arriesgado. Otra cosa que podría mejorarse es que pudiéramos utilizar un enfoque bayesiano y suponer un previo informativo que diera cuenta de algunos conocimientos fuera de los datos sobre los tiempos de carrera fisiológicamente posibles, que podrían no haber sido observados todavía (pero, por lo que sé, esto es desconocido en este momento). Por último, ya se utilizó una teoría de valores extremos similar en la investigación deportiva, por ejemplo, por Einmahl y Magnus (2008) en la Récords en el atletismo a través de la teoría del valor extremo papel.
Podrías protestar porque no has preguntado por la probabilidad del tiempo de carrera más rápido, sino por la probabilidad de observar al corredor más rápido. Desgraciadamente, aquí no podemos hacer mucho, ya que no sabemos cuál es la probabilidad de que un corredor se convierta en atleta profesional y de que disponga de los tiempos de carrera registrados. Esto no ocurre al azar y hay muchos factores que contribuyen a que algunos corredores se conviertan en atletas profesionales y otros no (o incluso que a alguien le guste correr y corra). Para ello, tendríamos que disponer de datos detallados de toda la población de corredores, y además, dado que estás preguntando por los extremos de la distribución, los datos tendrían que ser muy grandes. Así que en esto, estoy de acuerdo con las otras respuestas.
2 votos
Supone que el hecho de ser un atleta es independiente de su velocidad de carrera. Lo cual está bien, pero es cuestionable.
0 votos
@bayerj Sí, creo que está bastante claro que esta sería una muy mala forma de predecir el próximo aspirante a las Olimpiadas. Sin embargo, me parece una pregunta interesante en general y trato de responderla lo mejor posible con la esperanza de que alguien se apiade y me ayude.
1 votos
Me parece que la pregunta está mal planteada, ya que la cualidad de ser "rápido(a)", aquí, se refiere a un potencial genético o a un talento atlético y no a la capacidad real de alcanzar una gran velocidad.
0 votos
@Digio Sustituye "más rápido" por "tiene mayor número de serie" suponiendo que alguna empresa "Fubarco" hace un conjunto de productos con números de serie normalmente distribuidos.
0 votos
La pregunta debería reescribirse por completo. En su forma actual no está claro lo que se pregunta, y el ejemplo de Bolt no parece corresponder a lo que se pide.
1 votos
Motivar una pregunta con un ejemplo suele ser bueno. Sin embargo, este ejemplo parece distraer a la gente de lo que realmente está tratando de preguntar. ¿Podría editarlo para hablar de la situación a la que realmente se enfrenta?