En las estadísticas de béisbol, hay una estadística llamada "suerte", que es la diferencia entre un equipo de la ganar-pérdida de registro y sus Pitágoras registro de victorias y derrotas. Esta estadística se supone que debe medir cómo la suerte o la mala suerte de que un equipo era ganar sin embargo muchos de los juegos que hicieron en una temporada.
Supongamos que uno tiene un gran conjunto de datos que, para cada año n, incluye
- equipo ganador porcentaje $P(n)$
- equipo ganador porcentaje que el año anterior $P(n-1)$
- equipo de suerte, el año anterior $L(n-1)$
y quiere crear un modelo de regresión lineal usando $P(n-1)$ $L(n-1)$ para estimar el $P(n)$.
No hay relación aparente entre el$L(n-1)$$P(n)$, pero parece como si pudiéramos utilizar $L(n-1)$ en conjunción con $P(n-1)$ a predecir mejor los $P(n)$ sobre la base de cómo "flukey" $P(n-1)$ era y de qué manera.
Entonces, la pregunta es, ¿cómo se podría incorporar una suerte de tipo de medida en un modelo de regresión lineal como he discutido? No estoy preocupado con este particular de la suerte-tipo de medida, sino que cualquier medida que hace algo similar a lo que este se supone que uno debe hacer.