En el capítulo "Regresión a la media" de "Thinking, Fast and Slow" de Daniel Kahneman, se da un ejemplo y se pide al lector que pronostique las ventas de las tiendas individuales dada la previsión de ventas global y las cifras de ventas del año anterior. Por ejemplo (el ejemplo del libro tiene 4 tiendas, aquí utilizo 2 para simplificar):
Store 2011 2012
1 100 ?
2 500 ?
Total 600 660
La previsión ingenua sería de 110 y 550 para las tiendas 1 y 2, un 10% de aumento para cada una. Sin embargo, el autor afirma que este enfoque ingenuo es erróneo. Es más probable que la tienda con peores resultados aumente más del 10%, y que la tienda con mejores resultados aumente (o incluso disminuya) menos del 10%. Así que quizás una previsión de 115 (aumento del 15%) y 535 (aumento del 7%) sería "más correcta" que la previsión ingenua.
Lo que no entiendo es cómo podemos concluir que las ventas de 100 de la tienda 1 son necesariamente las de peor rendimiento. Tal vez, debido a las diferencias de ubicación, las verdaderas medias de las series temporales de las tiendas 1 y 2 son 10 y 550, y la tienda 1 tuvo un súper año en 2011, y la tienda 2 tuvo un año desastroso en 2011. Entonces, ¿no tendría sentido prever un descenso para la tienda 1 y un aumento para la tienda 2?
Sé que en el ejemplo original no se daba información sobre las series temporales, pero tengo la impresión de que la "regresión a la media" se refiere a la media transversal y, por tanto, la información sobre las series temporales no importa. ¿Qué he entendido mal?