Esto es simplemente una reformulación de la respuesta de Henry. Probablemente sea totalmente inútil volver a dar la misma prueba con diferentes palabras, así que lo hago en la comunidad-wiki.
Recordemos el problema de la secretaria: En cada momento $k$ Si quieres decidir si eliges al candidato $k$ o no. Ganas si el candidato que eliges es el mejor de todos $n$ candidatos, y quieres maximizar la probabilidad de ganar.
Ahora bien, tenga en cuenta que en cualquier momento $k$ , si el candidato $k$ no es el mejor entre los candidatos $1, \dots, k$ Si eliges al candidato, pierdes inmediatamente. (Este candidato ni siquiera es el mejor entre los vistos en ese momento, por lo que no puede ser el mejor entre todos los candidatos). Así que sólo escogerás a una candidata si es la mejor entre las vistas hasta ese momento. Así, cualquier estrategia óptima será de la forma que haga, en cada momento $k$ :
Si el candidato $k$ es mejor que todos los vistos anteriormente y [algunas condiciones adicionales], elija el candidato $k$ y parar.
Las "[algunas condiciones adicionales]" deben depender sólo de la información que se tenga hasta el momento $k$ y, en particular, sólo en $k$ y el orden relativo de los candidatos $1$ a $k$ . Pero como lo único que te importa es si eliges al mejor candidato o no, el único factor relevante del orden relativo es quién es el mejor entre los vistos en ese momento, y eso ya sabes que es candidato $k$ . Así que el "[algunas condiciones adicionales]" es algún predicado $P(k)$ que depende sólo de $k$ .
Ahora tenga en cuenta que si elige el candidato $k$ (quién es el mejor entre $1$ a $k$ ), entonces la probabilidad de ganar es $k/n$ (la probabilidad de que el mejor estuviera entre los primeros $k$ ). Se trata de una función creciente de $k$ lo que significa que si $k$ es bueno también lo es $k+1$ (es decir, si $P(k)$ es verdadera, entonces también debería serlo $P(k+1)$ ser). Así que $P(k)$ es de la forma $[k \ge t]$ es decir, la gama de bienes $k$ es un intervalo $\{t, \dots, n\}$ para algunos $t$ .
Esto es lo que se quería demostrar. (Y como Henry observó, para el caso especial $n=2$ , ambos $t=1$ y $t=2$ trabajo, pero para mayores $n$ puede demostrar que $t$ debe ser $n/e$ .)
1 votos
Estrictamente "elegir al próximo candidato que sea mejor que los ya vistos"