Imagina que tengo un artículo que quiero vender a una persona. Sé con seguridad que la persona no está dispuesta a pagar más de \$X for this item, but I don't know which value between \$ 0 y \$X ellos son dispuestos a pagar por ello, y tengo la misma incertidumbre sobre todos ellos. Así que si llamo a cuánto están dispuestos a pagar por él V, $p(V)$ es una distribución uniforme entre 0 y X.
Sin embargo, no puedo preguntarles directamente. Lo que sí puedo hacer es preguntar si están dispuestos a pagar algún valor \$Y for the item. If they are, then I get \$ Y y vender el artículo. Si no es así, no puedo vender el artículo y no me pagan nada.
Por lo tanto, comprarán el producto si valoran mi artículo en \$Y or more and will not otherwise, and so the expected value of asking for \$ Y es $p(V\geq Y) * Y$ . Desde $p(V) = 1/X$ es sencillo ver que el valor Y que maximiza esa expectativa es X/2, y el valor real esperado es \$X/4.
Supongamos, sin embargo, que puedo pedirle a esta persona dos veces en lugar de una sola vez. Es decir, puedo preguntarles si están dispuestos a pagar \N por el artículo. Entonces:
- Si lo son, recibo $Y y vendo el artículo.
- Si no lo son, puedo volver a pedir un valor diferente \$X, and then either I sell the item for \$ X o no lo hago y no consigo nada.
Una solución inicial e ingenua sería simplemente iterar la sugerencia anterior: primero pido \$X/2 and then, if I'm refused, I update my probability distribution and ask for \$ X/4. El valor esperado de esa estrategia es \$5X/16 (50% chance that I get \$ X/2, entonces un 50% de posibilidades de que haya un 50% de posibilidades de que obtenga \$X/4, and then in the remaining case I get \$ 0).
Sin embargo, esa no es la estrategia óptima. Supongamos, en cambio, que decido pedir \$2X/3 and then for \$ X/3. Hay un 1/3 de posibilidades de que me acepten la primera solicitud y un 2/3 de posibilidades de que no lo hagan; después, hay un 50% de posibilidades de que me acepten la segundo y un 50% de posibilidades de que no lo hagan. El valor final esperado de esa estrategia es \$X/3, which is greater than the \$ 5X/16 de la idea anterior.
¿Cómo iba a saber esto de antemano? Y si se me permite hacer N preguntas, ¿es siempre mejor pedir \$(N - 1)X/N and then \$ (N - 2)X/N y así sucesivamente hasta llegar a \$X/N?
Ahora, supongamos que tengo M personas diferentes que podrían estar dispuestas a comprar mi artículo. Tengo una distribución conjunta a priori sobre el valor de mi artículo. Puedo pedir un total de N preguntas entre todos ellos y, dado que mis creencias sobre cuánto valoran este artículo están correlacionadas, cada vez que uno de ellos rechaza el artículo esto es también información sobre cuánto lo valoran los demás.
¿Cómo puedo resolver este ¿Problema? Si es demasiado abierto, supongamos que lo limito a tener una distribución normal multivariante (con vector de medias y matriz de covarianza conocidos) para mis creencias previas sobre cuánto valoran mi artículo; ¿a dónde voy desde aquí?