18 votos

En qué tipo de situaciones de la vida real, podemos utilizar un multi-bandido de brazo algoritmo?

Multi-brazo bandidos funcionan bien en la situación en la que usted tiene opciones y no está seguro de que uno va a maximizar su bienestar. Usted puede utilizar el algoritmo para algunas situaciones de la vida real. Como un ejemplo, el aprendizaje puede ser un buen campo:

Si un niño está aprendiendo carpintería y él es malo, el algoritmo de decirle a él/ella que él/ella probablemente debería necesitan pasar. Si él/ella es buena en eso, el algoritmo de decirle a él/ella para continuar a aprender ese campo.

El noviazgo es un también un buen campo:

Eres un hombre en su puesta de un montón de "esfuerzo" en la búsqueda de una dama. Sin embargo, sus esfuerzos son sin duda inoportunas. El algoritmo debe "ligeramente" (o muy) empujar a avanzar.

¿Qué otras situaciones de la vida real, podemos utilizar la multi-bandido de brazo algoritmo?

PS: Si la pregunta es demasiado amplia, por favor deje un comentario. Si hay un consenso, voy a quitar a mi pregunta.

9voto

Nick Demyanchuk Puntos 441

Cuando usted juega el original de los juegos de Pokemon (Rojo o Azul y Amarillo) y llegar a Celadon city, el Equipo rocket máquinas tragamonedas tienen diferentes probabilidades. Multi-Bandido de Brazo derecho allí si desea optimizar conseguir que Porygon muy rápido.

En toda la seriedad, la gente hablar sobre el problema con la elección de optimización de las variables en el aprendizaje de máquina. Especialmente si usted tiene una gran cantidad de variables, la exploración vs explotación se menciona. Ver como la Hierbabuena o incluso el nuevo papel en este tema utiliza una super simple algoritmo para elegir los parámetros de ajuste (y supera a otros de optimización de variables técnicas)

6voto

Sean Hanley Puntos 2428

Pueden ser utilizados en un biomédica tratamiento / diseño de la investigación de configuración. Por ejemplo, yo creo q de aprendizaje de los algoritmos se utilizan en Secuencial, Asignación Múltiple, Aleatorizado (SMART ensayos). Vagamente, la idea es que el régimen de tratamiento se adapta de forma óptima a los avances que el paciente está haciendo. Está claro cómo esto podría ser mejor para un paciente individual, pero también puede ser más eficiente en los ensayos clínicos aleatorizados.

6voto

Dipstick Puntos 4869

Se utilizan en las pruebas a/B de la publicidad en línea, donde los diferentes anuncios se muestran a los diferentes usuarios y con base en los resultados se toman las decisiones acerca de lo que los anuncios se muestren en el futuro. Esto se describe en papel bonito por Google investigador Steven L. Scott.

2voto

twinmind Puntos 19

Me hizo la misma pregunta en Quora

Aquí está la respuesta

  • La asignación de fondos para los diferentes departamentos de una organización

  • Escoger el mejor rendimiento de los atletas de un grupo de estudiantes dada la limitación de tiempo y una selección arbitraria de umbral

  • La maximización de la página web de los ingresos, mientras que al mismo tiempo las pruebas de nuevas funcionalidades (en lugar de Una prueba a/B) Usted las puede utilizar en cualquier momento que usted necesita para optimizar los resultados cuando no se tienen suficientes datos para crear un riguroso modelo estadístico.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X