M. C. Martín Blanco, A. Jiménez Martín, A. Mateos Caballero

The multi-armed bandit problem has been deeply studied in statistics becoming fundamental in different areas of economics or artificial intelligence. Different allocation strategies/policies can be found in the literature for this problem under a frequentist view or from a Bayesian perspective. In this paper, we propose a novel allocation strategy, the possibilistic reward method, and a dynamic extension. The uncertainty about the arm expected rewards are first modelled by means of possibilistic reward distributions. Next, we use a pignistic probability transformation to convert these possibilistic functions into probability distributions. Finally, a simulation experiment is carried out by sampling from each arm with the corresponding probability distribution to find out the one with the highest expected reward, which is then pulled. A numerical study proves that the proposed method outperforms other policies in the literature in all tested scenarios.

Palabras clave: multi-armed bandit problem, possibilistic reward, numerical study

Programado

X09.3 Inferencia Estadística II
7 de septiembre de 2016  17:30
Aula 21.08


Otros trabajos en la misma sesión


Últimas noticias

  • 22/06/16
    Programa SEIO 2016 y X Jornadas de Estadística Pública

    El Programa del XXXVI Congreso Nacional de la SEIO y las X Jornadas de Estadística Pública ya está disponible en la página web.

    Puede acceder desde aquí.

  • 16/06/16
    Fecha límite para hacer la inscripción con la tarifa reducida.
  • 25/05/16
    Alojamiento en Residencias Universitarias

    La Universidad de Castilla-La Mancha ofrece a los asistentes al XXXVI Congreso Nacional de Estadística e Investigación Operativa y de las X Jornadas de Estadística Pública la posibilidad de alojamiento en el Colegio Mayor Gregorio Marañon, situado en el centro histórico de Toledo.

    Para ver más información pulse aquí.

Organizan

Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.