Estratégias de Atualização de Políticas para a Coordenação de Agentes Baseados em Enxames

Authors

  • Richardson Ribeiro Pontifícia Universidade Católica do Paraná - PUCPR
  • Fabrício Enembreck Pontifícia Universidade Católica do Paraná

DOI:

https://doi.org/10.22456/2175-2745.11695

Abstract

Neste artigo é analisada a influência dos parâmetros de aprendizagem de algoritmos de enxames e propostas estratégias de atualização de políticas geradas por recompensas (feromônios) para ambientes dinâmicos. Nós verificamos que quando os parâmetros de algoritmos baseados em recompensas são ajustados inadequadamente pode ocorrer atrasos no aprendizado e convergência para uma solução não-satisfatória. Além disso, esse problema é agravado em ambientes dinâmicos, pois o ajuste dos parâmetros de tais algoritmos não é suficiente para garantir convergência. Para solucionar tal problema, nós desenvolvemos estratégias que modificam valores de feromônio, melhorando a coordenação entre os agentes e permitindo convergência mesmo quando o ambiente é alterado dinamicamente. Para isso, um framework capaz de demonstrar de maneira iterativa a influência dos parâmetros e das estratégias foi desenvolvido. Resultados experimentais mostram que é possível acelerar a convergência para uma política global consistente, superando os resultados de abordagens clássicas de algoritmos baseados em enxames.

Downloads

Download data is not yet available.

Author Biographies

Richardson Ribeiro, Pontifícia Universidade Católica do Paraná - PUCPR

Doutorado na área da Ciência da Computação - Informática na Pontifícia Universidade Católica do Paraná (PUCPR) (2010). Mestrado em Informática Aplicada pela PUCPR (2006). Graduação em Informática/Sistemas de Informação pela Universidade do Contestado Campus Mafra (2003). Atualmente é professor Adjunto na Universidade Tecnológica Federal do Paraná (UTFPR) campus Pato Branco - PR. Tem experiência na área da Ciência da Computação, com ênfase em Sistemas de Informação, com interesse nos seguintes temas: Agentes de Software e Sistemas Multi-agente, Algoritmos de Aprendizagem por Reforço, Aprendizagem de Máquina e Banco de Dados

Fabrício Enembreck, Pontifícia Universidade Católica do Paraná

Possui graduação em Bacharelado em Informática pela Universidade Estadual de Ponta Grossa (1997), mestrado em Informática Aplicada pela Pontifícia Universidade Católica do Paraná (1999) e doutorado em Tecnologias da Informação e de Sistemas - Universite de Technologie de Compiegne (2003). Atualmente é professor adjunto da Pontifícia Universidade Católica do Paraná e pesquisador do Programa de Pós-Graduação em Informática da PUCPR, onde orienta trabalhos de mestrado e doutorado. Tem experiência na área de Ciência da Computação, com ênfase em Arquitetura de Sistemas de Computação, atuando principalmente nos seguintes temas: inteligência artificial distribuída, sistemas multi-agente, agentes adaptativos, recuperação de informação, aprendizagem de máquina.

Published

2011-03-28

How to Cite

Ribeiro, R., & Enembreck, F. (2011). Estratégias de Atualização de Políticas para a Coordenação de Agentes Baseados em Enxames. Revista De Informática Teórica E Aplicada, 17(3), 364–388. https://doi.org/10.22456/2175-2745.11695

Issue

Section

Regular Papers

Most read articles by the same author(s)