Journal of Control, Automation and Electrical Systems, 2018
This paper reports the use of response surface model (RSM) and reinforcement learning (RL) to sol... more This paper reports the use of response surface model (RSM) and reinforcement learning (RL) to solve the travelling salesman problem (TSP). In contrast to heuristically approaches to estimate the parameters of RL, the method proposed here allows a systematic estimation of the learning rate and the discount factor parameters.The Q-learning and SARSA algorithms were applied to standard problems from the TSPLIB library. Computational results demonstrate that the use of RSM is capable of producing better solutions to both symmetric and asymmetric tests of TSP.
Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Probl... more Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.
This article presents the UFSJ2D Team, a team of simulated
robots soccer from UFSJ - Federal Univ... more This article presents the UFSJ2D Team, a team of simulated robots soccer from UFSJ - Federal University of Sao Joao del-Rei, MG, Brazil. The main goals in this paper are to apply reinforcement learning in the optimization of decision taking and to model a strategy using fuzzy logic.
XI CONGRESSO BRASILEIRO DE INTELIGÊNCIA COMPUTACIONAL – CBIC 2013, 2013
O objetivo deste trabalho foi aplicar e analisar os efeitos do aprendizado por reforço na otimiza... more O objetivo deste trabalho foi aplicar e analisar os efeitos do aprendizado por reforço na otimização de tomadas decisões de um sistema multiagente cooperativo. É apresentada uma metodologia de modelagem da técnica de aprendizado por reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consistiu de quatro etapas: definição das ações dos agentes; definição dos estados do ambiente no qual os agentes estão inseridos; definição dos valores dos reforços; implementação no simulador RcSoccerSim da Robocup de futebol de robôs. Os testes estatísticos foram utilizados para verificar o comportamento do time de robôs durante todo o processo de aprendizado. A análise se deu verificando a evolução de desempenho do sistema multiagente como um todo, através de estudos do saldo de gols alcançado em cada jogo. Além disso, a performance individual de cada agente também foi quantificada. Através dos testes de análise de variância e comparações múltiplas foi possível quantificar quais agentes sofreram alterações de performance ao longo do processo de otimização.
O presente trabalho apresenta uma metodologia de modelagem da técnica de aprendizado por
refor... more O presente trabalho apresenta uma metodologia de modelagem da técnica de aprendizado por
reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consiste de quatro
etapas: denição e discretização das ações dos agentes; denição e discretização dos estados do ambiente no
qual os agentes estão inseridos; denic~ao dos valores dos reforços da tabela R, para cada par Estado (S) X Ac~ao
(A); implementac~ao no Simulador RcSoccerSim da Robocup de Futebol de Robôs. Além disso, e proposta uma
análise estatística por meio do teste T-Pareado para compreender o sistema de aprendizagem quando submetido
a competição entre outros times.
This article presents the UaiSoccer2D team, a simulation
team of robots soccer simulated at UFSJ ... more This article presents the UaiSoccer2D team, a simulation team of robots soccer simulated at UFSJ - Federal University of São João del-Rei, MG, Brazil. Will be present a modeling strategy for use of reinforcement learning algorithm Q-learning.
Journal of Control, Automation and Electrical Systems, 2018
This paper reports the use of response surface model (RSM) and reinforcement learning (RL) to sol... more This paper reports the use of response surface model (RSM) and reinforcement learning (RL) to solve the travelling salesman problem (TSP). In contrast to heuristically approaches to estimate the parameters of RL, the method proposed here allows a systematic estimation of the learning rate and the discount factor parameters.The Q-learning and SARSA algorithms were applied to standard problems from the TSPLIB library. Computational results demonstrate that the use of RSM is capable of producing better solutions to both symmetric and asymmetric tests of TSP.
Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Probl... more Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.
This article presents the UFSJ2D Team, a team of simulated
robots soccer from UFSJ - Federal Univ... more This article presents the UFSJ2D Team, a team of simulated robots soccer from UFSJ - Federal University of Sao Joao del-Rei, MG, Brazil. The main goals in this paper are to apply reinforcement learning in the optimization of decision taking and to model a strategy using fuzzy logic.
XI CONGRESSO BRASILEIRO DE INTELIGÊNCIA COMPUTACIONAL – CBIC 2013, 2013
O objetivo deste trabalho foi aplicar e analisar os efeitos do aprendizado por reforço na otimiza... more O objetivo deste trabalho foi aplicar e analisar os efeitos do aprendizado por reforço na otimização de tomadas decisões de um sistema multiagente cooperativo. É apresentada uma metodologia de modelagem da técnica de aprendizado por reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consistiu de quatro etapas: definição das ações dos agentes; definição dos estados do ambiente no qual os agentes estão inseridos; definição dos valores dos reforços; implementação no simulador RcSoccerSim da Robocup de futebol de robôs. Os testes estatísticos foram utilizados para verificar o comportamento do time de robôs durante todo o processo de aprendizado. A análise se deu verificando a evolução de desempenho do sistema multiagente como um todo, através de estudos do saldo de gols alcançado em cada jogo. Além disso, a performance individual de cada agente também foi quantificada. Através dos testes de análise de variância e comparações múltiplas foi possível quantificar quais agentes sofreram alterações de performance ao longo do processo de otimização.
O presente trabalho apresenta uma metodologia de modelagem da técnica de aprendizado por
refor... more O presente trabalho apresenta uma metodologia de modelagem da técnica de aprendizado por
reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consiste de quatro
etapas: denição e discretização das ações dos agentes; denição e discretização dos estados do ambiente no
qual os agentes estão inseridos; denic~ao dos valores dos reforços da tabela R, para cada par Estado (S) X Ac~ao
(A); implementac~ao no Simulador RcSoccerSim da Robocup de Futebol de Robôs. Além disso, e proposta uma
análise estatística por meio do teste T-Pareado para compreender o sistema de aprendizagem quando submetido
a competição entre outros times.
This article presents the UaiSoccer2D team, a simulation
team of robots soccer simulated at UFSJ ... more This article presents the UaiSoccer2D team, a simulation team of robots soccer simulated at UFSJ - Federal University of São João del-Rei, MG, Brazil. Will be present a modeling strategy for use of reinforcement learning algorithm Q-learning.
Uploads
Papers by André Ottoni
robots soccer from UFSJ - Federal University of Sao Joao del-Rei, MG, Brazil. The main goals in this paper are to apply reinforcement learning in the optimization of decision taking and to model a strategy using fuzzy logic.
reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consiste de quatro
etapas: denição e discretização das ações dos agentes; denição e discretização dos estados do ambiente no
qual os agentes estão inseridos; denic~ao dos valores dos reforços da tabela R, para cada par Estado (S) X Ac~ao
(A); implementac~ao no Simulador RcSoccerSim da Robocup de Futebol de Robôs. Além disso, e proposta uma
análise estatística por meio do teste T-Pareado para compreender o sistema de aprendizagem quando submetido
a competição entre outros times.
team of robots soccer simulated at UFSJ - Federal University of São João del-Rei, MG, Brazil. Will be present a modeling strategy for use of reinforcement learning algorithm Q-learning.
robots soccer from UFSJ - Federal University of Sao Joao del-Rei, MG, Brazil. The main goals in this paper are to apply reinforcement learning in the optimization of decision taking and to model a strategy using fuzzy logic.
reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consiste de quatro
etapas: denição e discretização das ações dos agentes; denição e discretização dos estados do ambiente no
qual os agentes estão inseridos; denic~ao dos valores dos reforços da tabela R, para cada par Estado (S) X Ac~ao
(A); implementac~ao no Simulador RcSoccerSim da Robocup de Futebol de Robôs. Além disso, e proposta uma
análise estatística por meio do teste T-Pareado para compreender o sistema de aprendizagem quando submetido
a competição entre outros times.
team of robots soccer simulated at UFSJ - Federal University of São João del-Rei, MG, Brazil. Will be present a modeling strategy for use of reinforcement learning algorithm Q-learning.