André Ottoni

Universidade Federal do Recôncavo da Bahia, Centro de Ciências Exatas e Tecnológicas, Faculty Member

UFSJ - Federal University of São João Del-Rei, Departamento de Engenharia Elétrica, Graduate Student

Followers

Following

Public Views

InterestsView All (13)

Uploads

Papers by André Ottoni

A Response Surface Model Approach to Parameter Estimation of Reinforcement Learning for the Travelling Salesman Problem

Journal of Control, Automation and Electrical Systems, 2018

This paper reports the use of response surface model (RSM) and reinforcement learning (RL) to sol... more This paper reports the use of response surface model (RSM) and reinforcement learning (RL) to solve the travelling salesman problem (TSP). In contrast to heuristically approaches to estimate the parameters of RL, the method proposed here allows a systematic estimation of the learning rate and the discount factor parameters.The Q-learning and SARSA algorithms were applied to standard problems from the TSPLIB library. Computational results demonstrate that the use of RSM is capable of producing better solutions to both symmetric and asymmetric tests of TSP.

Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional

Revista Brasileira de Computação Aplicada, 2017

Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Probl... more Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.

Controle de Epidemias com Aprendizado por Reforço: Estratégia de Combate ao Aedes aegypti

Download

Modelo Híbrido de Aprendizado por Reforço e Lógica Fuzzy Aplicado ao Problema do Caixeiro Viajante com Reabastecimento

XXI Congresso Brasileiro de Automática - CBA2016 , 2016

Análise de Sensibilidade dos Parâmetros do Aprendizado por Reforço na Solução do Problema do Caixeiro Viajante: Modelagem via Superfície de Resposta

XXI Congresso Brasileiro de Automática - CBA2016 , 2016

Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma

Revista Brasileira de Computação Aplicada, 2016

Análise do Desempenho do Aprendizado por Reforço na Solução do Problema do Caixeiro Viajante

XII SBAI - Simpósio Brasileiro de Automação Inteligente, 2015

Análise do Aprendizado por Reforço via Modelos de Regressão Logística: Um Estudo de Caso no Futebol de Robôs

Revista Junior de Iniciação Científica em Ciências Exatas e Engenharia, 2015

UFSJ2D (UaiSoccer2D + RoboCap): Team Description Paper Robocup 2014

This article presents the UFSJ2D Team, a team of simulated robots soccer from UFSJ - Federal Univ... more

Download

Análise do Aprendizado por Reforço Aplicado a Otimização em Tomadas de Decisões Multiagente

XI CONGRESSO BRASILEIRO DE INTELIGÊNCIA COMPUTACIONAL – CBIC 2013, 2013

O objetivo deste trabalho foi aplicar e analisar os efeitos do aprendizado por reforço na otimiza... more O objetivo deste trabalho foi aplicar e analisar os efeitos do aprendizado por reforço na otimização de tomadas decisões de um sistema multiagente cooperativo. É apresentada uma metodologia de modelagem da técnica de aprendizado por reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consistiu de quatro etapas: definição das ações dos agentes; definição dos estados do ambiente no qual os agentes estão inseridos; definição dos valores dos reforços; implementação no simulador RcSoccerSim da Robocup de futebol de robôs. Os testes estatísticos foram utilizados para verificar o comportamento do time de robôs durante todo o processo de aprendizado. A análise se deu verificando a evolução de desempenho do sistema multiagente como um todo, através de estudos do saldo de gols alcançado em cada jogo. Além disso, a performance individual de cada agente também foi quantificada. Através dos testes de análise de variância e comparações múltiplas foi possível quantificar quais agentes sofreram alterações de performance ao longo do processo de otimização.

DESENVOLVIMENTO DE UM SISTEMA DE APRENDIZADO POR REFORÇO PARA TIMES DE ROBÔS - UMA ANÁLISE DE DESEMPENHO POR MEIO DE TESTES ESTATÍSTICOS

O presente trabalho apresenta uma metodologia de modelagem da técnica de aprendizado por refor... more O presente trabalho apresenta uma metodologia de modelagem da técnica de aprendizado por
reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consiste de quatro
etapas: denição e discretização das ações dos agentes; denição e discretização dos estados do ambiente no
qual os agentes estão inseridos; denic~ao dos valores dos reforços da tabela R, para cada par Estado (S) X Ac~ao
(A); implementac~ao no Simulador RcSoccerSim da Robocup de Futebol de Robôs. Além disso, e proposta uma
análise estatística por meio do teste T-Pareado para compreender o sistema de aprendizagem quando submetido
a competição entre outros times.

Download