Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/15776
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorSilva, João Carlos Pereira da-
dc.contributor.authorSimões, Matheus Cunha-
dc.contributor.authorSepulveda, Daniel Jimenez-
dc.date.accessioned2021-12-09T20:29:43Z-
dc.date.available2023-12-21T03:08:41Z-
dc.date.issued2021-11-22-
dc.identifier.urihttp://hdl.handle.net/11422/15776-
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado por reforçopt_BR
dc.subjectAprendizado computacionalpt_BR
dc.subjectJogospt_BR
dc.subjectXadrezpt_BR
dc.titleUm estudo do aprendizado por esforço com enfoque no ensino de xadrez para iniciantespt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9413102524215939pt_BR
dc.contributor.referee1Menasche, Daniel Sadoc-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/9931198850020140pt_BR
dc.contributor.referee2Paixão, João Antonio Recio-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5705386762324718pt_BR
dc.description.resumoO aprendizado por reforço permite que seja realizado o treinamento de agentes autônomos que determinam quais são as melhores ações dado o ambiente em que estão inseridos. A utilização dos agentes autônomos em jogos está cada vez mais comum e incentiva a busca pelo entendimento das decisões tomadas pelo software e a descoberta de novas técnicas de treinamento. Este trabalho tem como objetivo aplicar o aprendizado por reforço a partir de configurações específicas do xadrez, avaliar a performance dos agentes obtidos dado as particularidades de cada configuração e disponibilizá-los para partidas contra pessoas com diferentes níveis de conhecimento do jogo. Nos experimentos, os agentes exploram o espaço de estados do jogo e recebem recompensas por movimentos que resultem em vitória de modo que sejam identificadas as jogadas boas. São aplicadas três configurações de dificuldade variada e que são utilizadas em aulas de xadrez para demonstrar conceitos específicos a jogadores iniciantes. Além disso, para melhor performance e avaliação, utilizamos técnicas e ferramentas para representação do tabuleiro e visualização das jogadas computacionalmente. Por fim, são apresentados os resultados dos experimentos, as limitações e desafios encontrados no treinamento e possibilidades de trabalhos futuros para obter melhor desempenho.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Computaçãopt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOpt_BR
dc.embargo.termsabertopt_BR
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
MCSimoes.pdf802.64 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.