Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/15776
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Silva, João Carlos Pereira da | - |
dc.contributor.author | Simões, Matheus Cunha | - |
dc.contributor.author | Sepulveda, Daniel Jimenez | - |
dc.date.accessioned | 2021-12-09T20:29:43Z | - |
dc.date.available | 2023-12-21T03:08:41Z | - |
dc.date.issued | 2021-11-22 | - |
dc.identifier.uri | http://hdl.handle.net/11422/15776 | - |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal do Rio de Janeiro | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Aprendizado por reforço | pt_BR |
dc.subject | Aprendizado computacional | pt_BR |
dc.subject | Jogos | pt_BR |
dc.subject | Xadrez | pt_BR |
dc.title | Um estudo do aprendizado por esforço com enfoque no ensino de xadrez para iniciantes | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9413102524215939 | pt_BR |
dc.contributor.referee1 | Menasche, Daniel Sadoc | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/9931198850020140 | pt_BR |
dc.contributor.referee2 | Paixão, João Antonio Recio | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/5705386762324718 | pt_BR |
dc.description.resumo | O aprendizado por reforço permite que seja realizado o treinamento de agentes autônomos que determinam quais são as melhores ações dado o ambiente em que estão inseridos. A utilização dos agentes autônomos em jogos está cada vez mais comum e incentiva a busca pelo entendimento das decisões tomadas pelo software e a descoberta de novas técnicas de treinamento. Este trabalho tem como objetivo aplicar o aprendizado por reforço a partir de configurações específicas do xadrez, avaliar a performance dos agentes obtidos dado as particularidades de cada configuração e disponibilizá-los para partidas contra pessoas com diferentes níveis de conhecimento do jogo. Nos experimentos, os agentes exploram o espaço de estados do jogo e recebem recompensas por movimentos que resultem em vitória de modo que sejam identificadas as jogadas boas. São aplicadas três configurações de dificuldade variada e que são utilizadas em aulas de xadrez para demonstrar conceitos específicos a jogadores iniciantes. Além disso, para melhor performance e avaliação, utilizamos técnicas e ferramentas para representação do tabuleiro e visualização das jogadas computacionalmente. Por fim, são apresentados os resultados dos experimentos, as limitações e desafios encontrados no treinamento e possibilidades de trabalhos futuros para obter melhor desempenho. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Computação | pt_BR |
dc.publisher.initials | UFRJ | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO | pt_BR |
dc.embargo.terms | aberto | pt_BR |
Appears in Collections: | Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MCSimoes.pdf | 802.64 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.