Um estudo do aprendizado por esforço com enfoque no ensino de xadrez para iniciantes

Sepulveda, Daniel Jimenez; Simões, Matheus Cunha

Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/15776

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Silva, João Carlos Pereira da	-
dc.contributor.author	Simões, Matheus Cunha	-
dc.contributor.author	Sepulveda, Daniel Jimenez	-
dc.date.accessioned	2021-12-09T20:29:43Z	-
dc.date.available	2023-12-21T03:08:41Z	-
dc.date.issued	2021-11-22	-
dc.identifier.uri	http://hdl.handle.net/11422/15776	-
dc.language	por	pt_BR
dc.publisher	Universidade Federal do Rio de Janeiro	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Aprendizado por reforço	pt_BR
dc.subject	Aprendizado computacional	pt_BR
dc.subject	Jogos	pt_BR
dc.subject	Xadrez	pt_BR
dc.title	Um estudo do aprendizado por esforço com enfoque no ensino de xadrez para iniciantes	pt_BR
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/9413102524215939	pt_BR
dc.contributor.referee1	Menasche, Daniel Sadoc	-
dc.contributor.referee1Lattes	http://lattes.cnpq.br/9931198850020140	pt_BR
dc.contributor.referee2	Paixão, João Antonio Recio	-
dc.contributor.referee2Lattes	http://lattes.cnpq.br/5705386762324718	pt_BR
dc.description.resumo	O aprendizado por reforço permite que seja realizado o treinamento de agentes autônomos que determinam quais são as melhores ações dado o ambiente em que estão inseridos. A utilização dos agentes autônomos em jogos está cada vez mais comum e incentiva a busca pelo entendimento das decisões tomadas pelo software e a descoberta de novas técnicas de treinamento. Este trabalho tem como objetivo aplicar o aprendizado por reforço a partir de configurações específicas do xadrez, avaliar a performance dos agentes obtidos dado as particularidades de cada configuração e disponibilizá-los para partidas contra pessoas com diferentes níveis de conhecimento do jogo. Nos experimentos, os agentes exploram o espaço de estados do jogo e recebem recompensas por movimentos que resultem em vitória de modo que sejam identificadas as jogadas boas. São aplicadas três configurações de dificuldade variada e que são utilizadas em aulas de xadrez para demonstrar conceitos específicos a jogadores iniciantes. Além disso, para melhor performance e avaliação, utilizamos técnicas e ferramentas para representação do tabuleiro e visualização das jogadas computacionalmente. Por fim, são apresentados os resultados dos experimentos, as limitações e desafios encontrados no treinamento e possibilidades de trabalhos futuros para obter melhor desempenho.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Instituto de Computação	pt_BR
dc.publisher.initials	UFRJ	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO	pt_BR
dc.embargo.terms	aberto	pt_BR
Appears in Collections:	Ciência da Computação

Files in This Item:

File	Description	Size	Format
MCSimoes.pdf		802.64 kB	Adobe PDF	View/Open

Show simple item record Recommend this item View Statistics

Pantheon Institutional repository