Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/18241
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorEvsukof, Alexandre Gonçalves-
dc.contributor.authorCano, Lyang Higa-
dc.date.accessioned2022-08-05T21:41:51Z-
dc.date.available2023-12-21T03:00:22Z-
dc.date.issued2019-08-
dc.identifier.urihttp://hdl.handle.net/11422/18241-
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado Por Reforçopt_BR
dc.subjectIApt_BR
dc.titleAprendizado por reforço com aproximadores não lineares aplicados a jogos eletrônicospt_BR
dc.title.alternativeReinforcement learning with non-linear approximants applied to electronic gamespt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.referee1Figueiredo, Daniel Ratton-
dc.contributor.referee2Resende Junior, Fernando Gil Vianna-
dc.description.resumoA Inteligência Artificial tem se tornado cada vez mais importante no mundo atual e o Aprendizado por Reforço tem ocupado uma área de destaque. No entanto, ainda há diversos problemas em aberto, como o problema de Convergência de Política Ótima, que ocorre ao combinar três elementos essenciais, o Bootstrapping, a metodologia Off-Policy e os Aproximadores Não Lineares. Até que o Artigo Human Level Control Through Deep Reinforcement Learning [1] do grupo de pesquisa Deep Mind propõem uma nova abordagem que consegue contornar tal problema. Este trabalho tem como objetivo apresentar cada um destes três elementos, apresentar o Problema de Convergência de Política Ótima, verificar a abordagem proposta pelo Artigo [1], realizar um novo teste e avaliar se tal proposta é realmente eficaz. A contribuição deste trabalho consiste primeiramente na revisão bibliográfica deste tema, que é extenso e complexo, numa análise profunda do Artigo [1], especialmento do Algoritmo Deep Q-Network, e por fim em uma nova avaliação através de experimentos em um ambiente diferente dos utilizados no Artigopt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentEscola Politécnicapt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::ENGENHARIASpt_BR
dc.embargo.termsabertopt_BR
Appears in Collections:Engenharia de Computação e Informação

Files in This Item:
File Description SizeFormat 
monopoli10029824.pdf1.89 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.