Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/14791
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorMenasché, Daniel Sadoc-
dc.contributor.authorMontalvão, Tiago Carvalho Gomes-
dc.date.accessioned2021-08-16T22:54:00Z-
dc.date.available2023-12-21T03:08:06Z-
dc.date.issued2021-06-17-
dc.identifier.urihttp://hdl.handle.net/11422/14791-
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado por reforçopt_BR
dc.subjectAprendizado computacionalpt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectRedes neuraispt_BR
dc.titleAplicando modelos de aprendizado por reforço profundo em um jogo adversáriopt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9931198850020140pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/3988000608743699pt_BR
dc.contributor.referee1Silva, João Carlos Pereira da-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/9413102524215939pt_BR
dc.contributor.referee2Caarls, Wouter-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/1164394299894445pt_BR
dc.description.resumoEste trabalho tem como objetivo explorar a área de aprendizado por reforço profundo, que tem apresentado grandes evoluções nos últimos anos e é considerada por diversos pesquisadores a área mais próxima da chamada Inteligência Artificial Geral ou Inteligência Artificial Forte. Uma variação do jogo da velha é apresentada e um modelo é proposto para o treinamento de um agente inteligente capaz de jogar este jogo, de tal forma que as ações do agente combinam uma parte numérica com uma parte categórica. Para isto, este trabalho introduz grande parte da modelagem encontrada na área de Aprendizado por Reforço Profundo. São exploradas diversas configurações para o treinamento deste agente a fim de validar a que apresenta o melhor desempenho no jogo. A pontuação é calculada com base em partidas contra um agente proposto ao longo do trabalho que age em partes de forma aleatória e em partes de forma inteligente. Por fim, são apresentados os resultados obtidos nos experimentos, desafios encontrados e propostas de melhoria para trabalhos futuros.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Computaçãopt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::LOGICAS E SEMANTICA DE PROGRAMASpt_BR
dc.embargo.termsabertopt_BR
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
TCGMontalvao.pdf877.19 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.