Aplicando modelos de aprendizado por reforço profundo em um jogo adversário

Montalvão, Tiago Carvalho Gomes

Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/14791

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Menasché, Daniel Sadoc	-
dc.contributor.author	Montalvão, Tiago Carvalho Gomes	-
dc.date.accessioned	2021-08-16T22:54:00Z	-
dc.date.available	2023-12-21T03:08:06Z	-
dc.date.issued	2021-06-17	-
dc.identifier.uri	http://hdl.handle.net/11422/14791	-
dc.language	por	pt_BR
dc.publisher	Universidade Federal do Rio de Janeiro	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Aprendizado por reforço	pt_BR
dc.subject	Aprendizado computacional	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject	Redes neurais	pt_BR
dc.title	Aplicando modelos de aprendizado por reforço profundo em um jogo adversário	pt_BR
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/9931198850020140	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/3988000608743699	pt_BR
dc.contributor.referee1	Silva, João Carlos Pereira da	-
dc.contributor.referee1Lattes	http://lattes.cnpq.br/9413102524215939	pt_BR
dc.contributor.referee2	Caarls, Wouter	-
dc.contributor.referee2Lattes	http://lattes.cnpq.br/1164394299894445	pt_BR
dc.description.resumo	Este trabalho tem como objetivo explorar a área de aprendizado por reforço profundo, que tem apresentado grandes evoluções nos últimos anos e é considerada por diversos pesquisadores a área mais próxima da chamada Inteligência Artificial Geral ou Inteligência Artificial Forte. Uma variação do jogo da velha é apresentada e um modelo é proposto para o treinamento de um agente inteligente capaz de jogar este jogo, de tal forma que as ações do agente combinam uma parte numérica com uma parte categórica. Para isto, este trabalho introduz grande parte da modelagem encontrada na área de Aprendizado por Reforço Profundo. São exploradas diversas configurações para o treinamento deste agente a fim de validar a que apresenta o melhor desempenho no jogo. A pontuação é calculada com base em partidas contra um agente proposto ao longo do trabalho que age em partes de forma aleatória e em partes de forma inteligente. Por fim, são apresentados os resultados obtidos nos experimentos, desafios encontrados e propostas de melhoria para trabalhos futuros.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Instituto de Computação	pt_BR
dc.publisher.initials	UFRJ	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::LOGICAS E SEMANTICA DE PROGRAMAS	pt_BR
dc.embargo.terms	aberto	pt_BR
Appears in Collections:	Ciência da Computação

Files in This Item:

File	Description	Size	Format
TCGMontalvao.pdf		877.19 kB	Adobe PDF	View/Open

Show simple item record Recommend this item View Statistics

Pantheon Institutional repository