Aprendizado por reforço com aproximadores não lineares aplicados a jogos eletrônicos

Cano, Lyang Higa

Pantheon Repositorio Institucional

Recopila, preserva y difundi la producción académica digital en todas las áreas del conocimiento.
Comprende los activos del repositorio, además de tesis y disertaciones en la UFRJ, artículos científicos, libros electrónicos, capítulos de libros y trabajos presentados en eventos para los profesores, investigadores, personal administrativo y estudiantes de maestría y doctorado.

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/18241

Especie:	Trabalho de conclusão de graduação
Título :	Aprendizado por reforço com aproximadores não lineares aplicados a jogos eletrônicos
Otros títulos:	Reinforcement learning with non-linear approximants applied to electronic games
Autor(es)/Inventor(es):	Cano, Lyang Higa
Tutor:	Evsukof, Alexandre Gonçalves
Resumen:	A Inteligência Artificial tem se tornado cada vez mais importante no mundo atual e o Aprendizado por Reforço tem ocupado uma área de destaque. No entanto, ainda há diversos problemas em aberto, como o problema de Convergência de Política Ótima, que ocorre ao combinar três elementos essenciais, o Bootstrapping, a metodologia Off-Policy e os Aproximadores Não Lineares. Até que o Artigo Human Level Control Through Deep Reinforcement Learning [1] do grupo de pesquisa Deep Mind propõem uma nova abordagem que consegue contornar tal problema. Este trabalho tem como objetivo apresentar cada um destes três elementos, apresentar o Problema de Convergência de Política Ótima, verificar a abordagem proposta pelo Artigo [1], realizar um novo teste e avaliar se tal proposta é realmente eficaz. A contribuição deste trabalho consiste primeiramente na revisão bibliográfica deste tema, que é extenso e complexo, numa análise profunda do Artigo [1], especialmento do Algoritmo Deep Q-Network, e por fim em uma nova avaliação através de experimentos em um ambiente diferente dos utilizados no Artigo
Materia:	Aprendizado Por Reforço IA
Materia CNPq:	CNPQ::ENGENHARIAS
Unidade de producción:	Escola Politécnica
Editor:	Universidade Federal do Rio de Janeiro
Fecha de publicación:	ago-2019
País de edición :	Brasil
Idioma de publicación:	por
Tipo de acceso :	Acesso Aberto
Aparece en las colecciones:	Engenharia de Computação e Informação

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
monopoli10029824.pdf		1.89 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem Recomiende este ítem View Statistics