Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/18241
Tipo: Trabalho de conclusão de graduação
Título: Aprendizado por reforço com aproximadores não lineares aplicados a jogos eletrônicos
Título(s) alternativo(s): Reinforcement learning with non-linear approximants applied to electronic games
Autor(es)/Inventor(es): Cano, Lyang Higa
Orientador: Evsukof, Alexandre Gonçalves
Resumo: A Inteligência Artificial tem se tornado cada vez mais importante no mundo atual e o Aprendizado por Reforço tem ocupado uma área de destaque. No entanto, ainda há diversos problemas em aberto, como o problema de Convergência de Política Ótima, que ocorre ao combinar três elementos essenciais, o Bootstrapping, a metodologia Off-Policy e os Aproximadores Não Lineares. Até que o Artigo Human Level Control Through Deep Reinforcement Learning [1] do grupo de pesquisa Deep Mind propõem uma nova abordagem que consegue contornar tal problema. Este trabalho tem como objetivo apresentar cada um destes três elementos, apresentar o Problema de Convergência de Política Ótima, verificar a abordagem proposta pelo Artigo [1], realizar um novo teste e avaliar se tal proposta é realmente eficaz. A contribuição deste trabalho consiste primeiramente na revisão bibliográfica deste tema, que é extenso e complexo, numa análise profunda do Artigo [1], especialmento do Algoritmo Deep Q-Network, e por fim em uma nova avaliação através de experimentos em um ambiente diferente dos utilizados no Artigo
Palavras-chave: Aprendizado Por Reforço
IA
Assunto CNPq: CNPQ::ENGENHARIAS
Unidade produtora: Escola Politécnica
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: Ago-2019
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Engenharia de Computação e Informação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
monopoli10029824.pdf1.89 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.