Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11422/18241
Especie: | Trabalho de conclusão de graduação |
Título : | Aprendizado por reforço com aproximadores não lineares aplicados a jogos eletrônicos |
Otros títulos: | Reinforcement learning with non-linear approximants applied to electronic games |
Autor(es)/Inventor(es): | Cano, Lyang Higa |
Tutor: | Evsukof, Alexandre Gonçalves |
Resumen: | A Inteligência Artificial tem se tornado cada vez mais importante no mundo atual e o Aprendizado por Reforço tem ocupado uma área de destaque. No entanto, ainda há diversos problemas em aberto, como o problema de Convergência de Política Ótima, que ocorre ao combinar três elementos essenciais, o Bootstrapping, a metodologia Off-Policy e os Aproximadores Não Lineares. Até que o Artigo Human Level Control Through Deep Reinforcement Learning [1] do grupo de pesquisa Deep Mind propõem uma nova abordagem que consegue contornar tal problema. Este trabalho tem como objetivo apresentar cada um destes três elementos, apresentar o Problema de Convergência de Política Ótima, verificar a abordagem proposta pelo Artigo [1], realizar um novo teste e avaliar se tal proposta é realmente eficaz. A contribuição deste trabalho consiste primeiramente na revisão bibliográfica deste tema, que é extenso e complexo, numa análise profunda do Artigo [1], especialmento do Algoritmo Deep Q-Network, e por fim em uma nova avaliação através de experimentos em um ambiente diferente dos utilizados no Artigo |
Materia: | Aprendizado Por Reforço IA |
Materia CNPq: | CNPQ::ENGENHARIAS |
Unidade de producción: | Escola Politécnica |
Editor: | Universidade Federal do Rio de Janeiro |
Fecha de publicación: | ago-2019 |
País de edición : | Brasil |
Idioma de publicación: | por |
Tipo de acceso : | Acesso Aberto |
Aparece en las colecciones: | Engenharia de Computação e Informação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
monopoli10029824.pdf | 1.89 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.