Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/11422/14791
Tipo: | Trabalho de conclusão de graduação |
Título: | Aplicando modelos de aprendizado por reforço profundo em um jogo adversário |
Autor(es)/Inventor(es): | Montalvão, Tiago Carvalho Gomes |
Orientador: | Menasché, Daniel Sadoc |
Resumo: | Este trabalho tem como objetivo explorar a área de aprendizado por reforço profundo, que tem apresentado grandes evoluções nos últimos anos e é considerada por diversos pesquisadores a área mais próxima da chamada Inteligência Artificial Geral ou Inteligência Artificial Forte. Uma variação do jogo da velha é apresentada e um modelo é proposto para o treinamento de um agente inteligente capaz de jogar este jogo, de tal forma que as ações do agente combinam uma parte numérica com uma parte categórica. Para isto, este trabalho introduz grande parte da modelagem encontrada na área de Aprendizado por Reforço Profundo. São exploradas diversas configurações para o treinamento deste agente a fim de validar a que apresenta o melhor desempenho no jogo. A pontuação é calculada com base em partidas contra um agente proposto ao longo do trabalho que age em partes de forma aleatória e em partes de forma inteligente. Por fim, são apresentados os resultados obtidos nos experimentos, desafios encontrados e propostas de melhoria para trabalhos futuros. |
Palavras-chave: | Aprendizado por reforço Aprendizado computacional Inteligência artificial Redes neurais |
Assunto CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::LOGICAS E SEMANTICA DE PROGRAMAS |
Unidade produtora: | Instituto de Computação |
Editora: | Universidade Federal do Rio de Janeiro |
Data de publicação: | 17-Jun-2021 |
País de publicação: | Brasil |
Idioma da publicação: | por |
Tipo de acesso: | Acesso Aberto |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCGMontalvao.pdf | 877.19 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.