Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/19377
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorCapron, Bruno Didier Olivier-
dc.contributor.authorVieira, Vinícius Ribeiro-
dc.contributor.authorFerreira, Jonny Farias Vicente-
dc.date.accessioned2022-12-14T19:22:04Z-
dc.date.available2023-12-21T03:09:40Z-
dc.date.issued2022-11-23-
dc.identifier.urihttp://hdl.handle.net/11422/19377-
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectReinforcement learningpt_BR
dc.titleDesenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulaçãopt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3006635957267883pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/9536668836352750pt_BR
dc.contributor.referee1Alberton, Kese Pontes Freitas-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/6508408949800887pt_BR
dc.contributor.referee2Torraca Neto, José Rodrigues-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5656727173285055pt_BR
dc.contributor.referee3Viana, Marcelo Mendes-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/2879216880730517pt_BR
dc.description.resumoOs avanços computacionais dos últimos 50 anos permitiram a elevação da inteligência artificial a novos patamares. Nesse contexto, surgiu o reinforcement learning: uma metodologia que permite aprender a ação a ser tomada e mapear situações de forma a realizar uma tarefa. Nos dias de hoje, essa metodologia pode ser encontrada em diversas áreas, como robótica, finanças, marketing e controle e automação, como ilustra este projeto. Este trabalho utiliza desta técnica para desenvolver uma metodologia em Python com as bibliotecas Numpy, Scipy e Pandas baseada em três passos para implementar um controlador de nível de tanque e aplicá-lo em simulações de sistemas diferentes aos quais fora treinado com o objetivo de avaliar a influência do aprendizado online no seu desempenho. O primeiro passo se tratou do treinamento offline do controlador. Já o segundo passo, foi realizado o treinamento online do controlador no sistema de pior desempenho. Por fim, no terceiro passo foi feito a comparação entre a resposta do controlador referente aos dois treinamentos. Os resultados evidenciam a robustez do controlador, adaptando-se aos diferentes cenários, assim como a melhor resposta que o aprendizado online pode proporcionar.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentEscola de Químicapt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICApt_BR
dc.embargo.termsabertopt_BR
Appears in Collections:Engenharia Química

Files in This Item:
File Description SizeFormat 
VRVieira.pdf454.99 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.