Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/17961
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Capron, Bruno Didier Olivier | - |
dc.contributor.author | Lima, Rodrigo Moysés | - |
dc.date.accessioned | 2022-07-27T19:47:25Z | - |
dc.date.available | 2023-12-21T03:00:19Z | - |
dc.date.issued | 2018-09 | - |
dc.identifier.uri | http://hdl.handle.net/11422/17961 | - |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal do Rio de Janeiro | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Reinforcement Learning | pt_BR |
dc.subject | Machine Learning | pt_BR |
dc.subject | Controle de Processos | pt_BR |
dc.subject | Actor-Critic | pt_BR |
dc.title | Aplicação de algoritmos de reinforcement learning para controle de nível de um tanque | pt_BR |
dc.title.alternative | Application of reinforcement learning algorithms for tank level control | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3006635957267883 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/3544294840089442 | pt_BR |
dc.contributor.advisorCo1 | Thomaz, Daniel Machado | - |
dc.contributor.advisorCo1Lattes | http://lattes.cnpq.br/7139174170761693 | pt_BR |
dc.contributor.referee1 | Gozzi, Jomar | - |
dc.contributor.referee2 | Souza, Maurício Bezerra de | - |
dc.description.resumo | Metodologias baseadas em dados são cada vez mais utilizadas para a resolução das mais diversas tarefas. Nesse trabalho, a metodologia reinforcement learning (RL) é aplicada no escopo de controle de processos. Realizou-se o projeto de um controlador de nível de um tanque com a utilização de RL e aplicação da metodologia actor-critic. Essa abordagem foi escolhida pois utiliza tanto o espaço de estados quanto o de ações contínuos, que é o mais indicado para uma representação adequada de processos contínuos. Os resultados mostram que o controle desenvolvido tem desempenho similar a um controlador clássico do tipo PI. Essa validação desse controle baseado em dados de processo para uma planta não-linear simples abre a porta para a sua implementação em processos cada vez mais complexos. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Escola Politécnica | pt_BR |
dc.publisher.initials | UFRJ | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS | pt_BR |
dc.embargo.terms | aberto | pt_BR |
Appears in Collections: | Engenharia de Controle e Automação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
monopoli10025771.pdf | 1.11 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.