Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/20474
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorLopes, Giseli Rabello-
dc.contributor.authorOliveira, Thiago do Nascimento-
dc.date.accessioned2023-05-16T17:38:39Z-
dc.date.available2023-12-21T03:00:25Z-
dc.date.issued2023-04-26-
dc.identifier.urihttp://hdl.handle.net/11422/20474-
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectinteligência artificialpt_BR
dc.subjectmineração de dadospt_BR
dc.subjectmineração de textospt_BR
dc.subjectweb scrapingpt_BR
dc.titleConstrução e classificação de uma base textual em portuguêspt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9439416101626260pt_BR
dc.contributor.advisorCo1Silva, João Carlos P. da-
dc.contributor.advisorCo1Latteshttp://lattes.cnpq.br/9413102524215939pt_BR
dc.contributor.referee1Marcelino, Carolina Gil-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/3289676418940953pt_BR
dc.contributor.referee2Paixão, João Antonio Recio da-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5705386762324718pt_BR
dc.description.resumoA Web tornou-se um importante meio para disponibilização de informações. Entre as principais dificuldades, nesse contexto dinâmico, estão a busca por informações específicas e a categorização das mesmas. Com a facilidade de acesso à Internet e a possibilidade de qualquer pessoa publicar ou replicar conteúdo online, é preciso ter cuidado ao selecionar as fontes dessas informações. No domínio do setor elétrico não é diferente. Um importante ator, nesse cenário, é o IFE - Informativo Eletrônico do Setor Elétrico - que sintetiza resumos de notícias, obtidas a partir de fontes confiáveis, para profissionais do setor. A aspiração deste trabalho é propor uma metodologia a fim de se criar um modelo de classicação automática de notícias, para oferecer aos seus editores a possibilidade de uma análise rápida, completa e precisa do conteúdo do texto e atribuir de forma mais ágil e eciente as categorias dos resumos de notícias. Uma análise das implementações clássicas de aprendizado supervisionado de máquina empregando os algoritmos k-Vizinhos-Mais Próximos, Regressão Logística, Naïve Bayes, Máquinas de Vetores de Suporte, Floresta Randômica, e um comitê com esses classicadores foi realizada. Alguns valores candidatos para hiperparâmetros foram comparados e a melhor combinação deles para cada uma das implementações foi configurada em seu treinamento. Este trabalho conclui com a avaliação dos desempenhos alcançados por cada algoritmo na tarefa de classificação de texto no contexto de resumos de notícias do IFE.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Computaçãopt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.embargo.termsabertopt_BR
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
TNOliveira.pdf2.25 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.