Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/20474
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Lopes, Giseli Rabello | - |
dc.contributor.author | Oliveira, Thiago do Nascimento | - |
dc.date.accessioned | 2023-05-16T17:38:39Z | - |
dc.date.available | 2023-12-21T03:00:25Z | - |
dc.date.issued | 2023-04-26 | - |
dc.identifier.uri | http://hdl.handle.net/11422/20474 | - |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal do Rio de Janeiro | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | inteligência artificial | pt_BR |
dc.subject | mineração de dados | pt_BR |
dc.subject | mineração de textos | pt_BR |
dc.subject | web scraping | pt_BR |
dc.title | Construção e classificação de uma base textual em português | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9439416101626260 | pt_BR |
dc.contributor.advisorCo1 | Silva, João Carlos P. da | - |
dc.contributor.advisorCo1Lattes | http://lattes.cnpq.br/9413102524215939 | pt_BR |
dc.contributor.referee1 | Marcelino, Carolina Gil | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/3289676418940953 | pt_BR |
dc.contributor.referee2 | Paixão, João Antonio Recio da | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/5705386762324718 | pt_BR |
dc.description.resumo | A Web tornou-se um importante meio para disponibilização de informações. Entre as principais dificuldades, nesse contexto dinâmico, estão a busca por informações específicas e a categorização das mesmas. Com a facilidade de acesso à Internet e a possibilidade de qualquer pessoa publicar ou replicar conteúdo online, é preciso ter cuidado ao selecionar as fontes dessas informações. No domínio do setor elétrico não é diferente. Um importante ator, nesse cenário, é o IFE - Informativo Eletrônico do Setor Elétrico - que sintetiza resumos de notícias, obtidas a partir de fontes confiáveis, para profissionais do setor. A aspiração deste trabalho é propor uma metodologia a fim de se criar um modelo de classicação automática de notícias, para oferecer aos seus editores a possibilidade de uma análise rápida, completa e precisa do conteúdo do texto e atribuir de forma mais ágil e eciente as categorias dos resumos de notícias. Uma análise das implementações clássicas de aprendizado supervisionado de máquina empregando os algoritmos k-Vizinhos-Mais Próximos, Regressão Logística, Naïve Bayes, Máquinas de Vetores de Suporte, Floresta Randômica, e um comitê com esses classicadores foi realizada. Alguns valores candidatos para hiperparâmetros foram comparados e a melhor combinação deles para cada uma das implementações foi configurada em seu treinamento. Este trabalho conclui com a avaliação dos desempenhos alcançados por cada algoritmo na tarefa de classificação de texto no contexto de resumos de notícias do IFE. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Computação | pt_BR |
dc.publisher.initials | UFRJ | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.embargo.terms | aberto | pt_BR |
Appears in Collections: | Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TNOliveira.pdf | 2.25 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.