Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/20474
Especie: Trabalho de conclusão de graduação
Título : Construção e classificação de uma base textual em português
Autor(es)/Inventor(es): Oliveira, Thiago do Nascimento
Tutor: Lopes, Giseli Rabello
Tutor : Silva, João Carlos P. da
Resumen: A Web tornou-se um importante meio para disponibilização de informações. Entre as principais dificuldades, nesse contexto dinâmico, estão a busca por informações específicas e a categorização das mesmas. Com a facilidade de acesso à Internet e a possibilidade de qualquer pessoa publicar ou replicar conteúdo online, é preciso ter cuidado ao selecionar as fontes dessas informações. No domínio do setor elétrico não é diferente. Um importante ator, nesse cenário, é o IFE - Informativo Eletrônico do Setor Elétrico - que sintetiza resumos de notícias, obtidas a partir de fontes confiáveis, para profissionais do setor. A aspiração deste trabalho é propor uma metodologia a fim de se criar um modelo de classicação automática de notícias, para oferecer aos seus editores a possibilidade de uma análise rápida, completa e precisa do conteúdo do texto e atribuir de forma mais ágil e eciente as categorias dos resumos de notícias. Uma análise das implementações clássicas de aprendizado supervisionado de máquina empregando os algoritmos k-Vizinhos-Mais Próximos, Regressão Logística, Naïve Bayes, Máquinas de Vetores de Suporte, Floresta Randômica, e um comitê com esses classicadores foi realizada. Alguns valores candidatos para hiperparâmetros foram comparados e a melhor combinação deles para cada uma das implementações foi configurada em seu treinamento. Este trabalho conclui com a avaliação dos desempenhos alcançados por cada algoritmo na tarefa de classificação de texto no contexto de resumos de notícias do IFE.
Materia: inteligência artificial
mineração de dados
mineração de textos
web scraping
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade de producción: Instituto de Computação
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: 26-abr-2023
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TNOliveira.pdf2.25 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.