Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/23630
Especie: Trabalho de conclusão de graduação
Título : Coleta e armazenamento de dados morfológicos na língua portuguesa
Autor(es)/Inventor(es): Vilela, Cristian Diamantaras
Cunha, Gabriel Rodrigues
Tutor: Silva, João Carlos Pereira da
Tutor : Garcia, Daniela Cid de
Resumen: Este trabalho teve como objetivo criar um processo estruturado de coleta de informações morfológicas da língua portuguesa para um banco de dados com o intuito de facilitar análises e estudos sobre o tema. O processo desenvolvido é composto por três módulos independentes. O primeiro módulo é responsável pela geração de corpus, onde arquivos PDF ou de imagem são convertidos em arquivos de texto. O segundo módulo realiza o processamento desses textos, extraindo informações morfológicas e estruturando-as em um banco de dados. Por último, o terceiro módulo realiza análises sobre esses dados, respondendo perguntas específicas referentes a palavras, sufixos e classes gramaticais. Foram utilizados três corpora nesse processo: um de notícias do setor elétrico e dois de autoria própria, sendo o primeiro composto por livros infantis e o segundo por cordéis. Os resultados mostraram que a ferramenta criada gerou informações coerentes em relação as perguntas, o que pode ser corroborado pela Lei de Zipf, que define um comportamento comum em linguagens naturais, demonstrando que o processo desenvolvido é eficaz para a coleta e análise de informações morfológicas da língua portuguesa.
Materia: Processamento de linguagem natural
Língua portuguesa
Morfologia
Natural language processing
Portuguese language
Morphology
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade de producción: Instituto de Computação
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: 7-ago-2024
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
CDVilela.pdf1.09 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.