Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/11422/23630
Tipo: | Trabalho de conclusão de graduação |
Título: | Coleta e armazenamento de dados morfológicos na língua portuguesa |
Autor(es)/Inventor(es): | Vilela, Cristian Diamantaras Cunha, Gabriel Rodrigues |
Orientador: | Silva, João Carlos Pereira da |
Coorientador: | Garcia, Daniela Cid de |
Resumo: | Este trabalho teve como objetivo criar um processo estruturado de coleta de informações morfológicas da língua portuguesa para um banco de dados com o intuito de facilitar análises e estudos sobre o tema. O processo desenvolvido é composto por três módulos independentes. O primeiro módulo é responsável pela geração de corpus, onde arquivos PDF ou de imagem são convertidos em arquivos de texto. O segundo módulo realiza o processamento desses textos, extraindo informações morfológicas e estruturando-as em um banco de dados. Por último, o terceiro módulo realiza análises sobre esses dados, respondendo perguntas específicas referentes a palavras, sufixos e classes gramaticais. Foram utilizados três corpora nesse processo: um de notícias do setor elétrico e dois de autoria própria, sendo o primeiro composto por livros infantis e o segundo por cordéis. Os resultados mostraram que a ferramenta criada gerou informações coerentes em relação as perguntas, o que pode ser corroborado pela Lei de Zipf, que define um comportamento comum em linguagens naturais, demonstrando que o processo desenvolvido é eficaz para a coleta e análise de informações morfológicas da língua portuguesa. |
Palavras-chave: | Processamento de linguagem natural Língua portuguesa Morfologia Natural language processing Portuguese language Morphology |
Assunto CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Unidade produtora: | Instituto de Computação |
Editora: | Universidade Federal do Rio de Janeiro |
Data de publicação: | 7-Ago-2024 |
País de publicação: | Brasil |
Idioma da publicação: | por |
Tipo de acesso: | Acesso Aberto |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
CDVilela.pdf | 1.09 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.