Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/23630
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorSilva, João Carlos Pereira da-
dc.contributor.authorVilela, Cristian Diamantaras-
dc.contributor.authorCunha, Gabriel Rodrigues-
dc.date.accessioned2024-09-06T16:24:56Z-
dc.date.available2024-09-08T03:00:18Z-
dc.date.issued2024-08-07-
dc.identifier.urihttp://hdl.handle.net/11422/23630-
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectLíngua portuguesapt_BR
dc.subjectMorfologiapt_BR
dc.subjectNatural language processingpt_BR
dc.subjectPortuguese languagept_BR
dc.subjectMorphologypt_BR
dc.titleColeta e armazenamento de dados morfológicos na língua portuguesapt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisorCo1Garcia, Daniela Cid de-
dc.contributor.referee1Rossetto, Silvana-
dc.contributor.referee2Santos, Sabrina Lopes dos-
dc.description.resumoEste trabalho teve como objetivo criar um processo estruturado de coleta de informações morfológicas da língua portuguesa para um banco de dados com o intuito de facilitar análises e estudos sobre o tema. O processo desenvolvido é composto por três módulos independentes. O primeiro módulo é responsável pela geração de corpus, onde arquivos PDF ou de imagem são convertidos em arquivos de texto. O segundo módulo realiza o processamento desses textos, extraindo informações morfológicas e estruturando-as em um banco de dados. Por último, o terceiro módulo realiza análises sobre esses dados, respondendo perguntas específicas referentes a palavras, sufixos e classes gramaticais. Foram utilizados três corpora nesse processo: um de notícias do setor elétrico e dois de autoria própria, sendo o primeiro composto por livros infantis e o segundo por cordéis. Os resultados mostraram que a ferramenta criada gerou informações coerentes em relação as perguntas, o que pode ser corroborado pela Lei de Zipf, que define um comportamento comum em linguagens naturais, demonstrando que o processo desenvolvido é eficaz para a coleta e análise de informações morfológicas da língua portuguesa.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Computaçãopt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.embargo.termsabertopt_BR
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
CDVilela.pdf1.09 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.