Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/27327

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorPagani Zanini, Carlos Tadeu-
dc.contributor.authorArgote Osorio, Juan Pablo-
dc.date.accessioned2025-10-06T18:56:19Z-
dc.date.available2025-10-08T03:00:09Z-
dc.date.issued2025-02-24-
dc.identifier.urihttp://hdl.handle.net/11422/27327-
dc.description.abstractThis master’s thesis addresses the topic modeling of master’s theses in statistics and related areas in Brazil, through Latent Dirichlet Allocation models. The main objective of the work is to infer the latent topics covered in these theses. First, the construction of a corpus of documents is discussed and presented, composed of the most recent theses from different Higher Education Institutions in Brazil, manually extracted from the web pages of each of the analyzed master’s programs. The inferential procedure adopted for the Latent Dirichlet Allocation model consists of Markov chain Monte Carlo methods and variational inference. Different methods for choosing the number of topics are also discussed, including information criteria such as Akaike, Bayesian, Deviance, Watanabe-Akaike, and metrics based on the coherence of the inferred latent topics. The adopted methodology provides an in-depth understanding of the predominant topics in this corpus.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectModelagem de tópicospt_BR
dc.subjectInferência variacionalpt_BR
dc.subjectTopic modelingpt_BR
dc.subjectVariational inferencept_BR
dc.titleAlocação latente de Dirichlet para modelagem de tópicos em dissertações de mestrado em estatística e áreas correlatas no Brasilpt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9272277541388166pt_BR
dc.contributor.referee1Carvalho, Hugo Tremonte de-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4007053253975343pt_BR
dc.contributor.referee2Zuanetti, Daiane Aparecida-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/8352484284929824pt_BR
dc.contributor.referee3Pereira, João Batista de Morais-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/5251604111283337pt_BR
dc.description.resumoEsta dissertação aborda a modelagem de tópicos presentes em dissertações de mestrado em estatística e áreas correlatas no Brasil, através de modelos de Alocação Latente de Dirichlet. O principal objetivo é inferir os tópicos latentes abordados nessas dissertações. Primeiramente, discute-se e apresenta-se a construção de um corpus de documentos composto pelas dissertações mais recentes em distintas Instituições de Ensino Superior do Brasil, extraídas manualmente a partir dos endereços eletrônicos de cada um dos programas de mestrado analisados. O procedimento inferencial adotado para o modelo de Alocação Latente de Dirichlet consiste em métodos de Monte Carlo via cadeias de Markov e inferência variacional. Discute-se ainda diferentes métodos para escolha do número de tópicos incluindo critérios de informação como o de Akaike, o Bayesiano, o de Deviância, o de Watanabe-Akaike e métricas baseadas na coerência dos tópicos latentes inferidos. A metodologia adotada fornece uma compreensão aprofundada dos tópicos predominantes nesse corpus.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Matemáticapt_BR
dc.publisher.programPrograma de Pós-Graduação em Estatísticapt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICApt_BR
dc.embargo.termsabertopt_BR
Aparece en las colecciones: Estatística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
JPAOsorio.pdf885.46 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.