Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/27327

Especie: Dissertação
Título : Alocação latente de Dirichlet para modelagem de tópicos em dissertações de mestrado em estatística e áreas correlatas no Brasil
Autor(es)/Inventor(es): Argote Osorio, Juan Pablo
Tutor: Pagani Zanini, Carlos Tadeu
Resumen: Esta dissertação aborda a modelagem de tópicos presentes em dissertações de mestrado em estatística e áreas correlatas no Brasil, através de modelos de Alocação Latente de Dirichlet. O principal objetivo é inferir os tópicos latentes abordados nessas dissertações. Primeiramente, discute-se e apresenta-se a construção de um corpus de documentos composto pelas dissertações mais recentes em distintas Instituições de Ensino Superior do Brasil, extraídas manualmente a partir dos endereços eletrônicos de cada um dos programas de mestrado analisados. O procedimento inferencial adotado para o modelo de Alocação Latente de Dirichlet consiste em métodos de Monte Carlo via cadeias de Markov e inferência variacional. Discute-se ainda diferentes métodos para escolha do número de tópicos incluindo critérios de informação como o de Akaike, o Bayesiano, o de Deviância, o de Watanabe-Akaike e métricas baseadas na coerência dos tópicos latentes inferidos. A metodologia adotada fornece uma compreensão aprofundada dos tópicos predominantes nesse corpus.
Resumen: This master’s thesis addresses the topic modeling of master’s theses in statistics and related areas in Brazil, through Latent Dirichlet Allocation models. The main objective of the work is to infer the latent topics covered in these theses. First, the construction of a corpus of documents is discussed and presented, composed of the most recent theses from different Higher Education Institutions in Brazil, manually extracted from the web pages of each of the analyzed master’s programs. The inferential procedure adopted for the Latent Dirichlet Allocation model consists of Markov chain Monte Carlo methods and variational inference. Different methods for choosing the number of topics are also discussed, including information criteria such as Akaike, Bayesian, Deviance, Watanabe-Akaike, and metrics based on the coherence of the inferred latent topics. The adopted methodology provides an in-depth understanding of the predominant topics in this corpus.
Materia: Modelagem de tópicos
Inferência variacional
Topic modeling
Variational inference
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Programa: Programa de Pós-Graduação em Estatística
Unidade de producción: Instituto de Matemática
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: 24-feb-2025
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Estatística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
JPAOsorio.pdf885.46 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.