Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/26437

Type: Dissertação
Title: Inferência variacional aplicada à análise de agrupamentos via modelos de mistura de normais multivariadas
Author(s)/Inventor(s): Custódio, Andrew Nery da Silva
Advisor: Alves, Mariane Branco
Abstract: Aplicamos o método de Inferência Variacional (IV) para ajuste de Modelos de Mistura de Normais Multivariados, no contexto de aprendizagem não supervisionada, visando ao agrupamento de vetores de observações. Utilizamos os métodos IV buscando ganho de eficiência computacional e escalabilidade na aproximação de distribuições a posteriori para inferência sobre quantidades desconhecidas, quando tais distribuições são intratáveis. Uma outra abordagem para problemas de densidades intratáveis são os métodos do tipo Markov Chain Monte Carlo (MCMC). No entanto, em diversos contextos, o custo computacional do MCMC pode ser proibitivo. Aplicamos a metodologia IV em três bases de dados: primeiro em um estudo simulado com mistura de normais bivariadas (dimensão D = 2), nos permitindo uma melhor comparação entre IV e MCMC; dados reais visando ao agrupamento de imagens, por meio de misturas de normais multivariadas (de dimensão D = 786); e, finalmente, a dados de séries temporais, dados de imagens de satélites (D = 46), buscando seu agrupamento por similaridade de padrão. Avaliamos tanto acurácia quanto desempenho dos métodos citados.
Abstract: We apply the Variational Inference (IV) method to adjust Multivariate Normal Mixture Models, in the context of unsupervised learning, aiming at grouping observation vectors. We use IV methods seeking to gain computational efficiency and scalability in the approximation of posteriori distributions for inference on unknown quantities, when such distributions are intractable. Another approach to intractable density problems are in Markov Chain Monte Carlo (MCMC) methods. However, in several contexts, the computational cost of MCMC can be prohibitive. We apply the IV methodology in three databases: first in a simulated study with a mixture of bivariate normals (dimension D = 2), allowing us a better comparison between IV and MCMC; real data aiming at the grouping of images, through mixtures of multivariate normals color red (of dimension D = 786); and, finally, to time series data, satellite image data (D = 46), where their groupings are sought by pattern similarity. We evaluated both the accuracy and performance of the aforementioned methods.
Keywords: Inferência variacional
Modelos de mistura de normais
Agrupamento
Variational inference
Gaussian mixture models
Clustering
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Program: Programa de Pós-Graduação em Estatística
Production unit: Instituto de Matemática
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: 13-Apr-2021
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Estatística

Files in This Item:
File Description SizeFormat 
PPGE_M_Andrew_compressed.pdf2.59 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.