Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/26437
| Type: | Dissertação |
| Title: | Inferência variacional aplicada à análise de agrupamentos via modelos de mistura de normais multivariadas |
| Author(s)/Inventor(s): | Custódio, Andrew Nery da Silva |
| Advisor: | Alves, Mariane Branco |
| Abstract: | Aplicamos o método de Inferência Variacional (IV) para ajuste de Modelos de Mistura de Normais Multivariados, no contexto de aprendizagem não supervisionada, visando ao agrupamento de vetores de observações. Utilizamos os métodos IV buscando ganho de eficiência computacional e escalabilidade na aproximação de distribuições a posteriori para inferência sobre quantidades desconhecidas, quando tais distribuições são intratáveis. Uma outra abordagem para problemas de densidades intratáveis são os métodos do tipo Markov Chain Monte Carlo (MCMC). No entanto, em diversos contextos, o custo computacional do MCMC pode ser proibitivo. Aplicamos a metodologia IV em três bases de dados: primeiro em um estudo simulado com mistura de normais bivariadas (dimensão D = 2), nos permitindo uma melhor comparação entre IV e MCMC; dados reais visando ao agrupamento de imagens, por meio de misturas de normais multivariadas (de dimensão D = 786); e, finalmente, a dados de séries temporais, dados de imagens de satélites (D = 46), buscando seu agrupamento por similaridade de padrão. Avaliamos tanto acurácia quanto desempenho dos métodos citados. |
| Abstract: | We apply the Variational Inference (IV) method to adjust Multivariate Normal Mixture Models, in the context of unsupervised learning, aiming at grouping observation vectors. We use IV methods seeking to gain computational efficiency and scalability in the approximation of posteriori distributions for inference on unknown quantities, when such distributions are intractable. Another approach to intractable density problems are in Markov Chain Monte Carlo (MCMC) methods. However, in several contexts, the computational cost of MCMC can be prohibitive. We apply the IV methodology in three databases: first in a simulated study with a mixture of bivariate normals (dimension D = 2), allowing us a better comparison between IV and MCMC; real data aiming at the grouping of images, through mixtures of multivariate normals color red (of dimension D = 786); and, finally, to time series data, satellite image data (D = 46), where their groupings are sought by pattern similarity. We evaluated both the accuracy and performance of the aforementioned methods. |
| Keywords: | Inferência variacional Modelos de mistura de normais Agrupamento Variational inference Gaussian mixture models Clustering |
| Subject CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| Program: | Programa de Pós-Graduação em Estatística |
| Production unit: | Instituto de Matemática |
| Publisher: | Universidade Federal do Rio de Janeiro |
| Issue Date: | 13-Apr-2021 |
| Publisher country: | Brasil |
| Language: | por |
| Right access: | Acesso Aberto |
| Appears in Collections: | Estatística |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| PPGE_M_Andrew_compressed.pdf | 2.59 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.