Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/26437

Especie: Dissertação
Título : Inferência variacional aplicada à análise de agrupamentos via modelos de mistura de normais multivariadas
Autor(es)/Inventor(es): Custódio, Andrew Nery da Silva
Tutor: Alves, Mariane Branco
Resumen: Aplicamos o método de Inferência Variacional (IV) para ajuste de Modelos de Mistura de Normais Multivariados, no contexto de aprendizagem não supervisionada, visando ao agrupamento de vetores de observações. Utilizamos os métodos IV buscando ganho de eficiência computacional e escalabilidade na aproximação de distribuições a posteriori para inferência sobre quantidades desconhecidas, quando tais distribuições são intratáveis. Uma outra abordagem para problemas de densidades intratáveis são os métodos do tipo Markov Chain Monte Carlo (MCMC). No entanto, em diversos contextos, o custo computacional do MCMC pode ser proibitivo. Aplicamos a metodologia IV em três bases de dados: primeiro em um estudo simulado com mistura de normais bivariadas (dimensão D = 2), nos permitindo uma melhor comparação entre IV e MCMC; dados reais visando ao agrupamento de imagens, por meio de misturas de normais multivariadas (de dimensão D = 786); e, finalmente, a dados de séries temporais, dados de imagens de satélites (D = 46), buscando seu agrupamento por similaridade de padrão. Avaliamos tanto acurácia quanto desempenho dos métodos citados.
Resumen: We apply the Variational Inference (IV) method to adjust Multivariate Normal Mixture Models, in the context of unsupervised learning, aiming at grouping observation vectors. We use IV methods seeking to gain computational efficiency and scalability in the approximation of posteriori distributions for inference on unknown quantities, when such distributions are intractable. Another approach to intractable density problems are in Markov Chain Monte Carlo (MCMC) methods. However, in several contexts, the computational cost of MCMC can be prohibitive. We apply the IV methodology in three databases: first in a simulated study with a mixture of bivariate normals (dimension D = 2), allowing us a better comparison between IV and MCMC; real data aiming at the grouping of images, through mixtures of multivariate normals color red (of dimension D = 786); and, finally, to time series data, satellite image data (D = 46), where their groupings are sought by pattern similarity. We evaluated both the accuracy and performance of the aforementioned methods.
Materia: Inferência variacional
Modelos de mistura de normais
Agrupamento
Variational inference
Gaussian mixture models
Clustering
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Programa: Programa de Pós-Graduação em Estatística
Unidade de producción: Instituto de Matemática
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: 13-abr-2021
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Estatística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
PPGE_M_Andrew_compressed.pdf2.59 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.