Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11422/26437
| Especie: | Dissertação |
| Título : | Inferência variacional aplicada à análise de agrupamentos via modelos de mistura de normais multivariadas |
| Autor(es)/Inventor(es): | Custódio, Andrew Nery da Silva |
| Tutor: | Alves, Mariane Branco |
| Resumen: | Aplicamos o método de Inferência Variacional (IV) para ajuste de Modelos de Mistura de Normais Multivariados, no contexto de aprendizagem não supervisionada, visando ao agrupamento de vetores de observações. Utilizamos os métodos IV buscando ganho de eficiência computacional e escalabilidade na aproximação de distribuições a posteriori para inferência sobre quantidades desconhecidas, quando tais distribuições são intratáveis. Uma outra abordagem para problemas de densidades intratáveis são os métodos do tipo Markov Chain Monte Carlo (MCMC). No entanto, em diversos contextos, o custo computacional do MCMC pode ser proibitivo. Aplicamos a metodologia IV em três bases de dados: primeiro em um estudo simulado com mistura de normais bivariadas (dimensão D = 2), nos permitindo uma melhor comparação entre IV e MCMC; dados reais visando ao agrupamento de imagens, por meio de misturas de normais multivariadas (de dimensão D = 786); e, finalmente, a dados de séries temporais, dados de imagens de satélites (D = 46), buscando seu agrupamento por similaridade de padrão. Avaliamos tanto acurácia quanto desempenho dos métodos citados. |
| Resumen: | We apply the Variational Inference (IV) method to adjust Multivariate Normal Mixture Models, in the context of unsupervised learning, aiming at grouping observation vectors. We use IV methods seeking to gain computational efficiency and scalability in the approximation of posteriori distributions for inference on unknown quantities, when such distributions are intractable. Another approach to intractable density problems are in Markov Chain Monte Carlo (MCMC) methods. However, in several contexts, the computational cost of MCMC can be prohibitive. We apply the IV methodology in three databases: first in a simulated study with a mixture of bivariate normals (dimension D = 2), allowing us a better comparison between IV and MCMC; real data aiming at the grouping of images, through mixtures of multivariate normals color red (of dimension D = 786); and, finally, to time series data, satellite image data (D = 46), where their groupings are sought by pattern similarity. We evaluated both the accuracy and performance of the aforementioned methods. |
| Materia: | Inferência variacional Modelos de mistura de normais Agrupamento Variational inference Gaussian mixture models Clustering |
| Materia CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| Programa: | Programa de Pós-Graduação em Estatística |
| Unidade de producción: | Instituto de Matemática |
| Editor: | Universidade Federal do Rio de Janeiro |
| Fecha de publicación: | 13-abr-2021 |
| País de edición : | Brasil |
| Idioma de publicación: | por |
| Tipo de acceso : | Acesso Aberto |
| Aparece en las colecciones: | Estatística |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| PPGE_M_Andrew_compressed.pdf | 2.59 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.