Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/27317
| Type: | Dissertação |
| Title: | Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| Author(s)/Inventor(s): | Oliveira, Pedro Henrique Neves de |
| Advisor: | Fonseca, Thaís Cristina Oliveira da |
| Abstract: | Em diversas áreas do conhecimento, há interesse na modelagem conjunta de variáveis aleatórias. Para representar e acomodar as dependências existentes entre essas variáveis, uma abordagem amplamente utilizada considera modelos de Redes Bayesianas. As Redes Bayesianas são definidas por dois elementos: um grafo direcionado e acíclico e um espaço de probabilidades relacionado a ele. Cada nó nesse grafo representa uma variável aleatória, enquanto as arestas indicam as relações de dependência entre elas. Para detectar o grafo de uma Rede Bayesiana a partir de dados, existem três classes de algoritmos, os baseados em score, os baseados em restrição e os híbridos, algo comum entre eles é o uso de funções de score ou testes de independência condicional que assumem distribuição multinomial ou Gaussiana. Métodos deste tipo foram aplicados em Redes sintéticas e dados reais ao longo deste trabalho, mostrando as diferenças que eles podem apresentar e a sua usabilidade. Além disso, os algoritmos baseados em score foram estendidos para distribuições contínuas não normais usando um score BIC que assume um modelo Laplace assimétrico. Os testes executados para comparar esse score com as variações do BIC para Redes normais e discretas se mostraram promissores em Redes sintéticas e dados reais. Nas Redes sintéticas, foram introduzidos outliers nos dados, e na ilustração utilizando dados reais, foi usada uma base pequena, para a qual a estimação é mais sensível a valores extremos. |
| Abstract: | In many areas of knowledge, there is interest in the joint modeling of random variables. To represent and accommodate the existing dependencies between these variables, a widely used approach considers Bayesian network models. Bayesian networks are defined by two elements: a directed acyclic graph and a probability space related to it. Each node in the graph represents a random variable, while the arcs are the dependencies between them. To detect the graph of a Bayesian Network from a dataset, there are three main classes of algorithms, the score-based, the constraint-based and the hybrid algorithms, something in commom between them is the use of score functions or conditional independence tests that assume multinomial or Gaussian distributions. These kinds of methods were applied on synthetic networks and real data throughout this work, showing the differences they can present and their usability. Additionally, the score-based algorithms were extended to non-Gaussian continuous distributions using a BIC score that assumes an Asymmetric Laplace model. The experiments to compare this score with the BIC variations for Gaussian and discrete networks were promising in synthetic networs and real data. On synthetic networks, outliers were introduced into the data, and in the real-data illustration, a small dataset was used, for which the estimation is more sensitive to extreme values. |
| Keywords: | Redes bayesianas Algoritmos Bayesian networks Algorithms |
| Subject CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| Program: | Programa de Pós-Graduação em Estatística |
| Production unit: | Instituto de Matemática |
| Publisher: | Universidade Federal do Rio de Janeiro |
| Issue Date: | 28-Aug-2025 |
| Publisher country: | Brasil |
| Language: | por |
| Right access: | Acesso Aberto |
| Appears in Collections: | Estatística |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| PHNOliveira.pdf | 1.01 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.