Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/27317

Type: Dissertação
Title: Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas
Author(s)/Inventor(s): Oliveira, Pedro Henrique Neves de
Advisor: Fonseca, Thaís Cristina Oliveira da
Abstract: Em diversas áreas do conhecimento, há interesse na modelagem conjunta de variáveis aleatórias. Para representar e acomodar as dependências existentes entre essas variáveis, uma abordagem amplamente utilizada considera modelos de Redes Bayesianas. As Redes Bayesianas são definidas por dois elementos: um grafo direcionado e acíclico e um espaço de probabilidades relacionado a ele. Cada nó nesse grafo representa uma variável aleatória, enquanto as arestas indicam as relações de dependência entre elas. Para detectar o grafo de uma Rede Bayesiana a partir de dados, existem três classes de algoritmos, os baseados em score, os baseados em restrição e os híbridos, algo comum entre eles é o uso de funções de score ou testes de independência condicional que assumem distribuição multinomial ou Gaussiana. Métodos deste tipo foram aplicados em Redes sintéticas e dados reais ao longo deste trabalho, mostrando as diferenças que eles podem apresentar e a sua usabilidade. Além disso, os algoritmos baseados em score foram estendidos para distribuições contínuas não normais usando um score BIC que assume um modelo Laplace assimétrico. Os testes executados para comparar esse score com as variações do BIC para Redes normais e discretas se mostraram promissores em Redes sintéticas e dados reais. Nas Redes sintéticas, foram introduzidos outliers nos dados, e na ilustração utilizando dados reais, foi usada uma base pequena, para a qual a estimação é mais sensível a valores extremos.
Abstract: In many areas of knowledge, there is interest in the joint modeling of random variables. To represent and accommodate the existing dependencies between these variables, a widely used approach considers Bayesian network models. Bayesian networks are defined by two elements: a directed acyclic graph and a probability space related to it. Each node in the graph represents a random variable, while the arcs are the dependencies between them. To detect the graph of a Bayesian Network from a dataset, there are three main classes of algorithms, the score-based, the constraint-based and the hybrid algorithms, something in commom between them is the use of score functions or conditional independence tests that assume multinomial or Gaussian distributions. These kinds of methods were applied on synthetic networks and real data throughout this work, showing the differences they can present and their usability. Additionally, the score-based algorithms were extended to non-Gaussian continuous distributions using a BIC score that assumes an Asymmetric Laplace model. The experiments to compare this score with the BIC variations for Gaussian and discrete networks were promising in synthetic networs and real data. On synthetic networks, outliers were introduced into the data, and in the real-data illustration, a small dataset was used, for which the estimation is more sensitive to extreme values.
Keywords: Redes bayesianas
Algoritmos
Bayesian networks
Algorithms
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Program: Programa de Pós-Graduação em Estatística
Production unit: Instituto de Matemática
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: 28-Aug-2025
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Estatística

Files in This Item:
File Description SizeFormat 
PHNOliveira.pdf1.01 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.