Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/27023

Type: Tese
Title: Planos amostrais eficientes na estimação em modelos de mistura de escala com caudas pesadas
Author(s)/Inventor(s): Gomes, Renato Monteiro Pinha
Advisor: Moura, Fernando Antônio da Silva
Co-advisor: Pereira, João Batista de Morais
Abstract: Em várias áreas de estudo há diversos conjuntos de dados que apresentam outliers, ou ainda, concentrações significativas de valores extremos nas caudas das suas respectivas distribuições. No caso particular da regressão T-Student, o parâmetro graus de liberdade é que determina o grau de robustez. Quanto menor for o número de graus de liberdade, mais pesadas serão as caudas. Entretanto, tal parâmetro é de difícil estimação, uma vez que para bem estimá-lo é necessário observar valores extremos da distribuição. No contexto de populações finitas, geralmente o pesquisador não tem acesso a todos os elementos populacionais para a modelagem. Um plano amostral deve ser adotado para obtenção da amostra. O presente trabalho propõe, no contexto de modelos de superpopulação que apresentam o comportamento de caudas pesadas e que podem ser descritos no formato de misturas de escala de distribuições normais, adotar planos amostrais informativos que proporcionem uma maior probabilidade de se selecionarem valores mais extremos daqueles que seriam obtidos por amostragem aleatória simples. A ideia é melhorar a estimação do vetor paramétrico associado às caudas. Dois planos amostrais foram propostos no presente trabalho. Para a implementação do primeiro, é necessário ter uma variável auxiliar, conhecida para toda a população e que tenha relação com a variável de interesse. No segundo, é necessário ter conhecimento de uma variável indicadora do estrato a que cada unidade amostral pertence. Os estudos simulados com a distribuição T-Student e o estudo considerando dados reais mostram que os planos amostrais propostos proporcionam uma melhora apreciável nas estimativas do parâmetro graus de liberdade, tanto para inferência sob enfoque clássico quanto sob enfoque bayesiano, sem grande impacto nas estimativas dos demais parâmetros.
Abstract: In several areas of study there are several data sets that present outliers, or even significant concentrations of extreme values in the tails of their respective distributions. In the particular case of the T-Student regression, the degrees of freedom parameter is what determines the degree of robustness. The smaller the number of degrees of freedom, the more robust the tail. However, this parameter is difficult to estimate, since it is necessary to observe extreme values of the distribution. In the context of finite populations, the researcher usually does not have access to all population elements for modeling. A sampling plan must be adopted to obtain the sample. The present work proposes, in the context of superpopulation models with heavy tails and that can be described in the format of scale mixtures of normal distributions, to adopt informative sampling plans that provide a greater probability of selecting more extreme values than those that would be obtained by simple random sampling. The idea is to improve the estimation of the parametric vector associated with the thickness of the tails. Three sampling plans were proposed in the present work. For the implementation of the first, it is necessary to have an auxiliary variable, known to the entire population and related to the variable of interest. In the second, it is necessary to have knowledge of an indicator variable of the stratum to which each sample unit belongs. The simulated studies with the T-Student distribution and the study considering real data show that the sampling plans proposed provide an appreciable improvement in the estimates of the degrees of freedom parameter, both for inference under the classical and the Bayesian approaches, without great impact on the estimates of the other parameters.
Keywords: Inferência bayesiana
Distribuição t de Student
População
Bayesian inference
Student's t distribution
Population
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Program: Programa de Pós-Graduação em Estatística
Production unit: Instituto de Matemática
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: 2023
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Estatística

Files in This Item:
File Description SizeFormat 
RMPGomes.pdf1.06 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.