Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/27023

Tipo: Tese
Título: Planos amostrais eficientes na estimação em modelos de mistura de escala com caudas pesadas
Autor(es)/Inventor(es): Gomes, Renato Monteiro Pinha
Orientador: Moura, Fernando Antônio da Silva
Coorientador: Pereira, João Batista de Morais
Resumo: Em várias áreas de estudo há diversos conjuntos de dados que apresentam outliers, ou ainda, concentrações significativas de valores extremos nas caudas das suas respectivas distribuições. No caso particular da regressão T-Student, o parâmetro graus de liberdade é que determina o grau de robustez. Quanto menor for o número de graus de liberdade, mais pesadas serão as caudas. Entretanto, tal parâmetro é de difícil estimação, uma vez que para bem estimá-lo é necessário observar valores extremos da distribuição. No contexto de populações finitas, geralmente o pesquisador não tem acesso a todos os elementos populacionais para a modelagem. Um plano amostral deve ser adotado para obtenção da amostra. O presente trabalho propõe, no contexto de modelos de superpopulação que apresentam o comportamento de caudas pesadas e que podem ser descritos no formato de misturas de escala de distribuições normais, adotar planos amostrais informativos que proporcionem uma maior probabilidade de se selecionarem valores mais extremos daqueles que seriam obtidos por amostragem aleatória simples. A ideia é melhorar a estimação do vetor paramétrico associado às caudas. Dois planos amostrais foram propostos no presente trabalho. Para a implementação do primeiro, é necessário ter uma variável auxiliar, conhecida para toda a população e que tenha relação com a variável de interesse. No segundo, é necessário ter conhecimento de uma variável indicadora do estrato a que cada unidade amostral pertence. Os estudos simulados com a distribuição T-Student e o estudo considerando dados reais mostram que os planos amostrais propostos proporcionam uma melhora apreciável nas estimativas do parâmetro graus de liberdade, tanto para inferência sob enfoque clássico quanto sob enfoque bayesiano, sem grande impacto nas estimativas dos demais parâmetros.
Resumo: In several areas of study there are several data sets that present outliers, or even significant concentrations of extreme values in the tails of their respective distributions. In the particular case of the T-Student regression, the degrees of freedom parameter is what determines the degree of robustness. The smaller the number of degrees of freedom, the more robust the tail. However, this parameter is difficult to estimate, since it is necessary to observe extreme values of the distribution. In the context of finite populations, the researcher usually does not have access to all population elements for modeling. A sampling plan must be adopted to obtain the sample. The present work proposes, in the context of superpopulation models with heavy tails and that can be described in the format of scale mixtures of normal distributions, to adopt informative sampling plans that provide a greater probability of selecting more extreme values than those that would be obtained by simple random sampling. The idea is to improve the estimation of the parametric vector associated with the thickness of the tails. Three sampling plans were proposed in the present work. For the implementation of the first, it is necessary to have an auxiliary variable, known to the entire population and related to the variable of interest. In the second, it is necessary to have knowledge of an indicator variable of the stratum to which each sample unit belongs. The simulated studies with the T-Student distribution and the study considering real data show that the sampling plans proposed provide an appreciable improvement in the estimates of the degrees of freedom parameter, both for inference under the classical and the Bayesian approaches, without great impact on the estimates of the other parameters.
Palavras-chave: Inferência bayesiana
Distribuição t de Student
População
Bayesian inference
Student's t distribution
Population
Assunto CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Programa: Programa de Pós-Graduação em Estatística
Unidade produtora: Instituto de Matemática
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: 2023
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Estatística

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
RMPGomes.pdf1.06 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.