Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/29066

Type: Tese
Title: Previsão de Turbulência de Céu Claro utilizando modelo hibrido sobre o sul do Brasil
Author(s)/Inventor(s): Mello, Ivan Bitar Fiuza de
Advisor: França, Gutemberg Borges
Co-advisor: Velho, Haroldo Fraga de Campos
Abstract: Neste trabalho, avalia-se a aplicação de algoritmos de aprendizado de máquina (AM) simulados a partir de saídas dos modelos Global Forecast System (GFS) e Weather Research and Forecasting (WRF) com o propósito de construir um modelo híbrido otimizado de previsão de turbulência de céu claro (CAT) sobre o sul do Brasil. Foram utilizados 14 preditores atmosféricos extraídos entre os níveis isobáricos de 500–200 hectopascal (hPa), derivados inicialmente de dados de previsão do GFS e, em seguida, de dados de previsão do WRF, este alimentado com dados de análise do GFS. Esses atributos foram simulados em diferentes resoluções espaciais com o objetivo de treinar e validar 15 modelos distintos de machine learning (ML). O método de desenvolvimento e comparação dos modelos envolveu amostragem estratificada, engenharia de atributos, otimização de hiperparâmetros e validação robusta de métricas estatísticas como Probabilidade de Detecção de eventos de CAT (PODy), de não-eventos de CAT (PODn), Estatística de Habilidade Verdadeira (TSS), F-medida (F-measure), Área sob a Curva Característica de Operação do Receptor (AUC) e a Diferença Percentual Relativa da Área sob a Curva da Característica de Operação do Receptor ((AUC_WRF– AUC_GFS)/AUC_GFS)x100. Entre os algoritmos avaliados, o classificador Bagging apresentou o melhor desempenho global quando considerados os valores de AUC obtidos iv a partir dos dados de previsão dos modelos GFS e WRF. Embora, ao utilizar os dados do WRF, o modelo Extra Trees tenha alcançado um valor de AUC ligeiramente superior ao do Bagging, a diferença de AUC entre os dois modelos nas simulações do GFS foi marginalmente maior do que aquela observada com base no WRF. Dessa forma, o Bagging destacou-se pelo desempenho mais consistente no conjunto combinado de dados, enquanto o Extra Trees apresentou desempenho ligeiramente superior quando aplicado às previsões do WRF. O classificador KNN apresentou o maior ganho na Diferença Percentual Relativa da Área sob a Curva da Característica de Operação do Receptor na comparação entre modelos GFS e WRF. O método de exclusão dos preditores confirmou que a temperatura potencial (Θ) e os indicadores de cisalhamento vertical/diferença da velocidade do vento entre níveis (VWS, DWS) foram os atributos que melhor representaram a detecção eficaz de CAT, enquanto que a energia cinética turbulenta (TKE) e os índices de turbulência não obtiveram desempenho satisfatório. Os resultados demonstram potencial ao treinar regionalmente técnicas de ML com modelos numéricos de previsão do tempo - com ênfase no uso de modelos físicos de maior resolução espacial - para aprimorar substancialmente a detecção de eventos de CAT frente à diagnósticos tradicionais. No âmbito operacional, os modelos Bagging e Extra Trees apresentaram desempenho mais satisfatório para a emissão de alertas mais precisos de CAT no corredor aéreo superior entre as cidades de São Paulo e Porto Alegre, na Região de Informação de Voo de Curitiba (FIR-CW). Dessa forma, reduz-se a dependência da subjetividade advinda de reportes de turbulência de aeronaves, elevando a segurança das operações aéreas e diminuindo o custo operacional dos voos. Pesquisas futuras devem direcionar-se para o uso de conjuntos de dados de maior resolução espacial e temporal, exploração de diagnósticos adicionais de turbulência e escolha de diferentes áreas de estudo e períodos sazonais para aprimorar ainda mais a capacidade preditiva de CAT para fins operacionais
Abstract: In this study, the application of machine learning (ML) algorithms is evaluated using simulations based on outputs from the Global Forecast System (GFS) and the Weather Research and Forecasting (WRF) models, with the objective of developing an optimized hybrid model for forecasting clear-air turbulence (CAT) over southern Brazil. Fourteen atmospheric predictors were used, extracted between the 500–200 hPa isobaric levels, initially derived from GFS forecast data and subsequently from WRF forecast data, with the latter driven by GFS analysis fields. These attributes were simulated at different spatial resolutions in order to train and validate 15 distinct machine learning models. The model development and comparison methodology involved stratified sampling, feature engineering, hyperparameter optimization, and robust validation of statistical metrics, including Probability of Detection of CAT events (PODy), Probability of Detection of non-events (PODn), True Skill Statistic (TSS), F-measure, Area Under the Receiver Operating Characteristic Curve (AUC), and the Relative Percentage Difference of AUC between WRF and GFS ((AUC_WRF–AUC_GFS)/AUC_GFS) × 100. Among the evaluated algorithms, the Bagging classifier showed the best overall performance when considering AUC values obtained from both GFS and WRF forecast datasets. Although Extra Trees model achieved a slightly higher AUC than Bagging when using WRF data, vi the AUC difference between the two models in the GFS simulations was marginally larger than that observed for WRF. Thus, Bagging stood out for its more consistent performance across the combined dataset, while Extra Trees exhibited marginally superior performance when applied specifically to WRF forecasts. The KNN classifier showed the greatest gain in Relative Percentage Difference of AUC in the comparison between GFS and WRF-based models. The predictor exclusion method confirmed that potential temperature (Θ) and vertical wind shear / wind speed difference indicators (VWS, DWS) were the attributes that best represented effective CAT detection, while turbulent kinetic energy (TKE) and turbulence indices did not achieve satisfactory performance. The results demonstrate the potential of regionally training ML techniques with numerical weather prediction models—emphasizing the use of higher spatial resolution physical models—to substantially improve CAT detection compared to traditional diagnostic methods. In the operational context, the Bagging and Extra Trees models showed more satisfactory performance for issuing more accurate clear-air turbulence (CAT) alerts in the upper air corridor between the cities of São Paulo and Porto Alegre, within the Curitiba Flight Information Region (FIR-CW). Consequently, reliance on the subjectivity of aircraft turbulence reports is reduced, enhancing flight safety and lowering operational costs. Future research should focus on using datasets with higher spatial and temporal resolution, exploring additional turbulence diagnostics, and selecting different study areas and seasonal periods to further improve CAT predictive capability for operational applications
Keywords: Turbulência atmosférica
Aprendizado do computador
Previsão numérica do tempo (Meteorologia)
Brasil, Sul
Clear air turbulence
Machine learning
Numerical weather forecasting
Brazil, South
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::METEOROLOGIA
Program: Programa de Pós-Graduação em Meteorologia
Production unit: Instituto de Geociências
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: Mar-2026
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Citation: MELLO, Ivan Bitar Fiuza de. Previsão de Turbulência de Céu Claro utilizando modelo híbrido sobre o sul do Brasil. 2026. 170 f. Tese (doutorado) - Instituto de Geociências, Programa de Pós-Graduação em Meteorologia, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2026.
Appears in Collections:Meteorologia

Files in This Item:
File Description SizeFormat 
IBFMello.pdf1.93 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.