Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/26751
| Type: | Tese |
| Title: | Machine learning and deep learning models for tone-mapped image quality assessment |
| Author(s)/Inventor(s): | Nunes, Gustavo Martins da Silva |
| Advisor: | Gomes, José Gabriel Rodríguez Carneiro |
| Co-advisor: | Oliveira, Fernanda Duarte Vilela Reis de |
| Co-advisor: | Farias, Mylène Christine Queiroz |
| Abstract: | Imagens em alta faixa dinâmica precisam ser processadas por operadores de tone mapping (TMOs) para serem mostradas adequadamente em displays convencionais. Há duas pequenas bases de dados para a tarefa de avaliação da qualidade de imagens tone-mapped (AQITM), chamadas ESPL-LIVE e TMID. Apresentamos, neste trabalho, uma nova base de dados para AQITM, chamada PBTDB. Ela contém cerca de 175000 amostras, cada uma rotulada por quatro métricas objetivas para AQITM. Conduzimos, também, testes subjetivos para avaliar a qualidade de 3009 amostras desta base. Métricas não-referenciadas (NR) para AQITM de estado-da-arte, que são o foco deste estudo, são incapazes de avaliar de forma confiável a qualidade de imagens tone-mapped que não pertencem a bases de dados específicas. Investigamos duas abordagens para obter novas métricas NR de AQITM mais gerais. Na primeira, usamos amostras da base ESPL-LIVE para treinar modelos de regressão que combinam notas de diversas métricas de AQITM em uma única nota. As notas do melhor modelo apresentam baixa correlação com as notas subjetivas da base de teste TMID (PLCC de 0,65, e SRCC de 0,55). Na segunda, treinamos modelos de aprendizado profundo com amostras da base PBTDB, e usamos as bases ESPL-LIVE e TMID para testá-los. Alguns modelos alcançam desempenho moderado na base TMID, mas todos apresentam baixo desempenho na base ESPL-LIVE (melhores desempenhos: PLCC de 0,48 e SRCC de 0,43 na base ESPL-LIVE, e PLCC de 0,79 e SRCC de 0,72 na base TMID). O tipo da nota de qualidade (subjetivo ou objetivo) usada para treinar os modelos influencia fortemente nesses desempenhos |
| Abstract: | High dynamic range (HDR) images are increasingly more common in today consumer applications. Such images need to be processed by so-called tone-mapping operators (TMOs), in order to be properly exhibited on standard display devices. Objective tone-mapped image quality assessment (TMIQA) metrics are desirable to aid selecting the best TMO for an HDR image. Only few relatively small benchmark databases exist for TMIQA task, namely ESPL-LIVE and TMID. We present a new database for TMIQA, called PBTDB, which contains approximately 175000 samples. Sample quality is labeled by four TMIQA metrics. We also conduct subjective experiments to assess quality of 3009 PBTDB samples. Current state-of-the-art noreference (NR) IQA metrics, which are the focus of our study, are unable to reliably assess the quality of tone-mapped images that do not come from specific databases. We design cross-dataset experiments to investigate two approaches for developing new generic NR TMIQA metrics. In the first one, we use ESPL-LIVE samples to train machine-learning based regression models that combine scores from multiple IQA metrics into a single quality score. The best performing model outputs quality scores that correlate relatively poorly with TMID sample mean opinion scores (PLCC of 0.65 and SRCC of 0.55). In the second one, we use PBTDB samples to train deep learning architectures, and ESPL-LIVE and TMID samples to test them. Models can achieve moderate performance in TMID, but all perform poorly in ESPL-LIVE (best performances: PLCC of 0.48 and SRCC of 0.43 in ESPL-LIVE, and PLCC of 0.79 and SRCC of 0.72 in TMID). Performance is heavily influenced by quality score types (subjective versus objective) used as targets to train the models |
| Keywords: | Processamento de imagens Qualidade da imagem Imagens em Alta Faixa Dinâmica Modelos de aprendizado profundo |
| Subject CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO |
| Program: | Programa de Pós-Graduação em Engenharia Elétrica |
| Production unit: | Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia |
| Publisher: | Universidade Federal do Rio de Janeiro |
| Issue Date: | Jul-2022 |
| Publisher country: | Brasil |
| Language: | eng |
| Right access: | Acesso Aberto |
| Citation: | NUNES, Gustavo Martins da Silva. Machine learning and deep learning models for tone-mapped image quality assessment. 2022. 125 f. Tese (Doutorado) - Programa de Pós-Gaduação em Engenharia Elétrica, COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022. |
| Appears in Collections: | Engenharia Elétrica |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 947959.pdf | 2.77 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.