Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/11560
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Silva, Eduardo Antônio Barros da | - |
dc.contributor.author | Silva, Renam Castro da | - |
dc.date.accessioned | 2020-03-20T00:17:43Z | - |
dc.date.available | 2023-12-21T03:06:56Z | - |
dc.date.issued | 2018-02 | - |
dc.identifier.uri | http://hdl.handle.net/11422/11560 | - |
dc.description.abstract | In modern video applications, the role of the decoded video is much more than filling a screen for visualization. To offer powerful video-enabled applications, it is increasingly critical not only to visualize the decoded video but also to provide efficient searching capabilities for similar content. Video surveillance and personal communication applications are critical examples of these dual visualization and searching requirements. However, current video coding solutions are strongly biased towards the visualization needs. In this context, the goal of this work is to propose a dual-purpose video coding solution targeting both visualization and searching needs by adopting a hybrid coding framework where the usual pixel-based coding approach is combined with a novel feature-based coding approach. In this novel dual-purpose video coding solution, some frames are coded using a set of keypoint matches, which not only allow decoding for visualization, but also provide the decoder valuable feature-related information, extracted at the encoder from the original frames, instrumental for efficient searching. The proposed solution is based on a flexible joint Lagrangian optimization framework where pixel-based and feature-based processing are combined to find the most appropriate trade-off between the visualization and searching performances. Extensive experimental results for the assessment of the proposed dual-purpose video coding solution under meaningful test conditions are presented. The results show the flexibility of the proposed coding solution to achieve different optimization trade-offs, notably competitive performance regarding the state-of-the-art HEVC standard both in terms of visualization and searching performance. | pt_BR |
dc.language | eng | pt_BR |
dc.publisher | Universidade Federal do Rio de Janeiro | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Engenharia elétrica | pt_BR |
dc.subject | Codificação de vídeo de dupla finalidade | pt_BR |
dc.subject | HEVC | pt_BR |
dc.title | Towards visualization and searching :a dual-purpose video coding approach | pt_BR |
dc.type | Tese | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/9165346235209757 | pt_BR |
dc.contributor.advisorCo1 | Pereira, Fernando Manuel Bernardo | - |
dc.contributor.referee1 | Lima Netto, Sergio | - |
dc.contributor.referee2 | Queiroz, Ricardo Lopes de | - |
dc.contributor.referee3 | Ebrahimi, Touradj | - |
dc.description.resumo | Em modernas aplicações de vídeo, o papel do vídeo decodificado é muito mais que simplesmente preencher uma tela para visualização. Para oferecer aplicações mais poderosas por meio de sinais de vídeo,é cada vez mais crítico não apenas considerar a qualidade do conteúdo objetivando sua visualização, mas também possibilitar meios de realizar busca por conteúdos semelhantes. Requisitos de visualização e de busca são considerados, por exemplo, em modernas aplicações de vídeo vigilância e comunicações pessoais. No entanto, as atuais soluções de codificação de vídeo são fortemente voltadas aos requisitos de visualização. Nesse contexto, o objetivo deste trabalho é propor uma solução de codificação de vídeo de propósito duplo, objetivando tanto requisitos de visualização quanto de busca. Para isso, é proposto um arcabouço de codificação em que a abordagem usual de codificação de pixels é combinada com uma nova abordagem de codificação baseada em features visuais. Nessa solução, alguns quadros são codificados usando um conjunto de pares de keypoints casados, possibilitando não apenas visualização, mas também provendo ao decodificador valiosas informações de features visuais, extraídas no codificador a partir do conteúdo original, que são instrumentais em aplicações de busca. A solução proposta emprega um esquema flexível de otimização Lagrangiana onde o processamento baseado em pixel é combinado com o processamento baseado em features visuais objetivando encontrar um compromisso adequado entre os desempenhos de visualização e de busca. Os resultados experimentais mostram a flexibilidade da solução proposta em alcançar diferentes compromissos de otimização, nomeadamente desempenho competitivo em relação ao padrão HEVC tanto em termos de visualização quanto de busca. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Engenharia Elétrica | pt_BR |
dc.publisher.initials | UFRJ | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | pt_BR |
dc.embargo.terms | aberto | pt_BR |
Appears in Collections: | Engenharia Elétrica |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
887655.pdf | 3.28 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.