Semi-automatic construction of subsea inspection datasets using deep convolutional neural networks

Sampaio, Olavo Argôlo Batista

Pantheon Repositório Institucional da UFRJ

Coleta, preserva e divulga a produção acadêmica digital em todas as áreas do conhecimento.
São os ativos do repositório, além de teses e dissertações da UFRJ, artigos científicos, livros eletrônicos, capítulos de livros e trabalhos apresentados em eventos por professores, pesquisadores, funcionários administrativos e alunos de mestrado e doutorado.

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/23209

Tipo:	Dissertação
Título:	Semi-automatic construction of subsea inspection datasets using deep convolutional neural networks
Autor(es)/Inventor(es):	Sampaio, Olavo Argôlo Batista
Orientador:	Gomes, José Gabriel Rodríguez Carneiro
Resumo:	A inspeção de dutos submarinos requer que especialistas analisem muitas horas de vídeos buscando eventos relevantes nos dutos, uma tarefa demorada e cara. Usando modelos de aprendizado profundo para classificação de imagens, pode-se acelerar a busca por eventos em vídeos, substituindo ou reduzindo o trabalho necessário dos especialistas. Para treinar tais modelos, que podem ter milhões de parâmetros treináveis, bases de dados com muitos exemplos são necessárias. Elas devem ser construídas através da anotação de eventos nos vídeos. Essa tarefa, se feita manualmente por anotadores humanos, é lenta, requer muito esforço humano e é de difícil escalabilidade. Este trabalho adapta e utiliza um método de anotar imagens usando força de trabalho humana em conjunto com redes neurais profundas de uma forma sequencial e iterativa. Esse método é usado para anotar 146 vídeos de inspeção submarina e construir uma base de dados com 457 mil imagens para uma tarefa de classificação hierárquica de três níveis. Essa base de dados é comparada com uma construída apenas usando anotadores humanos, usando ambas para treinar e avaliar modelos classificadores, onde a nova base permite que modelos tenham melhor desempenho em 10 de 14 testes, se comparados aos treinados pela base concorrente. O método também produz uma amplificação de esforço de anotação de 45:1, no melhor caso, e 13:1, no pior, além de ser estimado que ele permita uma que imagens sejam anotadas 4,3 vezes mais rápido do que o método manual anterior.
Resumo:	Undersea pipeline inspection requires that specialists analyze many hours of video searching for relevant events, a time-consuming and expensive task. Using deep neural models for image classification can accelerate event discovery in videos, substituting or reducing the work required from the specialists. To train such models with millions of parameters, large labeled datasets are required. The datasets must be built by annotating the events on videos. If that is done by human annotators, it becomes a task that is slow, time-consuming and difficult to scale. This work explores and adapts a method of annotating images using human effort in tandem with deep neural networks in an sequential, iterative manner. The method is used to annotate 146 videos of undersea inspection and builds a dataset of 457 thousand images to solve a hierarchical classification task with three levels. This dataset is compared to a dataset built using only human effort by using both to train and evaluate classifier models. The new dataset allows a model to achieve best performance in 10 out of 14 tests in comparison to the performance of models trained from the previous dataset. The method also produces an annotation effort amplification of 45:1 in the best case and 13:1 in the worst, and is estimated to allow the new dataset to be annotated 4.3 times faster than the previous, manual method.
Palavras-chave:	Anotação semi-automática Conjunto de dados
Assunto CNPq:	Engenharia elétrica
Programa:	Programa de Pós-Graduação em Engenharia Elétrica
Unidade produtora:	Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Editora:	Universidade Federal do Rio de Janeiro
Data de publicação:	Mar-2020
País de publicação:	Brasil
Idioma da publicação:	eng
Tipo de acesso:	Acesso Aberto
Aparece nas coleções:	Engenharia Elétrica

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
942453.pdf		420.03 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas