Diarização de locutor em conteúdo de vídeo baseada em análise de expressão facial via aprendizado de máquina supervisionado

Basilio, Renan Fasolato

Pantheon Repositorio Institucional

Recopila, preserva y difundi la producción académica digital en todas las áreas del conocimiento.
Comprende los activos del repositorio, además de tesis y disertaciones en la UFRJ, artículos científicos, libros electrónicos, capítulos de libros y trabajos presentados en eventos para los profesores, investigadores, personal administrativo y estudiantes de maestría y doctorado.

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/18244

Especie:	Trabalho de conclusão de graduação
Título :	Diarização de locutor em conteúdo de vídeo baseada em análise de expressão facial via aprendizado de máquina supervisionado
Otros títulos:	Speaker diarization in video content based on facial expression analysis via supervised machine learning
Autor(es)/Inventor(es):	Basilio, Renan Fasolato
Tutor:	Silva, Geraldo Zimbrão da
Resumen:	Este trabalho apresenta uma prova de conceito para um sistema diarizador baseado em uma rede neural convolucional capaz de identificar o estado de fala de um locutor a partir de um vídeo do mesmo, sem fazer uso da onda de áudio relacionada, para aplicação em casos onde esta se encontre em baixa qualidade, ruidosa, ou mesmo ausente. Para isso, é realizado um pré-processamento sobre a imagem de entrada de forma a identificar a posição da face do locutor e extrair desta suas feições principais, que servem de entrada para a rede neural. Uma arquitetura para a rede neural baseada em uma VGG, modificada para lidar com dados tridimensionais, foi construída, cuja implementação levou a um modelo com acurácia preditiva de 86.56%, resultando em uma taxa de erro de diarização de 32.5 sobre os dados de teste no melhor caso.
Materia:	Aprendizado Supervisionado Aprendizado de Máquina Diarização de Locutor
Materia CNPq:	CNPQ::ENGENHARIAS
Unidade de producción:	Escola Politécnica
Editor:	Universidade Federal do Rio de Janeiro
Fecha de publicación:	ago-2020
País de edición :	Brasil
Idioma de publicación:	por
Tipo de acceso :	Acesso Aberto
Aparece en las colecciones:	Engenharia de Computação e Informação

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
monopoli10031910.pdf		5.64 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem Recomiende este ítem View Statistics