Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/26804

Especie: Dissertação
Título : Identificação de gênero musical por meio de redes neurais convolucionais
Autor(es)/Inventor(es): Matos, Natanael Luciano de
Tutor: Carvalho, Hugo Tremonte de
Tutor : Pagani Zanini, Carlos Tadeu
Resumen: Classificação musical é uma coleção de problemas dentro da área de recuperação de informações musicais (musical information retrieval, MIR, em inglês), dentre eles: identificação de instrumentos presentes na música, identificação do conjunto de notas, identificação de gênero musical, decomposição de fontes sonoras, e entre outros. Nesta dissertação, será abordado o problema de classificação de gênero musical e será estudada a implementação de uma rede neural convolucional recorrente (CRNN) e seu desempenho será comparado com as redes neurais convolucionais(CNN). Além disso, a arquitetura das redes será construída com informações musicais em mente, isto é, estaremos utilizando características presentes nos sinais musicais para tentar melhorar o desempenho das redes neurais no problema de classificação. A estrutura de rede convolucional com camadas recorrentes, conjuntamente com o aprimoramento no projeto da arquitetura das redes levando em consideração a estrutura do sinal é capaz de obter uma acurácia categórica de 77% e AUC-ROC de 0, 96 no problema de identificação de gêneros musicais, comparável ao estado-da-arte.
Resumen: Musical classification is a collection of problems within the field of Musical Information Retrieval (MIR), including: identification of instruments present in the music, identification of the set of notes, identification of musical genre, decomposition of sound sources, and others. In this thesis, the problem of musical genre classification will be addressed, and the implementation of a Convolutional Recurrent Neural Network (CRNN) will be studied, with its performance compared to Convolutional Neural Networks (CNN). Additionally, the architecture of the networks will be built with musical information in mind, i.e., we will be utilizing characteristics present in musical signals to try to improve the performance of neural networks in the classification problem. The convolutional network structure with recurrent layers, together with enhancements in the design of the architecture of the networks considering the structure of the signal, is able to achieve a categorical accuracy of 77% and an AUC-ROC of 0.96 in the problem of identifying musical genres, comparable to the state-of-the-art.
Materia: Classificação musical
Recuperação de informação musical
Redes neurais
Rede neural convolucional recorrente
Musical classification
Musical information retrieval
Neural networks
Convolutional recurrent neural network
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Programa: Programa de Pós-Graduação em Estatística
Unidade de producción: Instituto de Matemática
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: mar-2024
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Estatística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
NLMatos.pdf2 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.