Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/26804

Tipo: Dissertação
Título: Identificação de gênero musical por meio de redes neurais convolucionais
Autor(es)/Inventor(es): Matos, Natanael Luciano de
Orientador: Carvalho, Hugo Tremonte de
Coorientador: Pagani Zanini, Carlos Tadeu
Resumo: Classificação musical é uma coleção de problemas dentro da área de recuperação de informações musicais (musical information retrieval, MIR, em inglês), dentre eles: identificação de instrumentos presentes na música, identificação do conjunto de notas, identificação de gênero musical, decomposição de fontes sonoras, e entre outros. Nesta dissertação, será abordado o problema de classificação de gênero musical e será estudada a implementação de uma rede neural convolucional recorrente (CRNN) e seu desempenho será comparado com as redes neurais convolucionais(CNN). Além disso, a arquitetura das redes será construída com informações musicais em mente, isto é, estaremos utilizando características presentes nos sinais musicais para tentar melhorar o desempenho das redes neurais no problema de classificação. A estrutura de rede convolucional com camadas recorrentes, conjuntamente com o aprimoramento no projeto da arquitetura das redes levando em consideração a estrutura do sinal é capaz de obter uma acurácia categórica de 77% e AUC-ROC de 0, 96 no problema de identificação de gêneros musicais, comparável ao estado-da-arte.
Resumo: Musical classification is a collection of problems within the field of Musical Information Retrieval (MIR), including: identification of instruments present in the music, identification of the set of notes, identification of musical genre, decomposition of sound sources, and others. In this thesis, the problem of musical genre classification will be addressed, and the implementation of a Convolutional Recurrent Neural Network (CRNN) will be studied, with its performance compared to Convolutional Neural Networks (CNN). Additionally, the architecture of the networks will be built with musical information in mind, i.e., we will be utilizing characteristics present in musical signals to try to improve the performance of neural networks in the classification problem. The convolutional network structure with recurrent layers, together with enhancements in the design of the architecture of the networks considering the structure of the signal, is able to achieve a categorical accuracy of 77% and an AUC-ROC of 0.96 in the problem of identifying musical genres, comparable to the state-of-the-art.
Palavras-chave: Classificação musical
Recuperação de informação musical
Redes neurais
Rede neural convolucional recorrente
Musical classification
Musical information retrieval
Neural networks
Convolutional recurrent neural network
Assunto CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Programa: Programa de Pós-Graduação em Estatística
Unidade produtora: Instituto de Matemática
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: Mar-2024
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Estatística

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
NLMatos.pdf2 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.