Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/11422/26804
| Tipo: | Dissertação |
| Título: | Identificação de gênero musical por meio de redes neurais convolucionais |
| Autor(es)/Inventor(es): | Matos, Natanael Luciano de |
| Orientador: | Carvalho, Hugo Tremonte de |
| Coorientador: | Pagani Zanini, Carlos Tadeu |
| Resumo: | Classificação musical é uma coleção de problemas dentro da área de recuperação de informações musicais (musical information retrieval, MIR, em inglês), dentre eles: identificação de instrumentos presentes na música, identificação do conjunto de notas, identificação de gênero musical, decomposição de fontes sonoras, e entre outros. Nesta dissertação, será abordado o problema de classificação de gênero musical e será estudada a implementação de uma rede neural convolucional recorrente (CRNN) e seu desempenho será comparado com as redes neurais convolucionais(CNN). Além disso, a arquitetura das redes será construída com informações musicais em mente, isto é, estaremos utilizando características presentes nos sinais musicais para tentar melhorar o desempenho das redes neurais no problema de classificação. A estrutura de rede convolucional com camadas recorrentes, conjuntamente com o aprimoramento no projeto da arquitetura das redes levando em consideração a estrutura do sinal é capaz de obter uma acurácia categórica de 77% e AUC-ROC de 0, 96 no problema de identificação de gêneros musicais, comparável ao estado-da-arte. |
| Resumo: | Musical classification is a collection of problems within the field of Musical Information Retrieval (MIR), including: identification of instruments present in the music, identification of the set of notes, identification of musical genre, decomposition of sound sources, and others. In this thesis, the problem of musical genre classification will be addressed, and the implementation of a Convolutional Recurrent Neural Network (CRNN) will be studied, with its performance compared to Convolutional Neural Networks (CNN). Additionally, the architecture of the networks will be built with musical information in mind, i.e., we will be utilizing characteristics present in musical signals to try to improve the performance of neural networks in the classification problem. The convolutional network structure with recurrent layers, together with enhancements in the design of the architecture of the networks considering the structure of the signal, is able to achieve a categorical accuracy of 77% and an AUC-ROC of 0.96 in the problem of identifying musical genres, comparable to the state-of-the-art. |
| Palavras-chave: | Classificação musical Recuperação de informação musical Redes neurais Rede neural convolucional recorrente Musical classification Musical information retrieval Neural networks Convolutional recurrent neural network |
| Assunto CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| Programa: | Programa de Pós-Graduação em Estatística |
| Unidade produtora: | Instituto de Matemática |
| Editora: | Universidade Federal do Rio de Janeiro |
| Data de publicação: | Mar-2024 |
| País de publicação: | Brasil |
| Idioma da publicação: | por |
| Tipo de acesso: | Acesso Aberto |
| Aparece nas coleções: | Estatística |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| NLMatos.pdf | 2 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.