Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11422/26804
| Especie: | Dissertação |
| Título : | Identificação de gênero musical por meio de redes neurais convolucionais |
| Autor(es)/Inventor(es): | Matos, Natanael Luciano de |
| Tutor: | Carvalho, Hugo Tremonte de |
| Tutor : | Pagani Zanini, Carlos Tadeu |
| Resumen: | Classificação musical é uma coleção de problemas dentro da área de recuperação de informações musicais (musical information retrieval, MIR, em inglês), dentre eles: identificação de instrumentos presentes na música, identificação do conjunto de notas, identificação de gênero musical, decomposição de fontes sonoras, e entre outros. Nesta dissertação, será abordado o problema de classificação de gênero musical e será estudada a implementação de uma rede neural convolucional recorrente (CRNN) e seu desempenho será comparado com as redes neurais convolucionais(CNN). Além disso, a arquitetura das redes será construída com informações musicais em mente, isto é, estaremos utilizando características presentes nos sinais musicais para tentar melhorar o desempenho das redes neurais no problema de classificação. A estrutura de rede convolucional com camadas recorrentes, conjuntamente com o aprimoramento no projeto da arquitetura das redes levando em consideração a estrutura do sinal é capaz de obter uma acurácia categórica de 77% e AUC-ROC de 0, 96 no problema de identificação de gêneros musicais, comparável ao estado-da-arte. |
| Resumen: | Musical classification is a collection of problems within the field of Musical Information Retrieval (MIR), including: identification of instruments present in the music, identification of the set of notes, identification of musical genre, decomposition of sound sources, and others. In this thesis, the problem of musical genre classification will be addressed, and the implementation of a Convolutional Recurrent Neural Network (CRNN) will be studied, with its performance compared to Convolutional Neural Networks (CNN). Additionally, the architecture of the networks will be built with musical information in mind, i.e., we will be utilizing characteristics present in musical signals to try to improve the performance of neural networks in the classification problem. The convolutional network structure with recurrent layers, together with enhancements in the design of the architecture of the networks considering the structure of the signal, is able to achieve a categorical accuracy of 77% and an AUC-ROC of 0.96 in the problem of identifying musical genres, comparable to the state-of-the-art. |
| Materia: | Classificação musical Recuperação de informação musical Redes neurais Rede neural convolucional recorrente Musical classification Musical information retrieval Neural networks Convolutional recurrent neural network |
| Materia CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| Programa: | Programa de Pós-Graduação em Estatística |
| Unidade de producción: | Instituto de Matemática |
| Editor: | Universidade Federal do Rio de Janeiro |
| Fecha de publicación: | mar-2024 |
| País de edición : | Brasil |
| Idioma de publicación: | por |
| Tipo de acceso : | Acesso Aberto |
| Aparece en las colecciones: | Estatística |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| NLMatos.pdf | 2 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.