Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/11422/18239
Tipo: | Trabalho de conclusão de graduação |
Título: | Bert e word2vec: uma analise inferencial e computacional na classificação de textos com redes neurais convolucionais |
Título(s) alternativo(s): | Bert and word2vec: an inferential and computational analysis in text classification with convolutional neural networks |
Autor(es)/Inventor(es): | Cordeiro, Bernardo Cardoso |
Orientador: | Almeida, Heraldo Luis Silveira de |
Resumo: | Este trabalho consiste na aplicação de técnicas de representação de palavras (word embeddings) atuais, considerando arquiteturas de redes neurais convolucionais, voltadas para a classificação de documentos textuais. Camadas de convolução são tradicionalmente utilizadas no processamento de imagens, mas recentemente, elas têm ganhado peso também no processamento de textos. Em um dos primeiros artigos abordando este uso desta técnica, foi considerada a utilização de um dos métodos mais conhecidos de word embeddings, o word2vec. Para este projeto, visa-se replicar este trabalho utilizando um dos métodos mais recentes de word embeddings, o BERT, de modo a comparar os efeitos de cada um no desempenho do modelo. Além disso, alguns conjuntos de documentos em português também serão utilizados. A maioria das pesquisas realizadas neste campo utilizam corpus de documentos em língua inglesa, o que acarreta em uma escassez deste tipo de trabalho no idioma lusófono. Desta forma, este projeto se coloca, também, como uma contribuição para o avanço destas soluções no campo da língua portuguesa. Por último, visa-se realizar não só uma análise inferencial do desempenho, como também uma análise computacional. O que isto quer dizer ´e que, além de utilizar métricas ligadas ao acerto e erro estatístico das técnicas, também serão levados em consideração aspectos computacionais, especificamente o tempo e a memória necessários nas soluções analisadas. |
Palavras-chave: | word2vec BERT |
Assunto CNPq: | CNPQ::ENGENHARIAS |
Unidade produtora: | Escola Politécnica |
Editora: | Universidade Federal do Rio de Janeiro |
Data de publicação: | Set-2019 |
País de publicação: | Brasil |
Idioma da publicação: | por |
Tipo de acesso: | Acesso Aberto |
Aparece nas coleções: | Engenharia de Computação e Informação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
monopoli10029908.pdf | 375.5 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.