Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/18239
Type: Trabalho de conclusão de graduação
Title: Bert e word2vec: uma analise inferencial e computacional na classificação de textos com redes neurais convolucionais
Other Titles: Bert and word2vec: an inferential and computational analysis in text classification with convolutional neural networks
Author(s)/Inventor(s): Cordeiro, Bernardo Cardoso
Advisor: Almeida, Heraldo Luis Silveira de
Abstract: Este trabalho consiste na aplicação de técnicas de representação de palavras (word embeddings) atuais, considerando arquiteturas de redes neurais convolucionais, voltadas para a classificação de documentos textuais. Camadas de convolução são tradicionalmente utilizadas no processamento de imagens, mas recentemente, elas têm ganhado peso também no processamento de textos. Em um dos primeiros artigos abordando este uso desta técnica, foi considerada a utilização de um dos métodos mais conhecidos de word embeddings, o word2vec. Para este projeto, visa-se replicar este trabalho utilizando um dos métodos mais recentes de word embeddings, o BERT, de modo a comparar os efeitos de cada um no desempenho do modelo. Além disso, alguns conjuntos de documentos em português também serão utilizados. A maioria das pesquisas realizadas neste campo utilizam corpus de documentos em língua inglesa, o que acarreta em uma escassez deste tipo de trabalho no idioma lusófono. Desta forma, este projeto se coloca, também, como uma contribuição para o avanço destas soluções no campo da língua portuguesa. Por último, visa-se realizar não só uma análise inferencial do desempenho, como também uma análise computacional. O que isto quer dizer ´e que, além de utilizar métricas ligadas ao acerto e erro estatístico das técnicas, também serão levados em consideração aspectos computacionais, especificamente o tempo e a memória necessários nas soluções analisadas.
Keywords: word2vec
BERT
Subject CNPq: CNPQ::ENGENHARIAS
Production unit: Escola Politécnica
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: Sep-2019
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Engenharia de Computação e Informação

Files in This Item:
File Description SizeFormat 
monopoli10029908.pdf375.5 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.