Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/18239
Tipo: Trabalho de conclusão de graduação
Título: Bert e word2vec: uma analise inferencial e computacional na classificação de textos com redes neurais convolucionais
Título(s) alternativo(s): Bert and word2vec: an inferential and computational analysis in text classification with convolutional neural networks
Autor(es)/Inventor(es): Cordeiro, Bernardo Cardoso
Orientador: Almeida, Heraldo Luis Silveira de
Resumo: Este trabalho consiste na aplicação de técnicas de representação de palavras (word embeddings) atuais, considerando arquiteturas de redes neurais convolucionais, voltadas para a classificação de documentos textuais. Camadas de convolução são tradicionalmente utilizadas no processamento de imagens, mas recentemente, elas têm ganhado peso também no processamento de textos. Em um dos primeiros artigos abordando este uso desta técnica, foi considerada a utilização de um dos métodos mais conhecidos de word embeddings, o word2vec. Para este projeto, visa-se replicar este trabalho utilizando um dos métodos mais recentes de word embeddings, o BERT, de modo a comparar os efeitos de cada um no desempenho do modelo. Além disso, alguns conjuntos de documentos em português também serão utilizados. A maioria das pesquisas realizadas neste campo utilizam corpus de documentos em língua inglesa, o que acarreta em uma escassez deste tipo de trabalho no idioma lusófono. Desta forma, este projeto se coloca, também, como uma contribuição para o avanço destas soluções no campo da língua portuguesa. Por último, visa-se realizar não só uma análise inferencial do desempenho, como também uma análise computacional. O que isto quer dizer ´e que, além de utilizar métricas ligadas ao acerto e erro estatístico das técnicas, também serão levados em consideração aspectos computacionais, especificamente o tempo e a memória necessários nas soluções analisadas.
Palavras-chave: word2vec
BERT
Assunto CNPq: CNPQ::ENGENHARIAS
Unidade produtora: Escola Politécnica
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: Set-2019
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Engenharia de Computação e Informação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
monopoli10029908.pdf375.5 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.