Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/18239
Especie: Trabalho de conclusão de graduação
Título : Bert e word2vec: uma analise inferencial e computacional na classificação de textos com redes neurais convolucionais
Otros títulos: Bert and word2vec: an inferential and computational analysis in text classification with convolutional neural networks
Autor(es)/Inventor(es): Cordeiro, Bernardo Cardoso
Tutor: Almeida, Heraldo Luis Silveira de
Resumen: Este trabalho consiste na aplicação de técnicas de representação de palavras (word embeddings) atuais, considerando arquiteturas de redes neurais convolucionais, voltadas para a classificação de documentos textuais. Camadas de convolução são tradicionalmente utilizadas no processamento de imagens, mas recentemente, elas têm ganhado peso também no processamento de textos. Em um dos primeiros artigos abordando este uso desta técnica, foi considerada a utilização de um dos métodos mais conhecidos de word embeddings, o word2vec. Para este projeto, visa-se replicar este trabalho utilizando um dos métodos mais recentes de word embeddings, o BERT, de modo a comparar os efeitos de cada um no desempenho do modelo. Além disso, alguns conjuntos de documentos em português também serão utilizados. A maioria das pesquisas realizadas neste campo utilizam corpus de documentos em língua inglesa, o que acarreta em uma escassez deste tipo de trabalho no idioma lusófono. Desta forma, este projeto se coloca, também, como uma contribuição para o avanço destas soluções no campo da língua portuguesa. Por último, visa-se realizar não só uma análise inferencial do desempenho, como também uma análise computacional. O que isto quer dizer ´e que, além de utilizar métricas ligadas ao acerto e erro estatístico das técnicas, também serão levados em consideração aspectos computacionais, especificamente o tempo e a memória necessários nas soluções analisadas.
Materia: word2vec
BERT
Materia CNPq: CNPQ::ENGENHARIAS
Unidade de producción: Escola Politécnica
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: sep-2019
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Engenharia de Computação e Informação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
monopoli10029908.pdf375.5 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.