Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/18239
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Almeida, Heraldo Luis Silveira de | - |
dc.contributor.author | Cordeiro, Bernardo Cardoso | - |
dc.date.accessioned | 2022-08-05T21:35:26Z | - |
dc.date.available | 2023-12-21T03:00:22Z | - |
dc.date.issued | 2019-09 | - |
dc.identifier.uri | http://hdl.handle.net/11422/18239 | - |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal do Rio de Janeiro | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | word2vec | pt_BR |
dc.subject | BERT | pt_BR |
dc.title | Bert e word2vec: uma analise inferencial e computacional na classificação de textos com redes neurais convolucionais | pt_BR |
dc.title.alternative | Bert and word2vec: an inferential and computational analysis in text classification with convolutional neural networks | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.referee1 | Souza Filho, Jo˜ao Baptista de Oliveira e | - |
dc.contributor.referee2 | Moura Junior, Natanael Nunes de | - |
dc.description.resumo | Este trabalho consiste na aplicação de técnicas de representação de palavras (word embeddings) atuais, considerando arquiteturas de redes neurais convolucionais, voltadas para a classificação de documentos textuais. Camadas de convolução são tradicionalmente utilizadas no processamento de imagens, mas recentemente, elas têm ganhado peso também no processamento de textos. Em um dos primeiros artigos abordando este uso desta técnica, foi considerada a utilização de um dos métodos mais conhecidos de word embeddings, o word2vec. Para este projeto, visa-se replicar este trabalho utilizando um dos métodos mais recentes de word embeddings, o BERT, de modo a comparar os efeitos de cada um no desempenho do modelo. Além disso, alguns conjuntos de documentos em português também serão utilizados. A maioria das pesquisas realizadas neste campo utilizam corpus de documentos em língua inglesa, o que acarreta em uma escassez deste tipo de trabalho no idioma lusófono. Desta forma, este projeto se coloca, também, como uma contribuição para o avanço destas soluções no campo da língua portuguesa. Por último, visa-se realizar não só uma análise inferencial do desempenho, como também uma análise computacional. O que isto quer dizer ´e que, além de utilizar métricas ligadas ao acerto e erro estatístico das técnicas, também serão levados em consideração aspectos computacionais, especificamente o tempo e a memória necessários nas soluções analisadas. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Escola Politécnica | pt_BR |
dc.publisher.initials | UFRJ | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS | pt_BR |
dc.embargo.terms | aberto | pt_BR |
Appears in Collections: | Engenharia de Computação e Informação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
monopoli10029908.pdf | 375.5 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.