Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/13431
Tipo: Trabalho de conclusão de graduação
Título: Avaliação de analogias em word embeddings para língua portuguesa
Autor(es)/Inventor(es): Couto, Bruno Ferraz de A.
Orientador: Silva, João Carlos Pereira da
Resumo: Estudos na área de Processamento de Linguagem Natural tem indicado o uso de representações vetoriais de palavras e proposto novos modelos de aprendizado de máquina para aprimoramento da geração dessas representações. Essas representações são utilizadas em aplicações de Processamento de Linguagem Natural para substituir a representação textual e utilizar as informações absorvidas pelas representações para melhorar os resultados da aplicação. A avaliação dos modelos treinados é realizada de diferentes formas e são divididas entre formas de avaliação intrínseca e extrínseca. Neste trabalho busca-se explorar as regularidades linguísticas (semântica e sintática) observadas nesses modelos e analisar os resultados do método de avaliação intrínseca em que é aferido a capacidade de resolução de analogias de pares de palavras. Como a maioria dos trabalhos referenciados utilizam da língua inglesa para demonstrar as utilidades de word embeddings, os experimentos foram realizados sobre a língua portuguesa, com intuito de contribuir para os estudos de Processamento de Linguagem Natural e word embeddings no idioma. A acurácia de modelos pré-treinados disponibilizados e dos modelos treinados para este trabalho indicam o potencial de resolução de analogias através dessa técnica. Além disso, a exploração do método de avaliação por analogias expõe particularidades dos resultados obtidos que podem ser enviesadas pela análise da acurácia obtida.
Palavras-chave: Word Embeddings
Avaliação
Processamento de linguagem natural
Assunto CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade produtora: Instituto de Matemática
Instituto Tércio Pacitti de Aplicações e Pesquisas Computacionais
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: 4-Ago-2020
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
BFACouto.pdf378.59 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.