Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/21591
Type: | Trabalho de conclusão de graduação |
Title: | Exploring the impact of intermediate languages on machine translation |
Author(s)/Inventor(s): | Oliveira, Alex Santos de Fernandes, Rafael da Silva |
Advisor: | Paixão, João Antonio Recio da |
Co-advisor: | Moraes, Laura de Oliveira Fernandes |
Abstract: | área de tradução é mais antiga que o computador e, conforme a tecnologia foi avançando, ela foi se modernizando e se adaptando às novas descobertas, tentando sempre se tornar mais eficiente e precisa. Tradução por máquina, uma parte integral do Processamento de Linguagem Natural, procura possibilitar a tradução automática entre idiomas buscando sempre melhorar a precisão e a acessibilidade. Porém, considerando a quantidade de idiomas que existem, treinar modelos para todos os pares de idiomas possíveis sem o uso de múltiplos computadores poderosos e uma quantidade imensa de dados se torna uma tarefa complexa, além de ser impossível para alguns pares de idiomas. Neste trabalho nós avaliamos uma forma simples e rápida de diminuir o número de treinamentos e como ela impacta na qualidade da tradução. Nossos resultados mostraram que é possível realizar traduções usando idiomas intermediários ao invés de se traduzir diretamente para o idioma desejado sem impactar de forma significativa no resultado da tradução. Também mostramos que o impacto está relacionado com a família dos idiomas original, alvo, e intermediário. Com isso, concluímos que usar idiomas intermediários é uma técnica efetiva para diminuir de forma o número de treinamentos necessários ao se lidar com um número grande de idiomas, fazendo com que o processo de treinar modelos demande menos recursos. Isso permite que a criação de modelos para tradução usando múltiplos idiomas se torne mais acessível já que, por exemplo, ao usar 10 idiomas, treinar uma tradução direta entre todos os pares possíveis de idiomas resultaria em 45 treinamentos diferentes, número obtido calculando a combinação simples. Já usando um idioma intermediário para esse mesmo cenário, só seria necessário calcular traduções para esse idioma, resultando em apenas 9 treinamentos, reduzindo o custo computacional, além de beneficiar diversas áreas e beneficiar a troca de conhecimentos e ideias. |
Keywords: | Tradução por Máquina Word Embedding Problema Ortogonal de Procrustes Língua Intermediária |
Subject CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Production unit: | Instituto de Computação |
Publisher: | Universidade Federal do Rio de Janeiro |
Issue Date: | 5-Sep-2023 |
Publisher country: | Brasil |
Language: | eng |
Right access: | Acesso Aberto |
Appears in Collections: | Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ASOliveira.pdf | 668.1 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.