Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/21591
Type: Trabalho de conclusão de graduação
Title: Exploring the impact of intermediate languages on machine translation
Author(s)/Inventor(s): Oliveira, Alex Santos de
Fernandes, Rafael da Silva
Advisor: Paixão, João Antonio Recio da
Co-advisor: Moraes, Laura de Oliveira Fernandes
Abstract: área de tradução é mais antiga que o computador e, conforme a tecnologia foi avançando, ela foi se modernizando e se adaptando às novas descobertas, tentando sempre se tornar mais eficiente e precisa. Tradução por máquina, uma parte integral do Processamento de Linguagem Natural, procura possibilitar a tradução automática entre idiomas buscando sempre melhorar a precisão e a acessibilidade. Porém, considerando a quantidade de idiomas que existem, treinar modelos para todos os pares de idiomas possíveis sem o uso de múltiplos computadores poderosos e uma quantidade imensa de dados se torna uma tarefa complexa, além de ser impossível para alguns pares de idiomas. Neste trabalho nós avaliamos uma forma simples e rápida de diminuir o número de treinamentos e como ela impacta na qualidade da tradução. Nossos resultados mostraram que é possível realizar traduções usando idiomas intermediários ao invés de se traduzir diretamente para o idioma desejado sem impactar de forma significativa no resultado da tradução. Também mostramos que o impacto está relacionado com a família dos idiomas original, alvo, e intermediário. Com isso, concluímos que usar idiomas intermediários é uma técnica efetiva para diminuir de forma o número de treinamentos necessários ao se lidar com um número grande de idiomas, fazendo com que o processo de treinar modelos demande menos recursos. Isso permite que a criação de modelos para tradução usando múltiplos idiomas se torne mais acessível já que, por exemplo, ao usar 10 idiomas, treinar uma tradução direta entre todos os pares possíveis de idiomas resultaria em 45 treinamentos diferentes, número obtido calculando a combinação simples. Já usando um idioma intermediário para esse mesmo cenário, só seria necessário calcular traduções para esse idioma, resultando em apenas 9 treinamentos, reduzindo o custo computacional, além de beneficiar diversas áreas e beneficiar a troca de conhecimentos e ideias.
Keywords: Tradução por Máquina
Word Embedding
Problema Ortogonal de Procrustes
Língua Intermediária
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Production unit: Instituto de Computação
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: 5-Sep-2023
Publisher country: Brasil
Language: eng
Right access: Acesso Aberto
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
ASOliveira.pdf668.1 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.