Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/21591
Tipo: Trabalho de conclusão de graduação
Título: Exploring the impact of intermediate languages on machine translation
Autor(es)/Inventor(es): Oliveira, Alex Santos de
Fernandes, Rafael da Silva
Orientador: Paixão, João Antonio Recio da
Coorientador: Moraes, Laura de Oliveira Fernandes
Resumo: área de tradução é mais antiga que o computador e, conforme a tecnologia foi avançando, ela foi se modernizando e se adaptando às novas descobertas, tentando sempre se tornar mais eficiente e precisa. Tradução por máquina, uma parte integral do Processamento de Linguagem Natural, procura possibilitar a tradução automática entre idiomas buscando sempre melhorar a precisão e a acessibilidade. Porém, considerando a quantidade de idiomas que existem, treinar modelos para todos os pares de idiomas possíveis sem o uso de múltiplos computadores poderosos e uma quantidade imensa de dados se torna uma tarefa complexa, além de ser impossível para alguns pares de idiomas. Neste trabalho nós avaliamos uma forma simples e rápida de diminuir o número de treinamentos e como ela impacta na qualidade da tradução. Nossos resultados mostraram que é possível realizar traduções usando idiomas intermediários ao invés de se traduzir diretamente para o idioma desejado sem impactar de forma significativa no resultado da tradução. Também mostramos que o impacto está relacionado com a família dos idiomas original, alvo, e intermediário. Com isso, concluímos que usar idiomas intermediários é uma técnica efetiva para diminuir de forma o número de treinamentos necessários ao se lidar com um número grande de idiomas, fazendo com que o processo de treinar modelos demande menos recursos. Isso permite que a criação de modelos para tradução usando múltiplos idiomas se torne mais acessível já que, por exemplo, ao usar 10 idiomas, treinar uma tradução direta entre todos os pares possíveis de idiomas resultaria em 45 treinamentos diferentes, número obtido calculando a combinação simples. Já usando um idioma intermediário para esse mesmo cenário, só seria necessário calcular traduções para esse idioma, resultando em apenas 9 treinamentos, reduzindo o custo computacional, além de beneficiar diversas áreas e beneficiar a troca de conhecimentos e ideias.
Palavras-chave: Tradução por Máquina
Word Embedding
Problema Ortogonal de Procrustes
Língua Intermediária
Assunto CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade produtora: Instituto de Computação
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: 5-Set-2023
País de publicação: Brasil
Idioma da publicação: eng
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ASOliveira.pdf668.1 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.