Treinando um modelo de tradução automática baseado em Transformers

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/39211

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2023_ClovisHenriqueMartinsPimentel_tcc.pdf		374,65 kB	Adobe PDF	ver/abrir

Título:	Treinando um modelo de tradução automática baseado em Transformers
Autor(es):	Pimentel, Clóvis Henrique Martins
Orientador(es):	Pires, Thiago Blanch
Assunto:	Linguística Tradução automática
Data de apresentação:	21-Jul-2023
Data de publicação:	8-Jul-2024
Referência:	PIMENTEL, Clóvis Henrique Martins. Treinando um modelo de tradução automática baseado em Transformers. 2023. 29 f. Trabalho de Conclusão de Curso (Bacharelado em Línguas Estrangeiras Aplicadas) — Universidade de Brasília, Brasília, 2023.
Resumo:	O presente trabalho possui como objetivo a análise dos modelos de tradução automática baseados em Transformers. Em específico, visa o teste da viabilidade do uso de modelos treinados a partir de corpus especializado. Para o treinamento do modelo foi construído corpus paralelo inglês-francês a partir de sete textos relativos à Convenção de 25 de outubro de 1980 sobre os Aspectos Civis do Rapto Internacional de Crianças e Adolescentes, posteriormente utilizado para treinar o modelo T5- small. Os resultados de tradução obtidos pelo modelo treinado foram comparados com resultados produzidos pelo Google Tradutor. Para a avaliação dos resultados foram utilizados os métodos de avaliação automática sacreBLEU e avaliação humana baseada na fluência, adequação e erros cometidos pelos modelos em suas traduções. Os resultados da avalição automática de frases produzidas pelo modelo treinado foram, em média, maiores que aquelas geradas pelo modelo não-treinado. A avaliação humana das frases revelou que houve erros de adequação no uso da linguagem específica à matéria da Convenção da Haia de 1980 tanto em frases geradas pelo modelo treinado, quanto em frases geradas pelo modelo do Google Tradutor.
Abstract:	The objective of this work is to analyze machine translation models based on Transformers. It aims to test the viability of using trained models based on a specific corpus. For the training of this model, a parallel English French corpus was built with seven texts related to the Convention of 25 October 1980 on the Civil Aspects of International Child Abduction, later used to train the T5 small model. The translation results obtained by the trained model were compared with results produced by Google Translate. For the evaluation of the results, automatic evaluation methods sacreBLEU and human evaluation based on fluency, adequacy and errors committed by the models in their translations were used. The results of the automatic evaluation of sentences produced by the trained model were, on average, higher than those generated by the non trained model. The human evaluation of the sentences revealed that there were adequacy errors in the use of language specific to the subject matter of the 1980 Hague Convention both in sentences generated by the trained model and in sentences generated by the Google Translate model.
Informações adicionais:	Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Letras, Departamento de Línguas Estrangeiras e Tradução, 2023.
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:	Letras - Línguas Estrangeiras Aplicadas

Mostrar item em formato completo Recomendar este item Visualizar estatísticas