PPCIC comemora a primeira defesa de dissertação de mestrado

No dia 04 de junho de 2018, tivemos a primeira defesa de Dissertação de Mestrado do Programa de Pós-graduação em Ciência da Computação do CEFET/RJ. O aluno Rafael Guimarães Rodrigues defendeu o trabalho intitulado Análise de Aspectos Semânticos em Traduções Automáticas de Textos. Ele foi orientado pelo Prof. Gustavo Paiva Guedes e Silva. A Banca Examinadora foi formada pelos Profs. Eduardo Bezerra (CEFET/RJ), Eduardo Ogasawara (CEFET/RJ) e Lilian Ferrari (UFRJ).

Durante o seu mestrado, Rafael Rodrigues teve sete artigos publicados e mais três em processo de avaliação. A duração do seu mestrado foi de 22 meses. “- É um excelente começo!” diz o coordenador do Programa, Prof. Eduardo Ogasawara.

 

Defesa de Dissertação de Mestrado do Rafael Rodrigues

Resumo: As traduções automáticas de texto surgiram nos anos 50, motivadas por questões militares. Atualmente esse tipo de tradução faz parte do nosso cotidiano e representa uma importante ferramenta para a comunicação no mundo globalizado, especialmente com a utilização de ferramentas de tradução automática de textos disponíveis em ambiente web. No entanto, apesar de tratar-se de uma área com mais de 60 anos de estudos, ainda há diversos desafios a serem superados, o que faz com que esse tipo de processo continue dependente de revisão humana. Existem, atualmente, diversas métricas para avaliar traduções automáticas de textos, dentre as quais, a métrica BLEU apresenta-se como o estado da arte. Essa métrica avalia a qualidade das traduções com base no pareamento exato e ordenado de palavras, sem considerar,
no entanto, a semântica (e.g., aspectos linguísticos e psicológicos) das sentenças avaliadas. Nesse cenário, o principal objetivo deste trabalho é propor uma nova métrica capaz de adicionar semântica às avaliações desse tipo de tradução. Como objetivo secundário, esse trabalho também contribui com dois algoritmos para auxiliar na identificação e quantificação de aspectos psicolinguísticos em traduções do inglês para
o português do Brasil. Para alcançar os objetivos propostos, este trabalho utiliza um léxico afetivo presente em uma ferramenta denominada LIWC (Linguistic Inquiry and Word Count). Esse léxico é capaz de contabilizar palavras em categorias que representam aspectos psicológicos e
linguísticos. Durante os experimentos foram utilizados dez textos traduzidos por dois especialistas humanos e por três dessas ferramentas já citadas. Os referidos textos foram utilizados para estabelecer uma comparação entre a métrica proposta e o estado da arte. Os testes também objetivaram avaliar possíveis problemas produzidos por ferramentas utilizadas para realizar esse tipo de tradução. Os resultados foram considerados promissores e indicam que esse estudo pode contribuir com novos trabalhos direcionados ao desenvolvimento de métricas para avaliação de traduções automáticas de textos e talvez até mesmo para trabalhos direcionados para o desenvolvimento de ferramentas que produzam esse tipo de tradução.

Comments are closed.