Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/18730
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2015_AlineRochaDeSousa_tcc.pdf1,32 MBAdobe PDFver/abrir
Título: Processamento automático de línguas naturais : um estudo sobre a localização do IBM Watson™ para o português do Brasil
Autor(es): Sousa, Aline Rocha de
Orientador(es): Duque, Cláudio Gottschalg
Assunto: Processamento de linguagem natural (Computação)
Linguagem natural
Português do Brasil
Sociedade da informação
Competências em informação
Data de apresentação: 9-Dez-2015
Data de publicação: 20-Dez-2017
Referência: SOUSA, Aline Rocha de. Processamento automático de línguas naturais: um estudo sobre a localização do IBM Watson™ para o português do Brasil. 2015. 76 f., il. Trabalho de Conclusão de Curso (Bacharelado em Línguas Estrangeiras Aplicadas)—Universidade de Brasília, Brasília, 2015.
Resumo: O Processamento Automático de Línguas Naturais é um domínio de pesquisa promissor quanto à organização de dados digitais na Sociedade da Informação, ao buscar recuperá-los pela língua de registro. Por outro lado, as especificidades de cada língua exigem tratamentos computacionais diferentes e, se não compreendidas em profundidade, podem constituir entraves à produção tecnológica. Esta pesquisa tem por objetivo investigar as particularidades do processamento automático do português brasileiro, comparado ao inglês americano e ao português europeu, a partir de um estudo de caso sobre a localização do sistema de perguntas e respostas Watson da IBM. Inicia-se com um levantamento teórico sobre o estado-da-arte do Processamento de Línguas Naturais, aborda as especificidades da arquitetura DeepQA no tratamento linguístico do sistema e detalha as particularidades do português do Brasil que devem ser observadas na localização do Watson. Da investigação, possíveis adaptações ao sistema são apresentadas, e a importância da inclusão do português brasileiro e, de modo geral, do Brasil na Sociedade da Informação é posta em reflexão.
Abstract: Automatic Natural Language Processing is a promising research domain to the organization of digital data in the Information Society, as it seeks to recover them by the language in which they are registered. Nevertheless, the specificities of each language require different computational treatments and, if not understood in depth, may hinder the technological production. This research aims to investigate the particularities of the automatic processing of Brazilian Portuguese, compared to American English and European Portuguese, from a case study on the localization of IBM Watson question-answering system. It begins with a theoretical survey on the state of the art of Natural Language Processing, addresses the specificities of the DeepQA architecture in processing language for the system and details the particularities of Brazilian Portuguese that have to be regarded in Watson's localization. From the research, possible adaptations to the system are presented, and the importance of including Brazilian Portuguese and, in general, Brazil in the Information Society is brought into consideration.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Letras, Departamento de Línguas Estrangeiras e Tradução, Línguas Estrangeiras Aplicadas ao Multilinguismo e à Sociedade da Informação, 2015.
Aparece na Coleção:Letras - Línguas Estrangeiras Aplicadas



Este item está licenciado na Licença Creative Commons Creative Commons