Título: | Os ritmos escritos do português brasileiro e moçambicano : um estudo comparativo em cadeias com ordem variável |
Autor(es): | Melo, Arthur Rodrigues |
Orientador(es): | Moreira, Lucas |
Assunto: | Linguística Probabilidades Estatística Algoritmos |
Data de apresentação: | 2018 |
Data de publicação: | 2-Jul-2021 |
Referência: | MELO, Arthur Rodrigues. Os ritmos escritos do português brasileiro e moçambicano: um estudo comparativo em cadeias com ordem variável. 2018. 59 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018. |
Resumo: | Neste trabalho comparamos o ritmo escrito do português brasileiro e do
português moçambicano por meio de cadeias com ordem variável tomando valores num
alfabeto A = {0, 1, 2, 3, 4}. Para isso, decodificamos textos não-literários de ambas as
línguas de acordo com a presença ou ausência de tonicidade silábica e início de palavra
prosódica. Inicialmente, três estimadores foram estudados: o Algoritmo Contexto, proposto
por Rissanen (1983), a versão modificada do Algortimo Contexto, proposta por Galves e
Leonardi (2008), e o estimador BIC, encontrado em Csiszár e Talata (2006). A fim de
analisar o melhor estimdor para a aplicação, estudos simulados foram realizados para os três
estimadores mencionados, para diferentes constantes de penalização (no caso do estimador
BIC), limiares de poda (Algoritmo Contexto e a sua versão modificada), tamanhos de
amostra e estruturas de contextos. Notamos que o estimador BIC apresentou o melhor
desempenho para os casos estudados, sendo usado, assim, na aplicação. Ao total, obtivemos
o retorno de dez árvores de contextos distintas para os 56 textos analisados do português
brasileiro e do português moçambicano. |
Abstract: | In this paper, we compare the written rhythm of Brazilian and Mozambican Portuguese variant through a chain with variable length taking values in alphabet
A = {0, 1, 2, 3, 4}. For this, we decoded non-literary texts in both languages according to the
presence or absence of their syllabic tonicity and their prosodic word onset. Initially, three
estimators were studied: the Context Algorithm, proposed by Rissanen (1983), a modified
version of the Context Algorithm, proposed by Galves and Leonardi (2008), and the BIC
estimator, found in Csiszár and Talata (2006). In order to analyze the best estimator for the
application, simulated studies were performed for the three previously mentioned estimators,
for different penalty constants (in the case of the BIC estimator), pruning thresholds
(Context Algorithm and its modifeid version), samples sizes and contextual structures. We
noticed that the BIC estimator presented the best performance for the studied cases, being
thus used in the application. In total, we obtained the return of ten distinct contexts trees
for the 56 analyzed texts in Brazilian Portuguese and Mozambican Portuguese. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Estatística
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.