Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/20529
Título: | Uso de árvores aleatórias para classificação sensorial de arroz cozido |
Autor(es): | Morais, Rafael Lima de |
Orientador(es): | Borries, George Freitas von |
Assunto: | Regressão logística (Estatística) Algoritmos Árvores de decisão |
Data de apresentação: | 2017 |
Data de publicação: | 13-Ago-2018 |
Referência: | MORAIS, Rafael Lima de. Uso de árvores aleatórias para classificação sensorial de arroz cozido. 2017. 72 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2017. |
Resumo: | A classificação por floresta aleatória (random forest) dispensa suposições paramétricas e
possui aplicabilidade em diversos problemas de predição. Foram consideradas as técnicas
de floresta aleatória e floresta aleatória para dados desbalanceados. Os resultados foram
comparados ao tradicional classificador de regressão logística. As regiões classificadoras
foram apresentadas em gráficos de calor da região formada entre as duas primeiras
componentes principais, com a intensidade dada pelo valor da probabilidade. Por fim, foi
investigado o uso da medida de discrepância fornecida pelo modelo de floresta aleatória,
para a determinação de regiões de incerteza de classificação.
A análise foi aplicada em dados de pegajosidade sensorial do arroz cozido. Resultados
competitivos foram observados em termos de acurácia do modelo de floresta aleatória
quando comparada com a regressão logística. Para o caso específico do arroz de terras
altas, do ano de 2014, a floresta aleatória balanceada representou um ganho considerável
no desempenho do modelo. Os gráficos de calor apresentados auxiliam na percepção de
particularidades do modelo e ajudam no entendimento da construção da floresta aleatória.
Finalmente, a barreira construída via valores discrepantes, se mostrou consistente na
seleção de observações erroneamente classificadas e quando aplicada à floresta aleatória
balanceada dos dados de terras altas, no ano de 2014, resultou em um modelo com apenas
um erro de classificação, isso sem custos elevados de não classificação. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2017. |
DOI: | http://dx.doi.org/10.26512/2017.TCC.20529 |
Aparece na Coleção: | Estatística
|
Este item está licenciado na Licença Creative Commons