Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/20529
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2017_RafaelLimaDeMorais_tcc.pdf596,8 kBAdobe PDFver/abrir
Título: Uso de árvores aleatórias para classificação sensorial de arroz cozido
Autor(es): Morais, Rafael Lima de
Orientador(es): Borries, George Freitas von
Assunto: Regressão logística (Estatística)
Algoritmos
Árvores de decisão
Data de apresentação: 2017
Data de publicação: 13-Ago-2018
Referência: MORAIS, Rafael Lima de. Uso de árvores aleatórias para classificação sensorial de arroz cozido. 2017. 72 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2017.
Resumo: A classificação por floresta aleatória (random forest) dispensa suposições paramétricas e possui aplicabilidade em diversos problemas de predição. Foram consideradas as técnicas de floresta aleatória e floresta aleatória para dados desbalanceados. Os resultados foram comparados ao tradicional classificador de regressão logística. As regiões classificadoras foram apresentadas em gráficos de calor da região formada entre as duas primeiras componentes principais, com a intensidade dada pelo valor da probabilidade. Por fim, foi investigado o uso da medida de discrepância fornecida pelo modelo de floresta aleatória, para a determinação de regiões de incerteza de classificação. A análise foi aplicada em dados de pegajosidade sensorial do arroz cozido. Resultados competitivos foram observados em termos de acurácia do modelo de floresta aleatória quando comparada com a regressão logística. Para o caso específico do arroz de terras altas, do ano de 2014, a floresta aleatória balanceada representou um ganho considerável no desempenho do modelo. Os gráficos de calor apresentados auxiliam na percepção de particularidades do modelo e ajudam no entendimento da construção da floresta aleatória. Finalmente, a barreira construída via valores discrepantes, se mostrou consistente na seleção de observações erroneamente classificadas e quando aplicada à floresta aleatória balanceada dos dados de terras altas, no ano de 2014, resultou em um modelo com apenas um erro de classificação, isso sem custos elevados de não classificação.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2017.
DOI: http://dx.doi.org/10.26512/2017.TCC.20529
Aparece na Coleção:Estatística



Este item está licenciado na Licença Creative Commons Creative Commons