Título: | Aplicações em quimiometria |
Autor(es): | Nascimento, Alex Rodrigues do |
Orientador(es): | Andrade, Bernardo Borba de |
Assunto: | Quimiometria Análise estatística Regressão logística (Estatística) |
Data de apresentação: | 2016 |
Data de publicação: | 7-Nov-2016 |
Referência: | NASCIMENTO, Alex Rodrigues do. Aplicações em quimiometria. 2016. 55 f., il. Monografia (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2016. |
Resumo: | A quimiometria é definida como a aplicação de técnicas matemáticas e estatísticas
à análise de dados relativos aos processos químicos tanto na área espectroscópica como
cromatográfica. Essa área, usualmente, faz utilização de técnicas específicas para problemas
de regressão e classificação.
Tendo em vista todo o aparato de técnicas da recente área de Aprendizagem
Estatística (do inglês Statistical Learning - SL) que se encaixam aos problemas químicos, se
tem como objetivo do presente trabalho: aplicar técnicas de SL em dados químicos, algumas
já utilizadas na esfera da quimiometria e outras não, ampliando o aparato tecnológico da área
e tentando gerar modelos com igual ou melhor previsibilidade.
Em uma primeira etapa do trabalho, realizou-se a análise, sob diferentes perspectivas,
de dados amplamente utilizados na indústria farmacêutica para prever variáveis
complexas, utilizando técnicas de Regressão com penalização, Mínimos Quadrados Parciais,
Regressão com Componentes Principais, entre outras.
Em uma segunda, realizou-se um estudo de dados fornecidos pelo Grupo de
Automação, Quimiometria e Química Ambiental (AQQUA) do Instituto de Química da UnB.
A problemática dessa etapa é de muita importância para áreas de fiscalização ambiental, mais
especificamente o controle e exploração da espécie de madeira Mogno. Essa etapa trata de
um problema de classificação e utilizou-se técnicas de Support Vector Machine, Árvore de
Decisão, Regressão com Penalização, entre outras. |
Abstract: | In this study I have implemented several techniques from Statistical Learning
to two problems in the eld of Chemometrics.
The rst problem was an exercise in predictive modeling and dimension reduction
where I have performed the analysis of publicly available data used for Quantitative
Structure-Activity Relationship (QSAR) modeling. the data consists of 228 chemical predictors
used to model solubility. The techniques compared were Partial Least Squares, Principal
Components Regression, Ridge Regression and LASSO.
In the second problem I analyzed data provided by the Automation, Chemometrics
and Environmental Chemistry Group (AQQUA) from UnB with statistical techniques
not commonly used in the eld of Chemometrics. The dataset consists of near infrared spectroscopy
measurements used to classify four types of wood with special interest in one type,
Mogno. I compared the method typically used for this kind of chemical classi cation problem,
Partial Least Squares, with Support Vector Machine, Decision Trees, Bagging, Ridge
Regression and LASSO. |
Informações adicionais: | Monografia (graduação)—Universidade de Brasília, Departamento de Estatística, 2016. |
Aparece na Coleção: | Estatística
|