Título: | Aplicação de métodos multivariados em dados multi-omics |
Autor(es): | Motta, Ana Carolina Souto Valente |
Orientador(es): | Andrade, Joanlise Marco de Leon |
Assunto: | Análise multivariada Estatística Biotecnologia Biologia molecular Câncer de mama |
Data de apresentação: | 5-Dez-2019 |
Data de publicação: | 11-Mar-2022 |
Referência: | MOTTA, Ana Carolina Souto Valente. Aplicação de métodos multivariados em dados multi-omics. 2019. 56 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2019. |
Resumo: | Dados com informações sobre genótipos, transcritos, proteínas e outros componentes
moleculares são chamados de informações moleculares. Avanços em biotecnologia têm
possibilitado o estudo de tais informações em larga escala. Nesses contextos adiciona-se o
sufixo “ômica” (omics em Inglês). Com base no dogma da biologia molecular, entende-se a
conexão entre as diferentes informações moleculares em um organismo e a necessidade de
considerar mais essas interações. Nesse contexto, tem-se como objetivo principal o estudo
da técnica multivariada capaz de lidar com análise supervisionada de dados multi-omics
implementada no pacote mixomics. Este trabalho fornece então uma aplicação das técnicas
multivariadas: Análise de Componentes Principais, Análise de discriminante por mínimos
quadrados parciais e DIABLO. O banco de dados é um conjunto pacientes de câncer
de mama e tal aplicação possui o intuito de entender o funcionamento destas técnicas,
uma breve comparação entre elas, com diferentes especificações, utilização de diversas
ferramentas gráficas e análise dos resultados de predição. Conclui-se que a utilização de
técnicas multivariadas mais sofisticadas pode trazer benefícios para a predição em novas
observações, melhor interpretação dos resultados biológicos e boas ferramentas visuais
para uma melhor compreensão da complexidade de um organismo. |
Abstract: | Genotypes, transcripts, proteins, and other molecular components data is called molecular
information. Advances in biotechnology have enabled the study of such information on a
large scale. In these contexts we add the suffix “omics”. Based on the dogma of molecular
biology, we understand the connection between the different molecular information in an
organism and the need to consider these interactions. In this context, the main objective
is to study the multivariate technique capable of dealing with supervised analysis of
multi-omics data implemented in the mixomics package. Here we provide an application of
multivariate techniques: Principal Component Analysis, Partial Least Squares Discriminant
Analysis and DIABLO. The database is a set of breast cancer patients and such application
aims to understand the operation of these techniques, a brief comparison between them,
with different specifications, use of some graphical tools and analysis of prediction results.
It is concluded that the use of more sophisticated multivariate techniques can benefit
prediction in new observations, better interpretation of biological results and good visual
tools for a better understanding of the complexity of an organism. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2019. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Estatística
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.