Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/34171
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2021_LouiseBarbosaDosSantos_tcc.pdf7,51 MBAdobe PDFver/abrir
Registro completo
Campo Dublin CoreValorLíngua
dc.contributor.advisorBorries, George Freitas von-
dc.contributor.authorSantos, Louise Barbosa dos-
dc.identifier.citationSANTOS, Louise Barbosa dos. Agrupamento por misturas finitas de normais com aplicação a dados de expressão gênica. 2021. 88 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2021.pt_BR
dc.descriptionTrabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2021.pt_BR
dc.description.abstractIntrodução: As técnicas de agrupamento e classificação de dados foram sendo refinadas e surgiram algoritmos que agrupam objetos por meio de características comuns de acordo com cada critério. Diversos algoritmos têm sido utilizados na área da genética para a identificação de padrões das doenças e como, futuramente, uma nova forma de diagnóstico. Neste trabalho, foi utilizado o algoritmo de agrupamento de misturas finitas de normais com o objetivo de analisar dados de expressão gênica de pacientes com diagnóstico de doença de Alzheimer. Metodologia: Foram analisadas as expressões gênicas diferenciadas obtidas por meio da diferença entre as expressões de pacientes com a DA e a mediana das expressões de idosos saudáveis, coletadas em seis regiões do cérebro. Para cada região, havia uma quantidade diferente de casos, controles e de transcritos a seres avaliados. O agrupamento por misturas finitas de normais foi aplicado dentro de cada região e, após identificar os grupos de transcritos mais extremos, foram identificadas as funções gênicas correspondentes. Resultados: Para cada região do cérebro, foram identificados, utilizando o critério ICL, ao menos 2 grupos de transcritos considerados mais super-expressos, seja em pacientes com a DA, seja em idosos saudáveis. Algumas funções, como a AUF 1 (hnRNP D0) binds and destabilizes mRNA, foram encontradas em mais de uma região em estudo. Conclusão: O modelo de misturas finitas de normais, utilizando o critério de seleção ICL, foi eficiente para identificar os grupos de transcritos considerados mais expressos e para obter os respectivos processos biológicos. Foi possível identificar funções específicas de cada grupo final selecionado dentro de determinada região, além de observar algumas funções comuns em mais de duas regiões.pt_BR
dc.rightsAcesso Restritopt_BR
dc.subject.keywordAlgoritmospt_BR
dc.subject.keywordAlzheimer, Doença dept_BR
dc.subject.keywordAnálise de agrupamento (Estatística)pt_BR
dc.titleAgrupamento por misturas finitas de normais com aplicação a dados de expressão gênicapt_BR
dc.typeTrabalho de Conclusão de Curso - Graduação - Bachareladopt_BR
dc.date.accessioned2023-03-15T15:44:24Z-
dc.date.available2023-03-15T15:44:24Z-
dc.date.submitted2021-11-05-
dc.identifier.urihttps://bdm.unb.br/handle/10483/34171-
dc.language.isoPortuguêspt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.pt_BR
dc.description.abstract1Introduction: Data clustering and classification techniques were refined and algorithms emerged that cluster objects by common characteristics according to each criterion. These algorithms have been used in the field of genetics to identify disease patterns and as, in the future, a new form of diagnosis. In this paper, the model-based clustering algorithm by finite mixtures of normal distribution was used to analyze gene expression data from patients diagnosed with Alzheimer’s disease. Methods: The differentiated gene expressions obtained through the difference between the expressions of patients with AD and the median expression of healthy elderly people, collected in six brain regions, were analyzed. For each region, there were a different number of cases, controls and transcripts to be evaluated. The model-based clustering by finite mixtures of normal distributions was applied within each region and, after the identification of the most extreme groups of transcripts, the corresponding gene functions were identified. Results: For each brain region, at least 2 groups of transcripts considered to be more over-expressed were identified, using the ICL criterion, either in patients with AD or in healthy elderly people. Some functions, such as AUF 1 (hnRNP D0) binds and destabilizes mRNA, were found in more than one region under study. Conclusions: The model-based clustering by finite mixtures of normal distribution, using the ICL selection criterion, was efficient to identify the groups of transcripts considered more expressed and to obtain the respective biological processes. It was possible to identify specific functions of each final group selected within a given region, in addition to observing some common functions in more than two regions.pt_BR
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.