Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/14799
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2015_CayanAtreioPortelaBarcenaSaavedra.pdf737,7 kBAdobe PDFver/abrir
Título: Análise de ampla associação do genoma : redução de dimensionalidade via seleçao por torneios e análises indicativas
Autor(es): Saavedra, Cayan Atreio Portela Bárcena
Orientador(es): Gomes, Eduardo Monteiro de Castro
Coorientador(es): Silva, Joseane Padilha da
Assunto: Ovino - criação
Genoma
Polimorfismo (Genética)
Animais - melhoramento genético
Data de apresentação: 2015
Data de publicação: 27-Set-2016
Referência: SAAVEDRA, Cayan Atreio Portela Bárcena. Análise de ampla associação do genoma: redução de dimensionalidade via seleçao por torneios e análises indicativas. 2015. 44 f., il. Monografia (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2015.
Resumo: O presente trabalho tem como objetivo identi car possíveis SNPs responsáveis pela cor da pelagem de ovinos da raça Morada Nova. Dados de genotipagem de 61 animais, consistindo em 54.412 SNPs e característica fenotípica de interesse (cor da pelagem), foram processados visando identi car os SNPs causadores do fenômeno. Três tipos de abordagem foram realizados para explicar a relação proposta; (1) modelos logísticos simples, (2) seleção por torneios e (3) modelos logísticos multivariados, montados a partir de inidcativas das análises univariadas. Primeiramente, foram construídos modelos logísticos simples, sendo a variável resposta a cor da pelagem (1 para vermelho e 0 para não vermelho) e a variável preditora um único SNP do conjunto de todos os disponíveis, visando a identi cação de regiões promissoras. SNPs in uentes que se encontram próximos no decorrer do genoma, caracterizam regiões promissoras. Estes SNPs foram identi cados, e a partir destes, modelos multivariados foram construídos. Além desta abordagem, uma seleção por torneios foi realizada para a construção de um modelo nal. Devido a eventuais cancelamentos na matriz de delineamento, foram excluídos SNPs que apresentaram valor faltante, restando então, 1.522 SNPs. Mesmo após uma ltragem inicial, o número de SNPs restantes continuou elevado de modo a acarretar problemas para o uso de métodos estatísticos convencionais. Para contornar os problemas decorrentes da explosão de graus de liberdade, causada pela grande quantidade de SNPs, foi implementada uma seleção por torneios, que consiste em subdividir o conjunto de convariá- veis iniciais em subconjuntos disjuntos, utilizando modelo de regressão logística multivariada em cada subconjunto e selecionando SNPs menos promissores, usando p-valor como critério. O procedimento é repetido até que se chegue a um número de SNPs desejado, previamente estabelecido, para uma modelagem nal. A partir das duas abordagens foram montados modelos logisticos multivariados, visando obter um bom poder de predição. Tais modelos foram comparados pelo Critério de Informação de Akaike (AIC) e pelo poder de predição. Ao nal, os cromossomos 9 e 13, bem como o modelo obtido através da seleção por torneios, obtiveram um poder de predição de 100%, acusando possíveis regiões responsáveis pela característica desejada e demonstrando que a seleção por torneios possui um bom poder para escolha de variáveis.
Informações adicionais: Monografia (graduação)—Universidade de Brasília, Departamento de Estatística, 2015.
Aparece na Coleção:Estatística



Este item está licenciado na Licença Creative Commons Creative Commons