Resumo: | O presente trabalho tem como objetivo identi car possíveis SNPs responsáveis
pela cor da pelagem de ovinos da raça Morada Nova. Dados de genotipagem de 61 animais,
consistindo em 54.412 SNPs e característica fenotípica de interesse (cor da pelagem), foram
processados visando identi car os SNPs causadores do fenômeno. Três tipos de abordagem foram
realizados para explicar a relação proposta; (1) modelos logísticos simples, (2) seleção por
torneios e (3) modelos logísticos multivariados, montados a partir de inidcativas das análises
univariadas. Primeiramente, foram construídos modelos logísticos simples, sendo a variável
resposta a cor da pelagem (1 para vermelho e 0 para não vermelho) e a variável preditora um
único SNP do conjunto de todos os disponíveis, visando a identi cação de regiões promissoras.
SNPs in uentes que se encontram próximos no decorrer do genoma, caracterizam regiões
promissoras. Estes SNPs foram identi cados, e a partir destes, modelos multivariados foram
construídos. Além desta abordagem, uma seleção por torneios foi realizada para a construção
de um modelo nal. Devido a eventuais cancelamentos na matriz de delineamento, foram
excluídos SNPs que apresentaram valor faltante, restando então, 1.522 SNPs. Mesmo após
uma ltragem inicial, o número de SNPs restantes continuou elevado de modo a acarretar
problemas para o uso de métodos estatísticos convencionais. Para contornar os problemas
decorrentes da explosão de graus de liberdade, causada pela grande quantidade de SNPs, foi
implementada uma seleção por torneios, que consiste em subdividir o conjunto de convariá-
veis iniciais em subconjuntos disjuntos, utilizando modelo de regressão logística multivariada
em cada subconjunto e selecionando SNPs menos promissores, usando p-valor como critério.
O procedimento é repetido até que se chegue a um número de SNPs desejado, previamente
estabelecido, para uma modelagem nal. A partir das duas abordagens foram montados modelos
logisticos multivariados, visando obter um bom poder de predição. Tais modelos foram
comparados pelo Critério de Informação de Akaike (AIC) e pelo poder de predição. Ao nal,
os cromossomos 9 e 13, bem como o modelo obtido através da seleção por torneios, obtiveram
um poder de predição de 100%, acusando possíveis regiões responsáveis pela característica
desejada e demonstrando que a seleção por torneios possui um bom poder para escolha de
variáveis. |