Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/38509
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2023_EnzoPortoBrasil_tcc.pdf826,9 kBAdobe PDFver/abrir
Registro completo
Campo Dublin CoreValorLíngua
dc.contributor.advisorNakano, Eduardo Yoshio-
dc.contributor.authorBrasil, Enzo Porto-
dc.identifier.citationBRASIL, Enzo Porto. Técnicas de imputação de dados faltantes com uso de modelagem preditiva. 2023. 61 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2023.pt_BR
dc.descriptionTrabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2023.pt_BR
dc.description.abstractA presença de dados faltantes em um banco de dados é comum, mas as análises estatísticas são fundamentadas para analisar dados completos. Uma das possíveis soluções para o tratamento da ausência de informações é utilizar imputação de dados. Este trabalho teve o objetivo de destacar o desempenho e importância de técnicas de imputação que utilizam regressão estatística, e propor assim um guia eficaz e prático aos pesquisadores com base na literatura e nos resultados observados. Além do estudo dos dois pilares principais desta pesquisa, regresssão estatística e técnicas de imputação, a metodologia implementada foi feita por meio de simulações, com a criação de bancos de dados artificiais, possibilitando a discussão de diferentes cenários de dados faltantes e técnicas. Questões relacionadas ao impacto da quantidade de dados faltantes, da natureza da variável incompleta e da quantidade de variáveis incompletas também foram verificadas. A partir de ajustes de modelos de regressão linear, os tipos de imputação (única e múltipla) e técnicas de imputação (medidas de tendência central e modelagem preditiva) foram comparados. Os resultados obtidos, junto às discussões, foram favoráveis ao uso de modelos de regressão em processos de imputação de dados, com evidências da importância ao selecionar métodos adequados com base nos motivos da ausência de dados e na proporção de dados faltantes.pt_BR
dc.rightsAcesso Abertopt_BR
dc.subject.keywordBanco de dadospt_BR
dc.subject.keywordDados - recuperaçãopt_BR
dc.subject.keywordAnálise estatísticapt_BR
dc.subject.keywordRegressão linear (Estatística)pt_BR
dc.titleTécnicas de imputação de dados faltantes com uso de modelagem preditivapt_BR
dc.typeTrabalho de Conclusão de Curso - Graduação - Bachareladopt_BR
dc.date.accessioned2024-05-15T11:21:43Z-
dc.date.available2024-05-15T11:21:43Z-
dc.date.submitted2023-12-20-
dc.identifier.urihttps://bdm.unb.br/handle/10483/38509-
dc.language.isoPortuguêspt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.pt_BR
dc.description.abstract1The presence of missing data in a database is common, but statistical analyses are typically performed on complete data. One possible solution for handling missing information is to use data imputation. This work aimed to highlight the performance and importance of imputation techniques that use statistical regression, and to propose an effective and practical guide for researchers based both on literature and the observed results. In addition to studying the two main pillars of this research, statistical regression and imputation techniques, the methodology implemented was done through simulations, with the creation of artificial databases, allowing for the discussion of different scenarios of missing data and techniques. Issues related to the impact of the amount of missing data, the nature of the incomplete variable, and the amount of incomplete variables were also verified. Based on adjustments of linear regression models, the types of imputation (single and multiple) and imputation techniques (measures of central tendency and predictive modelling) were compared. The results obtained, along with the discussions, were favorable to the use of regression models in data imputation processes, with evidence of the importance of selecting appropriate methods based on the reasons for missing data and the proportion of missing data.pt_BR
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.