Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/33712
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2021_AlexandreNisgoskiDaPaixao_tcc.pdf1,63 MBAdobe PDFver/abrir
Título: Ciência dos dados e inteligência artificial para agrupamento e diagnóstico de cidades inteligentes
Autor(es): Paixão, Alexandre Nisgoski da
Orientador(es): Evangelista Júnior, Francisco
Assunto: Cidades inteligentes
Dendrograma
Aprendizado estatístico
Data de apresentação: 29-Out-2021
Data de publicação: 24-Fev-2023
Referência: PAIXÃO, Alexandre Nisgoski da. Ciência dos dados e inteligência artificial para agrupamento e diagnóstico de cidades inteligentes. 2021. 73 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Civil) — Universidade de Brasília, Brasília, 2021.
Resumo: Cidades inteligentes são tão difíceis de serem classificadas que nem mesmo têm uma definição própria e aceita por todos. Foram estudadas diversas normas dos últimos 20 anos que vieram trazendo novas e velhas maneiras de se estabelecer um conjunto de indicadores que permitissem o diagnóstico, o acompanhamento e, claro, a classificação das cidades pelo quesito da inteligência. Em especial, uma publicação recente da ISO (Organização Internacional de Padronização), a ISO 37122, editada em português pela ABNT (Associação Brasileira de Normas Técnicas), que trouxe diversos indicadores novos. Métodos de aprendizado estatístico vêm sendo utilizados há muitos anos com intuito de permitir a visualização intuitiva de dados muito complexos para serem trabalhados em estado bruto. A separação de algumas técnicas deste tipo, aptas ao caso estudado, foi realizada neste trabalho. Além da visualização facilitada, fez-se uso destas técnicas para realizar o agrupamento das cidades com base nos valores apresentados dos indicadores. Em um primeiro momento, um teste-piloto foi realizado com dados fictícios criados pelo autor, validando as técnicas apresentadas. Então, buscaram-se dados reais para testagem em campo dos métodos escolhidos. Partindo-se ao uso em dados reais, mostraram-se as diferenças que existiam entre os dados reais e os dados sintéticos, as possíveis diferenças de análise e os agrupamentos reais. Além disso, foi apresentada uma metodologia de redução do número de indicadores necessários para geração dos mesmos agrupamentos com base nas correlações entre os indicadores, permitindo a economia computacional e financeira de estudos reais de grande vulto. Concluiu-se que as técnicas de baixa dimensionalidade (duas dimensões) não são tão eficazes para dados não tão dicotômicos e mais nuançados. As técnicas tridimensionais, no entanto, mostram-se eficazes para a geração de agrupamentos. A redução da dimensionalidade do problema com base na matriz de correlação mostrou-se eficaz em manter os mesmos agrupamentos, mas não a com base na PCA. No total, atingiu-se uma redução de 27,8% no número de indicadores para formar os mesmos agrupamentos. Foram indicados parâmetros a serem seguidos no tocante à matriz de correlação de variáveis. Novos estudos e testes foram sugeridos para complementação do tema.
Abstract: Smart cities are so hard to classify that they don’t even have an agreed upon definition. Many standards from the last twenty years were studied, they have been bringing new and old ways to stablish a set of indicators that would allow the diagnosis, follow-up and, of course, classification of cities based on how smart they are. In particular, a recent publication by ISO, ISO 37122, edited in Portuguese by ABNT, that brought several new indicators. Statistical learning methods have been under use for several years with the purpose to allow for the intuitive visualization of a too complex dataset to be worked on in its brute state. A selection of some techniques of this kind, fit for the studied case, was made in this work. Beyond facilitated visualization, the use of these techniques was made to also define clusters of cities based on their indicators’ values. At first, a pilot-test was made with fictional data created by the author, in order to validate the techniques here presented. Then, real data was looked for and submitted to the same method. From this dataset of real values, it was demonstrated that there were differences that existed between real and synthetical data, and showed all possible new different analysis and the real clusters. Furthermore, a methodology for the reduction of the number of indicators necessary from the appropriate clustering was presented. This allows for computational and financial savings, especially in real large studies. It was concluded that low dimensionality techniques (bidimensional) aren’t as effective for not so dichotomous a dataset. Tridimensional techniques, however, have showed to be effective for the creation of clusters. Dimensionality reduction of the problem based on the correlation matrix has showed to be effective in keeping the same clusters. PCA however was not able to steadily form clusters with fewer indicators being fed into it. Some parameters to be followed in relation to the correlation matrix of variables were indicated. New studies and tests were also suggested for complementation of the topic covered.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Civil e Ambiental, 2021.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia Civil



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.