Título: | Ciência dos dados e inteligência artificial para agrupamento e diagnóstico de cidades inteligentes |
Autor(es): | Paixão, Alexandre Nisgoski da |
Orientador(es): | Evangelista Júnior, Francisco |
Assunto: | Cidades inteligentes Dendrograma Aprendizado estatístico |
Data de apresentação: | 29-Out-2021 |
Data de publicação: | 24-Fev-2023 |
Referência: | PAIXÃO, Alexandre Nisgoski da. Ciência dos dados e inteligência artificial para agrupamento e diagnóstico de cidades inteligentes. 2021. 73 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Civil) — Universidade de Brasília, Brasília, 2021. |
Resumo: | Cidades inteligentes são tão difíceis de serem classificadas que nem mesmo têm uma
definição própria e aceita por todos. Foram estudadas diversas normas dos últimos 20 anos
que vieram trazendo novas e velhas maneiras de se estabelecer um conjunto de indicadores
que permitissem o diagnóstico, o acompanhamento e, claro, a classificação das cidades pelo
quesito da inteligência. Em especial, uma publicação recente da ISO (Organização
Internacional de Padronização), a ISO 37122, editada em português pela ABNT (Associação
Brasileira de Normas Técnicas), que trouxe diversos indicadores novos.
Métodos de aprendizado estatístico vêm sendo utilizados há muitos anos com intuito de
permitir a visualização intuitiva de dados muito complexos para serem trabalhados em
estado bruto. A separação de algumas técnicas deste tipo, aptas ao caso estudado, foi
realizada neste trabalho. Além da visualização facilitada, fez-se uso destas técnicas para
realizar o agrupamento das cidades com base nos valores apresentados dos indicadores.
Em um primeiro momento, um teste-piloto foi realizado com dados fictícios criados pelo
autor, validando as técnicas apresentadas. Então, buscaram-se dados reais para testagem em
campo dos métodos escolhidos. Partindo-se ao uso em dados reais, mostraram-se as
diferenças que existiam entre os dados reais e os dados sintéticos, as possíveis diferenças de
análise e os agrupamentos reais. Além disso, foi apresentada uma metodologia de redução
do número de indicadores necessários para geração dos mesmos agrupamentos com base nas
correlações entre os indicadores, permitindo a economia computacional e financeira de
estudos reais de grande vulto.
Concluiu-se que as técnicas de baixa dimensionalidade (duas dimensões) não são tão
eficazes para dados não tão dicotômicos e mais nuançados. As técnicas tridimensionais, no
entanto, mostram-se eficazes para a geração de agrupamentos. A redução da
dimensionalidade do problema com base na matriz de correlação mostrou-se eficaz em
manter os mesmos agrupamentos, mas não a com base na PCA. No total, atingiu-se uma
redução de 27,8% no número de indicadores para formar os mesmos agrupamentos. Foram
indicados parâmetros a serem seguidos no tocante à matriz de correlação de variáveis. Novos
estudos e testes foram sugeridos para complementação do tema. |
Abstract: | Smart cities are so hard to classify that they don’t even have an agreed upon definition.
Many standards from the last twenty years were studied, they have been bringing new and
old ways to stablish a set of indicators that would allow the diagnosis, follow-up and, of
course, classification of cities based on how smart they are. In particular, a recent publication
by ISO, ISO 37122, edited in Portuguese by ABNT, that brought several new indicators.
Statistical learning methods have been under use for several years with the purpose to
allow for the intuitive visualization of a too complex dataset to be worked on in its brute
state. A selection of some techniques of this kind, fit for the studied case, was made in this
work. Beyond facilitated visualization, the use of these techniques was made to also define
clusters of cities based on their indicators’ values.
At first, a pilot-test was made with fictional data created by the author, in order to
validate the techniques here presented. Then, real data was looked for and submitted to the
same method. From this dataset of real values, it was demonstrated that there were
differences that existed between real and synthetical data, and showed all possible new
different analysis and the real clusters. Furthermore, a methodology for the reduction of the
number of indicators necessary from the appropriate clustering was presented. This allows
for computational and financial savings, especially in real large studies.
It was concluded that low dimensionality techniques (bidimensional) aren’t as effective
for not so dichotomous a dataset. Tridimensional techniques, however, have showed to be
effective for the creation of clusters. Dimensionality reduction of the problem based on the
correlation matrix has showed to be effective in keeping the same clusters. PCA however
was not able to steadily form clusters with fewer indicators being fed into it. Some
parameters to be followed in relation to the correlation matrix of variables were indicated.
New studies and tests were also suggested for complementation of the topic covered. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Civil e Ambiental, 2021. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia Civil
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.