Título: | Modelos de inteligência artificial para detecção de atividades humanas focados na detecção de Advanced Persistent Threat (AI-APT) |
Autor(es): | Castro, Gabriel Alves Souza, Leonardo Rodrigues de |
Orientador(es): | Weigang, Li |
Assunto: | Inteligência artificial Aprendizado de máquina Banco de dados |
Data de apresentação: | 29-Set-2022 |
Data de publicação: | 17-Fev-2023 |
Referência: | CASTRO, Gabriel Alves; SOUZA, Leonardo Rodrigues de. Modelos de inteligência artificial para detecção de atividades humanas focados na detecção de Advanced Persistent Threat (AI-APT). 2022. xv, 63 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2022. |
Resumo: | Advanced Persistent Threat (APT), ou ameaça persistente avançada e Inteligência Artificial (IA) (inteligências artificiais) são dois assuntos que vêm ganhando cada vez mais a atenção da comunidade científica. Diversas organizações possuem os seus dados fragilizados devido à contextos de APT, dentre eles, o da exfiltração de dados. A partir da difusão de ambientes de nuvem, os problemas aumentaram, tornando cada vez mais difícil a detecção e contra-medidas contra casos de exfiltração de dados. Nesse contexto, as tecnologias de IA e Aprendizagem de Máquina (AM) podem se tornar ferramentas indispensáveis no combate à esse tipo de ameaça, mas, ao mesmo tempo, essas tecnologias são desafiadas pela complexidade exigida por um ataque de exfiltração de dados aos modelos. Há uma quantidade de dados enorme neste contexto, e exemplos escassos de ataque, o que o torna um exemplo de problema de classificação extremamente complexo para qualquer técnica. Muitos dados, alto desbalanceamento de classes e comportamentos sutis e não identificáveis claramente nos dados. É neste cerne que este trabalho se introduz, propomos a construção de um ambiente de desenvolvimento de soluções para problemas de APT, a partir do uso do Aprendizagem Profunda (AP) e Meta-Learning (MetL). Foi realizada uma extensa revisão da literatura, com foco em sistemas de DLPS, mapeando o estado da arte da aplicação de algoritmos de machine learning no contexto da exfiltração de dados. Em seguida, foram selecionados os modelos mais relevantes para a construção
de algoritmos de detecção de exfiltração de dados: Redes densas com uso de entropia, redes diferenciais robustas e transformers. Uma tecnologia de Meta-Learning (MetL) foi escolhida e estudada para conferir qualidade à construção dos modelos, e permitir a criação futura de processos de autoML. Um banco de dados de envio de pacotes pela nuvem foi criado, visando construir um banco de dados de casos de exfiltação de dados. Foi selecionado um banco de dados no domínio RAH para validar os modelos modelados,
uma vez que os casos de exfiltração de dados também se encontram neste domínio. Os modelos foram testados no banco de dados criado de pacotes, levando à conclusão de que este ainda era muito pequeno para ser utilizado. Os modelos foram então testados no banco de dados RAH, chegando-se à seleção do modelo transformer como o mais promissor para solucionar o problema, chegando a 90% de acurácia. As redes robustas ainda não foram descartadas, sendo sugeridas algumas mudanças para trabalhos futuros. Os
objetivos gerais e específicos do trabalho foram alcançados, permitindo a construção de uma base sólida para a pesquisa e desenvolvimento do sistema de DLPS em parceria com o exército brasileiro. |
Abstract: | Advanced Persistent Threat (APT) and Artificial Intelligences are subjects that concenrs each time more the scientific community. Several organizations have his data exposed from APT threats, like the problem of data exfiltration. By the diffusion of clouds environments, more problems arrive, making the detection and countermeasures to data exfiltration much more complexes. therefore, Artificial Intelligence and Machine learning technologies could be the solutions for several problems, but, at the same time, these technologies are challenged by the complexity of the subject. There are a huge amount of data, few examples of attacks in the context of data exfiltation, what make it a problem of classification very complex. Huge amount of data, high inequality between classes, and soft behaviors hard to identify in data. Therefore, in this work, we propose the construction of a new environment for the creation of solutions for APT problems, by the use of Deep Learning and Meta-Learning (MetL). We showed, and we validated the algorithms in know Data Banks and we built the path for the TRANSLAB team creating algorithms able to identify a data exfiltration attack new for the scientific community. It was made an extense literature review, with focus on DLPS, mapping the state of the art in the
application of machine learning algorithms in the context of data exfiltration. Therefore, the most relevant models for the construction of exfiltration detection algorithms were selected: Dense Networks with use of entropy, Robust Differential Networks and Transformers. A MetL tool was selected and studied for improving the quality of the models construction, and supply the future construction of AutoML process. A Packages Send
By The Cloud Data Bank was built with the aim of the construction of an Exfiltration Data Bank. It was selected a data bank in the HAR context to validate the modeled models, as the Exfiltration Cases are in that field. The models had been tested with the created data bank, showing that the data bank was too small yet to be used. The models were tested with the HAR data bank, demonstrating that the Transfomer model is the most promising option to solve the problem, classifying with 90% of precision. The Robust Network was not discarded yet, being suggested some changes for future works. the general and specific objectives were reached, what was enough to the construction of a solid basis for the research and development of the DLPS system by a partnership with the Brazilian army. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Ciência da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.