Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/37607
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2023_RaylanSales_StefanoSposito_tcc.pdf824,25 kBAdobe PDFver/abrir
Título: Uma biblioteca para anonimização de dados pessoais brasileiros em textos
Autor(es): Sales, Raylan da Silva
Spósito, Stefano Luppi
Orientador(es): Canedo, Edna Dias
Coorientador(es): Silva, Geovana Ramos Sousa
Assunto: Lei Geral de Proteção de Dados
Dados - privacidade
Linguagem de programação - Python
Data de apresentação: 11-Dez-2023
Data de publicação: 18-Fev-2024
Referência: SPÓSITO, Stefano Luppi; SALES, Raylan da Silva. Uma biblioteca para anonimização de dados pessoais brasileiros em textos. 2023. 64 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2023.
Resumo: Atualmente, uma grande quantidade de dados pessoais de indivíduos está em posse de grandes empresas. A Lei Geral de Proteção de Dados (LGPD) foi criada para regularizar o uso destes dados e reduzir esta posse ao máximo, para que sejam usados apenas os dados necessários e, se necessário, anonimizá-los de acordo com os regulamentos estabelecidos, entretanto, não há ainda uma ferramenta específica para anonimização de dados pessoais brasileiros. O objetivo deste trabalho é criar uma biblioteca para a anonimizaçãode dados pessoais, de forma a atender às especificidades dos dados pessoais brasileiros. A ferramenta tem como meta proporcionar um meio eficiente e seguro para a remoção de informações sensíveis e identificáveis presentes nos documentos, preservando a privacidade e a confidencialidade dos dados, de acordo com a Lei Geral de Proteção de Dados Pessoais(LGPD). Para este trabalho, foi utilizado uma abordagem mista, combinando elementos de pesquisa experimental e aplicada. A pesquisa experimental avaliou as bibliotecas existentes por meio de testes em cenários de anonimização de dados brasileiros, enquanto a pesquisa aplicada desenvolveu uma biblioteca específica para dados brasileiros em Python, considerando técnicas existentes e requisitos locais. A metodologia incluiu uma revisão bibliográfica, com pesquisa em bases científicas e a avaliação prática da biblioteca, destacando critérios como eficácia, preservação da utilidade dos dados e conformidade com regulamentações de proteção de dados. Após a compreensão das técnicas de anonimização de dados, foi desenvolvida uma biblioteca na linguagem de programação Python para a anonimização de dados pessoais brasileiros, de acordo com a LGPD. Foram realizados testes com as diferentes funções da biblioteca, utilizando os dados pessoais encontrados através de pesquisas na internet e dados gerados artificialmente em programas criados com a biblioteca para anonimizar dados pessoais. Os resultados demonstram a eficácia e funcionalidade da biblioteca. Assim, a biblioteca pode ser utilizada em qualquer código criado na linguagem Python. Este trabalho apresenta a criação de uma biblioteca com o intuito de contribuir e auxiliar no cumprimento das regulações estabelecidas pela LGPD, bem como promover a segurança e privacidade das informações pessoais. Como trabalhos futuros, o suporte a novos formatos será incluído na biblioteca, juntamente com uma possível integração a ferramentas de Inteligência Artificial que servirão para uma melhor detecção de dados pessoais e que permitirá a anonimização desses dados.
Abstract: Currently, a large amount of individuals’ personal data is in the possession of large com-panies. The General Data Protection Law (LGPD) was created to regularize the use of this data and reduce this ownership as much as possible, so that only the necessary data isused and, if necessary, anonymize it in accordance with established regulations, however,There is still no specific tool for anonymizing Brazilian personal data. The objective ofthis work is to create a library for the anonymization of personal data, in order to meetthe specificities of Brazilian personal data. The tool aims to provide an efficient and safemeans for removing sensitive and identifiable information present in documents, preserv-ing the privacy and confidentiality of data, in accordance with the General Personal Data Protection Law (LGPD). For this work, a mixed approach was used, combining elements of experimental and applied research. The experimental research evaluated existing li-braries through tests in Brazilian data anonymization scenarios, while the applied research developed a specific library for Brazilian data in Python, considering existing techniquesand local requirements. The methodology included a bibliographic review, with scientific research and practical evaluation of the library, highlighting criteria such as effectiveness, preservation of data usefulness and compliance with data protection regulations. Afterunderstanding data anonymization techniques, a library was developed in the Python programming language for the anonymization of Brazilian personal data, in accordancewith the LGPD. Tests were carried out with the different functions of the library, usingpersonal data found through internet searches and data artificially generated in programscreated with the library to anonymize personal data. The results demonstrate the ef-fectiveness and functionality of the library. Thus, the library can be used in any codecreated in the Python language. This work presents the creation of a library with the aimof contributing and assisting in compliance with the regulations established by the LGPD,as well as promoting the security and privacy of personal information. As future work,support for new formats will be included in the library, along with a possible integrationwith Artificial Intelligence tools that will serve to better detect personal data and allowfor the anonymization of this data.
Informações adicionais: Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.