Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/39344
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2023_ItaloViniciusPGuimaraes_tcc.pdf2,38 MBAdobe PDFver/abrir
Título: Modelos preditivos para categorizar notícias em português usando processamento de linguagem natural e transformadores
Autor(es): Guimarães, Ítalo Vinícius Pereira
Orientador(es): Silva, Nilton Correia da
Assunto: Análise de dados
Processamento de linguagem natural (Computação)
Data de apresentação: 20-Dez-2023
Data de publicação: 31-Jul-2024
Referência: GUIMARÃES, Ítalo Vinícius Pereira. Modelos preditivos para categorizar notícias em português usando processamento de linguagem natural e transformadores 2023. 85 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2023.
Resumo: Atualmente vivemos a era da informação e diariamente grandes empresas e startups en frentam problemas em relação à quantidade de dados processados, ou seja, têm grandes desafios em lidar com uma quantidade grande de dados e também não conseguem convertê lo em informações relevantes de forma otimizada. Uma das áreas mais antigas que mais produzem dados é o jornalismo, onde desde o passado todas as informações eram trans mitidas por papel e são atualmente feitas, em sua maioria, por meio da internet. Com a crescente quantidade de informações jornalisticas disponíveis online, é fundamental ter um sistema automatizado capaz de categorizar notícias com precisão e eficiência. Isso permitirá aos usuários acessarem conteúdo relevante de maneira mais rápida e aos por tais de notícias aprimorarem sua organização e distribuição de informações. O objetivo deste trabalho é criar um categorizador de notícias fornecendo a categoria mais adequada àquele texto a partir das categorias mais abordadas atualmente pelos portais de notí cias principais. Com o intuito de atingir este objetivo, serão realizadas as atividades de pré-processamento para maximizar a possibilidade de sucesso na tarefa de classificação. Isso pressupõe-se a necessidade de uma base de dados consolidadas e boas escolhas de métodos e técnicas que sejam efetivamente aplicadas e consequentemente tenhamos um bom desempenho nos resultados. Objetiva-se focar em técnicas atuais do estado da arte em aprendizado profundo para resolver e validar se são eficazes para alcançar os objetivos anteriormente apresentados.
Abstract: We currently live in the information age and daily large companies and startups face problems in relation to the amount of data processed, that is, they have great challenges in dealing with a large amount of data and also fail to convert it into relevant information in an optimized way. One of the oldest areas that produce the most data is journalism, where since the past all information was transmitted by paper and is currently done mostly through the internet. With the growing amount of journalistic information available on line, it is essential to have an automated system capable of categorizing news accurately and efficiently. This will allow users to access relevant content faster and news portals to improve their organization and distribution of information. The aim of this work is to create a news categorizer by providing the most suitable category for that text from the categories currently most addressed by the main news portals. In order to achieve this goal, pre-processing activities will be performed to maximize the possibility of success in the classification task. This presupposes the need for a consolidated database and good choices of methods and techniques that are effectively applied and consequently have a good performance in the results. The objective is to focus on current state-of-the-art tech niques in deep learning to solve and validate whether they are effective in achieving the objectives previously presented.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, 2023.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia de Software



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.