Título: | Modelos preditivos para categorizar notícias em português usando processamento de linguagem natural e transformadores |
Autor(es): | Guimarães, Ítalo Vinícius Pereira |
Orientador(es): | Silva, Nilton Correia da |
Assunto: | Análise de dados Processamento de linguagem natural (Computação) |
Data de apresentação: | 20-Dez-2023 |
Data de publicação: | 31-Jul-2024 |
Referência: | GUIMARÃES, Ítalo Vinícius Pereira. Modelos preditivos para categorizar notícias em português usando processamento de linguagem natural e transformadores 2023. 85 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2023. |
Resumo: | Atualmente vivemos a era da informação e diariamente grandes empresas e startups en frentam problemas em relação à quantidade de dados processados, ou seja, têm grandes
desafios em lidar com uma quantidade grande de dados e também não conseguem convertê lo em informações relevantes de forma otimizada. Uma das áreas mais antigas que mais
produzem dados é o jornalismo, onde desde o passado todas as informações eram trans mitidas por papel e são atualmente feitas, em sua maioria, por meio da internet. Com
a crescente quantidade de informações jornalisticas disponíveis online, é fundamental ter
um sistema automatizado capaz de categorizar notícias com precisão e eficiência. Isso
permitirá aos usuários acessarem conteúdo relevante de maneira mais rápida e aos por tais de notícias aprimorarem sua organização e distribuição de informações. O objetivo
deste trabalho é criar um categorizador de notícias fornecendo a categoria mais adequada
àquele texto a partir das categorias mais abordadas atualmente pelos portais de notí cias principais. Com o intuito de atingir este objetivo, serão realizadas as atividades de
pré-processamento para maximizar a possibilidade de sucesso na tarefa de classificação.
Isso pressupõe-se a necessidade de uma base de dados consolidadas e boas escolhas de
métodos e técnicas que sejam efetivamente aplicadas e consequentemente tenhamos um
bom desempenho nos resultados. Objetiva-se focar em técnicas atuais do estado da arte
em aprendizado profundo para resolver e validar se são eficazes para alcançar os objetivos
anteriormente apresentados. |
Abstract: | We currently live in the information age and daily large companies and startups face
problems in relation to the amount of data processed, that is, they have great challenges
in dealing with a large amount of data and also fail to convert it into relevant information
in an optimized way. One of the oldest areas that produce the most data is journalism,
where since the past all information was transmitted by paper and is currently done mostly
through the internet. With the growing amount of journalistic information available on line, it is essential to have an automated system capable of categorizing news accurately
and efficiently. This will allow users to access relevant content faster and news portals
to improve their organization and distribution of information. The aim of this work is to
create a news categorizer by providing the most suitable category for that text from the
categories currently most addressed by the main news portals. In order to achieve this
goal, pre-processing activities will be performed to maximize the possibility of success in
the classification task. This presupposes the need for a consolidated database and good
choices of methods and techniques that are effectively applied and consequently have a
good performance in the results. The objective is to focus on current state-of-the-art tech niques in deep learning to solve and validate whether they are effective in achieving the
objectives previously presented. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, 2023. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia de Software
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.