Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/29842
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2021_ArthurDaVeigaFBorges_tcc.pdfTrabalho de Conclusão de Curso (graduação)1,76 MBAdobe PDFver/abrir
Título: Classificação de parâmetros de efeitos de distorção a partir de áudio digital
Autor(es): Borges, Arthur da Veiga Feitoza
Orientador(es): Borges, Díbio Leandro
Assunto: Processamento de som por computador
Inteligência artificial
Áudio digital
Efeitos sonoros
Data de apresentação: 7-Mai-2021
Data de publicação: 9-Fev-2022
Referência: BORGES, Arthur da Veiga Feitoza. Classificação de parâmetros de efeitos de distorção a partir de áudio digital. 2021. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia da Computação) — Universidade de Brasília, Brasília, 2021.
Resumo: O processo de um músico que testa valores de parâmetros em efeitos de distorção sonora dado um áudio digital é típico no campo da Produção Musical. Mas, neste processo pode ocorrer erros humanos. Com isso, pôde-se observar que este é um processo de classificação supervisionada. Por isso, foi proposta uma simulação de classificação de parâmetros de efeitos de distorção a partir de áudio digital, onde três estimadores (SVM, KNN e Random Forest) comprovadamente apropriados para classificação de gêneros musicais, de parâmetros de efeitos de reverb e de detecção de intrusos em florestas sob proteção ambiental por áudio foram otimizados, testados e avaliados para quatro efeitos de distorção diferentes (Fuzz, Bitcrusher, Overdrive e Decimator). O dataset foi gerado a partir da aplicação de algoritmos de distorção em sinal senoidal e, a partir daí, da extração de características espectrais. Para avaliação, foram usadas matrizes de confusão e f1-score das classificações para cada parâmetro ou conjunto de parâmetros de cada efeito. Mesmo com limitações no dataset, o modelo Random Forest estimou mais de 90% de f1-score em 4 das 6 predições de parâmetros individuais. A partir deste resultado um dos possíveis trabalhos futuros é melhorar o dataset considerando utilizar a resposta ao impulso como áudio antes do préprocessamento e explicitar a correlação amostra-a-amostra ao extrair as características espectrais.
Abstract: The process of a musician testing parameter values in sound distortion effects given a digital audio is typical in the field of Music Production. But, in this process, human error can occur. It is clear that this process is a supervised classification. So, this work proposes a simulation on classification of distortion effect parameters from digital audio, where three estimators (SVM, KNN and Random Forest) proven to be appropriate for classification of musical genres, parameters of reverb effects and wildlife intruder detection by audio were optimized, tested and evaluated on four different distortion effects (Fuzz, Bitcrusher, Overdrive and Decimator). A dataset was generated by applying distortion algorithms in a sinusoidal signal and, from this, its spectral features were extracted. Confusion matrices and f1-score metric were used for evaluation on each parameter or parameter set of each effect. Even with limitations in the dataset, Random Forest estimated more than 90% f1-score in 4 of the 6 predictions on individual parameters. From this result one possible future work is to improve the dataset by considering using the impulse response as audio before preprocessing and making explicit the frame-by-frame correlation when extracting the spectral features.
Informações adicionais: Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.