Título: | Classificação de parâmetros de efeitos de distorção a partir de áudio digital |
Autor(es): | Borges, Arthur da Veiga Feitoza |
Orientador(es): | Borges, Díbio Leandro |
Assunto: | Processamento de som por computador Inteligência artificial Áudio digital Efeitos sonoros |
Data de apresentação: | 7-Mai-2021 |
Data de publicação: | 9-Fev-2022 |
Referência: | BORGES, Arthur da Veiga Feitoza. Classificação de parâmetros de efeitos de distorção a partir de áudio digital. 2021. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia da Computação) — Universidade de Brasília, Brasília, 2021. |
Resumo: | O processo de um músico que testa valores de parâmetros em efeitos de distorção sonora
dado um áudio digital é típico no campo da Produção Musical. Mas, neste processo pode
ocorrer erros humanos. Com isso, pôde-se observar que este é um processo de classificação
supervisionada. Por isso, foi proposta uma simulação de classificação de parâmetros de
efeitos de distorção a partir de áudio digital, onde três estimadores (SVM, KNN e Random
Forest) comprovadamente apropriados para classificação de gêneros musicais, de parâmetros de efeitos de reverb e de detecção de intrusos em florestas sob proteção ambiental por
áudio foram otimizados, testados e avaliados para quatro efeitos de distorção diferentes
(Fuzz, Bitcrusher, Overdrive e Decimator). O dataset foi gerado a partir da aplicação de
algoritmos de distorção em sinal senoidal e, a partir daí, da extração de características
espectrais. Para avaliação, foram usadas matrizes de confusão e f1-score das classificações
para cada parâmetro ou conjunto de parâmetros de cada efeito. Mesmo com limitações no
dataset, o modelo Random Forest estimou mais de 90% de f1-score em 4 das 6 predições
de parâmetros individuais. A partir deste resultado um dos possíveis trabalhos futuros é
melhorar o dataset considerando utilizar a resposta ao impulso como áudio antes do préprocessamento e explicitar a correlação amostra-a-amostra ao extrair as características
espectrais. |
Abstract: | The process of a musician testing parameter values in sound distortion effects given a
digital audio is typical in the field of Music Production. But, in this process, human error
can occur. It is clear that this process is a supervised classification. So, this work proposes
a simulation on classification of distortion effect parameters from digital audio, where three
estimators (SVM, KNN and Random Forest) proven to be appropriate for classification
of musical genres, parameters of reverb effects and wildlife intruder detection by audio
were optimized, tested and evaluated on four different distortion effects (Fuzz, Bitcrusher,
Overdrive and Decimator). A dataset was generated by applying distortion algorithms in
a sinusoidal signal and, from this, its spectral features were extracted. Confusion matrices
and f1-score metric were used for evaluation on each parameter or parameter set of each
effect. Even with limitations in the dataset, Random Forest estimated more than 90%
f1-score in 4 of the 6 predictions on individual parameters. From this result one possible
future work is to improve the dataset by considering using the impulse response as audio
before preprocessing and making explicit the frame-by-frame correlation when extracting
the spectral features. |
Informações adicionais: | Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.