Título: | Identificação forense de múltiplos locutores baseada em ICA convolutiva usando coeficientes cepstrais de frequência Mel e modelo de mistura gaussiana |
Autor(es): | Silveira, Matheus Almeida |
Orientador(es): | Costa, João Paulo Carvalho Lustosa da |
Assunto: | Reconhecimento automático da voz Comando de voz Ruído Modelo de mistura gaussiana Identificação automática de locutores Aplicações forenses Análise de componentes independentes Sinal de voz Escuta ambiente forense Voz - análise |
Data de apresentação: | 2013 |
Data de publicação: | 15-Jul-2016 |
Referência: | SILVEIRA, Matheus Almeida. Identificação forense de múltiplos locutores baseada em ICA convolutiva usando coeficientes cepstrais de frequência Mel e modelo de mistura gaussiana. 2013. vii, 59 f., il. Monografia (Bacharelado em Engenharia de Redes de Comunicação) — Universidade de Brasília, Brasília, 2013. |
Resumo: | Técnicas de identificação automática de locutores são amplamente utilizadas em aplicações forenses.
Porém a sua precisão cai severamente quando a voz do locutor de interesse está imersa em uma
gravação que contenha mais de uma voz. Esta é uma situação comum de investigações onde a voz
dos alvos são obtidos por meio de gravações de escuta ambiente. Em aplicações forenses onde temos
microfones escondidos, ruídos interferentes em gravações são comuns e degradam severamente
o desempenho das técnicas de identificação de locutores. Nesse trabalho, é proposto um método
para atenuar esse problema separando espacialmente a voz de cada pessoa usando uma técnia de
Separação Cega de Sinais chamada Análise de Componente Independente , e então aplicando nos
sinais de voz separados um sistema de identificação de voz baseado em Coeficientes Cepstrais de
Frequência Mel e Modelos de Mistura Gaussianas. Para identificar mais que um locutor, o método
proposto tem mais acurácia que os presentes na literatura. |
Abstract: | Automatic speaker identification techniques are widely used nowadays in forensic applications, but
its accuracy harshly degrades when the voice of the speaker of interest is immersed in a recording
containing more than one voices, common situation of investigations where the targets voice are
obtained through ambient recordings. In forensic applications where microphones are hidden, such
interferent sound sources in recordings are common and they severely degrade the performance of
speaker identification techniques. In this paper, we propose a method to mitigate this problem
by spatially separating the voice of each speaker using a Blind Source Separation technique called
Convolutive Independent Component Analysis, and then applying the separated speech signals to a
speaker identification system based on Mel Frequency Cepstral Coefficients and Gaussian Mixture
Models. For identifying more than one speaker, the proposed system has a better accuracy than
the state-of-the-art solutions. |
Informações adicionais: | Monografia (graduação) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2013. |
Aparece na Coleção: | Engenharia de Redes de Comunicação
|