Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/13703
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2013_MatheusAlmeidaSilveira.pdf1,55 MBAdobe PDFver/abrir
Título: Identificação forense de múltiplos locutores baseada em ICA convolutiva usando coeficientes cepstrais de frequência Mel e modelo de mistura gaussiana
Autor(es): Silveira, Matheus Almeida
Orientador(es): Costa, João Paulo Carvalho Lustosa da
Assunto: Reconhecimento automático da voz
Comando de voz
Ruído
Modelo de mistura gaussiana
Identificação automática de locutores
Aplicações forenses
Análise de componentes independentes
Sinal de voz
Escuta ambiente forense
Voz - análise
Data de apresentação: 2013
Data de publicação: 15-Jul-2016
Referência: SILVEIRA, Matheus Almeida. Identificação forense de múltiplos locutores baseada em ICA convolutiva usando coeficientes cepstrais de frequência Mel e modelo de mistura gaussiana. 2013. vii, 59 f., il. Monografia (Bacharelado em Engenharia de Redes de Comunicação) — Universidade de Brasília, Brasília, 2013.
Resumo: Técnicas de identificação automática de locutores são amplamente utilizadas em aplicações forenses. Porém a sua precisão cai severamente quando a voz do locutor de interesse está imersa em uma gravação que contenha mais de uma voz. Esta é uma situação comum de investigações onde a voz dos alvos são obtidos por meio de gravações de escuta ambiente. Em aplicações forenses onde temos microfones escondidos, ruídos interferentes em gravações são comuns e degradam severamente o desempenho das técnicas de identificação de locutores. Nesse trabalho, é proposto um método para atenuar esse problema separando espacialmente a voz de cada pessoa usando uma técnia de Separação Cega de Sinais chamada Análise de Componente Independente , e então aplicando nos sinais de voz separados um sistema de identificação de voz baseado em Coeficientes Cepstrais de Frequência Mel e Modelos de Mistura Gaussianas. Para identificar mais que um locutor, o método proposto tem mais acurácia que os presentes na literatura.
Abstract: Automatic speaker identification techniques are widely used nowadays in forensic applications, but its accuracy harshly degrades when the voice of the speaker of interest is immersed in a recording containing more than one voices, common situation of investigations where the targets voice are obtained through ambient recordings. In forensic applications where microphones are hidden, such interferent sound sources in recordings are common and they severely degrade the performance of speaker identification techniques. In this paper, we propose a method to mitigate this problem by spatially separating the voice of each speaker using a Blind Source Separation technique called Convolutive Independent Component Analysis, and then applying the separated speech signals to a speaker identification system based on Mel Frequency Cepstral Coefficients and Gaussian Mixture Models. For identifying more than one speaker, the proposed system has a better accuracy than the state-of-the-art solutions.
Informações adicionais: Monografia (graduação) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2013.
Aparece na Coleção:Engenharia de Redes de Comunicação



Este item está licenciado na Licença Creative Commons Creative Commons