Identificação forense de múltiplos locutores baseada em ICA convolutiva usando coeficientes cepstrais de frequência Mel e modelo de mistura gaussiana

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/13703

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2013_MatheusAlmeidaSilveira.pdf		1,55 MB	Adobe PDF	ver/abrir

Título:	Identificação forense de múltiplos locutores baseada em ICA convolutiva usando coeficientes cepstrais de frequência Mel e modelo de mistura gaussiana
Autor(es):	Silveira, Matheus Almeida
Orientador(es):	Costa, João Paulo Carvalho Lustosa da
Assunto:	Reconhecimento automático da voz Comando de voz Ruído Modelo de mistura gaussiana Identificação automática de locutores Aplicações forenses Análise de componentes independentes Sinal de voz Escuta ambiente forense Voz - análise
Data de apresentação:	2013
Data de publicação:	15-Jul-2016
Referência:	SILVEIRA, Matheus Almeida. Identificação forense de múltiplos locutores baseada em ICA convolutiva usando coeficientes cepstrais de frequência Mel e modelo de mistura gaussiana. 2013. vii, 59 f., il. Monografia (Bacharelado em Engenharia de Redes de Comunicação) — Universidade de Brasília, Brasília, 2013.
Resumo:	Técnicas de identificação automática de locutores são amplamente utilizadas em aplicações forenses. Porém a sua precisão cai severamente quando a voz do locutor de interesse está imersa em uma gravação que contenha mais de uma voz. Esta é uma situação comum de investigações onde a voz dos alvos são obtidos por meio de gravações de escuta ambiente. Em aplicações forenses onde temos microfones escondidos, ruídos interferentes em gravações são comuns e degradam severamente o desempenho das técnicas de identificação de locutores. Nesse trabalho, é proposto um método para atenuar esse problema separando espacialmente a voz de cada pessoa usando uma técnia de Separação Cega de Sinais chamada Análise de Componente Independente , e então aplicando nos sinais de voz separados um sistema de identificação de voz baseado em Coeficientes Cepstrais de Frequência Mel e Modelos de Mistura Gaussianas. Para identificar mais que um locutor, o método proposto tem mais acurácia que os presentes na literatura.
Abstract:	Automatic speaker identification techniques are widely used nowadays in forensic applications, but its accuracy harshly degrades when the voice of the speaker of interest is immersed in a recording containing more than one voices, common situation of investigations where the targets voice are obtained through ambient recordings. In forensic applications where microphones are hidden, such interferent sound sources in recordings are common and they severely degrade the performance of speaker identification techniques. In this paper, we propose a method to mitigate this problem by spatially separating the voice of each speaker using a Blind Source Separation technique called Convolutive Independent Component Analysis, and then applying the separated speech signals to a speaker identification system based on Mel Frequency Cepstral Coefficients and Gaussian Mixture Models. For identifying more than one speaker, the proposed system has a better accuracy than the state-of-the-art solutions.
Informações adicionais:	Monografia (graduação) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2013.
Aparece na Coleção:	Engenharia de Redes de Comunicação

Mostrar item em formato completo Recomendar este item Visualizar estatísticas

Este item está licenciado na Licença Creative Commons