|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将 Fisher
% l4 q% e. a' g' I" g准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同
% L" z, ~6 S2 ^- n! b类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在 NIST SRE
6 w% w2 `9 ?3 K2003 数据库上,实验结果表明该算法得到的等错误率是 7.62%,基于余弦距离打分的 i-vector 的等错误率是 6.7%。" L, M3 f6 }; D9 W* p
当两个系统融合后,得到的等错误率是 5.07%。
3 \6 {6 \; E3 ?& i3 U1 M7 ~3 [8 i关键词:说话人识别;字典学习;稀疏表示;Fisher 判别1 ?* A7 K: }2 Q$ t+ h0 T2 K
1 引言5 r" A/ h; s# U9 O- T8 R
说话人识别是语音识别领域的一个重要组成部
1 F1 V* R0 V7 L' M ?) ^分,其目的是从说话人的语音中提取出说话人的个
$ z; _) G/ {) i" f性特征,对说话人进行辨别的过程。该技术广泛应
. }+ @) S$ {: N- V/ F0 [5 Y用于司法取证、声控门锁、银行、电子商务和国防# J; u4 G3 g8 Z' y: n& H8 f8 Q8 b9 \
等领域。
6 O7 t4 U9 B0 C- V% J在过去的几年里,稀疏信号表示已广泛应用于
/ @0 d% _2 N) n3 S数字信号处理领域[1 5],例如:压缩感知和图像恢3 i6 E9 v& N3 a. _, U& s1 c
复。近年来,人们发现基于分类的稀疏表示的实验' j! T6 a0 [, \ n7 G
结果比较好,因此被广泛使用。稀疏编码是通过构
$ i4 N, H( C; I/ @! D0 N! R建过完备字典[6]对任意一个信号进行最紧凑的线性
1 X" G* F6 A% v表示。构建稀疏编码字典的方法有两种,分别是标4 _1 f8 S- `6 I. l
% [' _) R _) {5 ~: C) e
) i& G1 [$ I( U2 x6 S4 e& y: ~2 B: q0 T: I3 G4 E
: r1 r) |1 G M( u4 |. Y: w# z; G9 O' [. [ \
附件下载: ^) \) L# W9 t- g
) ^$ A% J8 i2 l" u
|
|