|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将 Fisher
/ \$ n# F: C: b. f/ I# \0 s6 s2 U准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同; X( M8 l5 M- A4 c" O7 G5 J( @' q
类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在 NIST SRE 8 t) F: J# i% p! Y* \
2003 数据库上,实验结果表明该算法得到的等错误率是 7.62%,基于余弦距离打分的 i-vector 的等错误率是 6.7%。: {7 ~/ A$ v& {. J& T0 j
当两个系统融合后,得到的等错误率是 5.07%。* N/ h1 I" i, w. C3 q* a
关键词:说话人识别;字典学习;稀疏表示;Fisher 判别
. ?6 ?5 j1 a) [1 `1 G1 引言
5 G1 v5 v, H1 `6 I说话人识别是语音识别领域的一个重要组成部$ b) B# j6 z; Z" N" M
分,其目的是从说话人的语音中提取出说话人的个
0 r2 O3 L( m- i' }3 n性特征,对说话人进行辨别的过程。该技术广泛应
! W( G# m0 H' E+ X E! X' P用于司法取证、声控门锁、银行、电子商务和国防5 F" G0 c. Z) w
等领域。4 D# S' Z1 I8 Z. W2 n# _
在过去的几年里,稀疏信号表示已广泛应用于
5 W; j, Z, b$ X/ j" u6 z9 X数字信号处理领域[1 5],例如:压缩感知和图像恢7 l- W, [* Y# z& W% k
复。近年来,人们发现基于分类的稀疏表示的实验
7 F8 I- v/ C" D2 }. B4 _) h( {4 \结果比较好,因此被广泛使用。稀疏编码是通过构
U2 p/ D9 ^9 Y# Q0 a建过完备字典[6]对任意一个信号进行最紧凑的线性+ C' s6 |) i# ^2 v5 G
表示。构建稀疏编码字典的方法有两种,分别是标: z0 T! Y; x; o9 [. d0 `
& F# o& E/ e u- O4 g! ?* E
0 m* I- y. |4 i) d" P) j- K- c1 j3 _6 c' G
附件下载:
7 F. t' a0 r" h! ^+ q9 U. ^8 ~1 |: k2 W* Z$ _
|
|