|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.
2 n! U8 I; l& d4 B, S' m" q D3 `
$ U" \+ T0 X+ `# ?9 U- Y$ {
关键词:话音激活检测;长时信息;听觉滤波器;自适应4 }$ F1 @1 z" t9 R( @
; k/ v) `' L$ P
, ~& _7 n( U3 N) M( W& g
' D! m: U/ b. {
话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能.
6 t# p6 `4 @# A& n7 I- b
, Q1 D, q2 s7 N5 J7 J/ f; U. N' G
) E: i S- T* t; G6 e7 s2 O2 v- N! u; S
" H( s/ j8 S; x* ]
( X# C. ~) s% @: Z8 x' e& U2 \! N
1 P/ K( u) E" E$ q- g
6 T8 c& o8 ?5 n6 c |
|