|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境- y. D# U' G' R4 A
下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网
; P5 D' V- T3 Q1 {9 h络的 VAD 算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此) I& E. C1 S+ g; R3 b5 U8 ]% C
基础上,将神经网络 VAD 与基于互通道信号功率比值的 VAD 相结合,提出一种新的适用于手机消噪系统的语音
) m0 Q2 ?1 }1 N1 Y9 v; x8 J( r" b和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因 VAD 误判而造成
9 T2 G9 R8 z- ~4 M4 ^4 Y" o( i的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性( Q: `6 [# p! X* g: e+ D: }
语音干扰也有很好的抑制效果。
! U0 t7 Z/ R8 L3 |关键词:语音活动检测;语音增强;神经网络
; y# n4 ~6 M( u* r3 N6 V3 s1 引言/ e( T7 A6 s: H A; R4 X
说话人处于噪声环境中时,远端接听者往往会" x5 u# u! F* Z0 {% }; ^5 Z6 l
听到难以忍受的噪声[1],为了解决这个问题,现有手/ P. U; m. g! P; O2 c e. S
机集成了语音增强模块来提高语音质量。传统的单
; @, Y$ E( E. |9 i. ~通道语音增强算法 [2 6]无法很好地处理非稳态噪
8 m: k" z9 f: G1 K声,而多通道算法[1,7 13]在利用语音与噪声性质差异3 E8 H4 h* @1 K& q3 {! P
的同时也结合了两者的空间差异性,使得算法在非" G, D4 D) j- M5 Z7 \2 ^
, g1 I5 Z: i8 F8 ~/ I' j6 e4 j; \$ b
# h% \- i7 B7 `& L
2 T; s$ C0 a% t2 ?( I0 h2 `/ O
- ]$ [! U7 i1 q* e; I- O W. q& G/ F& R, @9 o2 z" H
+ X! z h ?3 g/ n( T: u: O
附件下载:
; L( E" |$ {8 s2 k5 j) O* z% o6 Z8 ~) {' v
1 I/ B1 k- H1 [* |. |7 @- H! ^% B' v- s8 s# O0 b
0 p6 E* y/ B8 h3 M! r
2 S: _& z- S+ A' {, o |
|