|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.% ?3 B9 K" W! M
! F+ Z; y# Z, Y j. O& {, x: Q4 A, z% G8 P$ z
关键词:话音激活检测;长时信息;听觉滤波器;自适应2 M% P) v u& _' J. a9 [3 M. g
+ Y3 X$ t6 u; ?$ j/ ?; _& y
/ [" `2 P& c$ z; ~) {& x
/ n; o8 H: x9 n( S+ E } 话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能.$ T6 |8 x- B: H
+ o- ~" W# ]; M9 {4 ?* g I
4 b* I* Y8 y1 ?; @# z: z- h+ M2 O' Q0 d; J
# ]( s6 d5 j7 X
- `; I" K, D0 Z" J. `$ f7 k3 ^0 R- Q+ h; h2 ~+ r; T
' ^. E" x( N1 g0 D }4 [# l$ P; l
|
|