基于长时信息的自适应话音激活检测

sugarbabysu · 发表于 2021-6-18 10:36

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.

关键词:话音激活检测;长时信息;听觉滤波器;自适应

话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能.

游客，如果您要查看本帖隐藏内容请回复

nevadaooo · 发表于 2021-6-18 13:10

话音激活检测是语音信号处理相关应用必不可少的前端处理技术

帐号		自动登录	找回密码
密码			注册

[毕业设计] 基于长时信息的自适应话音激活检测

EDA365欢迎您登录！

浏览过的版块

推荐内容 /1