智能机器人

免费订阅电子杂志立即订阅 助推中国运动控制产业发展
首页 >> 杂志文章

基于VQ的语音识别技术研究

作 者:吕晶晶 / 陈 娟 / 张 培 /马艳娥 来自:2011年第4期"智能检测" 阅读 36609

引言
    语音识别是人机接口设计的一项重要内容,也是语音信号处理中非常重要的应用技术,在司法、军事、安全等领域都有广泛的应用。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。本文采用LBG算法设计每个待识别语音的码本,通过计算其所有帧的VQ失真累积值,把具有最小累积失真值的输入语音信号对应的参考类别作为识别判定的结果,从而识别特定人的语音,并分析所设计系统的特性。

实现原理
矢量量化
    矢量量化的过程是:将语音信号波形的K个样点的每一帧,构成K维空间中的一个矢量,然后对这个矢量进行量化。通常所说的标量量化,也可以说是K=1的一维矢量量化。在矢量量化时,将K维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。

     

 图1 系统的整体框图

LBG算法LBG算法实际上就是反复迭代的过程,它从对初始码书进行迭代优化

[登陆后可查看全文]