综合资讯 在线阅读 原文阅读 在线商城 下载专区 DATASHEET 技术论坛 商务频道

嵌入式系统  单片机  D S P  EDA/PLD  接口电路  存储技术  显示光电  电源技术
传感/控制  模拟技术  通信网络  无线通信  电测仪表  消费电子  汽车电子

所在的位置:首页技术文章传感/控制正文
 
语音识别的智能门控系统设计
发布日期:2008-06-16 作者:薛同泽 陈书旺 来源:微计算机信息

摘要:该智能门卫系统采用语音识别技术,在陵阳单片机SPCE061A上实现。硬件部分主要由SPCE061A单片机、电源与门控电路、外扩存储器SPR4096、音频输入与输出电路等组成。主要技术是该单片机在语音识别中的应用和对门控电路的设计。该系统软件部分由语音训练模块、语音识别模块、语音数据处理模块、语音播报模块和密码输入与确认模块组成,通过对系统的初始化和识别训练实现了语音数据的采集、特征提取、特定语音识别和语音播放等功能。根据语音识别算法原理,对语音信号的预处理、特征提取、模式匹配做了分析。该系统实验结果表明,系统性能稳定,识别效果好,可用于家庭或小型办公场所的门锁控制。
关键词: 语音识别、门控系统、线性预测、特征提取、模式匹配

引言

当前智能型门卫系统中利用的识别技术有很多种,其中基于特定人的身份识别的技术也有很多,但相对于其他技术,语音识别技术是目前公认的比较方便与安全的识别技术之一,该技术是利用人体生物特征进行身份认证的一种技术。由于每个人的生物特征与其他人相比具有不同的唯一性和在一定时期内不变的稳定性,因此不易伪造和假冒,所以利用语音识别技术进行身份认证,安全、准确、可靠。

1 语音识别的分类

由于语音识别的目的和作用不同,识别又分为说话人识别和语音识别。

其中说话人识别,可分为与文本有关和与文本无关两类。与文本有关的语音识别系统要求用户按照规定的内容发音,每个人的语音模型逐个被精确地建立,而识别时也必须按规定的内容发音,因此可以达到较好的识别效果;而与文本无关的识别系统则不规定说话人的发音内容,模型建立相对困难,但用户使用方便,应用范围较宽。从用途上看,可分为说话人识别和说话人确认。前者判定某一待识别的声音是多个话者中的一个,是多选一的问题,属于闭集识别范围。后者判定一个待识别的声音“是或不是”某一特定说话者的语音,其输出只有两种结果,为肯定或否定的问题[1]

该系统的核心处理器是陵阳16位单片机SPCE061A,并在其上实现与文本有关的说话人的确认,然后执行相应的命令与操作。该系统主要由说话人识别模块、门锁控制电机以及门锁等部分组成。在训练时,说话人的声音通过麦克风进入说话人语音信号采集前端电路,由语音信号处理电路对采集的语音信号进行特征化和语音处理,提取说话人的个性特征参数并进行存储,形成说话人特征参数数据库。在识别时,将待识别语音与说话人特征参数数据库进行匹配,通过输出电路控制门控电机,最终实现对门锁的控制[2]

本系统的硬件部分由单片机SPCE061A、音频输出电路、音频输入电路、语音识别电路、门锁控制电路、FLASH电路和按键电路等部分组成。系统框图如图1所示。硬件系统主要完成的任务是将语音信号数字化,实现语音数据的采集、上传、保存、识别及播放[3]

图1 系统硬件框图

2 硬件系统设计

2.1 CPU核心电路

SPCE061A 高性能 16 位单片机的工作电压范围为 2.6~5.5V,系统工作频率为 0.375~49.152MHz。在片内集成有 32 位可编程的多功能 I/O 端口、两个 16 位定时器/计数器、7 通道10位电压模-数转换器(ADC)、自动增益控制功能的麦克风输入方式、双通道10位DAC方式的音频输出功能及看门狗定时器。中断控制器可处理3种 FIQ中断和 11种IRQ 中断,以及一个由指令BREAK控制的软中断。提供丰富的C函数库和语音处理函数库,因此非常适合数字声音和语音识别产品的开发。使得设计电路简单化,大大降低了硬件成本。

2.2 语音识别电路

语音识别电路的工作原理是智能系统在提取语音后,对语音信号进行分析,首先是噪音的滤除和预加重,然后语音信号经过滤波器组进行信号的选择,提取有用信号,通过PARCOR系数、线性预测系数、过零次数和能量性关函数等的计算匹配对信号进行处理选择。语音信号在进行分析处理后与语音库(即字典)里的语音量进行模式匹配,最后根据匹配的结果输出语音识别结果。语音识别电路的基本结构如图2所示。

图2 语音识别电路框图

3 语音信号处理

    语音信号处理过程的总体结构框架图,如图3所示。

图3 语音信号处理过程结构图

从总体结构图可以看出:首先对输入的语音信号要进行预处理,对信号进行适当的放大,并进行反混叠滤波来消除工频干扰;然后为方便数字化设备对信号进行计算处理则对信号进行数字化,将模拟信号转化为数字信号;接着进行特征提取,用反映语音信号特点的若干参数来代表语音,最后根据任务的不同,采用不同的处理方法。语音识别分为两个阶段:训练阶段和识别阶段。在训练阶段对用特征参数形式表示的语音信号进行相应的处理,获得表示识别基本单元共性特点的标准数据,以此形成参考模板,将所有能识别的基本单元的参考模板结合在一起,形成参考模板库;在识别阶段将待识别的语音经过特征提取后逐一与参考模板比较,找出最相似的参考模板所对应的发音,即为识别结果[4]

3.1 语音信号预处理

噪声的存在对语音信号的处理和识别存在着严重的干扰,因此我们在处理前先要进行噪声的处理。对麦克风输入的模拟语音信号要进行采样和量化,获得数字化的语音信号。在语音信号数字化之前,要进行防混叠滤波及防工频干扰。其中防混叠滤波是滤除高于1/2采样频率的信号成分或噪声,使信号带宽限制在某个范围内。得到干净的语音信号后并通过预加重技术滤除低频干扰,尤其是50Hz或60Hz的工频干扰,提升语音信号的高频部分,而且它还可以起到消除直流漂移、抑制随机噪声和提升清音部分能量的作用。

3.2 特征提取

本系统采用了不同说话人的分散程度与各说话人自身的分散程度之间的对比值作为特征参数的评价方法。其基本思想是:对同一说话人的一段语音提取一组特征参数,相当于把该段语音映射到多维空间上的一个点。同一说话人的不同语音会在特征空间产生不同的点,其分布可用多变量概率密度函数来描述。对同一个说话人的不相同单次的发音,这些点比较集中;而不同说话人的发音分布相距较远,则所选择的这组特征参数就能够有效的描述说话人的个性特征。根据这一原则,对单个参数而言,可以取两种分布参数的方差比(称为F比)作为有效的度量准则。F比反映了不同说话人的分散程度与各说话人自身的分散程度之间的对比关系。某一特征参数的F比越大,说明对于本特征,平均而言前者要大于后者。因此,说话人识别系统中采用F比较大的,这样系统会得到较好的性能[5]

3.3 模式匹配

目前针对各种特征参数提出的模式匹配方法的研究越来越深入。典型的方法有:矢量量化方法、高斯混合模型方法、隐马尔可夫模型方法、动态时间规整(DTW)方法和人工神经网络方法。这些方法都有各自的优点和缺点。其中DTW算法对于较长语音的识别,模版匹配运算量太大,但对短语音(有效语音长度低于3s)的识别既简单又有效,而且并不比其他方法识别率低,特别适用于短语音、与文本有关的说话人识别系统。本系统采用端点松弛两点的(DTW)算法,端点松弛引起的计算量增加并不大,还可以放松对端点检测的精度要求[6]

4 实验结果

对于使用者要确认该系统的实用性和稳定性,则表征系统性能的两个重要的参量是错误识别率和拒绝识别率。前者是系统接受非使用者的语音信号而造成的错误,后者是系统拒绝使用者的语音信号而造成的错误,二者与匹配阈值的设定相关。匹配阈值的设定与语音锁系统的功能侧重有关、应用场合,对于特意为家用使用者设计的该智能系统而言,要求错误识别率和拒绝识别率尽可能低,甚至为零。

表1是先用录音机对特定人的发音进行录音(发音的语调、语素和话音内容相同),然后用录音与特定人真实发音在不同的距离范围内做40次比较。

 

表1 录音与特定人发音实时匹配结果

发音分类次数

人与话筒距离

特定人

相同发音

特定人

录音发音

特定人

相似发音

非特定人

相同发音

非特定人

相似发音

拒绝次数

1m内

37

40

36

40

39

接受次数

1m内

3

0

4

0

1

拒绝次数

2m外

25

37

39

40

40

接受次数

2m外

15

3

1

0

0

 

在实验结果中,使用录音机进行40次实验,非特定人通过认证的次数为零。对于使用该系统的家庭而言,这个结果十分理想的。而当说话人与麦克风距离较远时,识别率有明显下降,主要是因为随着距离的增加,有用的语音信号的能量与噪声能量的比值逐渐下降,使得在特征提取时发生失真,最终导致在模式匹配时很难达到匹配要求。解决这一问题可以通过调整阈值来实现。

5 结论

本文介绍的智能门控系统采用的是语音识别技术,即利用语音控制智能系统来执行对门禁系统的操作,并随语音的不同给予相应的语音回答与提示。语音识别与其他生物识别技术相比,不仅具有不会遗失和忘记、不需记忆、使用方便等优点,而且还具有用户接受程度高,声音输入设备造价低廉等优点。由于涉及不到用户的隐私问题,所以可以方便的推广应用。实验测试表明,该系统性能稳定、识别效果好。

本文作者创新点:将陵阳单片机的语音处理技术用于门控系统,拓展了单片机使用范围,丰富了语音识别应用领域,为智能门控系统提供了一种新方法。

参考文献

[1] 韩吉庆, 张磊, 郑铁燃. 语音信号处理[M]. 北京:清华大学出版社, 2004

[2] 俞铁城. 语音识别的发展现状[J]. 通信世界. 2005,2:56

[3] 赵世强, 荆炳礼, 赵满. 凌阳16位单片机SPCE061A的最小系统及开发[J]. 国外电子元器件, 2003,5:37-39

[4] 王和顺, 邓成中, 黄惟公. 基于SPCE061A的语音识别系统的研究[J]. 计算机工程与设计, 2004,25(12): 2222-2224

[5] 姜志玲. 用凌阳单片机实现多路数据采集与传输系统[J]. 西华大学学报:自然科学版, 2005,24(2): 69-72

[6] 罗俊光, 汤荣江. 基于DSP的非特定人语音识别系统[J]. 微计算机信息, 2007, 4-2:195-196


 (全文结束)

信息发布:   转引自: 【 】 【打印】 【关闭
 相 关 文 章
SPCE061A实现的电话防盗报警器 (11-30)
基于SPCE061A单片机的图形液晶模块的驱动设计 (01-06)
基于SPCE061A的车载DVD播放器设计与实现 (10-31)
以16位单片机实现信息家电连接internet的解决方案 (10-02)
基于SPCE061A的ACM12864J液晶显示模块应用设计 (09-04)
SPCE061A单片机与液晶显示模块HS12864-1的接口及其编程 (09-13)
SPCE061A实现的电话防盗报警器 (02-27)
智能语音播报作息时间控制器 (03-13)
数控直流电流源的设计与实现 (12-21)
基于SPCE061A单片机的二级倒立摆控制系统 (03-22)
基于LabVIEW与凌阳SPCE061A实现串口数据采集 (08-24)
基于SPCE061A的指纹识别系统 (08-10)
基于Cyclone EP1C6和SPCE061A的LED大屏幕系统设计 (07-20)
基于SPCE061A的嵌入系统接入互联网方法的研究 (08-10)
基于SPCE061A的语音识别系统的设计 (06-13)
关于我们 ┋ 友情链接


深圳市福田区海滨广场恒福花园恒华阁11F
电话:0755-88305872 传真:0755-88305880
Copyright©2005-2007 无忧电子开发网版权所有

粤ICP备05064233号