使用语音识别密码的智能电话远程控制系统 点击:1870 | 回复:0



xilinxue

    
  • 精华:13帖
  • 求助:0帖
  • 帖子:367帖 | 3回
  • 年度积分:0
  • 历史总积分:0
  • 注册:1900年1月01日
发表于:2010-04-25 14:43:19
楼主
1 引言
21世纪是信息化时代,随着电话机和手机走进了千家万户,各种通信技术推动了人类文明的巨大进步。随着通讯产业的发展,利用个人通信终端进行远程控制的技术也日益用于生活中。电话遥控与常规的遥控方式相比,显示出一定的优越性,既不需进行专门的布线,又不占用无线电频率资源,避免了电磁污染。同时,由于电话线路各地联网,可以充分利用现有的电话网,因此遥控距离可跨省市,甚至跨越国家。
本文介绍智能电话远程控制技术,该系统用于对家用电器进行电话遥控,用户可通过任意一部双音多频电话(包括手机,电话分机)对自己家庭安装的各种电器(如电饭锅,微波炉,热水器等)进行开机,停机等操作。智能远程控制系统能够在不改变家中任何家电的情况下,对家里的电器进行方便地控制,使人们尽享高科技带来的简便而时尚的现代生活。本系统还特别采用了语音识别密码和语音提示电路,使用起来更加方便,安全和可靠,具有实用价值和推广意义。

2 主要芯片简介
2.1 51系列兼容的单片机AT89C51
AT89C51是Atmel公司生产的与MCS-51系列兼容的单片机。内含:4K字节Flash EEPROM、128字节RAM、15根I/O引线、2个16位定时器/计数器、1个五向量两级中断结构,1个全双工串行口、1个精密模拟比较器等,其引脚如图1所示。





图1 AT89C51芯片引脚图


2.2 DTMF信号转换芯片MT8870
智能电话远程控制系统采用MITEL公司生产的MT8870 DTMF接受器作为DTMF信号的解码核心器件。MT8870主要用于程控交换机、遥控、无线通信等系统,实现DTMF信号的分离滤波和译码功能, MT8870是双直插式封装的集成芯片,可以将DTMF信号译成四位并行二进制BCD代码的译码芯片,16个DTMF信号分别对应0000-1111等 16位二进制代码。MT8870具有拨号音抑制和模拟信号输入可调功能,所以在设计MT8870 DTMF解码电路时,只需外加一些阻容元件即可。其引脚图如图2所示。 





图2 MT8870的引脚图


2.3 RSC-4128信号处理器
RSC4128是一个高度集成的语言和模拟输入/输出复合信号处理器,它包括:
●一个8位微控制器:具有先进的指令集和中断控制,高级的寄存器结构。
●独立的数字滤波器引擎和“L1”向量数学加速剂,片内ROM和RAM(4.8K),并且能够对片外的RAM,ROM,EPROM或者FLASH寻址。
●输入端扩音器具有前置放大器和16位模拟-数字转换器(ADC)对于语言和声音的/模拟输入
●10位数模转换器(DAC),和10位脉冲宽度调制器(PWM),用来直接连接话筒或者其他的模拟装置。
●当一个选定的声音的事件,比如鼓掌或者汽笛,发生的时候,可以从低功率的省电状态醒来。
RSC4128具有如下的功能:
●语音识别。RSC4128是Sensory Speech 7生产的硬件,可以支持HMM(隐马尔可夫建模)和神经网络技术,用于执行与发言人无关的独立的语音识别。与说话人无关的识别要求有芯片内或者片外的只读存储器存入被识别的词语。与说话人有关的(SD)识别要求可编程存储器存入个性化语言模板。这个可编程存储器可以是芯片内SRAM(静态存储器)或者片外的连续的EEPRAM(电可擦可编程只读存储器),FLASH MEMORY(闪速存储器),或者SRAM(静态存储器)。
●说话人确认。RSC4128也支持Sensry的是说话人确认(SV)技术—市场上最成功的计量生物学。发言人在片上训练一个特殊的字或者词组之后,芯片就能够识别一个特定的单词是否是最初的发言人说出的。RSC4128可以储藏10个说话人确认(SV)模板在芯片内,也可以使用外在的可编程存储器存储10 个以上。
●语言和音乐合成。
●录音和重放功能。

3 系统硬件示意图
智能电话远程控制系统接收远端发送来的DTMF信号,并对其进行解码,解码后的信号再由中央处理单元采集处理;为了方便用户使用,本系统设计了语音提示和语音识别密码;由于该系统一般工作在无人值守环境,所以应具有振铃检测和模拟摘挂机功能;为了符合智能化要求,系统采用AT89C51作为中央处理器。同时,电话远程控制系统正常工作还需电源供电电路、驱动电路等辅助电路。智能电话远程控制系统的硬件结构示意图如图3所示。





图3 智能电话远程控制系统


可以看出,系统主要由DTMF音频解码电路、语音识别电路、模拟摘挂机电路、中央处理单元、驱动电路、电源电路等组成。

4 语音密码检测部分
4.1 语音密码检测原理
现在有很多类似的系统采用采用了密码电路,也就是为了防止其他人对电器进行误操作或者恶意破坏。本系统采用的是语音识别密码,也就是应用RSC4128的第二个功能—说话人确认功能—在发言人在片上训练一个特殊的字或者词组之后,芯片就能够识别一个特定的单词是否是最初的发言人说出的。RSC4128可以储藏10个说话人确认(SV)模板在芯片内,也可以使用外在的可编程存储器存储10个以上。语音密码用作用户遥控应答机的用户密码,具有较强的安全性,而且比一般的拨号密码简便,而且保密性强,可靠性更高。家里的主人也许有几个,这个时候可以将每个人的语音记录下来,作为训练模板,只有符合要求的发言者才能够对这个系统进行控制。现在来看看这个语音识别系统,如图4所示:





图4 语音识别系统模块


语音识别模块通过SHS、DATA、MHS三线与主机相连,采用三线同步串行通讯方式。对于语音识别模块而言,SHS是输出、MHS是输入、DATA是双向输入输出线。
附表详细描述了控制部分和语音模块间的数据传送。

附表 控制部分和语音模块间的数据传送





4.2 数据传送时序
数据传送以位为基础,传送一位数据的握手协议详述如下。
(1) 当MCPU要向SCPU传送数据时,先将数据放在数据线DATA上,当确信SHS线处于高电平时,将MHS置0请求发送数据。
(2) SCPU检测到MHS为低时,读DATA上的数据,置SHS为低表明已接收数据。
(3) MCPU检测到SHS为低时,置MHS为高,表明此时DATA上的数据不再有效,同时置DATA为高。
(4) 然后SCPU置SHS为高,指示一个周期结束。双方准备传送下一位。
语音模块在接收到命令包的最后一位后仍保持忙状态(SHS=0),直到命令完成、语音模块准备返回执行结果为止。在这段时间,比较耗时的命令可通过电话机控制芯片在MHS上发送一个低脉冲来中断命令的执行。
当语音模块要向电话机控制芯片传送数据时,遵循同样的过程,但先要置SHS为低。协议是完全对称的,先置其HS为低的处理器是发送端,另一端是接收端。
数据传送总是以8位为一字节,每字节各个位的传送顺序为先高后低。
按惯例,从机(语音模块)不主动向主机(电话机控制芯片)发送命令,只有在接收到来自电话机控制芯片的请求命令之后才会向电话机发送命令。


5 系统工作流程图
系统工作流程图参见图5。





图5 系统工作流程图


当系统被呼叫时,电话交换机发出铃流信号。振铃为25±3V的正弦波,失真小于10%,电压有效值为90±15V。振铃信号以5s为周期,即1s送,4s断。由于振铃信号电压比较高,所以先要通过极性保护电路处理成标准的方波信号。该信号可以直接输出至单片机的定时器1进行计数,以实现对铃流的检测。
由于程控电话交换机在电话摘机时电话线回路电流会突然变大(约30mA),因此,交换机检测到回路电流变大就认为电话机已经摘机。自动摘挂机电路可以通过单片机控制一个继电器的开关,继电器的控制端连接一个大约300Ω的电阻接入电话线两端,从而完成模拟摘挂机。具体情况是当用户从异地打来电话,本装置接收到电话振铃音,开始计数。当电话铃声计到三次,装置自动摘机,回送提示音提示输入密


热门招聘
相关主题

官方公众号

智造工程师