作为AI(人工智能)重要应用领域的智能语音技术,已经在我们的日常生活中得到普遍应用,从手机里的智能语音助手,到能查询歌曲、甚至能控制家电的智能音箱,再到现在商场、医院中能与人亲切对话的机器人,语音技术的发展已经十分成熟。
语音技术是智能系统中的重要环节。在智能制造、智慧城市、应急指挥等领域,一个系统能否实现语音交互,部分反映了它是否真的做到了智能智慧、方便高效。因此如何将语音技术无缝地集成到一个智能系统中,就成为了运营系统中智能化智慧化建设的过程中尤为关键的部分。
易控天地(INSPEC TNT)作为一款运营智能化平台(SOP平台),具有强大的开放性和扩展性,例如,其提供的C#高级语言编程,不同于常规SCADA平台支持的只能实现有限功能的脚本语言。在易控天地提供的高级语言编程环境中,内置了大量访问工程中对象属性的指令,用户不仅可以自由使用C#语言的所有指令,还可以直接调用工程中的各种对象。平台还支持自定义类和指令,引用数以万计的.Net Framework类库和第三方程序集。基于其如此强大的扩展性,易控天地对于包括智能语音在内的高级技术都可以做到快速、简便的融合,极大地拓宽了应用领域,在新型应用场景中具有出色的表现。
一、语音技术的核心功能
语音技术的主要目的是通过对自然语言的识别解析,让机器“能听会说”人类的语言。其核心功能包括:
1、语音唤醒
指定一个特定的词语作为唤醒词,当对系统输入的音频中包含唤醒词时,系统将按照设置的运行逻辑进入下一步的动作,比如等待命令、执行操作等。在此之前则不会识别或执行用户的每一句语音指令,从而避免正常交谈造成的误操作。
2、语音识别
语音识别是基于自然语言处理,将一段自然语言的音频转换为文本形式。语音识别还支持上传个性化的词汇列表,如联系人列表等,识别过程中系统就会在特定语境下将语音匹配为指定的词汇。
3、语音合成
语音合成是指将一段文字转化为语音播放出来,播放的人声并非是机械化的逐字朗读,而是合成的自然流畅的人声,并支持多语种、多方言和中英混合。对于合成的语音,还可以灵活配置音频参数,实现多样化的语音效果。
集成了语音技术的易控天地,可以实现使用语音指令来代替鼠标和键盘的指令输入,并且同样以语音的形式进行结果的输出。相较于传统的人机交互,语音技术使交互的过程变得更加简便、自然。正如在日常生活中使用语音技术实现信息的查询、指令的下达、收听预警提醒一样,在工业场景中,同样可以将这些人机语音交互的优势发挥出来。
二、易控天地中语音技术的应用场景
1、语音控制查询数据
在使用易控天地开发的系统中,系统在运行期间将会监听语音输入,一旦检测到含有唤醒关键词的语音,便会触发语音唤醒功能,系统会对唤醒关键词做出应答,并准备处理接下来捕获的语音。
当系统捕获到下一条指令语句后,就会对该语句进行语音识别,将其准确地转换为文字。接下来系统通过解析这一段文字,将用户关注的信息点提取出来,最终形成若干关键词,并按照这些关键词去执行数据查询。
执行查询后,系统把查询结果按照一定规则组合成语句,再使用语音合成技术,将语句转换为音频,并通过扬声器等设备播放出来。这一系列交互过程结束之后,系统便会恢复到监听语音的状态,再次等待语音唤醒。
在这个语音交互过程中,基于易控天地强大的开放性,用户可以使用编程功能自由地定义语义解析的规则,也可以任意设置语句合成的方式,整个过程灵活自由,解决了普遍存在的解析规则太过死板、实用性差的问题。
比如,当用户对系统说出设置的唤醒关键词“易控天地”后,系统会语音应答“您请讲”,同时准备处理用户接下来说的语句。之后用户说出“请帮我查询三层办公室空调的运行状态”,系统听到命令语句后,将其转写为文字,然后提取出其中关键词“三层办公室空调”和“运行状态”,再到变量数据库中搜索该变量的当前值,得到搜索结果“运行中”。此时,系统会将这一结果放到答复语句中,如“三层办公室空调的运行状态是‘运行中’”。最后通过语音合成技术将文字转化为自然人声进行播放。接下来,系统将会回到等待语音唤醒的状态。
上述操作流程可以用下图清晰地表现出来,可以看到,整个过程中使用者只需要自然地说两句话,就可以完成一次数据的查询,这种运行模式给用户带来了很好的使用体验。
利用语音技术进行数据和信息的查询是智慧城市相关监控系统和运营系统建设中最常用的功能之一。通过在智慧平台或智能设备中搭载语音技术,使人们不需要手动操作,就可以在路上、在小区里、在家中的任何地方,都能随时随地获取到需要的信息。
2、语音控执行操作
与上述过程类似,在语音听写的过程中,除了可以下达查询数据的指令外,还可以直接控制系统执行某个事件,如打开画面、操作设备等。
在语音听写的过程中,用户可以说出需要完成的指令,比如“关闭一号水泵阀门”,系统将语音转换为文本并进行解析,得到以下几个关键词:“关闭”、“一号水泵阀门”。接下来,系统会按照编写的运行逻辑找出“一号水泵阀门”这一变量点,并将其状态置为“关闭”。在易控天地中,对变量的操作将会自动下发到设备中,之后设备响应控制,实现关闭操作。
在操作完成后,系统恢复到等待语音唤醒的状态,同时在人机界面中也可以展示出操作的结果或者状态画面。
在上述操作过程中,如果配合易控天地的工程安全功能或用户定义的编程逻辑,还可以控制语音指令的触发条件,使系统受到完善的安全保护。比如为一个工业上的重要指令设置条件:只有某个权限的用户可以调用该指令;或者在发出命令后需要用户在执行前进行再次确认;或者需要其他用户审批后,才能完成最终指令的下发。
3、系统自动语音报警
易控天地的报警功能可以在运行过程中监控重点关注的对象,当指定变量的数值达到了预先设定的临界条件,或者工程运行过程中出现了特定的场景或状态时,系统将会产生消息记录。与语音技术相结合,就可以把这些消息记录通过自然语音的方式播报出来,从而达到及时警示的作用。
当系统检测到某个变量达到了报警值,或者某个事件被触发,就会产生一条消息记录,同时进一步触发系统逻辑,将报警信息组合成为自然语句,然后通过语音合成技术,将这个语句转化为人声进行播报。
除了在应急指挥过程中进行语音警示、调用应急预案、指挥操作外,语音报警还可以应用在更为广泛的语音提示和智能播报的场合中。在此基础上,更可以进一步结合易控天地的视频监控、地理信息等功能,实现一站式的监控报警解决方案。
易控天地对于语音技术的集成方案具有巨大的优势:使用简单、扩展性强、用户使用自由度高、减少对语音技术厂商的依赖,等等,帮助用户在智能化智慧化的运营系统中打造出事半功倍以智取胜的意境!
关注我们 了解更多易控软件资讯