买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】语音控制装置和语音控制方法_威盛电子股份有限公司_201610839908.0 

申请/专利权人:威盛电子股份有限公司

申请日:2012-11-27

公开(公告)日:2020-06-30

公开(公告)号:CN106981290B

主分类号:G10L15/22(20060101)

分类号:G10L15/22(20060101);G06F1/3203(20190101);G06F1/3231(20190101)

优先权:

专利状态码:有效-授权

法律状态:2020.06.30#授权;2017.08.18#实质审查的生效;2017.07.25#公开

摘要:一种语音控制装置和语音控制方法。该语音控制装置包括:声音采集器,采集声音信号;声音转换器,耦接声音采集器,将声音信号从模拟信号转换为数字信号;语音识别器,耦接声音转换器,自声音信号识别输入语音信号,进行输入语音信号和预设语音信号的第一次比对,当第一次对比指示输入语音信号符合预设语音信号时,产生唤醒信号;以及中央处理单元,耦接声音转换器和语音识别器,当接收唤醒信号时,自第一睡眠状态进入第一工作状态,进行输入语音信号和预设语音信号的第二次比对,如果第二次对比指示输入语音信号符合预设语音信号,则接管来自声音采集器和声音转换器的语音输入,否则重新进入第一睡眠状态。

主权项:1.一种语音控制装置,包括:一声音采集器,采集一声音信号;一声音转换器,耦接该声音采集器,将该声音信号从模拟信号转换为数字信号;一语音识别器,耦接该声音转换器,自该声音信号识别一输入语音信号,进行该输入语音信号和一预设语音信号的第一次比对,当该第一次比对指示该输入语音信号符合该预设语音信号时,产生一唤醒信号;以及一中央处理单元,耦接该声音转换器和该语音识别器,当接收该唤醒信号时,自一第一睡眠状态进入一第一工作状态,进行该输入语音信号和该预设语音信号的第二次比对,如果该第二次比对指示该输入语音信号符合该预设语音信号,则接管来自该声音采集器和该声音转换器的语音输入,否则重新进入该第一睡眠状态,其中,该中央处理单元的该第一睡眠状态的能量消耗很低,且该中央处理单元具有较高的运算能力,可以准确对比该输入语音信号和该预设语音信号,以降低错误识别率。

全文数据:语音控制装置和语音控制方法[0001]本案是申请日为2012年11月27日、申请号为201210491178.1、发明名称为“语音控制装置和语音控制方法”的发明专利申请的分案申请。技术领域[0002]本发明涉及一种语音控制装置和语音控制方法,特别是涉及使用预设的短语唤醒语音控制装置的方法。背景技术[0003]目前,越来越多的电子装置开始使用语音控制。语音控制今后将成为大多数电子装置常用的使用者界面。[0004]但是,对于使用电池的移动电子装置来说,语音引擎的能耗是很高的。让系统的语音引擎一直处于运行状态,将快速地消耗系统的电能。因此目前的移动电子装置均使用按键或类似的机制来触发语音引擎。[0005]既然是语音控制,还需要用手来按一下按钮开始,对使用者来说很不方便。如果一直启动语音引擎,又会导致不必要的能量消耗。发明内容[0006]本发明提供一种语音控制装置和语音控制方法,可方便地启动语音功能,而且平时可保持低功耗,以解决语音引擎的启动和能源消耗的矛盾。[0007]本发明提出一种语音控制装置,包括声音采集器、声音转换器、语音识别器、以及中央处理单元CPU:centralprocessingunit。声音采集器采集第一声音信号。声音转换器親接声音采集器,将第一声音信号从模拟信号转换为数字信号。语音识别器親接声音转换器,自第一声音信号识别第一语音信号,进行第一语音信号和第二语音信号的第一次比对,并根据上述第一次比对产生唤醒信号。中央处理单元耦接声音转换器和语音识别器,当接收唤醒信号时,自睡眠状态进入工作状态,进行第一语音信号和第二语音信号的第二次比对,并根据上述第二次比对接管来自声音采集器和声音转换器的语音输入。[0008]本发明另提出一种语音控制方法,用于语音控制装置,上述的语音控制方法包括下列步骤:采集第一声音信号;自第一声音信号识别第一语音信号;进行第一语音信号和第二语音信号的第一次比对,并根据上述第一次比对产生唤醒信号。回应上述唤醒信号,上述语音控制装置的中央处理单元自睡眠状态进入工作状态,进行第一语音信号和第二语音信号的第二次比对,并根据上述第二次比对接管语音控制装置的语音输[0009]为使本发明的上述特征和优点能更明显易懂,下文特举实施例,并结合附图详细说明如下。附图说明[0010]图1是依照本发明一实施例的一种语音控制装置的示意图。[0011]图2A是依照本发明一实施例的一种语音控制方法的流程图。[0012]图2B绘示图1的语音控制装置对应图2A的方法流程的信号传送流程。[0013]图3A是依照本发明一实施例的一种语音控制方法的流程图。[0014]图3B绘示图1的语音控制装置对应图3A的方法流程的信号传送流程。[0015]附图符号说明[0016]100:语音控制装置[0017]110:声音采集器[0018]120:声音转换器[0019]130:语音识别器[0020]140:中央处理单元[0021]210〜230、305〜375:方法步骤具体实施方式[0022]图1是依照本发明一实施例的一种语音控制装置100的示意图。语音控制装置100可以是任何移动终端,比如移动电话、个人数字助理PDA:personaldigitalassistant、平板计算机tabletcomputer、笔记型计算机notebookcomputer、也可为桌上型计算机之类的任何一种可用语音控制的电子装置。语音控制装置100包括声音采集器110、声音转换器120、语音识别器130、以及中央处理单元140。其中声音转换器120耦接声音采集器110,语音识别器130耦接声音转换器120,中央处理单元140耦接声音转换器120和语音识别器130。[0023]本实施例的语音控制装置1〇〇可藉由预设的语音启动其语音控制功能。简单的说,声音采集器110采集周遭环境的所有声音,包括使用者发出的声音,输出采集所得的声音信号。声音采集器110可以是麦克风microphone或类似的收音装置。声音转换器120将上述声音信号从模拟信号转换为数字信号。语音识别器130和中央处理单元140比对上述的声音信号和预设的另一个声音信号,以决定是否启动语音控制装置100的语音控制功能。[0024]图2A是依照本发明一实施例的一种语音控制方法的流程图,此方法是关于如何设置用来启动语音控制装置100的预设语音,此方法可由语音控制装置100执行。图2B绘示语音控制装置100对应图2A的方法流程的信号传送流程。[0025]上述的预设语音通常是一个短词或短句,例如简短的口令或密码。或者也可以给语音控制装置100起一个名字,用这个名字做为上述的预设语音。使用者说出这个预设语音之后,在步骤210,声音采集器110采集声音信号,声音转换器120将此声音信号从模拟信号转换为数字信号。声音转换器120也可放大此声音信号。这个声音信号包括来自使用者的语音和周遭环境的杂音。中央处理单元140在步骤220自此声音信号识别来自使用者的预设语音信号(以下称为VSD。然后在步骤230中央处理单元140自预设语音信号VSD提取其预设语音特征(以下称为VCD。中央处理单元140可储存预设语音信号VSD和预设预设语音特征VCD。中央处理单元140也可将预设语音信号VSD传送至语音识别器130,以供语音识别器130储存。预设语音信号VSD就是用来启动语音控制装置1〇〇的预设语音。[0026]图3A是依照本发明一实施例的一种语音控制方法的流程图,此方法是关于上述的预设语音的比对,此方法可由语音控制装置100执行。图3B绘示语音控制装置100对应图3A的方法流程的信号传送流程。[0027]首先,在步骤305,语音控制装置100处于初始状态,也就是中央处理单元140处于睡眠状态,不处理语音输入,由处于工作状态的语音识别器13〇处理语音输入。中央处理单元140具有工作状态和睡眠状态,语音识别器130也具有工作状态和睡眠状态。工作状态是指正常工作的状态,有正常的能量消耗。睡眠状态是指不工作而等待被唤醒的状态,此时的能量消耗非常低。[0028]接下来,声音采集器110在步骤310采集声音信号。声音转换器120可将此声音信号从模拟信号转换为数字信号。声音转换器120也可以放大此声音信号。这个声音信号包括来自使用者的语音和周遭环境的杂音。语音识别器130在步骤315自此声音信号识别来自使用者的输入语音信号(以下称为VSI。[0029]接下来,语音识别器130在步骤320进行输入语音信号VSI和预设语音信号VSD的第一次比对,在步骤325判断这两个语音信号是否符合。如果输入语音信号VSI不符合预设语音信号VSD,流程返回步骤305。如果输入语音信号VSI符合预设语音信号VSD,则语音识别器130在步骤330产生一个唤醒信号以唤醒中央处理单元140。[0030]中央处理单元140在步骤335接收唤醒信号,在步骤340自睡眠状态进入工作状态。中央处理单元140自语音识别器130接收输入语音信号VSI,然后在步骤345至365进行输入语音信号VSI和预设语音信号VSD的第二次比对。中央处理单元140在步骤345比对输入语音信号VSI和预设语音信号VSD,在步骤350判断这两个语音信号是否符合。如果输入语音信号VSI不符合预设语音信号VSD,则中央处理单元140重新进入睡眠状态,流程返回步骤305。如果输入语音信号VSI符合预设语音信号VSD,则中央处理单元140在步骤355自输入语音信号VSI提取其输入语音特征(以下称为VCI,在步骤360比对输入语音特征VCI和预设语音特征VCD,然后在步骤365判断这两组语音特征是否符合。如果输入语音特征VCI不符合预设语音特征VCD,则中央处理单元140重新进入睡眠状态,流程返回步骤305。如果输入语音特征VCI符合预设语音特征VCD,则中央处理单元140在步骤370接管语音控制装置100的语音输入,也就是来自声音采集器110和声音转换器120的语音输入。语音识别器130在此时自工作状态进入睡眠状态。[0031]中央处理单元140执行语音控制装置100的语音引擎,所以步骤370就是启动语音控制装置100的语音引擎和语音控制功能。[0032]接下来,中央处理单元140在步骤375检查是否中央处理单元140在进入工作状态之后的一段预设时间内未自上述的语音输入识别出任何语音信号。如果中央处理器140有在预设时间内识别出语音信号,则流程返回步骤370。如果中央处理器140没有在预设时间内识别出任何语音信号,表示使用者没有在预设时间内发出任何语音指令,则中央处理单元140重新进入睡眠状态,而语音识别器130则重新进入工作状态,流程返回步骤305。[0033]在本实施例中,语音识别器1:30和中央处理单元140各进行一次输入语音信号VSI和预设语音信号VSD的比对。因为语音识别器130是超低功耗的低成本电路,上述比对的错误识别率高于中央处理单元140。而且声音采集器110必须连续不断地采集声音信号,所以语音识别器130必须自连续不断的声音信号中识别来自使用者的语音,这会进一步提高语音识别器130的错误识别率。所以本实施例在语音识别器130的初次比对之后,让中央处理单元140再次确认。中央处理单元140具有较高的运算能力,可使用更准确的演算法来比对输入语音信号VSI和预设语音信号VSD,以降低错误识别率。[0034]在本实施例中,语音信号的比对是为了确认使用者说出正确的预设语音,语音特征的比对则是为了确认使用者的身份,因为每个人的语音特征各不相同。比对语音特征可限制只有特定的使用者能启动语音控制装置100的语音引擎。如果不需要限制使用者身份,则可省略图2A的步骤230和图3A的步骤355至365,在此情况下,如果步骤350的结果为符合,则流程直接进入步骤370。[0035]语音识别器130就是一个简化版的低功耗语音识别引擎,专门识别一个可预设的简短语音,当识别到这个预设语音时,启动中央处理单元14〇所执行的正规语音引擎。语音识别器13〇只需要做单独一个简短语音的发音匹配,不需要声学词典和语言模型,因此规模与功耗远小于正规的语音识别引擎。这样,即可以达到很低的待机功耗,又让使用者可以直接用语音来启动语音控制,使语音控制装置更好用,更方便。因此,以上实施例可解决语音引擎的启动和能源消耗的矛盾。[0036]4虽然本发明已以实施例揭示如上,然其并非用以限定本发明,本领域的技术人员,在不脱离本发明的精神和范围的前提下,可作若干的更动与润饰,故本发明的保护范围是以本发明的权利要求为准。

权利要求:1.一种语音控制装置,包括:一声音米集器,采集一声音信号;一声音转换器,耦接该声音采集器,将该声音信号从模拟信号转换为数字信号;一语音识别器,耦接该声音转换器,自该声音信号识别一输入语音信号,进行该输入语音fg号和一预设语音伯号的第一次比对,当该第一次比对指示该输入语音信号符合该预设语音信号时,产生一唤醒信号;以及一中央处理单元,耦接该声音转换器和该语音识别器,当接收该唤醒信号时,自一第一睡眠状态进入一第一工作状态,进行该输入语音信号和该预设语音信号的第二次比对,如果该第二次比对指示该输入语音信号符合该预设语音信号,则接管来自该声音采集器和该声音转换器的语音输入,否则重新进入该第一睡眠状态,其中,该中央处理单元的该第一睡眠状态的能量消耗很低,且该中央处理单元具有较高的运算能力,可以准确对比该输入语音信号和该预设语音信号,以降低错误识别率。2.如权利要求1所述的语音控制装置,其中该预设语音信号提前存储在该语音识别器中。3.如权利要求1所述的语音控制装置,其中该语音识别器为超低功耗的低成本电路。4.如权利要求2所述的语音控制装置,其中该中央处理单元自该预设语音信号提取一预设语音特征;当该中央处理单元进行该第二次比对,而且该第二次比对指示该第一语音信号符合该预设语音信号时,该中央处理单元自该输入语音信号提取一输入语音特征,并比对该输入语音特征和该预设语音特征;当该输入语音信号符合该预设语音信号而且该输入语音特征符合该预设语音特征时,该中央处理单元接管该语音输入;当该输入语音信号不符合该预设语音信号或该输入语音特征不符合该预设语音特征时,该中央处理单元重新进入该第一睡眠状态。5.如权利要求1所述的语音控制装置,其中当该中央处理单元接管该语音输入时,该语音识别器自一第二工作状态进入一第二睡眠状态。6.如权利要求5所述的语音控制装置,其中当该中央处理单元在进入该第一工作状态之后的一段预设时间内未自该语音输入识别出任何语音信号时,该中央处理单元重新进入该第一睡眠状态,而且该语音识别器重新进入该第二工作状态。7.—种语音控制方法,用于一语音控制装置,包括:采集一输入声音信号;自该输入声音信号识别一输入语音信号;进行该输入语音信号和一预设语音信号的第一次比对,当该第一次比对指示该输入语音信号符合该预设语音信号时,产生一唤醒信号;以及回应该唤醒信号,该语音控制装置的中央处理单元自一睡眠状态进入一工作状态,进行该输入语音信号和该预设语音信号的第二次比对,如果该第二次比对指示该输入语音信号符合该预设语音信号,则该中央处理单元接管来自该声音采集器和该声音转换器的语音输入,否则该中央处理单元重新进入该睡眠状态,其中,该中央处理单元的该第一睡眠状态的能量消耗很低,且该中央处理单元具有较局的运算能力,可以准确对比该输入语音信号和该预设语音信号,以降低错误识别率。8.如权利要求7所述的语音控制方法,还包括:采集一预设声音信号•,以及自该预设声音信号识别该预设语音信号。9.如权利要求8所述的语音控制方法,还包括:自该预设语音信号提取一预设语音特征;而且进行该第二次比对的步骤还包括:当该输入语音信号符合该预设语音信号时,自该输入语音信号提取一输入语音特征,并比对该输入语音特征和该预设语音特征;n'’当该输入语音信号符合该预设语音信号而且该输入语音特征符合该预设语音特征时,该中央处理单元接管该语音输入;以及^当该输入语音信号不符合该预设语音信号或该输入语音特征不符合该预设语音特征时,该中央处理单元重新进入该睡眠状态。10.如权利要求7所述的语音控制方法,还包括:当该中央处理单元在进入该工作状态之后的一段预设时间内未自该语音输入识别出任何语音信号时,该中央处理单元重新进入该睡眠状态。

百度查询: 威盛电子股份有限公司 语音控制装置和语音控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。