【发明授权】语音控制装置和语音控制方法_威盛电子股份有限公司_201610839908.0

导航：龙图腾网> 最新专利技术> 语音控制装置和语音控制方法_威盛电子股份有限公司_201610839908.0

申请/专利权人：威盛电子股份有限公司

申请日：2012-11-27

公开（公告）日：2020-06-30

公开（公告）号：CN106981290B

主分类号：G10L15/22(20060101)

分类号：G10L15/22(20060101);G06F1/3203(20190101);G06F1/3231(20190101)

优先权：

专利状态码：有效-授权

法律状态：2020.06.30#授权;2017.08.18#实质审查的生效;2017.07.25#公开

摘要：一种语音控制装置和语音控制方法。该语音控制装置包括：声音采集器，采集声音信号；声音转换器，耦接声音采集器，将声音信号从模拟信号转换为数字信号；语音识别器，耦接声音转换器，自声音信号识别输入语音信号，进行输入语音信号和预设语音信号的第一次比对，当第一次对比指示输入语音信号符合预设语音信号时，产生唤醒信号；以及中央处理单元，耦接声音转换器和语音识别器，当接收唤醒信号时，自第一睡眠状态进入第一工作状态，进行输入语音信号和预设语音信号的第二次比对，如果第二次对比指示输入语音信号符合预设语音信号，则接管来自声音采集器和声音转换器的语音输入，否则重新进入第一睡眠状态。

主权项：1.一种语音控制装置，包括：一声音采集器，采集一声音信号；一声音转换器，耦接该声音采集器，将该声音信号从模拟信号转换为数字信号；一语音识别器，耦接该声音转换器，自该声音信号识别一输入语音信号，进行该输入语音信号和一预设语音信号的第一次比对，当该第一次比对指示该输入语音信号符合该预设语音信号时，产生一唤醒信号；以及一中央处理单元，耦接该声音转换器和该语音识别器，当接收该唤醒信号时，自一第一睡眠状态进入一第一工作状态，进行该输入语音信号和该预设语音信号的第二次比对，如果该第二次比对指示该输入语音信号符合该预设语音信号，则接管来自该声音采集器和该声音转换器的语音输入，否则重新进入该第一睡眠状态，其中，该中央处理单元的该第一睡眠状态的能量消耗很低，且该中央处理单元具有较高的运算能力，可以准确对比该输入语音信号和该预设语音信号，以降低错误识别率。

全文数据：语音控制装置和语音控制方法[0001]本案是申请日为2012年11月27日、申请号为201210491178.1、发明名称为“语音控制装置和语音控制方法”的发明专利申请的分案申请。技术领域[0002]本发明涉及一种语音控制装置和语音控制方法，特别是涉及使用预设的短语唤醒语音控制装置的方法。背景技术[0003]目前，越来越多的电子装置开始使用语音控制。语音控制今后将成为大多数电子装置常用的使用者界面。[0004]但是，对于使用电池的移动电子装置来说，语音引擎的能耗是很高的。让系统的语音引擎一直处于运行状态，将快速地消耗系统的电能。因此目前的移动电子装置均使用按键或类似的机制来触发语音引擎。[0005]既然是语音控制，还需要用手来按一下按钮开始，对使用者来说很不方便。如果一直启动语音引擎，又会导致不必要的能量消耗。发明内容[0006]本发明提供一种语音控制装置和语音控制方法，可方便地启动语音功能，而且平时可保持低功耗，以解决语音引擎的启动和能源消耗的矛盾。[0007]本发明提出一种语音控制装置，包括声音采集器、声音转换器、语音识别器、以及中央处理单元CPU:centralprocessingunit。声音采集器采集第一声音信号。声音转换器親接声音采集器，将第一声音信号从模拟信号转换为数字信号。语音识别器親接声音转换器，自第一声音信号识别第一语音信号，进行第一语音信号和第二语音信号的第一次比对，并根据上述第一次比对产生唤醒信号。中央处理单元耦接声音转换器和语音识别器，当接收唤醒信号时，自睡眠状态进入工作状态，进行第一语音信号和第二语音信号的第二次比对，并根据上述第二次比对接管来自声音采集器和声音转换器的语音输入。[0008]本发明另提出一种语音控制方法，用于语音控制装置，上述的语音控制方法包括下列步骤:采集第一声音信号；自第一声音信号识别第一语音信号;进行第一语音信号和第二语音信号的第一次比对，并根据上述第一次比对产生唤醒信号。回应上述唤醒信号，上述语音控制装置的中央处理单元自睡眠状态进入工作状态，进行第一语音信号和第二语音信号的第二次比对，并根据上述第二次比对接管语音控制装置的语音输[0009]为使本发明的上述特征和优点能更明显易懂，下文特举实施例，并结合附图详细说明如下。附图说明[0010]图1是依照本发明一实施例的一种语音控制装置的示意图。[0011]图2A是依照本发明一实施例的一种语音控制方法的流程图。[0012]图2B绘示图1的语音控制装置对应图2A的方法流程的信号传送流程。[0013]图3A是依照本发明一实施例的一种语音控制方法的流程图。[0014]图3B绘示图1的语音控制装置对应图3A的方法流程的信号传送流程。[0015]附图符号说明[0016]100:语音控制装置[0017]110:声音采集器[0018]120:声音转换器[0019]130:语音识别器[0020]140:中央处理单元[0021]210〜230、305〜375:方法步骤具体实施方式[0022]图1是依照本发明一实施例的一种语音控制装置100的示意图。语音控制装置100可以是任何移动终端，比如移动电话、个人数字助理PDA:personaldigitalassistant、平板计算机tabletcomputer、笔记型计算机notebookcomputer、也可为桌上型计算机之类的任何一种可用语音控制的电子装置。语音控制装置100包括声音采集器110、声音转换器120、语音识别器130、以及中央处理单元140。其中声音转换器120耦接声音采集器110,语音识别器130耦接声音转换器120,中央处理单元140耦接声音转换器120和语音识别器130。[0023]本实施例的语音控制装置1〇〇可藉由预设的语音启动其语音控制功能。简单的说，声音采集器110采集周遭环境的所有声音，包括使用者发出的声音，输出采集所得的声音信号。声音采集器110可以是麦克风microphone或类似的收音装置。声音转换器120将上述声音信号从模拟信号转换为数字信号。语音识别器130和中央处理单元140比对上述的声音信号和预设的另一个声音信号，以决定是否启动语音控制装置100的语音控制功能。[0024]图2A是依照本发明一实施例的一种语音控制方法的流程图，此方法是关于如何设置用来启动语音控制装置100的预设语音，此方法可由语音控制装置100执行。图2B绘示语音控制装置100对应图2A的方法流程的信号传送流程。[0025]上述的预设语音通常是一个短词或短句，例如简短的口令或密码。或者也可以给语音控制装置100起一个名字，用这个名字做为上述的预设语音。使用者说出这个预设语音之后，在步骤210，声音采集器110采集声音信号，声音转换器120将此声音信号从模拟信号转换为数字信号。声音转换器120也可放大此声音信号。这个声音信号包括来自使用者的语音和周遭环境的杂音。中央处理单元140在步骤220自此声音信号识别来自使用者的预设语音信号（以下称为VSD。然后在步骤230中央处理单元140自预设语音信号VSD提取其预设语音特征（以下称为VCD。中央处理单元140可储存预设语音信号VSD和预设预设语音特征VCD。中央处理单元140也可将预设语音信号VSD传送至语音识别器130,以供语音识别器130储存。预设语音信号VSD就是用来启动语音控制装置1〇〇的预设语音。[0026]图3A是依照本发明一实施例的一种语音控制方法的流程图，此方法是关于上述的预设语音的比对，此方法可由语音控制装置100执行。图3B绘示语音控制装置100对应图3A的方法流程的信号传送流程。[0027]首先，在步骤305，语音控制装置100处于初始状态，也就是中央处理单元140处于睡眠状态，不处理语音输入，由处于工作状态的语音识别器13〇处理语音输入。中央处理单元140具有工作状态和睡眠状态，语音识别器130也具有工作状态和睡眠状态。工作状态是指正常工作的状态，有正常的能量消耗。睡眠状态是指不工作而等待被唤醒的状态，此时的能量消耗非常低。[0028]接下来，声音采集器110在步骤310采集声音信号。声音转换器120可将此声音信号从模拟信号转换为数字信号。声音转换器120也可以放大此声音信号。这个声音信号包括来自使用者的语音和周遭环境的杂音。语音识别器130在步骤315自此声音信号识别来自使用者的输入语音信号（以下称为VSI。[0029]接下来，语音识别器130在步骤320进行输入语音信号VSI和预设语音信号VSD的第一次比对，在步骤325判断这两个语音信号是否符合。如果输入语音信号VSI不符合预设语音信号VSD，流程返回步骤305。如果输入语音信号VSI符合预设语音信号VSD，则语音识别器130在步骤330产生一个唤醒信号以唤醒中央处理单元140。[0030]中央处理单元140在步骤335接收唤醒信号，在步骤340自睡眠状态进入工作状态。中央处理单元140自语音识别器130接收输入语音信号VSI，然后在步骤345至365进行输入语音信号VSI和预设语音信号VSD的第二次比对。中央处理单元140在步骤345比对输入语音信号VSI和预设语音信号VSD，在步骤350判断这两个语音信号是否符合。如果输入语音信号VSI不符合预设语音信号VSD，则中央处理单元140重新进入睡眠状态，流程返回步骤305。如果输入语音信号VSI符合预设语音信号VSD，则中央处理单元140在步骤355自输入语音信号VSI提取其输入语音特征（以下称为VCI，在步骤360比对输入语音特征VCI和预设语音特征VCD，然后在步骤365判断这两组语音特征是否符合。如果输入语音特征VCI不符合预设语音特征VCD，则中央处理单元140重新进入睡眠状态，流程返回步骤305。如果输入语音特征VCI符合预设语音特征VCD，则中央处理单元140在步骤370接管语音控制装置100的语音输入，也就是来自声音采集器110和声音转换器120的语音输入。语音识别器130在此时自工作状态进入睡眠状态。[0031]中央处理单元140执行语音控制装置100的语音引擎，所以步骤370就是启动语音控制装置100的语音引擎和语音控制功能。[0032]接下来，中央处理单元140在步骤375检查是否中央处理单元140在进入工作状态之后的一段预设时间内未自上述的语音输入识别出任何语音信号。如果中央处理器140有在预设时间内识别出语音信号，则流程返回步骤370。如果中央处理器140没有在预设时间内识别出任何语音信号，表示使用者没有在预设时间内发出任何语音指令，则中央处理单元140重新进入睡眠状态，而语音识别器130则重新进入工作状态，流程返回步骤305。[0033]在本实施例中，语音识别器1：30和中央处理单元140各进行一次输入语音信号VSI和预设语音信号VSD的比对。因为语音识别器130是超低功耗的低成本电路，上述比对的错误识别率高于中央处理单元140。而且声音采集器110必须连续不断地采集声音信号，所以语音识别器130必须自连续不断的声音信号中识别来自使用者的语音，这会进一步提高语音识别器130的错误识别率。所以本实施例在语音识别器130的初次比对之后，让中央处理单元140再次确认。中央处理单元140具有较高的运算能力，可使用更准确的演算法来比对输入语音信号VSI和预设语音信号VSD，以降低错误识别率。[0034]在本实施例中，语音信号的比对是为了确认使用者说出正确的预设语音，语音特征的比对则是为了确认使用者的身份，因为每个人的语音特征各不相同。比对语音特征可限制只有特定的使用者能启动语音控制装置100的语音引擎。如果不需要限制使用者身份，则可省略图2A的步骤230和图3A的步骤355至365，在此情况下，如果步骤350的结果为符合，则流程直接进入步骤370。[0035]语音识别器130就是一个简化版的低功耗语音识别引擎，专门识别一个可预设的简短语音，当识别到这个预设语音时，启动中央处理单元14〇所执行的正规语音引擎。语音识别器13〇只需要做单独一个简短语音的发音匹配,不需要声学词典和语言模型，因此规模与功耗远小于正规的语音识别引擎。这样，即可以达到很低的待机功耗，又让使用者可以直接用语音来启动语音控制，使语音控制装置更好用，更方便。因此，以上实施例可解决语音引擎的启动和能源消耗的矛盾。[0036]4虽然本发明已以实施例揭示如上，然其并非用以限定本发明，本领域的技术人员，在不脱离本发明的精神和范围的前提下，可作若干的更动与润饰，故本发明的保护范围是以本发明的权利要求为准。

权利要求：1.一种语音控制装置，包括：一声音米集器，采集一声音信号；一声音转换器，耦接该声音采集器，将该声音信号从模拟信号转换为数字信号；一语音识别器，耦接该声音转换器，自该声音信号识别一输入语音信号，进行该输入语音fg号和一预设语音伯号的第一次比对，当该第一次比对指示该输入语音信号符合该预设语音信号时，产生一唤醒信号；以及一中央处理单元，耦接该声音转换器和该语音识别器，当接收该唤醒信号时，自一第一睡眠状态进入一第一工作状态，进行该输入语音信号和该预设语音信号的第二次比对，如果该第二次比对指示该输入语音信号符合该预设语音信号，则接管来自该声音采集器和该声音转换器的语音输入，否则重新进入该第一睡眠状态，其中，该中央处理单元的该第一睡眠状态的能量消耗很低，且该中央处理单元具有较高的运算能力，可以准确对比该输入语音信号和该预设语音信号，以降低错误识别率。2.如权利要求1所述的语音控制装置，其中该预设语音信号提前存储在该语音识别器中。3.如权利要求1所述的语音控制装置，其中该语音识别器为超低功耗的低成本电路。4.如权利要求2所述的语音控制装置，其中该中央处理单元自该预设语音信号提取一预设语音特征；当该中央处理单元进行该第二次比对，而且该第二次比对指示该第一语音信号符合该预设语音信号时，该中央处理单元自该输入语音信号提取一输入语音特征，并比对该输入语音特征和该预设语音特征；当该输入语音信号符合该预设语音信号而且该输入语音特征符合该预设语音特征时，该中央处理单元接管该语音输入；当该输入语音信号不符合该预设语音信号或该输入语音特征不符合该预设语音特征时，该中央处理单元重新进入该第一睡眠状态。5.如权利要求1所述的语音控制装置，其中当该中央处理单元接管该语音输入时，该语音识别器自一第二工作状态进入一第二睡眠状态。6.如权利要求5所述的语音控制装置，其中当该中央处理单元在进入该第一工作状态之后的一段预设时间内未自该语音输入识别出任何语音信号时，该中央处理单元重新进入该第一睡眠状态，而且该语音识别器重新进入该第二工作状态。7.—种语音控制方法，用于一语音控制装置，包括：采集一输入声音信号；自该输入声音信号识别一输入语音信号；进行该输入语音信号和一预设语音信号的第一次比对，当该第一次比对指示该输入语音信号符合该预设语音信号时，产生一唤醒信号；以及回应该唤醒信号，该语音控制装置的中央处理单元自一睡眠状态进入一工作状态，进行该输入语音信号和该预设语音信号的第二次比对，如果该第二次比对指示该输入语音信号符合该预设语音信号，则该中央处理单元接管来自该声音采集器和该声音转换器的语音输入，否则该中央处理单元重新进入该睡眠状态，其中，该中央处理单元的该第一睡眠状态的能量消耗很低，且该中央处理单元具有较局的运算能力，可以准确对比该输入语音信号和该预设语音信号，以降低错误识别率。8.如权利要求7所述的语音控制方法，还包括：采集一预设声音信号•，以及自该预设声音信号识别该预设语音信号。9.如权利要求8所述的语音控制方法，还包括：自该预设语音信号提取一预设语音特征；而且进行该第二次比对的步骤还包括：当该输入语音信号符合该预设语音信号时，自该输入语音信号提取一输入语音特征，并比对该输入语音特征和该预设语音特征；n'’当该输入语音信号符合该预设语音信号而且该输入语音特征符合该预设语音特征时，该中央处理单元接管该语音输入;以及^当该输入语音信号不符合该预设语音信号或该输入语音特征不符合该预设语音特征时，该中央处理单元重新进入该睡眠状态。10.如权利要求7所述的语音控制方法，还包括：当该中央处理单元在进入该工作状态之后的一段预设时间内未自该语音输入识别出任何语音信号时，该中央处理单元重新进入该睡眠状态。

百度查询：威盛电子股份有限公司语音控制装置和语音控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：上行传输方法、终端、网络设备、装置和存储介质_大唐移动通信设备有限公司_202211216179.5

下一篇：主动侧倾车辆安全冗余机制及侧倾运动断电锁止装置_北京坐骑科技有限公司_202310030092.7

相关技术

上行传输方法、终端、网络设备、装置和存储介质_大唐移动通信设备有限公司_202211216179.5

主动侧倾车辆安全冗余机制及侧倾运动断电锁止装置_北京坐骑科技有限公司_202310030092.7

一种铅钙锡铜合金、制备方法、正极板栅及铅酸蓄电池_安徽力普拉斯电源技术有限公司_202311837568.4

一种智慧考场监控系统及方法_中核国电漳州能源有限公司_202311791602.9

一种基于TiDB分布式集群的环境管理系统及方法_天翼云科技有限公司_202311645510.X

包括片上电阻器的半导体器件和校准片上电阻器的方法_爱思开海力士有限公司_202310572178.2

一种使用虚拟私有网络的云平台安全接入方法_天翼云科技有限公司_202311710330.5

一种用于航天器热控系统的自动化压胶装置_吉天星舟(长春)航天科技有限公司_202311569593.9

一种节能环保的牛仔服装水洗用污水处理工艺技术_广东省先进科学技术研究院_202211634006.5

车辆转向方法、装置、整车控制器、存储介质及车辆_毫末智行科技有限公司_202211215638.8

一种智能密集型母线槽插接箱_纳图(镇江)母线有限公司_202311829316.7

一种用于测量斜视合并屈光不正患者的三棱镜装置及方法_深圳爱尔眼科医院_202311604419.3

控制相关技术

控制装置、控制方法、以及存储介质_本田技研工业株式会社_201980094174.X

车辆控制系统和控制方法_现代自动车株式会社_202310192681.5

通信控制装置和通信控制方法_索尼公司_201980054543.2

控制盒_东风汽车股份有限公司_202311739187.2

控制装置_丰田自动车株式会社_202311272255.9

控制装置_株式会社电装_202010229662.1

线控制动系统的控制方法、可读存储介质、控制器和车辆_菲格智能科技有限公司_202210346378.1

线控制动模块，用于其的控制方法以及线控制动系统_罗伯特·博世有限公司_202311787506.7

线控制动模块、线控制动系统和用于其的控制方法_罗伯特·博世有限公司_202311785168.3

基于模型预测控制的立磨控制系统及控制方法_浙大城市学院_202410035023.X

语音相关技术

语音线控器的控制方法、语音线控器及存储介质_广东美的制冷设备有限公司_202211215631.6

一种多点语音通信装置及语音通信方法_洛阳普凡电气自动化有限公司_202410067350.3

语音识别模型的训练方法、语音识别方法及相关设备_科大讯飞股份有限公司_202311728223.5

语音交互模型的训练方法、语音交互方法及装置_北京百度网讯科技有限公司_202110931751.5

语音识别模型的训练方法、语音交互方法及装置_北京百度网讯科技有限公司_202110932773.3

语音合成模型训练方法、语音合成方法和装置_北京地平线机器人技术研发有限公司_201911096995.5

语音线控器的降温方法、语音线控器、空调器及存储介质_广东美的制冷设备有限公司_202211212262.5

一种智能语音识别装置_北京天下同网科技有限公司_202322547124.9

语音识别方法和装置_三星电子株式会社_201780078456.1

车载多人实时智能语音交互系统_南京龙垣信息科技有限公司_202410160194.5

方法相关技术

蚀刻方法_东京毅力科创株式会社_201910054586.2

加密方法_沃尔夫冈·弗拉托_202280053620.4

工艺方法_北京北方华创微电子装备有限公司_202211212212.7

清洗方法_富泰华工业(深圳)有限公司_202410069555.5

密钥生成方法、签名的生成方法、签名的验证方法和装置_中国建设银行股份有限公司_202410002859.X

测量参数集的确定方法及装置、验证方法及故障诊断方法_中国核电工程有限公司_202110244931.6

样本流场数据生成方法、模型训练方法、流场重建方法_北京百度网讯科技有限公司_202311755670.X

基于深度学习方法和传统方法结合的火灾检测方法_东北林业大学_202410009061.8

身份识别模型训练方法、测试方法、识别方法及装置_北京中科虹霸科技有限公司_202010883587.0

会话建立方法、中继设备的选择方法和注册方法及设备_华为技术有限公司_202410063202.4

龙图腾网&IPTOP

【发明授权】语音控制装置和语音控制方法_威盛电子股份有限公司_201610839908.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务