买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】智能音箱及用于智能音箱的语音交互方法_OPPO广东移动通信有限公司_201811509311.5 

申请/专利权人:OPPO广东移动通信有限公司

申请日:2018-12-11

公开(公告)日:2021-02-12

公开(公告)号:CN109462794B

主分类号:H04R1/20(20060101)

分类号:H04R1/20(20060101);G10L15/22(20060101);G10L15/26(20060101);H04R3/00(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.02.12#授权;2019.04.05#实质审查的生效;2019.03.12#公开

摘要:本申请提出一种智能音箱及用于智能音箱的语音交互方法,其中,智能音箱包括:主设备,至少一个从设备。其中,主设备包括:第一通信模块,处理模块;至少一个从设备包括:麦克风模块,扬声器模块,第二通信模块。麦克风模块用于获取语音控制指令;处理模块用于根据语音控制指令生成语音反馈结果;扬声器模块用于播放语音反馈结果;第二通信模块用于向第一通信模块发送语音控制指令,以及接收语音反馈结果;第一通信模块用于接收语音控制指令,以及向第二通信模块发送语音反馈结果。由此,解决了相关技术中智能音箱受到距离和空间的限制的技术问题,便于智能音箱在多个房间内布局和使用。

主权项:1.一种智能音箱,其特征在于,包括:主设备,所述主设备包括:第一通信模块,处理模块,麦克风模块,扬声器模块;至少一个从设备,所述至少一个从设备包括:麦克风模块,扬声器模块,第二通信模块;其中,所述从设备的麦克风模块用于获取语音控制指令,并将所述语音控制指令发送至所述主设备的所述处理模块;所述处理模块用于根据所述语音控制指令生成语音反馈结果,并将所述语音反馈结果通过所述第一通信模块发送至所述从设备,其中,当所述语音控制指令包括歌曲名称时,所述语音反馈结果包括所述歌曲名称对应的歌曲音频;所述从设备的所述扬声器模块用于播放所述语音反馈结果;所述第一通信模块用于接收所述第二通信模块发送的所述语音控制指令,以及向所述第二通信模块发送所述语音反馈结果;所述第二通信模块用于向所述第一通信模块发送所述语音控制指令,以及接收所述第一通信模块发送的所述语音反馈结果;所述麦克风模块包括:麦克风阵列,用于采集声场的空间特性,根据所述声场的空间特性通过声源定位算法获取音源与所述麦克风阵列的相对位置;所述处理模块还用于根据所述相对位置确定所述音源与所述至少一个从设备的距离,以及确定距离最近的从设备为当前进行语音交互的目标从设备;所述主设备的麦克风模块用于获取语音控制指令;所述处理模块还用于根据所述语音控制指令确定标识信息,以及所述标识信息为主设备对应的标识时,将语音反馈结果发送至主设备的扬声器模块;所述主设备的扬声器模块用于播放语音反馈结果;所述第一通信模块用于向所述第二通信模块广播所述标识信息和所述语音反馈结果,以使所述从设备的扬声器模块在与所述标识信息匹配时,播放所述语音反馈结果。

全文数据:智能音箱及用于智能音箱的语音交互方法技术领域本申请涉及智能终端技术领域,尤其涉及一种智能音箱及用于智能音箱的语音交互方法。背景技术随着科技的发展,智能音箱逐渐进入人们的生活,为用户提供了更丰富多样的语音交互功能。目前,智能音箱在人们的家庭中也越来越常见。相关技术中,在家庭中使用智能音箱时,由于墙壁的隔离等距离和空间的限制,智能音箱无法拾取到其他房间的语音,导致用户需要在智能音箱附近使用智能音箱进行交互,十分不便。发明内容本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种智能音箱,通过设置至少一个从设备,使用户可以在远离智能音箱或隔音时使用智能音箱进行交互,解决了相关技术中智能音箱受到距离和空间的限制的技术问题,便于智能音箱在多个房间内布局和使用。本申请的另一个目的在于提出一种用于智能音箱的语音交互方法。本申请第一方面实施例提出了一种智能音箱,包括:主设备,所述主设备包括:第一通信模块,处理模块;至少一个从设备,所述至少一个从设备包括:麦克风模块,扬声器模块,第二通信模块;其中,所述麦克风模块用于获取语音控制指令;所述处理模块用于根据所述语音控制指令生成语音反馈结果;所述扬声器模块用于播放所述语音反馈结果;所述第一通信模块用于接收所述第二通信模块发送的所述语音控制指令,以及向所述第二通信模块发送所述语音反馈结果;所述第二通信模块用于向所述第一通信模块发送所述语音控制指令,以及接收所述第一通信模块发送的所述语音反馈结果。本申请实施例的智能音箱,通过至少一个从设备中的麦克风模块接收语音控制指令,进而将语音控制指令发送至主设备,由处理模块根据该语音控制指令生成语音反馈结果并发送至至少一个从设备,进一步通过扬声器模块播放该语音反馈结果。由此,通过在从设备中设置麦克风模块和扬声器模块,解决了相关技术中智能音箱受到距离和空间的限制的技术问题,使用户可以在远离智能音箱或隔音时使用智能音箱进行交互,便于智能音箱在多个房间内布局和使用。本申请第二方面实施例提出了一种用于智能音箱的语音交互方法,所述智能音箱包括:主设备,以及至少一个从设备,所述方法包括:接收所述从设备发送的语音控制指令,其中,所述语音控制指令是由所述从设备获取的;根据所述语音控制指令生成语音反馈结果;向所述从设备发送所述语音反馈结果,以使所述从设备播放所述语音反馈结果。本申请实施例的用于智能音箱的语音交互方法,通过至少一个从设备中接收语音控制指令,进而将语音控制指令发送至主设备,由主设备根据该语音控制指令生成语音反馈结果并发送至至少一个从设备,进一步通过从设备播放该语音反馈结果。由此,解决了相关技术中智能音箱受到距离和空间的限制的技术问题,使用户可以在远离智能音箱或隔音时使用智能音箱进行交互,便于智能音箱在多个房间内布局和使用。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例所提供的一种智能音箱的结构示意图;图2为本申请实施例所提供的另一种智能音箱的结构示意图;图3为本申请实施例所提供的一种应用场景示意图;图4为本申请实施例所提供的一种用于智能音箱的语音交互方法的流程示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的智能音箱及用于智能音箱的语音交互方法。图1为本申请实施例所提供的一种智能音箱的结构示意图,如图1所示,该智能音箱包括:主设备10,至少一个从设备20。其中,主设备10包括:第一通信模块11,处理模块12。至少一个从设备20包括:麦克风模块21,扬声器模块22,第二通信模块23。本申请实施例中,麦克风模块21用于获取语音控制指令。作为一种可能的实现方式,麦克风模块21可以包括电容麦克风、驻极体麦克风、动圈麦克风、铝带麦克风等,语音控制指令可以为语音信号。例如,以用户通过智能音箱点播歌曲为例,用户通过语音输入歌曲名称,从设备20通过麦克风模块21获取用户输入的歌曲名称作为语音控制指令。进而,通过第二通信模块23将该语音控制指令发送至主设备10,由主设备10中的第一通信模块11接收该语音控制指令。其中,第一通信模块11和第二通信模块23可以是无线通信模块,也可以是有线通信模块,此处不作限制。比如,主设备10与至少一个从设备20之间通过无线方式进行通信时,第一通信模块11和第二通信模块23可以为WiFiWIreless-Fidelity,无线保真模块。本申请实施例中,处理模块12用于根据语音控制指令生成语音反馈结果。作为一种示例,可以在处理模块12中预先设置音频处理、机器学习、自然语言处理等功能,进而,主设备10接收到语音控制指令时,通过处理模块12对该语音控制指令进行处理,并生成相应的语音反馈结果。其中,语音反馈结果的形式可以为语音信号。例如,语音控制指令为歌曲名称,处理模块12根据该语音控制指令获取歌曲名称信息,并根据主设备10本地预先存储的歌曲中调用相应的歌曲音频,作为语音反馈结果。进而,通过第一通信模块11将该语音反馈结果发送至从设备20,由从设备20中的第二通信模块23接收该语音反馈结果。本申请实施例中,扬声器模块22用于播放语音反馈结果。作为一种可能的实现方式,扬声器模块22包括但不限于电动式扬声器、电磁式扬声器、静电式扬声器或其他可以将电信号转换为声音信号的器件。作为一种示例,从设备20接收到歌曲音频时,通过扬声器模块22播放该歌曲。本申请实施例的智能音箱,通过至少一个从设备20中的麦克风模块21接收语音控制指令,进而将语音控制指令发送至主设备10,由处理模块12根据该语音控制指令生成语音反馈结果并发送至至少一个从设备20,进一步通过扬声器模块22播放该语音反馈结果。由此,通过在从设备中设置麦克风模块和扬声器模块,解决了相关技术中智能音箱受到距离和空间的限制的技术问题,使用户可以在远离智能音箱或隔音时使用智能音箱进行交互,便于智能音箱在多个房间内布局和使用。基于上述实施例,下面结合多个从设备的情况进行说明。图2为本申请实施例所提供的一种智能音箱的结构示意图,如图2所示,该智能音箱包括:主设备10,从设备20。其中,主设备10包括:第一通信模块11,处理模块12,麦克风模块13,扬声器模块14,联网模块15。从设备20包括:麦克风模块21,扬声器模块22,第二通信模块23。在本申请的一个实施例中,麦克风模块21包括麦克风阵列。作为一种可能的实现方式,当用户输入语音控制指令时,从设备20可以通过麦克风阵列采集声场的空间特性,进而通过相关声源定位算法获取音源的位置,例如可以获取音源与麦克风阵列的相对位置。其中,相关声源定位算法可以包括基于时延估计的算法、基于高分辨率谱估计的算法、基于稀疏表示的算法等。进而,各从设备20可以分别获取音源的位置,并可以通过第二通信模块23将音源的位置发送至主设备10,由处理模块12根据位置确定音源与各从设备的距离,以及确定距离最近的从设备为当前进行语音交互的目标从设备。可以理解,在实际应用中,可能存在从设备20之间距离较近的情况。例如,当用户通过其中一个从设备A输入语音控制指令时,附近的从设备B也可以接收到该语音控制指令,从设备A和B分别获取音源的位置并发送至主设备10,处理模块12获取从设备A与音源距离为1,从设备B与音源距离为2,进而确定从设备A为目标从设备。也就是说,可以通过检测音源位置获取音源与各从设备之间的距离,进而确定与音源距离最近的从设备为当前进行语音交互的目标从设备,并通过该目标从设备向主设备10发送语音控制指令,并接收主设备10发送的语音反馈结果进行播放。在本申请的一个实施例中,主设备10还包括:麦克风模块13,扬声器模块14。其中,麦克风模块13用于获取语音控制指令,扬声器模块14用于播放语音反馈结果。作为一种示例,用户可以通过主设备10输入语音控制指令,进而主设备10通过麦克风模块13获取语音控制指令,由处理模块12根据语音控制指令生成语音反馈结果,并通过扬声器模块14播放该语音反馈结果。需要说明的是,前述实施例对麦克风模块21、扬声器模块22的解释说明,同样适用于麦克风模块13、扬声器模块14,此处不再赘述。在本申请的一个实施例中,主设备10还包括:联网模块15。作为一种可能的实现方式,联网模块15用于将语音控制指令发送至云端服务器,以使云端服务器根据语音控制指令生成语音反馈结果,以及接收云端服务器发送的语音反馈结果。例如,在进行大数据语音识别时,可以通过联网模块15将语音控制指令发送至云端服务器,有云端服务器对该语音控制指令进行大数据语音识别处理,进而根据语音识别结果获取语音反馈结果。进一步,云端服务器将语音反馈结果发送至联网模块15。在本申请的一个实施例中,还可以预先设置设备标识,其中,设备标识可以与设备一一对应,设备标识的形式包括但不限于数字、字母、符号等。可选地,处理模块12还用于根据语音控制指令确定标识信息,第一通信模块11用于向第二通信模块23广播标识信息和语音反馈结果,以使扬声器模块22在与标识信息匹配时,播放语音反馈结果。作为一种示例,从设备A对应设备标识1,从设备B对应设备标识2,从设备A向主设备10发送语音控制指令时可以携带设备标识1,处理模块12根据语音控制指令确定标识信息,即确定设备标识为1,进而,第一通信模块11向各从设备的第二通信模块23广播设备标识1和语音反馈结果,从设备A和B分别对设备标识1进行匹配,从设备A匹配成功,并通过扬声器模块22播放语音反馈结果,从设备B匹配失败,不播放该语音反馈结果。作为另一种示例,从设备A对应设备标识1,从设备B对应设备标识2,从设备A向主设备10发送语音控制指令a时可以携带设备标识1,从设备B向主设备10发送语音控制指令b时携带设备标识2。处理模块12根据语音控制指令a和b分别生成语音反馈结果c和d,并确定标识信息。进而,第一通信模块11向各从设备的第二通信模块23广播设备标识1和语音反馈结果c,以及广播设备标识2和语音反馈结果d,从设备A和B分别对设备标识进行匹配。进一步,从设备A通过扬声器模块22播放语音反馈结果c,从设备B通过扬声器模块22播放语音反馈结果d。作为又一种示例,还可以预先设置主设备10对应的设备标识,进而,主设备10通过麦克风模块13接收语音控制指令时,处理模块12根据设备标识将相应的语音反馈结果发送至扬声器模块14进行播放。本申请实施例的智能音箱,通过对于一个智能音箱设置多个包括麦克风和扬声器的从设备,并确定与音源距离最近的从设备进行语音交互,以及根据标识确定播放语音反馈结果的从设备,保证了智能音箱语音交互功能的可靠性。图3为本申请实施例所提供的一种应用场景示意图。参照图3,主设备包括麦克风模块,扬声器模块,主处理器模块,无线收发模块,以及联网模块等。从设备包括麦克风模块,扬声器模块,以及无线收发模块等。例如,对于一个智能音箱设置多个包括麦克风和扬声器的从设备。可以确定与音源最近距离的麦克风接收语音控制指令,并通过无线网络传输到主设备,主设备处理后将反馈的语音信号通过无线网络传输到对应的从设备,从设备通过扬声器输出语音反馈,从而与用户形成交互。其中,用于音频处理,机器学习,自然语言处理等功能的处理器可以设置在主设备上,主设备可以通过联网模块和互联网相连,进行云端计算处理。可以理解,主设备和从设备1、2可以分别设置在不同位置,例如,用户在位置2输入语音控制指令时,主设备在位置1由于距离和空间限制无法获取语音控制指令,因此,可以通过从设备1获取语音控制指令,发送至主设备进行处理,以及获取并输出语音反馈,从而实现语音交互,解决了相关技术中智能音箱受到距离和空间的限制的技术问题,使用户可以在远离智能音箱或隔音时使用智能音箱进行交互,便于智能音箱在多个房间内布局和使用。基于上述实施例,本申请还提出一种用于智能音箱的语音交互方法。图4为本申请实施例所提供的一种用于智能音箱的语音交互方法的流程示意图,其中,智能音箱包括:主设备,以及至少一个从设备,如图4所示,该方法包括:步骤101,接收从设备发送的语音控制指令,其中,语音控制指令是由从设备获取的。本申请实施例中,执行主体为智能音箱主设备。步骤102,根据语音控制指令生成语音反馈结果。步骤103,向从设备发送语音反馈结果,以使从设备播放语音反馈结果。在本申请的一个实施例中,主设备还可以接收从设备发送的音源的位置,并根据位置确定音源与至少一个从设备的距离,以及确定距离最近的从设备为进行语音交互的目标从设备。在本申请的一个实施例中,还可以通过主设备获取语音控制指令,并根据语音控制指令生成语音反馈结果,进而通过主设备播放语音反馈结果。在本申请的一个实施例中,主设备在接收从设备发送的语音控制指令后,还可以根据语音控制指令确定标识信息。进而,主设备根据获取相应的语音反馈结果,向各从设备广播标识信息和语音反馈结果,以使从设备在与标识信息匹配时,播放语音反馈结果。需要说明的是,前述实施例对智能音箱的解释说明同样适用于本实施例的用于智能音箱的语音交互方法,此处不再赘述。本申请实施例的用于智能音箱的语音交互方法,通过至少一个从设备中接收语音控制指令,进而将语音控制指令发送至主设备,由主设备根据该语音控制指令生成语音反馈结果并发送至至少一个从设备,进一步通过从设备播放该语音反馈结果。由此,解决了相关技术中智能音箱受到距离和空间的限制的技术问题,使用户可以在远离智能音箱或隔音时使用智能音箱进行交互,便于智能音箱在多个房间内布局和使用。为了实现上述实施例,本申请还提出一种电子设备,包括处理器和存储器;其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述任一实施例所述的用于智能音箱的语音交互方法。为了实现上述实施例,本申请还提出一种计算机程序产品,当计算机程序产品中的指令被处理器执行时实现如前述任一实施例所述的用于智能音箱的语音交互方法。为了实现上述实施例,本申请还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述任一实施例所述的用于智能音箱的语音交互方法。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

权利要求:1.一种智能音箱,其特征在于,包括:主设备,所述主设备包括:第一通信模块,处理模块;至少一个从设备,所述至少一个从设备包括:麦克风模块,扬声器模块,第二通信模块;其中,所述麦克风模块用于获取语音控制指令;所述处理模块用于根据所述语音控制指令生成语音反馈结果;所述扬声器模块用于播放所述语音反馈结果;所述第一通信模块用于接收所述第二通信模块发送的所述语音控制指令,以及向所述第二通信模块发送所述语音反馈结果;所述第二通信模块用于向所述第一通信模块发送所述语音控制指令,以及接收所述第一通信模块发送的所述语音反馈结果。2.如权利要求1所述的智能音箱,其特征在于,所述麦克风模块包括:麦克风阵列,用于检测音源的位置;所述处理模块还用于根据所述位置确定所述音源与所述至少一个从设备的距离,以及确定距离最近的从设备为当前进行语音交互的目标从设备。3.如权利要求1所述的智能音箱,其特征在于,所述主设备还包括:麦克风模块,用于获取语音控制指令;扬声器模块,用于播放所述语音反馈结果。4.如权利要求1所述的智能音箱,其特征在于,所述主设备还包括:联网模块,用于将所述语音控制指令发送至服务器,以使所述服务器根据所述语音控制指令生成语音反馈结果,以及接收所述服务器发送的语音反馈结果。5.如权利要求1所述的智能音箱,其特征在于,所述处理模块还用于根据所述语音控制指令确定标识信息;所述第一通信模块用于向所述第二通信模块广播所述标识信息和所述语音反馈结果,以使所述扬声器模块在与所述标识信息匹配时,播放所述语音反馈结果。6.如权利要求1所述的智能音箱,其特征在于,所述第一通信模块和所述第二通信模块为无线通信模块。7.一种用于智能音箱的语音交互方法,其特征在于,所述智能音箱包括:主设备,以及至少一个从设备,所述方法包括:接收所述从设备发送的语音控制指令,其中,所述语音控制指令是由所述从设备获取的;根据所述语音控制指令生成语音反馈结果;向所述从设备发送所述语音反馈结果,以使所述从设备播放所述语音反馈结果。8.如权利要求7所述的用于智能音箱的语音交互方法,其特征在于,还包括:接收所述从设备发送的音源的位置;根据所述位置确定所述音源与所述至少一个从设备的距离,以及确定距离最近的从设备为进行语音交互的目标从设备。9.如权利要求7所述的用于智能音箱的语音交互方法,其特征在于,在根据所述语音控制指令生成语音反馈结果之前,还包括:获取语音控制指令;在根据所述语音控制指令生成语音反馈结果之后,还包括:播放所述语音反馈结果。10.如权利要求7所述的用于智能音箱的语音交互方法,其特征在于,在接收所述从设备发送的语音控制指令之后,还包括:根据所述语音控制指令确定标识信息;所述向所述从设备发送所述语音反馈结果,以使所述从设备播放所述语音反馈结果,包括:向各从设备广播所述标识信息和所述语音反馈结果,以使所述从设备在与所述标识信息匹配时,播放所述语音反馈结果。

百度查询: OPPO广东移动通信有限公司 智能音箱及用于智能音箱的语音交互方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。