申请/专利权人:哈曼国际工业有限公司
申请日:2023-08-17
公开(公告)日:2024-03-01
公开(公告)号:CN117636844A
主分类号:G10L15/02
分类号:G10L15/02;G10L15/04;G10L15/08;G10L15/22
优先权:["20220824 IN 202241048208"]
专利状态码:在审-公开
法律状态:2024.03.01#公开
摘要:所公开的实施方案包括用于处理虚拟个人助理的音频命令的技术。语音处理系统将在音频输入信号中检测到的语音分割成多个语音片段,其中给定语音片段中包括的语音是由单个说话者说出的。所述语音处理系统将多个语音片段中包括的语音片段聚类成多个聚类簇,其中多个聚类簇中包括的每个聚类簇是由不同的说话者说出的。所述语音处理系统确定多个聚类簇中包括的第一聚类簇是由第一授权说话者说出的。所述语音处理系统致使虚拟个人助理执行第一聚类簇中包括的第一音频命令。
主权项:1.一种用于处理虚拟个人助理的音频命令的计算机实施的方法,所述方法包括:将在音频输入信号中检测到的语音分割成多个语音片段,其中给定语音片段中包括的所述语音是由单个说话者说出的;将所述多个语音片段中包括的所述语音片段聚类成多个聚类簇,其中所述多个聚类簇中包括的每个聚类簇是由不同的说话者说出的;确定所述多个聚类簇中包括的第一聚类簇是由第一授权说话者说出的;以及致使所述第一聚类簇中包括的第一音频命令执行。
全文数据:
权利要求:
百度查询: 哈曼国际工业有限公司 用于处理虚拟个人助理的命令音频的方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。