申请/专利权人:谷歌有限责任公司
申请日:2018-04-16
公开(公告)日:2023-10-31
公开(公告)号:CN110998717B
主分类号:G10L15/22
分类号:G10L15/22;G10L15/00;G10L15/08;G10L15/26;G10L17/00
优先权:
专利状态码:有效-授权
法律状态:2023.10.31#授权;2020.05.05#实质审查的生效;2020.04.10#公开
摘要:确定用于通过用于与自动化助理交互的自动化助理接口接收的口头话语的语音识别的语言。实施方式可以实现与自动化助理的多语言交互,而不需要用户明确指明每个交互所使用的语言。实施方式确定对应于捕获口头话语的音频数据的用户简档,并且在确定用于口头话语的语音识别的语言时利用被指派给用户简档的语言和可选地对应概率。一些实施方式仅选择被指派给用户简档的语言的子集以用于用户的给定口头话语的语音识别。一些实施方式以被指派给用户简档的多个语言中的每一个执行语音识别,并且利用标准来适当地选择语音识别中的仅一个以用于生成和提供响应于口头话语的内容。
主权项:1.一种由一个或多个处理器实现的方法,所述方法包括:使用一个或多个声学模型处理音频数据,以监测被配置为调用自动化助理的调用短语的出现,其中所述音频数据是基于在客户端设备处对用户的口头输入的检测,所述客户端设备包括用于与所述自动化助理进行交互的自动化助理接口;基于使用所述一个或多个声学模型处理所述音频数据,检测在所述音频数据的部分中的所述调用短语的出现;基于使用所述一个或多个声学模型对所述音频数据的处理或使用一个或多个其他声学模型对所述音频数据的其他处理,确定包括所述调用短语的所述音频数据的所述部分对应于所述自动化助理可访问的用户简档;标识被指派给所述用户简档的语言;标识所述一个或多个场境参数与所述音频数据相关联;选择所述语言的语音识别模型,其中选择所述语言的所述语音识别模型是基于确定所述音频数据的所述部分对应于所述用户简档,并且基于标识被指派给所述用户简档的所述语言以及被指派给所述用户简档中的所述语言的至少一个概率是关联于被标识为与所述音频数据相关联的所述一个或多个场境参数,其中所述至少一个概率是基于与所述用户简档相关联的与所述自动化助理的先前交互,并且其中所述至少一个概率与一个或多个场境参数相关联;使用所选择的语音识别模型来处理在所述音频数据的所述部分之后的所述音频数据的后续部分;以及使所述自动化助理提供响应内容,所述响应内容是基于使用所选择的语音识别模型对所述后续部分进行处理而确定的。
全文数据:
权利要求:
百度查询: 谷歌有限责任公司 自动确定通过自动化助理接口接收的口头话语的语音识别的语言
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。