申请/专利权人:VIDAA国际控股(荷兰)公司
申请日:2023-06-25
公开(公告)日:2024-04-02
公开(公告)号:CN117809641A
主分类号:G10L15/22
分类号:G10L15/22;G10L15/16
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.19#实质审查的生效;2024.04.02#公开
摘要:本申请提供一种终端设备及基于查询文本改写的语音交互方法,所述方法可以在获取到用户输入的查询语音后,识别查询语音中的查询文本,获取与查询文本关联的历史对话文本,并根据历史对话文本生成对话信息,其中,对话信息包括对话行为和意图。将查询文本和对话信息输入至查询改写模型,以根据查询改写模型的输出结果得到查询改写文本,并响应查询改写文本对应的语音控制指令,以执行相应的操作。所述方法为基于对话行为和上下文交互的查询文本检测改写方法,通过融合用户与系统对话过程中的多轮交互信息,实时预测当前查询文本是否需要改写,以及文本改写位置,提高语音交互成功率,提升用户交互体验。
主权项:1.一种终端设备,其特征在于,包括:声音采集器,用于采集查询语音;存储器,被配置为存储查询改写模型,所述查询改写模型为根据训练样本语料预训练获得的神经网络模型;控制器,被配置为:响应于用户输入的查询语音,识别所述查询语音中的查询文本;获取与所述查询文本关联的历史对话文本;根据所述历史对话文本生成对话信息,所述对话信息包括对话行为和意图;将所述查询文本和所述对话信息输入至所述查询改写模型,以根据所述查询改写模型的输出结果得到查询改写文本;响应所述查询改写文本对应的语音控制指令。
全文数据:
权利要求:
百度查询: VIDAA国际控股(荷兰)公司 一种终端设备及基于查询文本改写的语音交互方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。