买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种机器人多轮对话语音交互方法、系统和终端设备_福州灵医科技有限公司_202011301188.5 

申请/专利权人:福州灵医科技有限公司

申请日:2020-11-19

公开(公告)日:2024-04-02

公开(公告)号:CN112435669B

主分类号:G10L15/26

分类号:G10L15/26;G10L25/63;G10L15/02;G10L25/51

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.03.19#实质审查的生效;2021.03.02#公开

摘要:本发明涉及语音处理技术领域,特别涉及一种机器人多轮对话语音交互方法、系统和终端设备。所述一种机器人多轮对话语音交互方法,包括步骤:终端设备接收语音数据,按帧读取语音数据;若存在连续多帧有效声音,若连续多帧有效声音的持续时间大于最大预设说话时间阈值,若用户停顿时间大于最小预设停顿时间且小于最大预设停顿时间,则进行语音识别,若用户停顿时间大于最大预设停顿时间,则分析得用户意图,根据所述用户意图播放目标音频文件。本方案中的处理方式可以使得处理效率大大提高,用户可以很快听到终端设备的回复,将大大提高互动效率,且当是有效声音的时候才发送给语音识别系统,亦可大大节约语音识别成本。

主权项:1.一种机器人多轮对话语音交互方法,其特征在于,包括步骤:终端设备接收语音数据,按帧读取所述语音数据,判断每帧语音数据是否为有效声音;若为有效声音,则持续收集有效声音帧,判断在最大预设说话时间阈值内是否遇到静音帧,若遇到静音帧,则当遇到所述静音帧时,判断用户停顿时间是否大于等于最小预设停顿时间,若用户停顿时间大于等于最小预设停顿时间,则判定为逗号短句,并判断所述静音帧前的有效声音帧的持续时间是否大于等于最小预设说话时间阈值,若大于等于最小说话时间阈值,则发送所述有效声音帧的语音数据至语音识别系统进行语音识别;若在最大预设说话时间阈值内未遇到静音帧,则当超过最大预设说话时间阈值时,则判定为句号短句,直接发送所述有效声音帧的语音数据至语音识别系统进行语音识别;语音识别系统根据语音识别得语义内容,并发送所述语义内容至终端设备;所述终端设备根据预设知识图谱对所述语义内容进行分析得用户意图,根据所述用户意图播放目标音频文件;还包括步骤:交互完后,对整个交互过程中的用户语音数据进行处理,提取结构化数据;所述结构化数据包括从所述用户语音数据中提取到的特定词汇;所述特定词汇包括“嗯”、“好的”、“谢谢提醒”、“已经收到”中的任一项或多项;对所述结构化数据进行分析,进而将所述结构化数据进行类别划分,所述类别划分包括:通知类,所述通知类用于指示用户收到通知。

全文数据:

权利要求:

百度查询: 福州灵医科技有限公司 一种机器人多轮对话语音交互方法、系统和终端设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。