买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】发音错误检测方法、装置、电子设备及存储介质_广州视琨电子科技有限公司_202010789667.X 

申请/专利权人:广州视琨电子科技有限公司

申请日:2020-08-07

公开(公告)日:2024-04-19

公开(公告)号:CN111862959B

主分类号:G10L15/08

分类号:G10L15/08;G10L15/02;G10L15/16;G10L25/60;G10L25/93

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2020.11.17#实质审查的生效;2020.10.30#公开

摘要:本申请提供一种发音错误检测方法、装置、电子设备及存储介质。该方法包括:根据发音文本和待检测语音信号,获取待检测语音信号对应的第一音素序列及边界信息,待检测语音信号是针对发音文本的语音信号;根据第一音素序列及边界信息,构建包含预设混淆音素的候选路径的WFST对齐网络;在WFST对齐网络中搜索待检测语音信号对应的第二音素序列;比较第一音素序列及第二音素序列的音素,确定第一音素序列中音素是否发音错误。本申请利用构建包含预设混淆音素的候选路径的WFST对齐网络与强制对齐还原出实际音素,减少解码搜索空间,从而加快发音检错的解码速度。

主权项:1.一种发音错误检测方法,其特征在于,包括:根据发音文本和待检测语音信号,获取所述待检测语音信号对应的第一音素序列及边界信息,所述待检测语音信号是针对所述发音文本的语音信号;其中,所述第一音素序列为所述待检测语音信号对应的发音音素;根据所述第一音素序列及边界信息,构建包含预设混淆音素的候选路径的加权有限状态转移器WFST对齐网络;在所述WFST对齐网络中搜索所述待检测语音信号对应的第二音素序列;其中,所述第二音素序列中的音素为实际发音音素;比较所述第一音素序列及所述第二音素序列的音素,确定所述第一音素序列中音素是否发音错误;所述根据所述第一音素序列及边界信息,构建包含预设混淆音素的候选路径的WFST对齐网络,包括:根据所述第一音素序列中非静音音素及边界信息,构建包含预设混淆音素的候选路径的WFST对齐网络,所述预设混淆音素为所述非静音音素对应的预设混淆音素。

全文数据:

权利要求:

百度查询: 广州视琨电子科技有限公司 发音错误检测方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。