【发明授权】发音插入错误检测方法、装置、电子设备及存储介质_广州视琨电子科技有限公司_202010789649.1

申请/专利权人：广州视琨电子科技有限公司

申请日：2020-08-07

公开（公告）日：2024-04-02

公开（公告）号：CN111862958B

主分类号：G10L15/08

分类号：G10L15/08;G10L15/02;G10L15/16;G10L25/60;G10L25/93

优先权：

专利状态码：有效-授权

法律状态：2024.04.02#授权;2020.11.17#实质审查的生效;2020.10.30#公开

摘要：本申请提供一种发音插入错误检测方法、装置、电子设备及存储介质。该方法包括：根据发音文本和待检测语音信号，获取待检测语音信号对应的第一音素序列及边界信息，待检测语音信号是针对发音文本的语音信号；根据第一音素序列中静音音素及边界信息，对静音音素构建包含预设混淆音素的候选路径的WFST对齐网络，预设混淆音素包括非静音音素和多读音素串；在WFST对齐网络中搜索待检测语音信号对应的第二音素序列；比较第一音素序列及第二音素序列的音素，确定第一音素序列中是否包含插入错误。本申请中的预设混淆音素包含多读音素串，还可检测出多音素插入的情况，从而提升插入错误识别率。

主权项：1.一种发音插入错误检测方法，其特征在于，包括：根据发音文本和待检测语音信号，获取所述待检测语音信号对应的第一音素序列及边界信息，所述待检测语音信号是针对所述发音文本的语音信号；根据所述第一音素序列中静音音素及边界信息，对所述静音音素构建包含预设混淆音素的候选路径的加权有限状态转移器WFST对齐网络，所述预设混淆音素包括非静音音素和多读音素串；在所述WFST对齐网络中搜索所述待检测语音信号对应的第二音素序列；比较所述第一音素序列及所述第二音素序列的音素，确定所述第一音素序列中是否包含插入错误；在所述WFST对齐网络中搜索所述待检测语音信号对应的第二音素序列，包括：基于所述待检测语音信号对应的声学分数和维特比算法，在所述WFST对齐网络中搜索最优路径，得到所述待检测语音信号对应的第二音素序列；所述根据发音文本和待检测语音信号，获取所述待检测语音信号对应的第一音素序列及边界信息，包括：根据所述发音文本，构建初始WFST对齐网络，其中，所述初始WFST对齐网络表示所述发音文本对应的音素的可能路径状态图；根据所述待检测语音信号和所述初始WFST对齐网络，获取所述待检测语音信号对应的第一音素序列及边界信息；所述比较所述第一音素序列及所述第二音素序列的音素，确定所述第一音素序列中是否包含插入错误，包括：若所述第二音素序列与所述第一音素序列的音素相同，则确定所述第一音素序列中不包含插入错误；若所述第二音素序列与所述第一音素序列的音素不同，则确定所述第一音素序列中包含插入错误。

全文数据：

权利要求：

百度查询：广州视琨电子科技有限公司发音插入错误检测方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

下一篇：磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

相关技术

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

龙图腾网&IPTOP

【发明授权】发音插入错误检测方法、装置、电子设备及存储介质_广州视琨电子科技有限公司_202010789649.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务