【发明公布】一种基于视觉信息的粤语语音识别增强方法_湘潭大学_202210636176.0

导航：龙图腾网> 最新专利技术> 一种基于视觉信息的粤语语音识别增强方法_湘潭大学_202210636176.0

申请/专利权人：湘潭大学

申请日：2022-06-07

公开（公告）日：2022-09-06

公开（公告）号：CN115019772A

主分类号：G10L15/00

分类号：G10L15/00;G10L21/02;G10L15/16;H04N21/8547;G06V40/20;G06V20/40;G06V10/82;G06V10/80;G06N3/08;G06N3/04;G06K9/62;G06F40/289

优先权：

专利状态码：在审-实质审查的生效

法律状态：2022.09.23#实质审查的生效;2022.09.06#公开

摘要：本发明公开了一种基于视觉信息的粤语语音识别增强方法，步骤如下：S1、构建数据集；S2、数据处理；S3、使用算法对预处理过的数据进行训练，得到训练模型。S4、利用训练模型在不同语音环境下对识别效果同纯音频模型进行对比。本发明采用上述的一种基于视觉信息的粤语语音识别增强方法，通过提出一种基于多尺度时间卷积网络的端到端音视频增强网络，利用视觉信息对粤语语音识别增强，有效的提升了在复杂的语音环境下的粤语语音识别效果。

主权项：1.一种基于视觉信息的粤语语音识别增强方法，其特征在于，步骤如下：S1、构建数据集；S2、数据处理；S3、使用算法对预处理过的数据进行训练，得到训练模型；S4、利用训练模型在不同语音环境下对识别效果同纯音频模型进行对比。

全文数据：

权利要求：

百度查询：湘潭大学一种基于视觉信息的粤语语音识别增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种带有环状槽的齿轮制备模具_蓝山县金山川粉末冶金有限公司_202111384059.1

下一篇：用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

相关技术

一种带有环状槽的齿轮制备模具_蓝山县金山川粉末冶金有限公司_202111384059.1

用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

基于数字镜像的变电站自动化设备状态诊断方法和系统_北京四方继保工程技术有限公司_202210022507.1

一种处理DMS红外光反射导致亮斑的系统_钧捷智能(深圳)有限公司_202310101483.3

具有高吞吐量的多反射质谱仪_莱克公司_202011284023.1

一种基于动网格模拟隧道列车运动的结构网格划分方法_天津大学_202111426137.X

泌尿道菌群检测在女性泌尿道结石诊断中的应用_广东省科学院微生物研究所(广东省微生物分析检测中心)_202111500822.2

微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

一种防止带钢在精轧卷取中发生追尾的方法_首钢京唐钢铁联合有限责任公司_202210031884.1

一种多功能模块化农村生活污水处理设备及处理方法_江苏大学_202211232661.8

车载电动轮椅装载装置_洛阳和合电子科技有限公司_202111539605.4

一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

龙图腾网&IPTOP

【发明公布】一种基于视觉信息的粤语语音识别增强方法_湘潭大学_202210636176.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务