【发明公布】用于训练混合语言识别模型的方法和装置_百度在线网络技术(北京)有限公司_201911075088.2

申请/专利权人：百度在线网络技术(北京)有限公司

申请日：2019-11-06

公开（公告）日：2020-01-10

公开（公告）号：CN110675865A

主分类号：G10L15/06(20130101)

分类号：G10L15/06(20130101);G10L15/16(20060101);G10L25/24(20130101);G10L25/30(20130101);G10L15/02(20060101)

优先权：

专利状态码：有效-授权

法律状态：2021.09.28#授权;2020.02.11#实质审查的生效;2020.01.10#公开

摘要：本申请实施例公开了用于训练混合语言识别模型的方法和装置。该方法的一具体实施方式包括：生成第一语言音频的第一音节标签序列和第二语言音频的第二音节标签序列；将第二语言音频输入至预先训练的第一语言识别模型，得到连接时序分类峰序列；基于第二音节标签序列和连接时序分类峰序列，计算第二音节标签序列中的每种第二音节标签的连接时序分类峰正确率；基于所计算出的连接时序分类峰正确率，从第二音节标签序列中确定差异音节标签；基于第一音节标签序列和差异音节标签对深层神经网络进行混合训练，得到混合语言识别模型。该实施方式实现了同一个模型支持多种语言的识别。

主权项：1.一种用于训练混合语言识别模型的方法，包括：生成第一语言音频的第一音节标签序列和第二语言音频的第二音节标签序列；将所述第二语言音频输入至预先训练的第一语言识别模型，得到连接时序分类峰序列，其中，所述第一语言识别模型是基于所述第一音节标签序列训练得到的；基于所述第二音节标签序列和所述连接时序分类峰序列，计算所述第二音节标签序列中的每种第二音节标签的连接时序分类峰正确率；基于所计算出的连接时序分类峰正确率，从所述第二音节标签序列中确定差异音节标签；基于所述第一音节标签序列和所述差异音节标签对深层神经网络进行混合训练，得到混合语言识别模型。

全文数据：

权利要求：

百度查询：百度在线网络技术(北京)有限公司用于训练混合语言识别模型的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种数据传输系统及方法、电子设备和存储介质_摩尔线程智能科技(北京)有限责任公司_202410338917.6

下一篇：用于齿部加工的设备、刀具头和齿部加工机器_雷肖尔股份公司_202280062247.9

相关技术

一种数据传输系统及方法、电子设备和存储介质_摩尔线程智能科技(北京)有限责任公司_202410338917.6

用于齿部加工的设备、刀具头和齿部加工机器_雷肖尔股份公司_202280062247.9

一种光伏组件热斑测试方法_英利能源发展有限公司_202410149506.2

烟气浓度可调的气溶胶生成系统及控制方法_河南中烟工业有限责任公司_202410193979.2

一种产五种类型西红花苷的大肠杆菌工程菌及其应用_安徽医科大学_202410059069.5

一种煤矿园区的管控方法和管控系统_宁波长壁流体动力科技有限公司_202410338009.7

一种食品加工用蒸煮设备的清洁装置_滨州尚亿食品有限责任公司_202410338095.1

一种高效吸附氟离子的羟基磷灰石及其制备方法_江苏省海洋资源开发研究院(连云港)_202410126507.5

一种齿轮啮合润滑装置_北京理工大学_202410123562.9

一种卫星高频次海面风估测方法_国家卫星气象中心(国家空间天气监测预警中心)_202410120101.6

基于出行码的资源管理方法、装置、可读介质及电子设备_八维通科技有限公司_202311860248.0

燃料电池的增压系统_IHI供应系统国际有限责任公司_202280062700.6

龙图腾网&IPTOP

【发明公布】用于训练混合语言识别模型的方法和装置_百度在线网络技术(北京)有限公司_201911075088.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务