【发明公布】基于知识驱动文本生成的语音识别领域自适应方法及系统_上海交通大学_202311648708.3

导航：龙图腾网> 最新专利技术> 基于知识驱动文本生成的语音识别领域自适应方法及系统_上海交通大学_202311648708.3

申请/专利权人：上海交通大学

申请日：2023-12-04

公开（公告）日：2024-03-22

公开（公告）号：CN117746848A

主分类号：G10L15/183

分类号：G10L15/183;G10L15/06;G10L13/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明实施例提供一种基于知识驱动文本生成的语音识别领域自适应方法及系统。该方法包括：将目标领域知识输入至知识描述框架进行填充，引导大语言模型生成符合目标领域知识的目标领域文本；将目标领域文本输入至文本转语音模型，生成第一训练数据；利用第一训练数据对语音识别模型进行领域自适应的第一优化训练，利用训练后的语音识别模型输出第一训练数据的目标音频假设；将目标音频假设输入至大语言模型进行知识驱动的文本生成迭代，得到第二训练数据；利用第二训练数据对语音识别模型进行领域自适应的第二优化训练，得到领域自适应的语音识别模型。本发明实施例显著提高语音识别性能，同时优化训练出领域自适应性能更强的语音识别模型。

主权项：1.一种基于知识驱动文本生成的语音识别领域自适应方法，包括：将目标领域知识输入至知识描述框架进行填充，利用填充后的知识描述框架引导大语言模型生成符合所述目标领域知识的目标领域文本；将所述目标领域文本输入至文本转语音模型，生成目标领域音频，将所述目标领域文本以及对应的所述目标领域音频确定为第一训练数据；至少利用所述第一训练数据对语音识别模型进行领域自适应的第一优化训练，利用训练后的语音识别模型输出所述第一训练数据的目标音频假设；将所述目标音频假设输入至所述大语言模型进行知识驱动的文本生成迭代，得到第二训练数据；至少利用所述第二训练数据对语音识别模型进行领域自适应的第二优化训练，得到领域自适应的语音识别模型。

全文数据：

权利要求：

百度查询：上海交通大学基于知识驱动文本生成的语音识别领域自适应方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

下一篇：一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

相关技术

一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

用于高压柜体的固定防护装置_江苏贯中电气有限公司_202322341188.3

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

一种矮轴gasket结构的机械键盘_渴创技术(深圳)有限公司_202322395230.X

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

龙图腾网&IPTOP

【发明公布】基于知识驱动文本生成的语音识别领域自适应方法及系统_上海交通大学_202311648708.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务