【发明公布】融合语言模型生成方法和装置、单词纠错方法和电子设备_亿度慧达教育科技(北京)有限公司_201910912185.6

申请/专利权人：亿度慧达教育科技(北京)有限公司

申请日：2019-09-25

公开（公告）日：2021-04-13

公开（公告）号：CN112651230A

主分类号：G06F40/232(20200101)

分类号：G06F40/232(20200101);G06F40/242(20200101);G06F40/284(20200101)

优先权：

专利状态码：有效-授权

法律状态：2022.04.26#授权;2021.04.30#实质审查的生效;2021.04.13#公开

摘要：本申请实施例提供了一种融合语言模型生成方法和装置、单词纠错方法和电子设备。该融合语言模型生成方法包括：确定至少两个预先训练好的语言模型的权重；根据权重以及拼写纠错训练集中样本纠错候选单词在各语言模型中的先验概率，得到融合的先验概率；根据融合的先验概率、样本纠错候选单词为样本拼写错误单词的样本拼写建议单词的转移概率以及样本纠错候选单词的标签信息，调整各语言模型权重；基于预先训练好的语言模型以及各语言模型调整后的权重，生成融合语言模型。通过将预先训练好的语言模型按照不同权重进行融合，生成融合语言模型，利用融合语言模型对拼写错误单词进行纠错，能够从纠错候选集里面选择合理的单词作为最终拼写建议单词。

主权项：1.一种融合语言模型生成方法，其特征在于，包括：确定至少两个预先训练好的语言模型的权重；根据所述权重以及拼写纠错训练集中样本纠错候选单词在各所述语言模型中的先验概率，得到融合的先验概率；根据所述融合的先验概率、所述样本纠错候选单词为样本拼写错误单词的样本拼写建议单词的转移概率以及所述样本纠错候选单词的标签信息，调整各所述语言模型的权重；基于所述预先训练好的所述语言模型以及各所述语言模型调整后的权重，生成融合语言模型；其中，所述样本纠错候选单词的标签信息表征所述样本纠错候选单词是否为所述样本拼写错误单词的正确样本拼写建议单词；所述拼写纠错训练集为所述样本拼写错误单词与所述样本拼写错误单词对应的所述样本纠错候选单词的集合。

全文数据：

权利要求：

百度查询：亿度慧达教育科技(北京)有限公司融合语言模型生成方法和装置、单词纠错方法和电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：烟气浓度可调的气溶胶生成系统及控制方法_河南中烟工业有限责任公司_202410193979.2

下一篇：背光模组及显示面板_武汉华星光电技术有限公司_202410020388.5

相关技术

烟气浓度可调的气溶胶生成系统及控制方法_河南中烟工业有限责任公司_202410193979.2

背光模组及显示面板_武汉华星光电技术有限公司_202410020388.5

用于UV上光机网纹辊的均料装置_本溪九星印刷包装有限公司_202410212043.X

罗汉果植物类功能饮料及制备方法_益阳龙果饮料有限公司_202410193846.5

一种基于全生命周期理论的斜拉桥机电系统技术状况评价方法_上海浦江桥隧运营管理有限公司_202410109461.6

数据存储方法、装置、计算机设备和存储介质_腾讯科技(深圳)有限公司_202211239992.4

触摸轨迹确定方法、装置、设备及介质_青岛海信商用显示股份有限公司_202211255349.0

基板处理装置以及基板处理方法_株式会社斯库林集团_202280061924.5

一种基于分层强化学习的无人机动态任务分配方法及装置_中国电子科技集团有限公司电子科学研究院_202410037582.4

基于Kubernetes的异常pod处理方法、装置、电子设备和存储介质_卡奥斯物联科技股份有限公司_202410029106.8

一种二氧化碳驱采出水预处理工艺_中国石油天然气股份有限公司_202211261163.6

资源分配模型的矫正方法及装置、存储介质、电子设备_中博信征信有限公司_202410115695.1

龙图腾网&IPTOP

【发明公布】融合语言模型生成方法和装置、单词纠错方法和电子设备_亿度慧达教育科技(北京)有限公司_201910912185.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务