【发明授权】一种基于词粒度的自然语言模型的训练方法与系统_智者四海(北京)技术有限公司_202110588758.1

申请/专利权人：智者四海(北京)技术有限公司

申请日：2021-05-28

公开（公告）日：2024-04-16

公开（公告）号：CN113326693B

主分类号：G06F40/216

分类号：G06F40/216;G06F40/126;G06F40/242;G06F40/284;G06N3/045;G06N3/09

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2021.09.17#实质审查的生效;2021.08.31#公开

摘要：本公开提供了一种基于词粒度的自然语言模型的训练方法和系统，所述方法包括：根据词典将训练语料分词，所述分词的粒度为词语；根据词频，将分词的结果按照词频大小排序，分为三组词语，分别为高频词语、中频词语、低频词语；将所述三组词语嵌入向量；通过变形层进行编码与解码，得到带有浮点数的多个向量；将所述带有浮点数的多个向量通过自适应线性层，将其中概率超过阈值的向量选择为输出，并转化为预测词语；训练自然语言模型时，使用中文句子为样本数据，以及预先确定的预测词语为样本标签；使用自适应优化器训练自然语言模型，所述自适应优化器使用矩阵的低秩分解来压缩训练中产生的变量。

主权项：1.一种基于词粒度的自然语言模型的训练方法，包括：根据词典将训练语料分词，所述分词的粒度为词语；根据词频，将分词的结果按照词频大小排序，分为三组词语，分别为高频词语、中频词语、低频词语；将所述三组词语嵌入向量；通过变形层进行编码与解码，得到带有浮点数的多个向量；将所述带有浮点数的多个向量通过自适应线性层，将其中概率超过阈值的向量选择为输出，并转化为预测词语；训练自然语言模型时，使用中文句子为样本数据，以及预先确定的预测词语为样本标签；使用自适应优化器训练自然语言模型，所述自适应优化器使用矩阵的低秩分解来压缩训练中产生的变量；其中，所述自适应线性层首先只使用高频词语预测，当发现表示预测词语是中频或低频词语的第一预测概率较高时，则继续使用中频或低频词语进行预测，在得到表示预测词语是中频或低频词语的第二预测概率时，则预测词语的实际概率即为第一预测概率与第二预测概率的乘积；所述训练自然语言模型时，预加载了基于字粒度自然语言模型的权重，所述基于词粒度的自然语言模型的词权重是由组成该词的每一个字的基于字粒度的自然语言模型的字权重的和的平均值。

全文数据：

权利要求：

百度查询：智者四海(北京)技术有限公司一种基于词粒度的自然语言模型的训练方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：针对SAR ADC的分裂电容模组及相应的开关方法_深圳大学_202311804036.0

下一篇：数字信号解析方法、装置、设备及车辆_北京罗克维尔斯科技有限公司_202211349864.5

相关技术

针对SAR ADC的分裂电容模组及相应的开关方法_深圳大学_202311804036.0

数字信号解析方法、装置、设备及车辆_北京罗克维尔斯科技有限公司_202211349864.5

随流检测方法、装置及系统_华为技术有限公司_202211348549.0

一种冷热负荷的预测方法及装置、存储介质、计算机设备_国网新疆电力有限公司昌吉供电公司_202410036837.5

一种用于废气净化的镍合金洗涤器_南京胜德金属装备有限公司_202311756686.2

一种超轻量且快速的隐写分析检测方法_福建理工大学_202410048998.6

机动车辆和检测该机动车辆本身的行驶速度的方法_法拉利股份有限公司_202311420447.X

低速时车辆档位控制的方法和装置_上海汽车集团股份有限公司_202211337164.4

一种基于实时地图的路线规划方法、系统及电子设备_中国第一汽车股份有限公司_202311792980.9

具有求平均值功能的装置和/或分析设备_西门子股份公司_202311415545.4

一种司美格鲁肽口服固体药物组合物及其应用_齐鲁制药有限公司_202311407557.2

用于虚拟直播的播控方法、PC设备、移动终端、计算机可读存储介质_蓝色宇宙数字科技有限公司_202311811538.6

龙图腾网&IPTOP

【发明授权】一种基于词粒度的自然语言模型的训练方法与系统_智者四海(北京)技术有限公司_202110588758.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务